使用 Gemini 3.5 Live Translate 进行流畅、自然的语音翻译
内容摘要
Google 推出了 Gemini 3.5 Live Translate,这是一款先进的音频模型,可提供 70 多种语言的近乎实时、连续的语音到语音翻译。通过在流式传输过程中处理语音,该模型在保持翻译同步的同时,保留了说话者的语调、节奏和音高,避免了传统对话式系统中的停顿。该技术正在整合进 Google Meet、Android 和 iOS 版 Google Translate 应用中,并已通过 Gemini Live API 向开发者开放。此外,该模型生成的所有音频均带有 SynthID 水印,以确保内容可追溯并防止虚假信息。
(来源:Gemini)