Gemini 3.5 Live Translate による流暢で自然な音声翻訳

Gemini
Gemini 3.5 Live Translateは、70以上の言語に対応し、自然な抑揚と低遅延でリアルタイム音声翻訳を実現するAIモデルです。

概要

Googleは、70以上の言語に対応した近リアルタイムの音声翻訳を実現する最新のオーディオモデル「Gemini 3.5 Live Translate」を発表しました。このモデルは音声をストリーミングしながら処理するため、従来のターン制システムのような不自然な間を置くことなく、話し手の抑揚、テンポ、ピッチを維持した流暢な翻訳を生成します。本機能はGoogle MeetやGoogle翻訳アプリ(Android/iOS)に導入されるほか、Gemini Live APIを通じて開発者にも提供されます。また、生成されるすべての音声にはSynthIDの透かしが埋め込まれており、AI生成コンテンツの識別と誤情報の防止が図られています。

(出典:Gemini)