Gemini 3.1 Flash Live:オーディオAIをより自然で信頼性の高いものに

Gemini
Googleは、より高い精度と低遅延を実現し、自然で信頼性の高いリアルタイム対話を提供する高品質オーディオモデル、Gemini 3.1 Flash Liveを発表しました。

概要

Googleは、次世代の音声優先AI体験のために、スピードと自然なリズムを提供する最高品質のオーディオおよび音声モデルであるGemini 3.1 Flash Liveを発表しました。このモデルは、開発者向けにはGoogle AI StudioのGemini Live APIを通じて、企業向けにはGemini Enterprise for Customer Experienceを通じて、そして一般ユーザー向けにはSearch LiveおよびGemini Liveを通じて利用可能です。開発者向けには、3.1 Flash Liveは複雑なタスク実行の信頼性が向上し、音調理解も改善されているため、より自然な対話が可能です。一般ユーザー向けには、Gemini Liveの応答が高速化し、会話の流れを2倍長く維持できるようになりました。さらに、このモデルの多言語対応により、Search Liveが200以上の国と地域に拡大しました。重要な点として、3.1 Flash Liveによって生成されたすべての音声にはSynthIDによる透かしが埋め込まれており、AI生成コンテンツの検出を可能にし、誤情報の拡散防止に役立てられます。

(出典:Gemini)