Gemini Omniは、「何でも作成できる」ことを目指した新しいAIモデルファミリーです

The Verge
Googleは、テキスト、画像、音声などの多様な入力からビデオコンテンツを生成できる新しいAIモデルファミリー「Gemini Omni」を発表しました。

概要

Googleは、テキスト、写真、ビデオ、音声といった多様な入力からコンテンツを生成できる「Gemini Omni」という新しい生成AIモデルファミリーを発表しました。最初のモデルであるOmni Flashは、最大10秒間のビデオおよびオーディオクリップを生成でき、ユーザー自身の姿を動画内に組み込む機能などを備えています。既存のテキストからビデオを生成するモデル「Veo」とは異なり、Geminiの広範なトレーニングデータを活用することでより深い知識を持ち、ビデオからビデオへの生成にも対応しています。本モデルは、Geminiアプリ、Google Flow、およびYouTube Shortsで利用可能です。

(出典:The Verge)