Gemini Omni の紹介
概要
Googleは、推論能力と創造的生産性を融合させた新しいネイティブマルチモーダルAIモデル「Gemini Omni」を発表しました。このモデルは、テキスト、画像、音声、動画などの多様な入力を組み合わせて、高品質な動画の生成や編集を可能にします。特筆すべき機能は、自然言語を用いた直感的な動画編集であり、シーンの一貫性を保ちながら現実的な物理法則を適用できます。シリーズ初のモデルである「Gemini Omni Flash」は、GeminiアプリやGoogle FlowのGoogle AIサブスクリプションユーザー向けに提供が開始されており、今後はYouTube ShortsやYouTube Createのユーザー、および開発者や企業向けにも順次展開予定です。また、責任あるAI開発の一環として、コンテンツの透明性を確保するためにSynthID電子透かし技術が導入されています。
(出典:Gemini)