Gemini Omni の紹介

Gemini
Googleは、テキスト、画像、音声、動画を入力として高品質な動画を作成・編集できるネイティブマルチモーダルモデル「Gemini Omni」を発表しました。

概要

Googleは、推論能力と創造的生産性を融合させた新しいネイティブマルチモーダルAIモデル「Gemini Omni」を発表しました。このモデルは、テキスト、画像、音声、動画などの多様な入力を組み合わせて、高品質な動画の生成や編集を可能にします。特筆すべき機能は、自然言語を用いた直感的な動画編集であり、シーンの一貫性を保ちながら現実的な物理法則を適用できます。シリーズ初のモデルである「Gemini Omni Flash」は、GeminiアプリやGoogle FlowのGoogle AIサブスクリプションユーザー向けに提供が開始されており、今後はYouTube ShortsやYouTube Createのユーザー、および開発者や企業向けにも順次展開予定です。また、責任あるAI開発の一環として、コンテンツの透明性を確保するためにSynthID電子透かし技術が導入されています。

(出典:Gemini)