Googleの「Gemini Omni」が画像・音声・テキストを動画に変換 ― それはまだ始まりに過ぎない

English 中文 Español

TechCrunch May 19, 2026

Googleは、テキスト、画像、音声から動画を生成できるマルチモーダルAIモデル「Gemini Omni」を発表しました。

全文を読む

概要

Googleは、テキスト、音声、画像、動画を統合的に推論し、高品質な動画を生成できる新たなマルチモーダルAIモデル「Gemini Omni」を発表しました。このモデルは、物理法則や文脈を理解した一貫性のある出力を可能にします。現在提供されている「Gemini Omni Flash」は、一般ユーザー向けのパーソナライズされた動画作成やデジタルアバター生成に注力しており、安全対策としてSynthID透かしが適用されています。今後、より高度な「Pro」モデルの投入も予定されており、広告や映画制作などのプロフェッショナルな領域での活用が期待されています。

(出典：TechCrunch)

English 中文 Español

全文を読む

TechCrunch Jul 4, 2026

Googleの新しいCMは、AIの助けを借りて書かれた独立宣言を想像する

Yahoo News Jul 4, 2026

Meta、数百人の請負業者を雇い、未成年になりすまして競合他社のAIに不穏なコンテンツを送りつける

TechCrunch Jul 4, 2026

Midjourneyがハリウッドのスタジオに対し、AI利用の詳細を明らかにするよう要求

TechCrunch Jul 4, 2026

報道によると、アリババは従業員による「Claude Code」の使用を禁止

TechCrunch Jul 4, 2026