Gemini Omni 是一个旨在“创造一切”的全新 AI 模型家族

The Verge
Google 推出了全新的 Gemini Omni AI 模型系列,能够利用文本、图像和音频等多种输入方式生成视频内容。

内容摘要

Google 发布了名为 Gemini Omni 的新型生成式 AI 模型家族,旨在通过多种输入方式(如文本、照片、视频和音频)创造内容。首款模型 Omni Flash 可生成长达 10 秒的视频及音频片段,并允许用户在视频中加入个人形象。与 Google 此前的文本转视频模型 Veo 不同,Omni Flash 凭借 Gemini 的深度训练数据具备更强的世界知识,并支持视频到视频的生成。目前,该模型已在 Gemini 应用、Google Flow 和 YouTube Shorts 中上线。

(来源:The Verge)