介绍 Gemini Omni

Gemini
谷歌推出了 Gemini Omni,这是一款能够通过文本、图像、音频和视频输入来创建和编辑高质量视频的原生多模态模型。

内容摘要

谷歌发布了 Gemini Omni,这是一款旨在连接推理能力与内容创作的原生多模态 AI 模型。该模型支持用户通过文本、图像、音频和视频等多种输入方式来生成及编辑高质量视频。其核心优势在于能够通过自然语言指令进行复杂的视频编辑,确保场景连贯性并应用真实的物理规律。首个发布的版本 Gemini Omni Flash 现已面向 Gemini 应用和 Google Flow 的 Google AI 订阅用户推出,并逐步向 YouTube Shorts 和 YouTube Create 用户开放,后续还将通过 API 提供给开发者和企业客户。此外,该平台通过 SynthID 水印技术强调了 AI 的负责任使用与内容透明度。

(来源:Gemini)