介绍 Gemini Omni

English 日本語 Español

Gemini 2026年05月19日

谷歌推出了 Gemini Omni，这是一款能够通过文本、图像、音频和视频输入来创建和编辑高质量视频的原生多模态模型。

阅读全文

内容摘要

谷歌发布了 Gemini Omni，这是一款旨在连接推理能力与内容创作的原生多模态 AI 模型。该模型支持用户通过文本、图像、音频和视频等多种输入方式来生成及编辑高质量视频。其核心优势在于能够通过自然语言指令进行复杂的视频编辑，确保场景连贯性并应用真实的物理规律。首个发布的版本 Gemini Omni Flash 现已面向 Gemini 应用和 Google Flow 的 Google AI 订阅用户推出，并逐步向 YouTube Shorts 和 YouTube Create 用户开放，后续还将通过 API 提供给开发者和企业客户。此外，该平台通过 SynthID 水印技术强调了 AI 的负责任使用与内容透明度。

(来源：Gemini)

English 日本語 Español

阅读全文

TechCrunch 2026年07月04日

Google 新广告构想了在人工智能辅助下撰写的《独立宣言》

Yahoo News 2026年07月04日

Meta雇佣数百名合同工冒充青少年，用令人不安的内容轰炸其竞争对手的AI

TechCrunch 2026年07月04日

Midjourney 要求好莱坞制片厂披露其 AI 使用细节

TechCrunch 2026年07月04日

据报道，阿里巴巴禁止员工使用 Claude Code

TechCrunch 2026年07月04日