Presentación de Gemini Omni

Gemini
Google presenta Gemini Omni, un modelo multimodal nativo capaz de crear y editar videos de alta calidad mediante entradas de texto, imagen, audio y video.

Resumen

Google ha presentado Gemini Omni, un nuevo modelo de IA multimodal diseñado para unir la capacidad de razonamiento con la creación de contenido. El modelo permite a los usuarios generar y editar videos de alta calidad utilizando una combinación de entradas de texto, imágenes, audio y video. Una característica destacada es la capacidad de realizar ediciones complejas en los videos mediante lenguaje natural, manteniendo la coherencia de los personajes y aplicando leyes físicas realistas. La primera versión, Gemini Omni Flash, está disponible para suscriptores de Google AI en la aplicación Gemini y Google Flow, y se está implementando para usuarios de YouTube Shorts y YouTube Create, con planes de acceso para desarrolladores y clientes empresariales próximamente. Además, Google enfatiza la IA responsable integrando marcas de agua digitales SynthID para garantizar la transparencia del contenido.

(Fuente:Gemini)