Gemini Omni de Google convierte imágenes, audio y texto en video, y esto es solo el comienzo

English 中文日本語

TechCrunch May 19, 2026

Google presentó Gemini Omni, un modelo multimodal capaz de generar video de alta calidad a partir de entradas de texto, imagen y audio.

Leer Artículo Completo

Resumen

Google ha presentado Gemini Omni, una nueva familia de modelos de IA multimodal capaces de razonar sobre texto, audio, imágenes y video para generar contenido de video de alta calidad. Al sintetizar estas diversas entradas, el modelo busca simular la realidad mediante una comprensión profunda de la física y el contexto. Actualmente disponible como Gemini Omni Flash, la herramienta permite a los usuarios crear avatares digitales y videos personalizados, incorporando la marca de agua digital SynthID para mayor seguridad. Se espera que futuras iteraciones, incluyendo una versión Pro más potente, expandan su utilidad para cineastas y anunciantes profesionales.

(Fuente：TechCrunch)

English 中文日本語

Leer Artículo Completo

TechCrunch Jul 4, 2026

Nuevo comercial de Google imagina una Declaración de Independencia escrita con ayuda de IA

Yahoo News Jul 4, 2026

Meta pagó a cientos de contratistas para hacerse pasar por adolescentes mientras bombardeaban la IA de sus competidores con contenido inquietante

TechCrunch Jul 4, 2026

Midjourney quiere que los estudios de Hollywood revelen los detalles de su uso de IA

TechCrunch Jul 4, 2026

Según se informa, Alibaba prohíbe a sus empleados el uso de Claude Code

TechCrunch Jul 4, 2026

¿Qué es Mistral AI? Todo lo que hay que saber sobre el competidor de OpenAI

The Verge Jul 4, 2026

La comunidad de fanfiction está en guerra con la IA, y consigo misma

TechCrunch Jul 3, 2026

El único glosario de IA que necesitarás este año

TechCrunch Jul 3, 2026

La guerra de los navegadores ya no trata sobre las búsquedas: aquí están las mejores alternativas a Chrome y Safari

The Verge Jul 3, 2026

Anthropic quiere desarrollar sus propios fármacos

The Verge Jul 3, 2026

Un vistazo detrás de escena al escáner médico de Midjourney deja muchas preguntas sin respuesta