Gemini 3.1 Flash TTS: la próxima generación de voz IA expresiva
Resumen
Google ha lanzado Gemini 3.1 Flash TTS, su modelo de texto a voz más reciente, diseñado para ofrecer mayor control, expresividad y calidad en el habla generada por IA. El modelo introduce "etiquetas de audio", que permiten a los usuarios controlar con precisión el estilo vocal, el ritmo y la entrega mediante comandos de lenguaje natural incrustados directamente en el texto. Esta función permite a los desarrolladores ajustar las voces de IA para escenarios específicos, crear personajes consistentes y construir experiencias de audio inmersivas. Gemini 3.1 Flash TTS es compatible con más de 70 idiomas y ha obtenido una alta puntuación en la tabla de clasificación TTS de Artificial Analysis por su habla natural y expresiva. Todo el audio generado por el modelo está marcado con SynthID para garantizar la detección fiable de contenido generado por IA y ayudar a prevenir la desinformación. El modelo está disponible para desarrolladores a través de la API de Gemini y Google AI Studio, para empresas en Vertex AI y para usuarios de Workspace a través de Google Vids.
(Fuente:Gemini)