Avanzando la inteligencia de voz con nuevos modelos en la API

English 中文日本語

OpenAI May 7, 2026

OpenAI presenta tres nuevos modelos de API para aplicaciones de voz avanzadas, mejorando la interacción natural y las capacidades en tiempo real.

Leer Artículo Completo

Resumen

OpenAI ha lanzado tres nuevos modelos de audio dentro de su API para habilitar una nueva clase de aplicaciones de voz. GPT-Realtime-2 ofrece razonamiento de clase GPT-5 para conversaciones naturales y solicitudes complejas. GPT-Realtime-Translate proporciona traducción de voz en vivo a través de más de 70 idiomas de entrada y 13 de salida, manteniendo el ritmo de los hablantes. GPT-Realtime-Whisper es un modelo de transcripción de voz a texto en streaming para transcripción en vivo de baja latencia. Estos modelos buscan mover las interfaces de voz de simples respuestas a agentes que puedan escuchar, razonar, traducir, transcribir y actuar en tiempo real, soportando patrones como voz a acción, guía de sistema a voz y comunicación de voz a voz. GPT-Realtime-2 presenta ventanas de contexto mejoradas, comportamiento de recuperación, control de tono y capacidades de razonamiento, mostrando mejoras significativas en los puntos de referencia de inteligencia de audio y seguimiento de instrucciones. GPT-Realtime-Translate está diseñado para experiencias de voz multilingües fluidas, mientras que GPT-Realtime-Whisper mejora los flujos de trabajo empresariales en vivo con transcripción instantánea. La API Realtime incluye medidas de seguridad y se proporcionan detalles de precios para cada modelo.

(Fuente：OpenAI)

English 中文日本語

Leer Artículo Completo

The Verge May 7, 2026

El 'Contacto de Confianza' de ChatGPT alertará a los seres queridos sobre preocupaciones de seguridad

TechCrunch May 7, 2026

Cómo Mythos de Anthropic ha reescrito el enfoque de Firefox sobre la ciberseguridad

The Verge May 7, 2026

OpenClaw y Claude pueden poner tus podcasts generados por IA en Spotify

The Verge May 7, 2026

Google apuesta fuerte por la salud con IA con el Fitbit Air

TechCrunch May 7, 2026

China’s Moonshot AI raises $2B at $20B valuation as demand for open-source AI skyrockets

TechCrunch May 7, 2026

Spotify quiere convertirse en el hogar del audio personal generado por IA

TechCrunch May 7, 2026

El DJ con IA de Spotify ahora es compatible con francés, alemán, italiano y portugués de Brasil

Blocknow: Be ready. Be informed May 7, 2026

Coinbase despide a 700 empleados y el CEO advierte que todas las empresas harán lo mismo

OpenAI May 7, 2026

Avanzando la inteligencia de voz con nuevos modelos en la API

TechCrunch May 7, 2026

Cinco arquitectos de la economía de la IA explican dónde se están desmoronando las cosas