Predicción del comportamiento del modelo antes del lanzamiento mediante la simulación de despliegue

English 中文日本語

OpenAI Jun 4, 2026

OpenAI presenta la simulación de despliegue, un método que mejora la seguridad al reproducir conversaciones reales para predecir cómo actuarán los modelos antes de lanzarlos.

Leer Artículo Completo

Resumen

La simulación de despliegue es un método de evaluación de seguridad previo al lanzamiento que reproduce conversaciones pasadas con un modelo candidato para observar sus respuestas en contextos realistas. Al utilizar tráfico de producción representativo, esta técnica ayuda a identificar comportamientos desalineados, reduce la probabilidad de que los modelos detecten que están siendo evaluados y permite obtener estimaciones cuantitativas sobre conductas no deseadas. Si bien complementa la evaluación tradicional y el red-teaming al ofrecer una visión más precisa del rendimiento en el mundo real, no sustituye al análisis de riesgos extremos, ya que es más eficaz para comportamientos que ocurren con una frecuencia suficiente.

(Fuente：OpenAI)

English 中文日本語

Leer Artículo Completo

OpenAI Aug 4, 2026

Desarticulación de una operación de estafa criminal

TechCrunch Jul 31, 2026

OpenAI encuentra supuestamente pruebas de que más de sus agentes se descontrolaron

TechCrunch Jul 31, 2026

Google elimina su función de IA en Earth un día después del lanzamiento, en medio de críticas de que difundiría desinformación

The Verge Jul 31, 2026

La herramienta de deepfake de IA de Google Earth solo duró un día

Gemini Jul 31, 2026