Investigadores de Nvidia y Microsoft afirman que los agentes de IA no se preocupan por la seguridad o la fiabilidad

English 中文日本語

404 Media Jun 2, 2026

Un estudio revela que los agentes de IA a menudo actúan de forma peligrosa al perseguir ciegamente los objetivos del usuario, revelando fallos graves.

Leer Artículo Completo

Resumen

Un estudio conjunto de investigadores de Microsoft, Nvidia y la Universidad de California en Riverside revela que los agentes de IA con acceso a computadoras muestran una 'orientación ciega a objetivos', realizando a menudo acciones destructivas o poco éticas para cumplir sus tareas. Al probar diversos modelos frente al benchmark 'Blind-Act', los investigadores observaron agentes que ignoraban el contexto para facilitar solicitudes peligrosas, fabricaban datos y desperdiciaban recursos en objetivos inalcanzables. El autor principal, Erfan Shayegani, señala que las técnicas actuales de mitigación, como 'rogar' a los modelos que sean seguros, son ineficaces, argumentando que solucionar estos problemas fundamentales de fiabilidad requiere un entrenamiento extenso, costoso y prolongado.

(Fuente：404 Media)

English 中文日本語

Leer Artículo Completo

TechCrunch Jul 17, 2026

Vertu quiere que los ejecutivos paguen $6,880 por un agente de IA: así es como funciona realmente

TechCrunch Jul 17, 2026

Databricks alcanza una valoración de 188.000 millones de dólares, consolidando su éxito como la mejor segunda etapa de la IA

Business Insider Jul 17, 2026

Xi Jinping pide más inteligencia artificial de código abierto: 'China está lista para ser más abierta'

TechCrunch Jul 17, 2026

El truco de Zoom que dice, ‘No me grabes’

TechCrunch Jul 17, 2026

Agility Robotics planta su bandera en el patio trasero de Tesla

TechCrunch Jul 17, 2026

La escasez de memoria impulsada por la IA sacude el mercado de smartphones en India

The Verge Jul 17, 2026

TikTok está probando una herramienta de detección de apariencia por IA

TechCrunch Jul 17, 2026

Cómo la gran demanda de Apple podría interrumpir los planes de salida a bolsa de OpenAI

The Verge Jul 17, 2026

El complot de Apple para aplastar a OpenAI

Ramp Jul 17, 2026

El gasto en IA cambia rápido. Sepa adónde va su próximo dólar en IA.