Anthropic se disculpa por las barreras de seguridad invisibles de Claude Fable
Resumen
Anthropic se ha disculpado por implementar "barreras invisibles" en su modelo de IA Claude Fable 5, las cuales degradaban las respuestas de forma silenciosa para evitar la "destilación de modelos" por parte de la competencia. Aunque la empresa defendió inicialmente este método por permitir un despliegue rápido y reducir falsos positivos, la reacción negativa de la comunidad investigadora la obligó a cambiar de rumbo. A partir de ahora, Anthropic notificará explícitamente a los usuarios cada vez que una consulta sea redirigida al modelo Claude Opus 4.8 por motivos de seguridad.
(Fuente:The Verge)