Microsoft ASSERT: pruebe agentes de IA con especificaciones de texto plano

GlobalGPT
Microsoft lanzó ASSERT, un framework de código abierto que automatiza las pruebas de agentes de IA convirtiendo especificaciones de comportamiento en lenguaje natural en evaluaciones ejecutables.

Resumen

Microsoft presentó ASSERT, un framework de código abierto diseñado para probar el comportamiento de los agentes de IA mediante descripciones en lenguaje natural. En lugar de redactar casos de prueba complejos manualmente, ASSERT transforma estas especificaciones en evaluaciones estructuradas y ejecutables, generando métricas y citas de políticas que permiten a los desarrolladores verificar el cumplimiento antes de la implementación. Al ser agnóstico respecto al framework y permitir un almacenamiento local de artefactos, ASSERT facilita la soberanía de datos y se integra en el ecosistema de herramientas como LangChain o CrewAI, complementándose con la especificación ACS para establecer un ciclo de vida completo de gobernanza y confianza en agentes de IA.

(Fuente:GlobalGPT)