微软推出新工具,支持开发者通过文本描述生成人工智能行为测试

TechCrunch
微软发布了开源框架 ASSERT,该工具能将自然语言描述的 AI 目标与政策转化为可执行的测试用例。

内容摘要

微软推出了名为 ASSERT(自适应规范驱动的评估与回归测试评分)的开源框架,旨在帮助开发者进行特定应用的 AI 行为评估。该工具能够将关于 AI 预期行为、政策和约束的自然语言描述转化为结构化的测试用例,并自动生成问题场景进行测试与评分。ASSERT 不仅能检查系统是否遵循特定规则,还能记录 AI 的决策路径,便于开发者定位故障,从而在模型构建、部署及持续监控阶段确保 AI 系统的可靠性与合规性。

(来源:TechCrunch)