介绍 LifeSciBench

English 日本語 Español

OpenAI 2026年06月17日

LifeSciBench 是一项旨在评估人工智能在生命科学领域真实专家级研究任务中表现的基准测试。

阅读全文

内容摘要

LifeSciBench 是一项为评估人工智能系统在生命科学研究中的能力而设计的全面基准测试。该基准由超过 170 位专家科学家参与开发，涵盖七个领域的 750 项任务，重点关注证据处理、实验设计和转化研究等实际工作流。与依赖简单事实回忆的传统基准不同，LifeSciBench 使用详细的评分细则来评估模型是否能够进行复杂的科学推理，并提供对实际工业应用有价值的方案。

(来源：OpenAI)

English 日本語 Español

阅读全文

OpenAI 2026年08月04日

打击犯罪诈骗团伙

TechCrunch 2026年08月01日

法官驳回 xAI 阻止明尼苏达州“脱衣”应用禁令的请求

The Verge 2026年08月01日

Is this Billboard Hot 100 hit AI slop?

OpenAI 2026年08月01日

数学 and 理论计算机科学领域的十项进展

TechCrunch 2026年07月31日