研究中,人工智能模型OpenScholar能像人类专家一样准确地综合科学研究并引用来源
内容摘要
华盛顿大学(UW)和艾伦人工智能研究所(Ai2)的研究人员开发了OpenScholar,这是一个专门设计用于综合当前科学研究并准确引用来源的开源人工智能模型,旨在解决像GPT-4o这类通用模型常见的“幻觉”问题。
研究团队创建了首个大型、多领域的基准测试ScholarQABench来评估研究综合能力,并使用检索增强生成技术,让OpenScholar能够从4500万篇科学论文中提取信息并整合最新研究。测试结果显示,OpenScholar的引文准确性与人类专家相当,并且科学家有51%的时间更喜欢OpenScholar的回答而非主题专家的回答。
研究人员指出,科学家对这种透明的开源系统需求很高。当OpenScholar的引用方法与GPT-4o结合使用时,科学家更喜欢人工智能生成的答案的比例高达70%。该项目的代码和演示已公开,团队正在开发后续模型DR Tulu。
(来源:UW News)