理解人工智能和学习成果的新工具
内容摘要
教育领域仍在早期阶段,尚未完全理解像 ChatGPT 这样的人工智能工具对长期学习成果的影响,因为当前的研究往往依赖于考试分数等狭隘的绩效指标。为了解决这一差距,OpenAI 与塔尔图大学和斯坦福大学的 SCALE Initiative 合作,开发了学习成果测量套件。该框架通过跟踪模型行为、学习者反应以及长期可衡量的认知结果等信号,支持跨不同教育环境的纵向测量,包括自主动机、坚持性和元认知。
使用 ChatGPT 中学习模式功能对大学生进行的初步研究结果不一:微观经济学考试分数有意义的提高,但在神经科学中则没有,这凸显了短期评估的局限性。新的测量套件旨在捕捉学习者与人工智能之间不断发展、个性化的互动,为教育工作者和研究人员提供一个标准框架,以根据既定的教学法标准评估人工智能的影响。
该套件目前正在通过大规模随机对照试验(例如涉及爱沙尼亚近 20,000 名学生的一项试验)进行广泛验证。OpenAI 打算将该测量套件作为公共资源发布,以促进人工智能的深入、深思熟虑的整合,从而培养高阶思维,并支持全球教育系统中多样化的学习目标。
(来源:OpenAI)