xAI的好消息:Grok现在非常擅长回答有关《博德之门》的问题

TechCrunch
xAI的Grok模型在《博德之门》问题测试中表现良好,证实了其专注的开发工作。

内容摘要

据报道,埃隆·马斯克的xAI优先改进了Grok模型回答详细电子游戏问题的能力,甚至为了满足马斯克对《博德之门》的要求而推迟了模型发布。为了测试这种专注的成果,TechCrunch使用了一套关于《博德之门》的五个通用问题(称为“BaldurBench”)对Grok、ChatGPT、Claude和Gemini进行了测试。Grok提供了有用且信息丰富的答案,尽管它使用了密集的玩家术语,如“save-scumming”。虽然模型的整体表现相似,都参考了常见指南,但风格上存在差异:ChatGPT偏爱项目符号列表,Gemini会加粗重要词语,而Claude则非常谨慎,避免提供剧透。文章总结道,尽管Grok在报道的冲刺后表现与竞争对手持平,但这证明了xAI在努力时可以实现其特定目标。

(来源:TechCrunch)