xAIにとって朗報:Grokは『バルダーズ・ゲート』に関する質問への回答がかなり得意になった
概要
イーロン・マスク氏のxAIは、詳細なビデオゲームの質問に答えるGrokの能力向上に重点を置いており、マスク氏がゲーム『バルダーズ・ゲート』に関して求めた内容を満たすためにモデルのリリースを数日間遅らせたことが報じられています。この集中的な開発の結果をテストするため、TechCrunchはGrok、ChatGPT、Claude、Geminiに対し、「BaldurBench」と名付けた『バルダーズ・ゲート』に関する5つの一般的な質問セットを実行しました。Grokは、ゲーマー特有の専門用語(例:「save-scumming」)を使いつつも、有用で情報に基づいた回答を提供しました。モデルのパフォーマンスは一般的に類似していましたが、ChatGPTは箇条書きを好み、Geminiは重要な単語を太字にするなど、スタイルに違いが見られました。Claudeは特にネタバレを避けることに熱心でした。記事は、集中的な開発努力の後、Grokのパフォーマンスが他のモデルと同等になったものの、xAIが努力すれば目標を達成できることを示していると結論付けています。
(出典:TechCrunch)