科学者がAIエージェントをより失礼にさせたら、複雑な推論タスクでより良いパフォーマンスを発揮した
概要
新しい研究により、AIチャットボットがより人間らしくコミュニケーションできるようになると、複雑な推論においてより効果的になることがわかりました。これには、割り込みや礼儀正しさの欠如も含まれます。研究者たちは、大規模言語モデル(LLM)を文単位で応答を処理するように再プログラムし、「ビッグファイブ」の人格特性に基づいて人格を割り当てました。3つの会話設定(固定の発言順、動的な発言順、割り込みが有効な動的な発言順)をテストしました。その結果、エラーや重要なポイントを特定に基づいてトリガーされる割り込みを許可すると、Massive Multitask Language Understanding(MMLU)ベンチマークでの精度が大幅に向上することが示されました。たとえば、エージェントが最初に誤った回答を与えた場合、精度は固定順の68.7%から割り込みが許可された場合の79.2%に向上しました。研究者たちは、割り込みを含む人格主導のAIインタラクションは、厳格な礼儀正しさや順番待ちの交流よりも良い結果をもたらす可能性があり、共同作業環境での応用を検討する予定です。
(出典:Live Science)