ハッカーはチャットボットの「個性」を悪用することを学んでいる

The Verge
ハッカーは従来の技術的なコード攻撃ではなく、心理的操縦やソーシャルエンジニアリングを駆使してAIの安全ガードレールを回避しようとしています。

概要

現代のAIセキュリティに対する脅威は、技術的なコードの脆弱性を突くものから、心理的な操作(いわゆる「ジェイルブレイク」)へと移行しています。大規模言語モデルは人間のような対話を行うよう設計されているため、ハッカーは言葉巧みに、あるいは心理的な圧力をかけてチャットボットを誘導し、安全規定を破らせようとします。この「サイコサイバーセキュリティ」という新しい分野は、AIが自然なやり取りを目的としているがゆえに、人間に対する操作と同等の手法に弱いという深刻な脆弱性を示しています。結果として、AIの「個性」が多様なソーシャルエンジニアリングにどう反応するかをテストするため、心理学の知識を持つ専門家がセキュリティ分野で重要視され始めています。

(出典:The Verge)