蒸馏战争:间谍活动还是效率?
内容摘要
AI初创公司Anthropic声称,中国的DeepSeek、Moonshot AI和MiniMax实验室对Claude聊天机器人发起了“工业规模的蒸馏攻击”,利用了约24,000个虚假账户和超过1600万次API查询来窃取其推理和编码能力。Anthropic将此定性为国家安全威胁,警告未经许可蒸馏的模型缺乏必要的安全措施,可能被用于生物武器或网络攻击,并敦促美国收紧出口管制。模型蒸馏是一种标准的、合法的机器学习技术,即较小的“学生”模型从较大的“教师”模型的输出来学习;Anthropic和OpenAI自身也经常使用此技术。批评者认为,所引用的查询量(1600万次交换)与常规的大规模测试相当,并且MiniMax在训练其即将推出的模型时被抓获。此外,这一指控面临虚伪性的质疑,因为Anthropic自身也因涉嫌抓取书籍和音乐等受版权保护的材料来训练其前沿模型而面临诉讼和与作者的和解,引发了“数据为我所有,但不为你所有”的论调。
(来源:Aisuperhuman Substack)