安全专家抗议美国封禁 Anthropic 最强模型

2026年6月16日内容管家

内容管家

1465
文章

0
评论

AI领域评论0字数 1009阅读3分21秒阅读模式

76 位网络安全专家联名上书：要求解除对 Anthropic Fable/Mythos 模型的出口管理&制约

上周五，美国zf 下令人工智能公司 Anthropic 限制其 Fable 和 Mythos 模型的出口，援引国家安全关切，但未公布具体原因。Anthropic 随即将这两款模型对全球所有用户暂停访问。

这一决定迅速引发反弹——由数十位网络安全资深专家组成的联名小组发布公开信，呼吁zf 撤销该出口管理&制约令。

最好的模型被从防御者手中夺走

公开信措辞直接："此举将最好的模型从[网络安全]防御者手中夺走"——而他们本可借助这些模型发现漏洞、强化软件与产品安全。

信中写道："在对手快速推进之际，以缺乏充分理由为由将最强能力从防御者身边剥离，是极其危险的。" 截至发稿，该联名信已获得 76 位网络安全专家 签署，包括：

Alex Stamos——前 Facebook 首席安全官
Casey Ellis——漏洞赏金平台 Bugcrowd 创始人
Jon Callas——知名密码学家、前苹果安全架构设计师
Paul Vixie——计算机科学家
Dino Dai Zovi——Block 前应用安全工程负责人
Katie Moussouris——Luta Security 创始人
Rachel Tobac——安全意识培训公司 SocialProof Security CEO

Fable 和 Mythos 的背景

Mythos 于今年 4 月以预览版发布时，Anthropic 明确表示其发现安全漏洞的能力极为强大，公司需要严格限制访问，以防恶意黑客或外国对手利用其在网上制造混乱。当时 Mythos 仅向约 50 家公司开放，近日才扩展至约 15 个国家的 150 个组织。

上周 Anthropic 发布 Fable——即 Mythos 的公开版本，官方称其配备了严格的安全护栏：禁止用于生物学、化学和网络安全领域，同时阻止他人对模型进行"蒸馏"以复制能力。然而护栏设置过于严苛，许多网络安全专家发现 Fable 几乎屏蔽了所有与网络安全相关的提示词。

"越狱漏洞"争议：亚马逊论文引发管理&制约？

Anthropic 表示，美国zf 此次出口管理&制约令可能基于一份报告——该报告称存在绕过 Fable 安全护栏（即所谓"越狱"）的方法，可解锁与 Mythos 同等的强大能力。

据其中一位联名签署者 Katie Moussouris 透露，该方法由亚马逊研究人员在一篇未公开的论文中演示，她本人已查阅过该论文。

然而 Moussouris 在博文中表示，该论文实际上并未展示真正的越狱：研究人员的做法不过是先让 Fable 拒绝"审核&查验代码安全问题"，随后请它修复包含已知漏洞的开源代码——以及"故意植入的漏洞"。

Moussouris 直言："论文中描述的行为无法被有效修复，任何修复尝试只会削弱模型在防御方面的能力。防御者需要能够要求 AI 修复文件中的 bug、解释修复理由、编写测试用例验证补丁有效。这不是护栏绕过，而是 AI 模型为防御安全所做的最有价值的事：执行安全人员每天都在运行的'发现—修复—测试'循环。" 这一批评在公开信中得到呼应。信中指出，专家组认为上述方法同样可以在 OpenAI GPT-5.5、Anthropic 自家已公开的 Claude Opus 4.8 和 Sonnet，乃至 Kimi 2.7 等中国模型上复现。

专家呼吁：监督&管理应以科学为基

公开信还提出，法规制定应遵循"民主程序"，基于行业与学术界专家的科学调研，且"仅在最小必要范围内使用，以确保美国公众安全"——言下之意，当前一刀切的出口管理&制约并未达到这一标准。