
76 位网络安全专家联名上书:要求解除对 Anthropic Fable/Mythos 模型的出口管理&制约
上周五,美国zf 下令人工智能公司 Anthropic 限制其 Fable 和 Mythos 模型的出口,援引国家安全关切,但未公布具体原因。Anthropic 随即将这两款模型对全球所有用户暂停访问。
这一决定迅速引发反弹——由数十位网络安全资深专家组成的联名小组发布公开信,呼吁zf 撤销该出口管理&制约令。
最好的模型被从防御者手中夺走
公开信措辞直接:"此举将最好的模型从[网络安全]防御者手中夺走"——而他们本可借助这些模型发现漏洞、强化软件与产品安全。
信中写道:"在对手快速推进之际,以缺乏充分理由为由将最强能力从防御者身边剥离,是极其危险的。" 截至发稿,该联名信已获得 76 位网络安全专家 签署,包括:
- Alex Stamos——前 Facebook 首席安全官
- Casey Ellis——漏洞赏金平台 Bugcrowd 创始人
- Jon Callas——知名密码学家、前苹果安全架构设计师
- Paul Vixie——计算机科学家
- Dino Dai Zovi——Block 前应用安全工程负责人
- Katie Moussouris——Luta Security 创始人
- Rachel Tobac——安全意识培训公司 SocialProof Security CEO
Fable 和 Mythos 的背景
Mythos 于今年 4 月以预览版发布时,Anthropic 明确表示其发现安全漏洞的能力极为强大,公司需要严格限制访问,以防恶意黑客或外国对手利用其在网上制造混乱。当时 Mythos 仅向约 50 家公司开放,近日才扩展至约 15 个国家的 150 个组织。
上周 Anthropic 发布 Fable——即 Mythos 的公开版本,官方称其配备了严格的安全护栏:禁止用于生物学、化学和网络安全领域,同时阻止他人对模型进行"蒸馏"以复制能力。然而护栏设置过于严苛,许多网络安全专家发现 Fable 几乎屏蔽了所有与网络安全相关的提示词。
"越狱漏洞"争议:亚马逊论文引发管理&制约?
Anthropic 表示,美国zf 此次出口管理&制约令可能基于一份报告——该报告称存在绕过 Fable 安全护栏(即所谓"越狱")的方法,可解锁与 Mythos 同等的强大能力。
据其中一位联名签署者 Katie Moussouris 透露,该方法由亚马逊研究人员在一篇未公开的论文中演示,她本人已查阅过该论文。
然而 Moussouris 在博文中表示,该论文实际上并未展示真正的越狱:研究人员的做法不过是先让 Fable 拒绝"审核&查验代码安全问题",随后请它修复包含已知漏洞的开源代码——以及"故意植入的漏洞"。
Moussouris 直言:"论文中描述的行为无法被有效修复,任何修复尝试只会削弱模型在防御方面的能力。防御者需要能够要求 AI 修复文件中的 bug、解释修复理由、编写测试用例验证补丁有效。这不是护栏绕过,而是 AI 模型为防御安全所做的最有价值的事:执行安全人员每天都在运行的'发现—修复—测试'循环。" 这一批评在公开信中得到呼应。信中指出,专家组认为上述方法同样可以在 OpenAI GPT-5.5、Anthropic 自家已公开的 Claude Opus 4.8 和 Sonnet,乃至 Kimi 2.7 等中国模型上复现。
专家呼吁:监督&管理应以科学为基
公开信还提出,法规制定应遵循"民主程序",基于行业与学术界专家的科学调研,且"仅在最小必要范围内使用,以确保美国公众安全"——言下之意,当前一刀切的出口管理&制约并未达到这一标准。


评论