Anthropic Fable 5遭美国政府召回,服务全线暂停
AI大模型领域近日发生了一起史无前例的事件:美国商务部强制要求AI公司Anthropic下线其Fable 5和Mythos 5两款模型。此次“模型召回”源于一项政府管制令,其核心是基于国家安全考量,要求立即中断所有非美国籍人员对上述模型的访问,甚至包括Anthropic自身的外籍员工,迫使该公司不得不将相关服务全面停用。
这标志着全球范围内,一个已上线并投入商业化使用的大型语言模型首次遭遇政府强制性召回。事件的导火索是美国商务部长 Howard Lutnick向Anthropic CEO Dario Amodei发送的一封信函,信中指出的“越狱”方式,即让模型读一段代码并修复其中的bug,被政府视为潜在的安全漏洞。尽管Anthropic方面认为这些漏洞为已知且不构成严重威胁的小问题,且其他公开模型同样能发现,但政府部门的立场则更为严峻,不仅要求立即停用Fable 5和Mythos 5,还对Anthropic的未来模型出口设置了逐案审批的门槛,并伴有严厉的处罚措施。
Anthropic在事后对政府的指控进行了逐条回应。公司强调,Fable 5在发布前已进行了数千小时的红队测试,并与多方机构合作,结论是该模型的防护效果远超以往,不存在可广泛绕过的“通用越狱”手段。然而,Anthropic也坦承,在当前技术水平下,完美防御越狱几乎不可能实现,任何防护措施都存在被规避的风险,这一点在其模型发布时已有所披露。为了应对这一挑战,Fable 5采用了纵深防御策略,力求将越狱的难度提高,并配合全面的监控系统来及时发现和阻止潜在攻击。此外,为便于安全研究和风险缓解,Fable要求用户数据保留30天,此举虽引发用户不满,但被视为保障模型安全的重要措施。
对于“发现一个窄域潜在越狱”便可成为召回一个服务数亿用户商用模型的理由,Anthropic表示不认同,并认为若以该标准衡量,将几乎叫停所有前沿模型提供商的新模型部署。值得注意的是,Anthropic与政府间的紧张关系由来已久,此前曾因被五角大楼列为“供应链风险”而对政府提起诉讼。有报道指出,此次举报的背后可能另有其人,且政府本身对该模型的发布就持保留态度。截至目前,Fable 5已无法访问,而Opus、Sonnet、Haiku等其他模型则不受影响。
(鉴于原文围绕AI模型安全与政策管制展开,此处补充模型安全维度中的“可解释性”和“鲁棒性”作为相关判断维度,这与模型是否存在“越狱”风险直接相关。)
在AI模型安全性的评估中,可解释性(Explainability)和鲁棒性(Robustness)是两个关键维度。可解释性关乎我们能否理解模型做出特定决策的原因,尤其是在涉及敏感或关键应用场景时。而鲁棒性则直接衡量模型在面对对抗性输入、噪声干扰或数据分布变化时的稳定性。Fable 5此次面临的“越狱”争议,核心便是其鲁棒性是否足以抵御某些精心设计的输入,以至于暴露其潜在的安全隐患。反之,若模型的可解释性较弱,一旦出现异常行为,将更难追溯原因并进行有效修复,这无疑会加剧对其安全性的担忧。
尽管Anthropic正积极争取恢复Fable 5的访问权限,但白宫的态度似乎更为坚决。这场由美国政府主导的“模型召回”事件,究竟是出于真实的国家安全考量,还是政治博弈的延伸,其答案或许比任何AI模型的“越狱”代码都更加复杂和难以探寻。
深度评测:Fable 5遭史无前例召回,Anthropic模型安全与商业化博弈浮现

近日,人工智能领域发生了一起极具标志性事件:美国政府罕见地下令强制召回一款已投入商业化运行的大型语言模型——Anthropic的Fable 5。此次事件不仅是技术层面的一次重大冲击,更在国家安全、技术监管与商业利益之间引发了深刻的探讨。Anthropic已按指令要求,暂时停止了Fable 5及Mythos 5的所有服务,尽管其认为相关安全漏洞并不构成重大风险,但政府的强硬态度预示着新一代AI模型在部署上面临前所未有的挑战。
Fable 5在被要求下线前,已通过多项安全评估。Anthropic表示,在模型发布前,曾联合美国政府、英国AISI、多家第三方机构及内部团队进行了数千小时的“红队测试”。其结论是,Fable 5的安全防护能力远超以往部署过的任何模型,并且至今未出现能够大规模绕过防护的“通用越狱”方法。然而,Anthropic也承认,在现有技术条件下,完全杜绝越狱风险是不可能的,任何防护措施都可能存在非通用或高成本绕过的可能性,这一点在模型发布初期便已对外披露。
为应对潜在风险,Fable 5采用了纵深防御策略,旨在提高越狱的门槛,无论是使其变得“窄域化”还是“高成本化”。同时,通过全面的监控系统来快速识别和阻断攻击。为支持这一策略,Fable 5要求客户保留30天的数据,此举虽引发客户不满,但旨在为后续的安全研究和风险缓解提供数据支持。Anthropic认为,发现一个仅存在于特定场景下的潜在越狱漏洞,不应成为叫停一个服务数亿用户商用模型的理由,若此标准成为行业惯例,将严重阻碍前沿AI模型的发展与部署。
此次事件并非孤例,此前Anthropic已因“供应链风险”被五角大楼列入关注名单,并因此与政府对簿公堂。此次召回事件可能与此前的恩怨以及第三方举报有关,显示出AI技术在国家安全考量下的复杂博弈。Fable 5目前已无法访问,而Anthropic的其他模型如Opus、Sonnet、Haiku则不受影响,正常运行。Anthropic已表明正在与相关部门沟通,希望能尽快恢复Fable 5的服务,但此次事件的影响深远,无疑为未来AI模型的商业化部署蒙上了一层不确定性。
模型性能与安全性:Fable 5此次被点名之处在于其“越狱”风险,即模型可能被诱导执行非预期任务。尽管Anthropic声称其安全防护优于以往模型,并且漏洞属于已知小问题,但政府将其上升到国家安全层面。这突显了AI模型在能力边界探索与安全风险控制之间,存在着难以调和的矛盾。对于模型开发者而言,如何在追求模型能力最大化的同时,有效遏制潜在的滥用风险,将是持续的难题。而对于用户而言,则需要审慎评估模型可能带来的隐患。
Fable 5的遭遇,为整个AI行业敲响了警钟,预示着未来AI技术的发展将更加受到监管的审视。如何在技术创新、商业落地与国家安全之间找到平衡点,是所有参与者需要共同面对的课题。