Mythos风暴：一个AI模型如何让华盛顿和华尔街同时“拉响警报”

本文来自微信公众号：心智观察所，作者：心智观察所

2026年4月7日，人工智能公司Anthropic发布了一个名为Claude Mythos Preview的新模型预览版。与以往任何一次产品发布不同，这家以谨慎著称的公司罕见地宣布，该模型不会向公众开放。它仅通过一项名为“玻璃翼计划”的严格框架，向苹果、亚马逊、微软、谷歌等12家合作伙伴及40余个关键基础设施组织提供受限的访问权限。

就在同一天，美国财政部长斯科特·贝森特与美联储主席杰罗姆·鲍威尔在华盛顿财政部总部紧急召集了华尔街最主要的几位银行CEO。花旗、摩根士丹利、美国银行、富国银行和高盛的负责人悉数到场。这场会议事先并未公开，且安排得极为仓促，监管层在内部将其定性为“系统性金融风险即将显现的明确苗头”。

一个尚未公开销售的AI模型，究竟拥有怎样的魔力，能在发布当天就触发美国金融监管最高级别的响应？Mythos背后所代表的能力跃迁，到底触碰了现代数字社会的哪根敏感神经？

一、Mythos到底有多强？

Anthropic在官方技术报告中给出的描述直截了当，甚至带有几分警告意味：在用户指令下，Mythos能够识别并利用“所有主流操作系统和所有主流网络浏览器”中的漏洞，其速度和规模显著超过了任何传统的人工渗透测试流程。

如果觉得这句话听起来有些抽象，那么从随后披露的测试数据中，我们或许能更真切地感受到那种技术代差带来的压迫感。

在针对Firefox浏览器的漏洞利用测试中，Anthropic的前代旗舰模型Opus 4.6即便尝试了数百次，也仅勉强写出了2次可用的攻击代码，成功率近乎可以忽略不计。而Mythos Preview在完全相同的测试环境下，不仅写出了181次有效的漏洞利用，另有29次尝试已经非常接近取得系统的完全控制权。这意味着成功率从前代模型接近于零的水平，直接拉升至72.4%。Anthropic的工程师们在报告中将这种跨越称为“数量级的跃迁”，这在AI能力进化史上极为罕见。

这种压倒性的优势同样体现在专业网络安全竞赛中。在名为Cybench的顶级基准测试里，Mythos取得了100%的满分成绩，成为有史以来第一个通关该测试的AI模型。这一成绩甚至直接迫使Anthropic内部的红色测试团队放弃了所有模拟挑战——因为他们意识到，唯一能够对Mythos构成有意义的评估手段，只剩下挖掘真实世界中的未知零日漏洞。在另一个名为CyberGym的漏洞复现基准上，Mythos的83.1%得分也远远甩开了Opus 4.6的66.6%。

更令人感到不安的是，Mythos发现的漏洞往往潜伏在人类专家眼皮底下数十年之久。其中一个最典型的案例发生在以安全性著称的OpenBSD操作系统中。Mythos找到了一个隐藏在TCP SACK实现里的内核崩溃漏洞，这段有问题的代码自1998年引入系统后就从未被修改过。漫长的27年间，它经历了无数次人工审计和自动化的模糊测试，始终安然无恙。而Mythos发现它的单次算力成本，还不到50美元。

仅仅是发布后的数周时间里，Mythos就在Linux内核、OpenBSD、Firefox以及广泛使用的多媒体框架FFmpeg中挖掘出了数千个高危零日漏洞，其中相当一部分的潜伏期都长达一二十年。Anthropic的一位内部工程师曾描述过这样一个场景：一个并没有深厚安全培训背景的开发人员，睡前让Mythos去自主寻找远程代码执行漏洞，“第二天醒来，邮箱里已经躺着一份完整且可直接运行的漏洞利用结果”。

Mythos最致命的才华并不仅仅在于发现单个漏洞，而在于它能像经验丰富的攻击者一样，将多个看似无害的小问题编织成一条完整的攻击链。在一个案例中，它自主组合了四个不同的浏览器漏洞，编写了高度复杂的JIT堆喷射代码，成功穿透了渲染器与操作系统的双重沙箱防护。在Linux内核中，它更是自主发现了一组环环相扣的漏洞，使得一个普通权限的用户可以在无人察觉的情况下悄无声息地提升至root级别的最高控制权。

尤其值得深思的是，Anthropic明确表示，这种强大的攻击能力并非刻意训练的结果。它更像是模型在代码推理能力和自主规划能力获得突破后产生的一种“附带产物”。换句话说，当你教会一个模型如何更好地修复代码漏洞时，它也自然而然地学会了如何更高效地摧毁它。

二、金融系统为何如此紧张？

如果说上述技术细节尚且停留在令安全专家惊叹的层面，那么美国财政部与美联储的紧急介入，则标志着Mythos已经从实验室里的技术议题，彻底升级为事关全局的系统性风险事件。

金融系统天然就是网络攻击者眼中的高价值猎物。银行的核心交易系统、清算网络一旦被突破，引发的绝不仅仅是数据泄露或者金钱损失那么简单，它可能导致支付中断、市场恐慌，甚至触发跨机构的连锁崩溃。而此次被紧急召见的银行，无一不是由金融稳定理事会认定的全球系统重要性银行，它们的稳健运行直接维系着全球金融市场的呼吸。

监管层之所以反应剧烈，根源在于Mythos彻底改写了网络攻击的成本公式。在过去，发现并武器化一个零日漏洞往往需要顶尖安全研究员长达数月的艰苦攻坚，其背后的经济成本动辄高达数十万甚至上百万美元。而现在，Mythos能够在几小时内以几十美元的电费完成同等质量的工作。这意味着，针对金融基础设施的高水平网络攻击，正从一种只有国家级力量才能负担的“奢侈品”，迅速滑向普通人唾手可得的“日用品”。

贝森特和鲍威尔展现出的反应速度也从一个侧面印证了事态的严重性。他们选择在模型发布当天直接对话各大银行的CEO，而不是向下传达给技术或合规部门。美国国家经济委员会主任凯文·哈塞特随后也对外表态，称政府“正在采取一切措施”，其中就包括Anthropic承诺在监管机构完成全面评估之前，暂缓该模型的公开发布。与此同时，华尔街的银行内部已经悄然行动起来，开始利用受限访问权限在封闭环境中测试Mythos，试图抢在潜在攻击者之前修补自身的致命短板。

警报声不仅仅在华盛顿响起。加拿大央行几乎在同一时间召集了该国主要金融机构，专门讨论Mythos带来的网络安全影响。英国央行也计划在未来两周内与各大银行、保险公司及交易所代表举行紧急会议，评估由Mythos暴露出的金融系统潜在漏洞。这种近乎同步的跨大西洋监管联动，清晰无误地传达了各国对于AI驱动新型网络攻击的共同忧虑——这是一场无人可以置身事外的考验。

三、风暴之外的涟漪

Mythos引发的冲击波远不止于监管机构的会议室，它同样剧烈地搅动了资本市场与软件生态的深层结构。

资本市场的反应来得直接且残酷。全球网络安全领域的标志性企业Cloudflare在Mythos发布后的短短四个交易日内，股价暴跌了22%，数十亿美元的市值凭空蒸发；另一家SaaS巨头ServiceNow更是一度惨遭40%的暴跌。投资者用真金白银投下了一张极度不信任票，其背后的逻辑令人心惊：如果一个AI模型能够以近乎为零的边际成本发现并利用漏洞，那么以出售安全服务为核心商业模式的传统SaaS公司，其存在的根基是否已经开始动摇？

与此同时，支撑着全球数字文明底座的开源软件生态也感受到了前所未有的压力。据统计，全球约97%的在用软件都或多或少依赖于开源组件，但它们的维护者往往是那些缺乏资金和人手的志愿者团队。知名命令行工具cURL的创始人Daniel Stenberg坦言，AI模型生成的海量漏洞报告已经让本已超负荷运转的开源维护者们喘不过气来。Linux基金会执行董事Jim Zemlin更是发出警告，在技术生态充分消化AI带来的冲击之前，攻击者很可能会获得一段显著的时间窗口优势。

有关能力扩散的忧虑也在蔓延。已经有专家指出，一些AI网络安全初创公司声称使用较小的开源模型复现了Mythos的大部分能力，这暗示着Mythos的威胁并非遥不可及的天顶星科技。更值得警惕的是，Anthropic自己也承认，Mythos“仅仅预示着即将到来的一波AI模型浪潮，它们将以远超防御者努力的方式利用漏洞”。

至于Anthropic做出的“不公开发布”决定，在业内也引发了截然相反的解读。支持者将其视为负责任的AI安全实践，是企业在商业利益与社会责任之间的艰难取舍；而质疑者则尖锐地指出，这种选择性发布或许同样隐藏着商业考量——在锁定苹果、微软等少数企业大客户的同时，也能有效阻止竞争对手通过“蒸馏”技术快速复制其模型成果。

四、谁在制造危险，谁在控制危险？

围绕Mythos上演的这出戏剧，还有一个心智观察所此前关注和讨论过的注脚。仅仅在一个多月前，美国国防部刚刚将Anthropic列为“供应链风险”对象，禁止国防部及其承包商使用该公司的技术，理由是Anthropic拒绝接受军方对于AI武器使用的特定要求。而在本周，联邦上诉法院刚刚驳回了Anthropic要求暂停该认定的紧急请求。

在被美国政府视为潜在的“供应链威胁”后，美国最高经济决策者又紧急召集会议，讨论这家公司所开发的模型可能引发的系统性金融崩塌风险。这在某种程度上，已经折射出了当下AI治理所面临的核心困境：那些最强大、足以影响社会运行规则的AI模型，往往诞生于少数几家私人企业的高墙之内。企业的安全决策正在直接影响全社会的风险敞口，而公共监管的框架却远远跟不上算法进化的脚步。

Mythos很可能仅仅是一段漫长序曲的第一个强音。OpenAI此前也曾发出过预警，称其即将推出的模型存在“高”级别的网络安全风险，并计划内部测试具有强大网络攻防能力的AI模型。更深远的变化在于，前沿实验室围墙之外的开放权重模型和开源模型也正在以惊人的速度追赶，攻击能力的平权化与扩散，几乎是一个不可逆转的历史进程。

在此次紧急会议中，美国监管层除了要求银行加强防御，实际上也鼓励他们“利用Mythos检测自身系统漏洞”。这等于变相承认了一个无奈的现实：面对即将到来的AI驱动攻击浪潮，最有效的防御手段恰恰是使用同样级别的AI武器。这是一场永无止境的军备竞赛，AI既是最锋利的矛，或许也将是我们唯一能指望的坚固盾牌。

Mythos事件的价值，并不在于告诉世人某一个特定的模型究竟有多么强大，而在于照亮了AI能力正从“被动信息处理”向“自主环境行动”跃迁的临界线。一旦模型不再满足于阅读和解释代码，而能够在无人干预的状态下自主发现弱点、编写攻击脚本、组合攻击链路，我们赖以生存的数字基础设施的安全范式，就必须迎来根本性的重估。

在这场前所未有的变革面前，尤其是下一个更强的模型在某个夜晚悄然觉醒时，我们是否真的做好了准备？

#Mythos风暴一个AI模型如何让华盛顿和华尔街同时拉响警报