Back to Blog

PaperDog 论文解读

Paper
Anthropic 用 Claude Mythos Preview 联合 50 家合作伙伴,一个月发现超过 10,000 个高危漏洞。网络安全进步的瓶颈已经从"发现"变成了"修补"。
10,000+
高危/严重漏洞
50
合作伙伴
10×
漏洞发现提速

一个月一万多个高危漏洞

Anthropic 上个月启动了 Project Glasswing——用专门的 AI 模型 Claude Mythos Preview,联合全球约 50 家头部基础设施合作伙伴,对最关键的软件进行大规模漏洞扫描。一个月后的成绩单:超过 10,000 个高危或严重级别漏洞。

这个数字意味着什么?Mozilla 用 Mythos 测 Firefox 150,找到了 271 个漏洞,是上一版用 Claude Opus 4.6 测 Firefox 148 的十倍以上。Cloudflare 在核心路径系统里发现了 2,000 个 bug,其中 400 个高危或严重,而且误报率比人类安全工程师还低。Palo Alto Networks 最新一版的补丁数量是平时的五倍。

英国的 AI 安全研究所(AISI)报告说,Mythos 是第一个能端到端完成他们两个网络攻击模拟靶场的模型。独立安全平台 XBOW 的评价更直接:在 web exploit 基准上"token 效率绝对史无前例"。

瓶颈已经转移

这篇更新最核心的一句话是:网络安全进步的瓶颈已经从"能多快发现漏洞"变成了"能多快验证、披露和修补"。

这是一个质变。过去几十年,安全行业最大的痛点是找不到漏洞——攻击者可能利用一个未知漏洞潜伏几年。现在问题反过来了:AI 找漏洞的速度远远超过了整个软件供应链消化这些发现的能力。每一个漏洞的修补流程涉及确认、复现、编写补丁、测试兼容性、协调披露、等待部署——这个链条上的每个环节都还靠人,而且很多开源项目的维护者是志愿者。

Anthropic 自己也清楚这个问题。他们发布了 Claude Security 企业版漏洞扫描工具,三周内 Claude Opus 4.7 帮企业打了 2,100 多个补丁。但企业打补丁快,是因为他们在修自己的代码;开源世界的修补速度要慢得多。

Mythos 为什么还不公开

Anthropic 明确表示不会公开发布 Mythos 级别的模型。原因很简单:当前没有任何公司——包括 Anthropic 自己——开发出了足够强的安全防护,能防止这种模型被恶意使用。一个能自动发现上万漏洞的 AI,如果落到攻击者手里,后果不堪设想。

所以他们选择了 Glasswing 这条路:先把能力给防守方,建立不对称优势。同时开放了 Cyber Verification Program,让合法安全研究人员可以申请解除部分使用限制。

这意味着什么

从 AI 能力演进的角度看,Glasswing 的成绩说明了几件事:

第一,AI 在代码安全领域的应用已经从辅助工具变成了生产力倍增器。不是"帮人类看代码"的水平,而是独立发现人类找不到的漏洞,而且速度十倍于人类。

第二,软件安全行业的整个工作流程面临重构。传统的 90 天披露窗口、人工复现确认、志愿者维护者驱动的补丁流程,在 AI 的发现速度面前已经不够用了。需要新的基础设施来处理海量漏洞报告。

第三,AI 安全的讨论正在从"AI 能否做 X"转向"AI 已经能做 X,我们怎么应对"。Mythos 不是未来的威胁,它是当下的能力。真正的问题是:当多家公司都能训练出同类模型时,谁能先把这个能力变成防守方的武器。

Anthropic 的赌注很清楚:先帮好人把墙修好,坏人想翻墙的时候就翻不过去了。但时间窗口不会永远存在——他们自己也承认,"Mythos 级别的模型很快会被多家 AI 公司开发出来"。防守方跑得必须比进攻方更快,而这个速度差距正在被 AI 快速拉平。

Glasswing 不是一篇技术论文,但它比大多数论文都更紧迫。它描述的世界已经在发生:AI 发现漏洞的能力已经超越了人类修补漏洞的能力,而这个差距还在扩大。

Tags: #Paper