别睡了!Anthropic刚丢下AI界“核弹”:Claude Mythos正秘密接管互联网!
有个研究员正坐在公园里吃三明治手机忽然震了一下。发来邮件的不是同事不是老板而是一个被他关进密封沙盒、理论上完全断网的 AI。可偏偏这个模型竟然自己找到了“出去”的路。这个模型叫Claude Mythos Preview。 说真的我觉得这也许是 2026 年目前最重磅的一次 AI 官宣。它真正可怕的地方不在于它此刻能给普通用户带来什么而在于它让我们第一次隐约看见Anthropic 实验室里到底还藏着怎样的“底牌”。那么Project Glasswing到底是什么就在这周早些时候Anthropic 公布了一个名为Project Glasswing的计划。而在那条公告里真正值得所有人起鸡皮疙瘩的是一个被夹在其中的模型Claude Mythos Preview。这个模型并不向你我开放。它不在 API 里买不到也没有排队名单。之所以如此不是因为产品还没准备好而是因为它强得太特殊了。它寻找并利用软件漏洞的能力已经超过了任何一个现役黑客再往大一点说它甚至比全球最顶尖的人类安全专家都更能打。更关键的是这不是传说这是 Anthropic 自己造出来的东西。而 Anthropic 的反应也很不寻常。他们没有选择直接上线、按量收费、顺手把市场吃掉相反他们拉来几乎所有头部科技公司先用这个模型去修补互联网把能堵的洞尽量先堵上赶在坏人自己做出同类系统之前。 这一步意义完全不一样。参与者以及那笔钱站在 Glasswing 背后的联盟名单长得有点夸张AWS、Apple、Broadcom、Cisco、CrowdStrike、Google、JP Morgan、Linux Foundation、Microsoft、NVIDIA以及 Paloalto Networks。如果你对科技行业稍微有一点了解看到这串名字大概都会停一下。 因为这几乎就是安全与基础设施领域最核心的一桌人如今却坐在同一张桌上为的是同一件事。他们已经为这个项目承诺投入超过1 亿美元的使用额度。除此之外Anthropic 还直接向开源安全组织投入了400 万美元并额外让 40 家机构接入该模型用来扫描它们各自的系统。企业不会为了一个空洞的新闻稿随手写下九位数的支票。 之所以愿意真金白银下场是因为Claude Mythos Preview 已经在所有主流操作系统和主流浏览器中找出了数千个高危漏洞——其中不少很可能就潜伏在你今天正在使用的设备里而之前的人类安全团队压根没发现。Anthropic 这次几乎是在明牌 “这些洞我们比坏人更早看见了。既然如此那就先把它们补上。”这些基准测试到底意味着什么Agentic search and computer useMythos 与 Anthropic 当前公开最强模型Opus 4.6之间的差距并不是那种“快一点、准一点”的微小进步。 更准确地说它们已经不像在同一个量级里竞争了而像是站在了不同的层级。Agentic Coding在一个针对 Mozilla Firefox JavaScript 引擎进行漏洞利用开发的单项测试里Opus 4.6 在数百次尝试中只成功了2 次而 Mythos 成功了181 次。除此之外它还额外有29 次做到了完整寄存器控制。Reasoning在 Anthropic 内部的崩溃严重性基准中Opus 4.6 只1 次触及最高等级然而 Mythos 在目标系统已经打满补丁的前提下仍然10 次达到这一层级。它找到了横跨所有主流操作系统与主流浏览器的零日漏洞——也就是此前没人知道存在的漏洞。 其中最老的一个甚至来自 OpenBSD一个几乎把“安全”刻进骨子里的操作系统而那个漏洞已经静静躺了27 年直到被它翻出来如今才被修复。更夸张的是当人类安全专家回头审查它提交的漏洞报告时他们与 Mythos 的严重性判断89% 完全一致在98%的案例中双方的判断也只差一个等级。这已经不是普通意义上的升级了。 这几乎是在告诉所有人天花板被整体抬高了一大截。真正值得聊的不只是安全我真正想说的其实不是安全新闻本身。 当然安全这件事很重要而且非常重要然而它并不是这次公告里最值得反复咀嚼的那一层。真正的重点在于这条公告暴露了 Anthropic 当下真实的能力边界。你可以这样理解。 今天我们在用的 Claude Sonnet、Claude Opus是 Anthropic 判断为“已经足够安全、可以交给几百万人去用”的版本。可 Mythos 显然不属于这一类。它被做出来了但几乎是立刻就被判定这个版本不能公开。这意味着什么 意味着 Anthropic 的实验室里此刻很可能确实放着一批能力明显强于公众可接触版本的模型。 这不是我在阴谋论式地“脑补”而是他们亲自通过公告递出来的明确信号。公开的 Claude从来都不一定是最强的 Claude。 只是直到这一次我们才第一次比较具体地看见原来内部版本和公开版本之间那道鸿沟可能比很多人想象得大得多。这对正在做 AI 的人意味着什么如果你现在正在用 AI 做产品、搭流程、养习惯这反而是个相当让人兴奋的消息。因为每一次新的 Claude 版本被推向公众它都不是 Anthropic 手里“最新鲜”的那一个它只是那个经过红队测试、经过评估、并被认为适合大规模开放的版本。 而在公开版本之上往往还压着一层更强的能力只是那一层仍在被测试、被校准、被研究如何更安全地交到大众手里。而且这种“内部能力领先外部发布”的差距大概率不是在缩小反而可能还在继续拉大。 也就是说等到今年晚些时候新一轮公开 Claude 发布时它们背后依托的底层能力很可能已经超出了我们现在能想象到的范围。因此今天那些真正把 AI 用起来、做起来、磨出肌肉记忆的人未来会拥有更明显的先发优势。 另一边那些还停留在围观、怀疑、顺手点评阶段的人与前者之间的距离只会越拉越大。 Glasswing 的出现不过是把这件事摊开来讲明白了。我们仍然不知道什么这里我也想说得坦白一点因为这很重要。我们不知道它的具体架构 不知道它的真实成本而这很可能是关键变量之一 不知道它最明显的失效模式也不知道它最不擅长的边界到底在哪里 更不知道这类能力会在什么时候、以什么形式甚至会不会真正向公众开放。也许其中一部分能力会以限制更多的方式被释出也许有些能力会永久停留在受控环境里。 说到底我们现在真的不知道。不过站在安全披露的语境下看这种克制本身反而是合理的。 毕竟面对的是一个已经足以改变攻防平衡的模型。最后Anthropic 这一次显然不只是想把自己放在“聊天机器人公司”的位置上。 它更像是在告诉行业他们想参与建设的是整个互联网的安全基础设施而且他们已经拉来了一群愿意真金白银下注的巨头共同把这件事做下去。一个具体的模型。 一个具体的联盟。 一组强到不能轻易公开、却又重要到无法回避的能力。所以如果你现在已经觉得 Opus 和 Sonnet 很强那恐怕还只是开始。 Anthropic 这次等于掀开了一点帘子让我们偷看到天花板真正的高度。 而那高度老实说比大多数人心理准备中的还要高得多。最后精通 React 面试从零到中高级(针对面试回答)CSS终极指南Vue 设计模式实战指南20个前端开发者必备的响应式布局深入React:从基础到最佳实践完整攻略python 技巧精讲React Hook 深入浅出CSS技巧与案例详解vue2与vue3技巧合集全栈AI·探索涵盖动效、React Hooks、Vue 技巧、LLM 应用、Python 脚本等专栏案例驱动实战学习点击二维码了解更多详情。