Claude Mythos干爆评测上限,超指数增长逼近2027 AGI奇点!
就在刚刚Claude Mythos把评测干「失效」了METR第一次测不准AI攻防拐点已至。AI进化如「外星文明」降临超越指数增长2027 AGI奇点正加速撞向人类。刚刚Claude Mythos干爆METR评测上限超指数级进化已逼近AGI奇点。就在今天一张趋势图刷屏全网。国际最权威的AI评测机构METR惊恐地发现他们的「温度计」要被Mythos撑爆了。Claude Mythos Preview的能力已捅破人类评测框架的天花板进入「失真区」。OpenAI超级对齐团队前成员Leopold Aschenbrenner曾预测2027年是AGI的奇点但最新数据显示Mythos的表现已略高于2027情景的趋势线。「外星文明」已强行着陆阴影覆盖整片天空。在METR最新测试中试图衡量AI完成长周期复杂任务的能力Time Horizons。METR设置了「50%成功率时间线」指标即模型有50%概率成功独立完成一项人类需耗费X小时才能完成的任务。此前模型成绩是几十分钟或几个小时但Claude Mythos上场时数据直接爆表。它在人类需16个小时才能完成的极其复杂的长线任务上轻松达到50%的成功率。有人会问那测试32小时、64小时的任务呢METR给出的答案让人惊恐「我们测不了了。」在METR精心构建的228个魔鬼级测试任务中只有区区5个任务被归类为「16小时及以上」。这意味着人类现有的难题库已被AI彻底掏空。在16小时以上区间METR根本没有足够样本对Mythos进行准确的定量比较。METR坦言在这个阈值之上数据测算变得「不稳定且失去意义」。这是人类历史上罕见的一幕创造者失去了丈量被创造物能力的工具。当「考官」出不出题时「考生」的真实实力到底有多恐怖这不是一次常规的AI模型迭代而是一次「超指数级」的物种变异旧法则正在崩塌AI已成「外星文明」降临。AI从业者、硅谷著名观察家Chase Brower直言AI发展远超行业预期。根据SemiAnalysis的数据AI行业的年化营收已远超此前对2026年第二季度约260亿美元的预测。当前的AI技术如「清晰可见的外星飞船」悬浮在人类文明的天空中人类已无法理解AI的超指数增长这标志着AGI的征兆已完全显现。把METR趋势图拉出来细看纵轴是AI能自主完成的编码任务时长从8秒到5年对数刻度横轴是模型发布时间2021到2028每一个点是一个模型版本。把点连起来画出的不是直线也不是指数曲线而是比指数还陡的弧。AI在超指数增长增速本身在加速。2021年最好的模型能自主完成8秒级别的任务2023年初推到1分钟量级2024年中冲到大约1小时2026年4月Mythos Preview落点为16小时。每一代的跃升幅度都比上一代更大间隔时间都比上一代更短。人类大脑天生是线性的好不容易理解了「指数增长」现在却要面对指数之上的指数猿类大脑面对超指数直接集体宕机。METR在图上画了几条参考线基于多家机构联合预测假设AI能力按目前最主流的预期持续增长大约在2027年前后触达通用人工智能门槛。Mythos的数据点落在这条线的上方。AI基础设施从业者Chase Brower看完METR报告后在推特上判断那个预计在2026年初出现的Agent - 1描述低估了当前最好模型的能力整个行业对AI发展速度的预估都偏保守了。METR的纵轴不是跑分不是准确率不是某个benchmark上的百分比那条曲线目前没有任何减速的迹象。如果说METR的烦恼还是学术性的那么Palo Alto Networks的预警则是带血的实战报告。近期Palo Alto获得了Mythos、GPT - 5.5 - Cyber等前沿模型的早期无限制访问权限。测试结论让所有防御者脊背发凉AI已跨过「自主」的门槛。当模型能自主工作16小时时在安全领域能干什么Palo Alto的报告中有一个令人震撼的数据使用Mythos辅助进行漏洞分析仅3周时间其完成的工作深度和覆盖广度等同于一整个顶级渗透测试团队整整1年的工作量。以往的AI只能帮写脚本、搜代码片段但Mythos展现出「软件漏洞直觉」能识别上万行代码中零散、低危的小漏洞还能将这些漏洞串联成致命的攻击链。从初步入侵到数据拖库在AI辅助下整个过程被压缩到25分钟而过去这种级别的攻击可能需要一个团队潜伏数周才能完成。Anthropic曾因觉得Claude Mythos「太危险」而拒绝全面发布一度被嘲讽为PR手段但现在看来这更像是对未知的敬畏。Mozilla已开始行动利用Mythos扫描Firefox浏览器仅在2026年4月一个月内就修复了破纪录的423个安全问题。这说明AI也是最强的盾但前提是要比攻击者跑得更快。必须接受一个残酷的现实旧时代的防御节奏已彻底失效。检测响应时间不能再以「小时」计必须缩短到「分钟」甚至「秒」安全不再是人的审计而是「用AI对抗AI」的自动化博弈。与此同时资本侧也已all in。在过去5个月里英伟达向自己的客户注资约400亿美金300亿给OpenAI20亿给算力商CoreWeave32亿给光纤商康宁。这些钱最后都变成了英伟达芯片的订单显然黄仁勋正在用钱投票强行拉拽全产业链加速撞向奇点。但这套永动机在奇点坠落前根本无法停下。Chase Brower指出Anthropic的年化收入已远高于此前260亿美元的预测线资本市场已在用脚投票钱在押注那条曲线不会拐弯。2027年按照METR趋势图上那条中央轨迹线是多家机构联合预测的AGI门槛年份。Mythos已跑在这条线的上方。如果接下来18个月不出现根本性的技术断崖那么2027不再是一个需要辩论的预测而是一个需要准备的倒计时。AGI的奇点不再是预测而是正在发生的冲击外星文明已经来临。