2026年Claude Opus 4.7全面上线:性能升级,多领域测试反馈亮眼!
全新模型登场2026年4月16日最新模型Claude Opus 4.7全面上线。在高级软件工程领域相较于Opus 4.6Opus 4.7有显著提升处理高难度任务表现出色。用户可放心将以往需密切监督的高难度编码工作交给它它能严谨稳定处理复杂耗时任务精准遵循指令还会在反馈结果前验证自身输出。能力大幅升级Opus 4.7的视觉能力大幅提升能以更高分辨率识别图像。完成专业任务时更具品味和创造力可生成更高质量的界面、幻灯片和文档。虽综合能力不如Claude Mythos Preview但在系列基准测试中表现优于Opus 4.6。网络安全考量上周宣布的 [Project Glasswing](https://www.anthropic.com/glasswing)强调了AI模型在网络安全方面的风险与益处。Claude限制了Claude Mythos Preview的发布范围并先在能力稍弱的模型上测试新的网络安全防护措施Opus 4.7便是首个此类模型其网络安全能力不如Mythos Preview训练时还针对性降低了这些能力。发布Opus 4.7时配备了防护机制可自动检测并阻止涉及违禁或高风险网络安全用途的请求。积累的经验将有助于最终广泛发布Mythos级模型。安全专业人员若希望将Opus 4.7用于合法网络安全目的如漏洞研究、渗透测试和红队行动可加入新的 [Cyber Verification Program](https://claude.com/form/cyber-use-case)。使用途径与定价即日起Opus 4.7可在所有Claude产品、API、Amazon Bedrock、Google Cloud的Vertex AI以及Microsoft Foundry上使用。定价与Opus 4.6一致每百万输入令牌收费5美元每百万输出令牌收费25美元。开发者可通过 [Claude API](https://platform.claude.com/docs/en/about-claude/models/overview)使用 claude-opus-4-7。早期测试反馈Claude Opus 4.7在早期测试阶段收获了积极反馈技术副总裁Clarence Huang表示它有望为开发者带来重大突破能在规划阶段发现自身逻辑错误加速执行过程。联合创始人兼首席技术官Igor Ostrovsky称它进一步提升了编码模型标准在内部评估中能出色处理现实世界中的异步工作流程。联合创始人兼首席技术官Caitlin Colgrove指出它是更智能、更高效的Opus 4.6低投入的Opus 4.7大致相当于中等投入的Opus 4.6。首席产品官Mario Rodriguez提到在93项编码基准测试中其解决率比Opus 4.6提高了13%。应用AI首席AI工程师Michal Mucha表示在多步骤工作中展现出最强效率基准在六个模块中总得分并列第一在“通用金融”模块中比Opus 4.6有显著提升。首席执行官Jeff Wang认为它拓展了模型在调查和完成任务方面的能力边界。首席研究官Sanj Ahilan称在多模态理解方面有重大改进。首席执行官Scott Wu指出将Devin中的长期自主性提升到新水平。总裁Michele Catasta表示升级到它是无需思考的决定在日常工作中更高效精确。应用研究主管Niko Grupen提到在Harvey的BigLaw Bench测试中展现出强大的实质准确性。联合创始人兼首席执行官Michael Truell称在CursorBench测试中能力有显著提升。AI负责人Sarah Sachs表示对于复杂的多步骤工作流程有明显提升解决率提高了14%工具错误减少了三分之一。应用研究主管Adithya Ramanathan提到核心编排代理的工具调用和规划准确性有两位数提升。企业AI总经理Yusuke Kaji称在Rakuten - SWE - Bench测试中解决的生产任务是Opus 4.6的3倍。AI副总裁David Loker表示对于CodeRabbit的代码审查工作负载来说是测试过的最出色的模型。联合创始人兼首席技术官Kay Zhu称在三个最重要的生产差异化因素上表现出色。创始人兼首席执行官Zach Lloyd表示对Warp来说是重大升级。联合创始人兼首席执行官Aj Orbach称是构建仪表板和数据丰富界面的最佳模型。首席AI官Ben Chan表示是Quantium测试过的最强大的模型。高级工程师Ben Lafferty称在智能方面有真正提升。首席执行官Oege de Moor提到在XBOW自主渗透测试的视觉敏锐度基准测试中得分从Opus 4.6的54.5%提高到了98.5%。杰出软件工程师Joe Haddad表示对Vercel来说是稳定升级。技术人员Leo Tchourakov称在Factory Droids的任务成功率上比Opus 4.6提高了10%至15%。首席执行官兼联合创始人Sean Ward表示自主构建了完整的Rust文本转语音引擎。联合创始人兼首席执行官Itamar Friedman称通过了之前Claude模型无法通过的三个TBench任务。神经网络首席技术官Hanlin Tang表示在Databricks的OfficeQA Pro测试中文档推理方面表现明显更强。软件工程师Austin Ray称在Ramp的代理团队工作流程中表现出色。首席执行官兼创始人Eric Simons表示在Bolt的长期应用构建工作中明显优于Opus 4.6。亮点与注意事项指令遵循Opus 4.7在遵循指令方面显著提升为早期模型编写的提示可能产生意想不到的结果用户应重新调整提示和测试工具。改进的多模态支持能处理高分辨率图像可接受长边最长为2576像素约375万像素的图像为多模态应用开辟广阔空间。实际工作应用在金融代理评估中领先更适合担任财务分析师在 [GDPval - AA](https://artificialanalysis.ai/evaluations/gdpval - aa)评估中也处于领先水平。记忆能力在使用基于文件系统的内存方面表现更出色能在长时间、多会话工作中记住重要笔记开展新任务减少对前期上下文的需求。评估结果展示以下图表展示了在预发布测试中该模型在不同领域的更多评估结果