Anthropic PBC今日宣布发布其迄今为止开发的最强大前沿模型预览版,该模型将提供给少数合作伙伴和网络安全研究人员,用于帮助保护全球软件安全。
这个名为Claude Mythos的模型作为新网络安全倡议Project Glasswing项目的一部分发布,将有超过40个合作伙伴专门将其用于"防御性安全工作"。据Anthropic表示,尽管Mythos最初并非为安全目的而训练,但它在识别专有和开源软件代码漏洞方面表现出色。
该公司表示不会向公众发布Mythos,因为它"过于强大",公开发布风险太大。
Claude Mythos首次于今年3月在《财富》杂志曝光的泄露信息中被披露。根据该报告,泄露细节描述Mythos比Anthropic现有的Claude Opus模型"更大、更智能",而Claude Opus是其目前最强大的公开可用产品。Mythos最初被设计为Claude的通用模型,具有极强的编码和推理能力,能够执行构建AI智能体和编写代码等任务。
Anthropic表示谨慎是必要的,因为"我们在Mythos预览版中观察到的能力可能重塑网络安全"。在过去几周测试Mythos期间,该公司表示已在网站和应用程序中识别出"数千个漏洞",包括当今使用的每个主要操作系统和网络浏览器。
Project Glasswing的合作伙伴组织包括亚马逊公司、苹果公司、博通公司、思科系统公司、CrowdStrike控股公司、Linux基金会、微软公司和Palo Alto Networks公司。此外,还将向约40个构建或维护"关键软件基础设施"的其他组织提供访问权限。
合作伙伴将与整个技术社区分享他们使用Mythos的学习成果,以便所有人都能从中受益并开发更安全的软件,Anthropic表示。为促进合作伙伴的研究,Anthropic已向Project Glasswing承诺1亿美元的使用积分,因此这些合作伙伴无需为其安全测试和研究支付应用程序编程接口费用。
据报道,该公司还与美国政府官员就给予他们Mythos访问权限进行"持续讨论",尽管这些谈判可能因公司与白宫的持续法律纠纷而复杂化。这是因为Anthropic最近被标记为"供应链风险",原因是拒绝让五角大楼将Claude用于自主武器瞄准或大规模监控。
关于Mythos的能力,Anthropic解释说,它最近在FFmpeg中发现了一个存在16年的漏洞,FFmpeg被数百个应用程序用于编码和解码视频。该漏洞在一行代码中被发现,而这行代码已被传统安全工具扫描超过500万次却从未被发现。更严重的是,Mythos还强大到足以立即为其发现的漏洞开发复杂的攻击代码,潜在地允许攻击者立即利用并开始造成损害。
但尽管Mythos可能极其危险,它也可以用于善事。思科首席安全和信任官Anthony Grieco表示,他的团队一直在使用该模型"以前所未有的速度和规模"查找和修复硬件和软件的安全漏洞。他说这代表了"深刻转变和明确信号,表明加固系统的旧方法不再足够"。
Anthropic表示其最终目标是使Mythos级别的模型能够由公众大规模部署,但要实现这一点,需要开发能够检测和阻止其最危险输出的网络安全防护措施。
如果这些防护措施能够得到构建和验证,Mythos将对软件开发人员特别有用。在衡量AI模型编码能力的SWE-bench Verified基准测试中,Mythos能够解决93.9%的所有问题,远高于Claude Opus 4.6的80.8%准确率。此外,Mythos在更具挑战性的SWE-bench Pro评估中达到77.8%的准确率,而Opus 4.6仅为53.4%。
Q&A
Q1:Claude Mythos模型有什么特殊能力?
A:Claude Mythos是Anthropic开发的最强大前沿模型,在识别专有和开源软件代码漏洞方面表现出色。它具有极强的编码和推理能力,能够执行构建AI智能体和编写代码等任务,在SWE-bench Verified基准测试中达到93.9%的准确率。
Q2:为什么Anthropic不向公众发布Mythos模型?
A:Anthropic认为Mythos模型"过于强大",公开发布风险太大。该模型不仅能发现漏洞,还能立即为发现的漏洞开发复杂的攻击代码,可能被攻击者立即利用造成损害。公司需要先开发网络安全防护措施来检测和阻止其最危险的输出。
Q3:Project Glasswing项目包括哪些合作伙伴?
A:Project Glasswing项目包括超过40个合作伙伴,主要包括亚马逊、苹果、博通、思科、CrowdStrike、Linux基金会、微软和Palo Alto Networks等知名公司。Anthropic为此项目承诺了1亿美元的使用积分,合作伙伴无需支付API费用进行安全测试和研究。