2026.07.04 / 00:31 AM

腾讯玄武实验室阿图因 AI 在 CyberGym 测试中超越 Mythos

腾讯玄武实验室宣布，其研发的阿图因 AI 在加州大学伯克利分校主导的 CyberGym 网络安全基准测试中获得 84.0% 的得分，超过 Anthropic 的 Claude Mythos Preview。该工具基于可本地部署的开源模型 GLM-5.1 构建，消耗的预算不到 Mythos「玻璃翼计划」的 0.1%。

阿图因 AI 还在 curl、gnark、OpenSSL、Python cryptography、Java bc-java 等重要项目中发现了多个 Mythos 未检出的高危逻辑漏洞，评分最高达 9.3。在伯克利 BVI 真实世界漏洞榜单中，阿图因 AI 的严重漏洞严重程度排名第 1，总数排名第 5。