腾讯玄武实验室阿图因 AI 在 CyberGym 测试中超越 Mythos
腾讯玄武实验室宣布,其研发的阿图因 AI 在加州大学伯克利分校主导的 CyberGym 网络安全基准测试中获得 84.0% 的得分,超过 Anthropic 的 Claude Mythos Preview。该工具基于可本地部署的开源模型 GLM-5.1 构建,消耗的预算不到 Mythos「玻璃翼计划」的 0.1%。
阿图因 AI 还在 curl、gnark、OpenSSL、Python cryptography、Java bc-java 等重要项目中发现了多个 Mythos 未检出的高危逻辑漏洞,评分最高达 9.3。在伯克利 BVI 真实世界漏洞榜单中,阿图因 AI 的严重漏洞严重程度排名第 1,总数排名第 5。