Claude Code 挖掘简报
从泄露的 Claude Code 的源代码来看,多方向信息渠道为我们带来了一些有意思的观察,我们总结当前时间可以关注的一些内容。当然我们相信更多的内容和借鉴意义在于 Claude 模型本身如何被合理的使用,这是代码中体现的工程价值,这种能力有助于任何想要持续挖掘和理解 Claude 系列模型的工程师所借鉴。
以下是当前挖掘的部分信息:
1. 新模型
src/utils/model/model.ts:388:体现出的 capybara-v2-fast(1m),但是之前提到的 Mythos 系列模型并没有展现。
src/constants/prompts.ts:204:展现出该模型的一些特点:
对 \n\nHuman: 停止序列敏感、v8 版本有过度注释倾向(29-30% 虚假声明率)、受保护的思考块(protected-thinking block)。
详细信息参考 X 推文
src/utils/undercover.ts:48-49:Opus 4.7 / Sonnet 4.8 在泄露的代码中不作为实际存在的模型出现,而是作为未发布版本的示例,所以可以认为这两个系列的模型的更新需要观察,同时可能需要分析 capybara 模型同现有模型的关系。
2. 风控与遥测机制
收集的核心信息为:deviceId(**设备唯一标识(持久化 UUID)**)、sessionId(会话标识)、email、organizationUuid、accountUuid、subscriptionType、rateLimitTier、firstTokenTime(首次使用时间戳)、githubActionsMetadata(GitHub Actions 环境元数据),此外还会上报:环境元数据(系统信息: platform ,platform_raw, arch, node_version, terminal, package_managers, runtimes 以及一系列的部署环境标识)、进程指标、使用情况(不做过多展开)。
3. 仓库指纹(URL Hash)策略
获取 Git remote URL 后进行标准化,然后 SHA256 哈希取前 16 个字符以 rh 的字段上报,这也是为何我们不建议使用 Claude Code 直接链接仓库进行分析的原因,当然,还有一些潜在的 Prompt 识别策略等共同促使我们发出警告。
4. 彩蛋: Claude Code Buddy