Anthropic Claude Code 移除用户代码引关注
近日,一款名为 Claude Code 的程序被曝出一段在用户不知情的情况下秘密运行了三个月的代码,这段代码从 4 月 2 日持续到 7 月 1 日,期间并未发布任何更新日志或官方文档披露。
通过对二进制文件的深度拆解和多版本源码的逆向分析,安全研究人员发现该隐藏代码的核心功能是识别使用该产品的国内用户,以及通过国内 AI 企业代理接口访问该产品的使用者。其识别设计极为隐蔽,采用了 Unicode 隐写技术,利用接口请求中的日期文本作为秘密传输载体,普通用户难以察觉异常。

这段代码在识别国内用户时,会启动两项校验机制:一是核对设备时区,二是校验加密域名黑名单。该黑名单在解密后包含百度、字节、MiniMax 等上百家国内 AI 企业及中转域名,覆盖范围极广。一旦匹配到国内时区或代理域名,文本字符就会被悄悄替换为特殊的 Unicode 符号,以便后台精准标记用户,但这些替换在肉眼看来难以分辨差异。
此外,该代码还内置了反蒸馏标识,一旦命中目标,便会自动注入虚假工具调用数据,旨在干扰第三方利用其输出训练自研大模型。尽管官方事后解释称此功能仅为防范账号倒卖的短期实验,并在新版程序中已移除相关代码,但这一机制的设计和执行方式引发了广泛争议。加密混淆域名清单的长期隐藏和不公示,可能导致大量合规使用内网代理的国内企业用户被误标记,从而带来显著的隐私和使用风险。该事件的发生时间也颇具巧合,正值美方部分模型出口限制解除之际,识别代码丑闻的同步曝光,形成了强烈的反差,极大地损害了开发者对产品的信任基础,因为开发者工具本应拥有读取本地代码、修改文件等高权限,底层隐藏未告知的检测逻辑无疑是严重的信任危机。
Claude Code 作为一款开发者工具,其隐藏检测逻辑的行为,尤其是涉及到用户识别和潜在的数据干扰,对于开发者而言,意味着其使用的工具可能存在未知的隐私泄露和数据滥用风险。这对于依赖这些工具进行开发和模型训练的国内开发者群体来说,不仅增加了使用门槛(需警惕潜在的隐私问题),也可能对模型的训练数据质量和安全性产生不确定性影响。在 AI 领域,数据安全和隐私保护是构建信任的基石,此类事件的出现,无疑是对行业内透明度和用户信任的重大挑战。