TechWeb文/卞海川
在人工智能日新月异的今天,技术创新的边界与竞争规则的尺度正面临前所未有的考验。近期,一场关于“模型蒸馏”的指控将美国AI巨头Anthropic与深度求索(DeepSeek)、月之暗面(Moonshot AI)及MiniMax(稀宇科技)等中国顶尖AI实验室推向了舆论的风口浪尖。
Anthropic指控,都是蒸馏惹的祸
回顾整个事件,根据Anthropic发布的博客文章,其发现中国三家知名初创企业—DeepSeek、Moonshot AI及MiniMax通过约2.4万个虚假账号,与其Claude进行了超过1600万次对话。
对此,Anthropic认为,这些对话数据可能被用于训练上述公司的自研模型,构成对其服务条款的违反。而其条款是明确禁止通过自动化或隐蔽方式抓取数据进行“知识蒸馏”,同时限制其技术在中国境内的使用。
这里我们不得不解释下所谓的“知识蒸馏”,它是指利用一个大型、性能较强的“教师模型”生成输出,再将这些输出用于训练较小或不同架构的“学生模型”。需要说明的是,在学术界与产业界,这种技术并不罕见,尤其在开源模型生态中,蒸馏被广泛视为提升效率、降低成本的有效路径。
几乎同一时间,OpenAI在提交给美国国会相关委员会的备忘录中指出,部分中国公司正采用更为复杂的“混淆式蒸馏” *** ,通过掩饰来源与调用方式,持续获取其模型输出。虽然文件中未详细披露技术细节,但措辞中提及“国家安全风险”,并暗示若安全对齐机制在蒸馏过程中被剥离,可能带来潜在风险。
基于上述事件的重要性和关注度,其在舆论层面引发的争议也迅速升温。其中部分海外科技评论者认为,如果蒸馏行为确属违规,应当通过法律途径解决。也有人指出,AI行业本身建立在对海量互联网数据的抓取之上,美国公司同样因训练数据来源问题面临版权诉讼。事实上,Anthropic曾在版权纠纷中达成高额和解;OpenAI也正与包括媒体机构在内的原告展开诉讼拉锯,并由此形成一种颇具讽刺意味的“罗生门”。
具体表现为,一方面,蒸馏在技术上被视为常规手段;另一方面,当蒸馏对象是闭源商业模型时,其合法性与伦理边界又变得模糊。而从中国企业角度看,截至目前,被点名公司并未公开详细回应指控。
对此,行业内部人士普遍表示,在大模型训练中,公开数据、合成数据与模型生成数据往往交织使用,如何界定合理调用与违规抓取,需要更清晰的技术证据与法律标准。
争议背后,中国AI模型发展约束下亟待持续创新
如果我们深入剖析上述的争议,就必须回归到AI行业的技术底层逻辑。
如前述,知识蒸馏并非什么旁门左道,而是由深度学习先驱Geoffrey Hinton正式提出的核心技术。实际上,无论是 OpenAI还是Anthropic自身,在开发如Haiku这样轻量化的模型时,都广泛采用了蒸馏技术。而对于中国AI企业,在算力资源受限、先进芯片获取受阻的极端环境下,通过算法优化和高效的数据利用(包括蒸馏)来追赶全球领先的AI模型是一种必然且独特的工程创新路径。
然而,必须明确的是,“抄作业”是有天花板的。正如行业专家所言,蒸馏或许能让一个模型快速从60分进步到85分,但真正决定模型能否达到95分乃至更高分的是其底层的架构设计、预训练数据的原始质量以及对人类偏好的精准对齐。而这些“硬实力”是无法通过简单的对话提取来完成的。
事实上,Kimi K2.5和 MiniMax M2.5在海外开发者平台OpenRouter上的调用量一度占据榜首,更多是因为它们在中文语境理解、长文本处理和性价比上表现出了显著的差异化优势,而非单纯的模仿。至于DeepSeek,其也曾在其技术论文中坦诚,虽然互联网语料中不可避免包含AI生成的内容,但其核心进步依然源于算法的深度优化。
当我们站在更高的视角,此次事件对中国AI产业的长远发展具有深刻的启示。
首先,它预示着全球AI竞争已进入“全维度摩擦”阶段,技术争议往往会迅速演变为地缘政治工具。对此,中国企业除了提升技术硬实力,还必须构建更专业的合规防御体系,以应对日益复杂的条款约束和舆论审视;其次,这也倒逼国内实验室加速底层创新。毕竟当“蒸馏”被作为出口管制的借口时,唯有在高质量、自主可控的中文语料库建设以及基础架构创新上投入更多,才能彻底摆脱外界对于我们技术依赖的质疑。
写在最后:从Anthropic与OpenAI的公开指控,到中国大模型企业被推至风口浪尖,这场围绕“蒸馏”的争议折射出AI时代竞争逻辑的深层变化—既是技术路径之争,也是规则与话语权之争。
对于中国AI模型而言,短期内或许承受舆论与合规压力,但从长期看,事件也倒逼企业强化原创能力与合规体系建设,尤其是在全球人工智能加速演进的今天,真正决定胜负的,不仅是算力与数据,更是创新深度与规则适应能力。而如何在开放合作与自主创新之间找到平衡,无疑是中国AI产业持续发展的关键。