中山广播电视台-Anthropic指控抄袭背后：中国AI模型约束中何以求发展？

TechWeb文/卞海川

在人工智能日新月异的今天，技术创新的边界与竞争规则的尺度正面临前所未有的考验。近期，一场关于“模型蒸馏”的指控将美国AI巨头Anthropic与深度求索（DeepSeek）、月之暗面（Moonshot AI）及MiniMax（稀宇科技）等中国顶尖AI实验室推向了舆论的风口浪尖。

Anthropic指控，都是蒸馏惹的祸

回顾整个事件，根据Anthropic发布的博客文章，其发现中国三家知名初创企业—DeepSeek、Moonshot AI及MiniMax通过约2.4万个虚假账号，与其Claude进行了超过1600万次对话。

对此，Anthropic认为，这些对话数据可能被用于训练上述公司的自研模型，构成对其服务条款的违反。而其条款是明确禁止通过自动化或隐蔽方式抓取数据进行“知识蒸馏”，同时限制其技术在中国境内的使用。

这里我们不得不解释下所谓的“知识蒸馏”，它是指利用一个大型、性能较强的“教师模型”生成输出，再将这些输出用于训练较小或不同架构的“学生模型”。需要说明的是，在学术界与产业界，这种技术并不罕见，尤其在开源模型生态中，蒸馏被广泛视为提升效率、降低成本的有效路径。

几乎同一时间，OpenAI在提交给美国国会相关委员会的备忘录中指出，部分中国公司正采用更为复杂的“混淆式蒸馏” *** ，通过掩饰来源与调用方式，持续获取其模型输出。虽然文件中未详细披露技术细节，但措辞中提及“国家安全风险”，并暗示若安全对齐机制在蒸馏过程中被剥离，可能带来潜在风险。

基于上述事件的重要性和关注度，其在舆论层面引发的争议也迅速升温。其中部分海外科技评论者认为，如果蒸馏行为确属违规，应当通过法律途径解决。也有人指出，AI行业本身建立在对海量互联网数据的抓取之上，美国公司同样因训练数据来源问题面临版权诉讼。事实上，Anthropic曾在版权纠纷中达成高额和解；OpenAI也正与包括媒体机构在内的原告展开诉讼拉锯，并由此形成一种颇具讽刺意味的“罗生门”。

具体表现为，一方面，蒸馏在技术上被视为常规手段；另一方面，当蒸馏对象是闭源商业模型时，其合法性与伦理边界又变得模糊。而从中国企业角度看，截至目前，被点名公司并未公开详细回应指控。

对此，行业内部人士普遍表示，在大模型训练中，公开数据、合成数据与模型生成数据往往交织使用，如何界定合理调用与违规抓取，需要更清晰的技术证据与法律标准。

争议背后，中国AI模型发展约束下亟待持续创新

如果我们深入剖析上述的争议，就必须回归到AI行业的技术底层逻辑。

如前述，知识蒸馏并非什么旁门左道，而是由深度学习先驱Geoffrey Hinton正式提出的核心技术。实际上，无论是 OpenAI还是Anthropic自身，在开发如Haiku这样轻量化的模型时，都广泛采用了蒸馏技术。而对于中国AI企业，在算力资源受限、先进芯片获取受阻的极端环境下，通过算法优化和高效的数据利用（包括蒸馏）来追赶全球领先的AI模型是一种必然且独特的工程创新路径。

然而，必须明确的是，“抄作业”是有天花板的。正如行业专家所言，蒸馏或许能让一个模型快速从60分进步到85分，但真正决定模型能否达到95分乃至更高分的是其底层的架构设计、预训练数据的原始质量以及对人类偏好的精准对齐。而这些“硬实力”是无法通过简单的对话提取来完成的。

事实上，Kimi K2.5和 MiniMax M2.5在海外开发者平台OpenRouter上的调用量一度占据榜首，更多是因为它们在中文语境理解、长文本处理和性价比上表现出了显著的差异化优势，而非单纯的模仿。至于DeepSeek，其也曾在其技术论文中坦诚，虽然互联网语料中不可避免包含AI生成的内容，但其核心进步依然源于算法的深度优化。

当我们站在更高的视角，此次事件对中国AI产业的长远发展具有深刻的启示。

首先，它预示着全球AI竞争已进入“全维度摩擦”阶段，技术争议往往会迅速演变为地缘政治工具。对此，中国企业除了提升技术硬实力，还必须构建更专业的合规防御体系，以应对日益复杂的条款约束和舆论审视；其次，这也倒逼国内实验室加速底层创新。毕竟当“蒸馏”被作为出口管制的借口时，唯有在高质量、自主可控的中文语料库建设以及基础架构创新上投入更多，才能彻底摆脱外界对于我们技术依赖的质疑。

写在最后：从Anthropic与OpenAI的公开指控，到中国大模型企业被推至风口浪尖，这场围绕“蒸馏”的争议折射出AI时代竞争逻辑的深层变化—既是技术路径之争，也是规则与话语权之争。

对于中国AI模型而言，短期内或许承受舆论与合规压力，但从长期看，事件也倒逼企业强化原创能力与合规体系建设，尤其是在全球人工智能加速演进的今天，真正决定胜负的，不仅是算力与数据，更是创新深度与规则适应能力。而如何在开放合作与自主创新之间找到平衡，无疑是中国AI产业持续发展的关键。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Anthropic指控抄袭背后：中国AI模型约束中何以求发展？

相关推荐：

网站分类

catalog