Warning: sprintf(): Too few arguments in C:\wwwroot\www.xizhenhl.com\wp-content\themes\covernews\lib\breadcrumb-trail\inc\breadcrumbs.php on line 254

走访大半个中国AI圈后,一位美国研究员看到了最真实的中国AI

本文来自微信公众号: 硅基观察Pro ,作者:硅基君

一直以来,中美AI的发展差异,始终是行业讨论的核心话题。

美国负责创新,中国负责产业化,几乎已经成了很多人的共识。

但过去,大多数讨论都停留在外部视角:谁的模型更强、融资更多、产品更领先。真正从AI实验室内部出发,去观察中美研究文化、组织方式和技术生态差异的人,其实并不多。

不久前,美国AI研究员Nathan Lambert访问了多家中国AI实验室,包括月之暗面、智谱等等,并在之后撰写了一篇长文,系统分享了他对中国AI产业的观察。

Nathan Lambert曾在Meta AI、DeepMind、Hugging Face等机构工作,也是AI行业里颇具影响力的研究者和独立观察者之一。

在他的视角里,中国AI的竞争力,并不只是“追赶速度快”这么简单。更深层的差异,来自工程文化、人才结构、组织方式,以及中国科技公司对于技术栈控制权的重视。

某种程度上,这篇文章也提供了一个难得的“内部视角”——帮助我们理解,中国为什么能够在这一轮AI竞争中,始终紧紧咬住美国,甚至在部分方向上开始形成自己的优势。

以下是Nathan Lambert文章内容:

/01/

为什么中国实验室更适合“今天的大模型”

中国的大模型公司,某种程度上可以说是“快速追赶型技术体系”的最佳样本。

如果只看结果,中美之间其实已经非常接近。无论是支持Agent工作流的新一代模型,还是研究人员、数据规模、算力资源等基础条件,中国头部实验室与美国前沿实验室之间的差距,已经远没有外界想象得那么大。

真正的差异,不在资源本身,而在于这些资源是如何被组织、管理和激励的。

Nathan Lambert在与大量中国AI实验室交流后,一个最强烈的感受是:中国的组织文化,可能天然更适合当前这一阶段的大模型竞争。

因为今天的大模型研发,本质上已经不再是单点突破,而是一场复杂的系统工程。

从数据清洗、模型架构、训练策略,到强化学习、后训练、Agent能力,每一个环节都可能带来提升。但真正困难的地方在于,如何把这些细碎优化整合成一个整体。

很多时候,一个模型是否足够领先,并不取决于某一个“天才想法”,而取决于整个团队能否持续围绕最终结果做协同优化。

而这恰恰是中国实验室相对擅长的部分。

在Lambert看来,美国AI研究文化更强调个人表达。研究人员需要不断强调自己的贡献、技术路线和个人影响力,才能获得更高的认可。随着AI行业影响力不断扩大,“明星AI科学家”甚至正在变成一种新的名望路径。

但这种文化,也会带来副作用。

因为当模型研发越来越依赖团队协同和多目标优化时,过强的个人表达欲、技术路线之争,以及组织内部的利益博弈,反而可能影响最终模型效果。

外界一直有传言称,Llama后期内部出现了明显的组织问题,本质上就是不同研究方向、不同利益群体不断嵌入层级组织后产生的结果。

Lambert甚至提到,有实验室需要额外补偿顶级研究人员,才能让他们接受自己的方案没有被纳入最终模型。

这些细节未必完全真实,但背后的逻辑很明确:

当大模型竞争进入“系统工程”阶段后,个人ego和职业晋升诉求,本身就可能成为研发效率的一部分阻力。

而中国实验室在这方面,恰好呈现出另一种气质。

很多中国AI实验室里,大量核心贡献者仍然是在校学生。整个团队也更年轻。学生会被直接纳入核心研发体系,而不是只做边缘性工作。

这与美国顶级实验室形成了鲜明对比。像OpenAI、Anthropic、Cursor等公司,几乎都不提供真正意义上的核心实习机会。即便是Google DeepMind的Gemini相关实习,很多人也担心只能接触到相对边缘的工作。

而中国实验室这种更“开放”的组织方式,反而带来了几个优势。

第一,中国研究人员更愿意做那些“不够光鲜”的工作。

大模型能力提升,很多时候并不来自论文里的惊艳创新,而来自无数细节优化。大量中国工程师愿意长期投入这些基础工作,只为了让最终模型效果再提高一点。

第二,年轻研究人员没有太强的历史路径依赖。

过去几年,大模型技术路线变化极快,从MoE到强化学习,再到Agent,几乎每隔一段时间,行业范式就会发生变化。

很多年轻研究人员没有经历过上一轮AI周期,因此更容易快速接受新的技术方向。

第三,组织内部的“政治摩擦”更少。

因为整体ego相对更弱,很多人更倾向于围绕最终结果协同,而不是持续强调个人贡献。这使得组织扩张时的阻力更小。

第四,中国拥有极其庞大的工程型人才供给。

尤其擅长解决那些已经被验证方向正确,但仍需要大量工程化优化的问题。

当然,这也对应着外界长期以来对中国AI的一个典型评价:

更擅长工程化追赶,而不是“0到1”的原创突破。

Lambert在交流中也发现,很多中国实验室已经意识到这个问题。一些偏学术的负责人,正在尝试培养更具原创性的研究文化。

但与此同时,也有不少技术负责人对此持怀疑态度。

因为原创能力的形成,并不是靠几家公司就能完成的,它背后涉及整个教育体系、激励机制乃至社会结构。

短时间内,很难彻底改变。

但至少在当前这一轮大模型竞争里,中国教育体系确实正在持续输出大量非常适合“AI工程战”的学生和工程师,而且数量极其庞大。

与此同时,中国也正在经历与美国类似的人才流向变化:越来越多原本想留在学术界的人,开始转向产业界。

其中最有意思的一句话,来自一位研究人员。

他说,自己曾经想成为教授,因为这样能更接近教育体系。

但后来他意识到:

“既然有了LLM,学生为什么还要来找我?”

除此之外,Lambert还提到一个很有意思的观察:中国年轻AI研究人员普遍非常“直接”。

他们很少像美国AI圈那样,持续讨论AGI、社会风险、意识形态或AI哲学。

当Lambert询问他们对AI长期经济影响、社会结构变化等问题怎么看时,很多人的反应甚至会有些困惑。

因为在他们看来,自己的核心任务非常简单:

把模型做得更好。

这种差异非常微妙。

只有当你和一位极其聪明、英文流利、表达能力很强的研究人员长时间交流时,才会明显感受到:

一旦话题进入AI哲学层面,他们会突然露出一种“为什么要讨论这个”的不解。

对他们而言,这甚至像是一种“分类错误”。

有位研究人员甚至引用了一句话:“中国是工程师治国,美国是律师治国。”用来解释中国为什么更强调建设、执行和工程落地。

某种程度上,这也解释了为什么中国AI圈里,很少出现类似Lex Fridman或Dwarkesh Patel这样的“明星AI传播者”。

因为中国整个行业的文化重心,本身就更偏向“把东西做出来”,而不是持续围绕技术本身展开公共讨论。

/02/

中国AI更像“生态系统”,而不是“部落战争”

北京给我的感觉,其实很像旧金山湾区。

实验室之间距离很近,打车就能到。我下飞机后,先顺路去了阿里北京园区。之后36小时里,我们又连续拜访了:Z.ai、月之暗面、清华大学、美团、小米、01.ai等公司。

研究人员之间跳槽也很频繁,这一点和美国非常像。

但不同的是,中国的大模型圈,更像一个“生态系统”,而不是彼此敌对的部落。

私下交流时,我几乎感受不到美国实验室之间那种明显的火药味。

所有中国实验室都非常忌惮字节跳动,因为豆包是中国唯一真正意义上的前沿闭源实验室。

与此同时,大家又都非常尊敬DeepSeek,认为它是研究品位最好的实验室。

而在美国,如果你私下和实验室成员交流,很多时候很快就会进入激烈争论。

/03/

中国AI行业,与西方最大的不同

如今,AI公司已经不仅仅是在“训练模型”。

它们还要解决部署、融资、推广、商业化、生态建设等问题。

美国生态已经形成了一套相对成熟的模式,以OpenAI、Anthropic为代表。

但中国公司的思路,有不少不同,有这样几个观点让我印象深刻:

1.中国AI需求,可能比外界想象的大

很多人认为,中国AI市场会比较小,因为中国企业不愿为软件付费。

但这个逻辑,其实主要适用于SaaS。而中国虽然SaaS不强,却拥有非常庞大的云计算市场。

一个关键问题在于:AI更像SaaS,还是更像云?

中国实验室内部也在争论这个问题。但整体来看,AI更像云计算,而不是传统软件。

因此,大多数人并不担心未来没有足够大的AI市场。

2.中国开发者几乎都在用Claude

尽管Claude名义上在中国不可用,但中国开发者几乎都对它非常痴迷。

很多人都认为,Claude极大改变了他们的软件开发方式。有些人也会提到Kimi或GLM CLI,但几乎所有人都会提Claude。

反而让我意外的是,几乎没人提到Codex。而Codex在硅谷最近非常火。

3.中国公司有很强的“技术所有权意识”

这一点非常重要。很多中国科技公司,并不是为了蹭热点才做大模型。

而是因为它们认为,未来最重要的技术能力,必须掌握在自己手里。

这也是为什么美团、蚂蚁、小米这些公司,都会自己做LLM。

如果放在美国,同类公司更可能直接采购OpenAI或Anthropic的服务。

中国公司的逻辑则是,即使使用通用模型,也必须掌握自己的技术栈,并保留自己的内部微调版本。

所谓“开源优先”,本质上也是一种务实策略:开源可以帮助模型获得更多反馈,增强生态影响力,也能帮助自身迭代。

4.政府支持确实存在,但很难量化

中国政府对AI的支持是真实存在的。但它到底有多大,目前外界很难真正判断。

北京很多区域都在争夺AI公司入驻。政府提供的帮助,可能包括审批、办公资源、人才支持等。

但究竟能深入到什么程度,很难说。整个访问过程中,我们听到了很多关于“政府支持”的说法,但很少有人能给出明确细节。

不过有一点很明确:没有任何迹象显示,中国政府高层会直接干预模型技术路线。

5.中国的数据产业,仍然明显落后

美国很多AI公司,会花数亿美元购买RL环境和训练数据。

但中国实验室普遍认为,国内数据服务质量不够好。因此,它们更倾向于自己搭建训练环境、自己做数据。很多研究人员本身就会参与RL环境构建。

而字节、阿里这种公司,则拥有自己的数据标注团队。这其实也符合中国企业整体的“自建优先”思维。

6.所有人都极度缺GPU

英伟达GPU依然是训练前沿模型的黄金标准,所有实验室都缺。

如果供应足够,他们一定会大量购买。当然,华为芯片在推理侧也获得了很多积极评价。很多实验室都已经能使用华为芯片。

/04/

总结,全球AI正在进入一种新的平衡

这趟中国之行让我意识到,中国并不是一个能简单用“规则”或者“模板”去理解的地方。

它拥有完全不同的文化、组织方式和技术生态。而这些东西,正在深刻影响AI的发展路径。

中国实验室并不一定是“开源理想主义者”。但它们非常重视开发者生态,也非常强调技术栈控制权。

几乎所有大型中国科技公司,都在做自己的通用大模型。

这不是因为跟风,而是他们真的相信,未来最重要的技术,必须掌握在自己手里。

当我从电脑前抬头,看见远处无数起重机时,我会非常自然地觉得:这种技术建设欲望,与整个中国社会的气质,其实是一体的。

最让我触动的,是中国研究人员身上的真诚、热情与温和。

美国那种激烈的地缘政治情绪,并没有明显影响到他们。

世界或许需要更多这种简单、直接的积极感。

当然,作为美国人,我依然希望美国实验室在AI各个层面保持领先。

但与此同时,我也希望全球开放AI生态能够继续繁荣。

因为这意味着,更安全、更开放、更普惠的AI。

#走访大半个中国AI圈后一位美国研究员看到了最真实的中国AI

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注