AI智能总结
对DeepSeek AI人才的深度洞察及其对美国创新的启示 由艾米·泽加特和艾默生·约翰斯顿 2025年4月21日 对DeepSeek AI人才的深度洞察及其对美国创新的启示 由艾米·泽加特和艾默生·约翰斯顿 中国初创企业DeepSeek AI颠覆了人工智能(AI)创新的传统观念。发布于2025年1月,该公司的 R1 语言模型和 V3 通用大型语言模型 (LLM)sent市场波动,并挑战了美国在尖端人工智能发展领域技术优越性的假设。1Although DeepSeek AI’sclaims(专家们)认为其V3型号的训练成本仅600万美元的说法已引起广泛争议。估计真正的计算成本接近5亿美元,并且DeepSeek AI自己也表示成本仅针对最终的训练运行),基于V3构建的R1模型展现了前所未有的推理能力和技术成就,超越了美国公司先前设定的基准。 在DeepSeek的技术成就之下,隐藏着一个更为重要的故事:全球AI人才的流动模式,这些模式促成了公司的突破性进展。本文考察了2024年1月至2025年2月间撰写DeepSeek五篇奠基性论文的200多名研究人员的教育背景、职业路径以及国际流动情况。这五篇论文构成了公司自2023年成立以来的公开研究论文集合。 我们发现有力证据表明中国已培养出一支强大的本土人才队伍。DeepSeek的五篇论文背后几乎所有研究人员都接受过中国教育或培训。其中超过一半never有赴中国留学或工作,这表明中国通过完全本土化的培养管道发展世界级AI人才的日益增强的能力。同时,虽然近四分之一的DeepSeek研究人员在其职业生涯中在美国机构获得过经验,但他们大多数人都回到了中国,形成了一种单向的知识转移,这有利于中国的AI生态系统。 这些人才模式对美国技术领导地位构成了根本性挑战,单靠出口管制和计算投资无法解决。深Seek是一个关于人力资本——而不仅仅是硬件或算法——在 geopolitics 中发挥的至关重要作用,以及美国人才优势正在削弱的预警指标。 方法 DeepSeek AI, 一家中国人工智能研究公司专注关于“高性价比、高性能语言模型”,在2024年至2025年间,发布了五篇论文于康奈尔大学的arXiv.org手稿存档。2共计223位作者被列为五篇论文的贡献者。我们能够对其中的211篇进行全面的综述。3Using data from theOpenAlex2025年2月收集的研究目录中,我们收集了详细的作者资料(发表记录、引用指标、自1989年起的研究机构隶属关系)以及全面的机构数据(地理位置、组织类型、研究产出指标),并特别关注了对时间变化的追踪。4随后,我们通过定制的Python脚本进行数据收集和分析,绘制了每位研究者的完整机构历史,揭示了此前未被发现的跨境流动模式。传统分析往往依赖特定时间点上的人才静态快照,而我们的方法使我们能够量化人才不仅今天的分布,还在于其随时间在国家间的流动——特别是中美之间的流动,捕捉到代表战略性知识转移机制的“反向人才流失”案例。 DeepSeek 的 talent infrastructure 跨五篇论文 共有223人被列为DeepSeek的五篇论文中的贡献者(见图1)。我们的分析发现,有31名研究人员(约占总数不到14%——)作者团队对五篇论文都做出了我们所谓的“核心团队”的贡献。) 5另50位作者参与了四篇论文的撰写,64位作者贡献了三篇论文,55位作者列名于两篇论文,以及22位研究人员仅贡献了一篇论文。 如表1所示(见附录B), DeepSeek在五篇论文中使用了人才角色的动态分类。在第一篇论文《DeepSeek大型语言模型》中,报道的贡献者标签偏向组织而非基于角色,将53人分类为业务团队(8人)、合规团队(7人)、数据标注团队(36人)和设计团队(2人)。值得注意的是,这些标注的贡献者并未在论文本身被列为作者,而官方列出了86位作者。然而,其中40位贡献者在后续至少一篇DeepSeek论文中被列为作者——这也是他们在此被记录的原因。这种差异可能表明,第一篇论文的贡献者名单反映了一个更广泛的内部合作群体——当时许多人是非正式合作的,但随着项目的推进,他们后来获得了作者署名权。 论文2和论文4似乎已转入更侧重功能描述的类别,这些类别与内部团队结构高度相似。论文2引入了混合贡献者标签,如“业务与合规”、“数据标注”和“研究与工程”。在156名总贡献者中,绝大多数(105人)被归类为研究与工程,其次是数据标注的31人,以及业务与合规的18人。值得注意的是,2名贡献者——叶胜峰和徐艳红——被列在多个类别中:叶胜峰同时出现在研究与工程和业务与合规类别中;徐艳红则被归入研究与工程和数据标注类别,这可能反映了组织内部的职责重叠。论文4(DeepSeek V3),列有197位作者,采用了相同的分类结构:研究与工程(148人)、数据标注(30人)和业务与合规(17人)。同样,叶胜峰和徐艳红是唯一被分配到两个类别的贡献者——叶胜峰属于研究与工程和业务与合规;徐艳红属于研究与工程和数据标注。这种分类似乎捕捉了DeepSeek技术工作的核心。在此结构中,31人关键团队的几乎所有成员都被指定为研究与工程贡献者,有一个显著的例外——徐艳红,如前所述,她在论文2和论文4中同时担任数据标注的角色。 论文3和5通过二分法引入了贡献级别的不同界定:贡献者和核心贡献者。这一转变可能表明对研究小组内层级地位的正式认可。在论文3中,仅39位贡献者中的4位被标记为核心贡献者。类似地,论文5——公司备受国际关注R1推理模型——在194位总贡献者中指定了18位核心贡献者。在这两种情况下,核心贡献者约占总贡献者基础的10%,表明精心挑选的领导层级。值得注意的是,论文3中的四位核心贡献者——郭大、杨德建、朱启豪、 以及赵志宏——也被列为论文5中的核心贡献者,并且四人都为DeepSeek的五篇论文中的每一篇做出了贡献,这很可能表明他们对DeepSeek项目具有核心的长期影响力。 DeepSeek研究人员引用指标:并非真的绿色。 主导叙事一直认为DeepSeek的成功归功于年轻的、经验不足的研究人员。然而,引文指标表明DeepSeek的人才实际上并不那么青涩。 尽管DeepSeek的合作结构在参与层级上表现出明显的差异,但不同层级之间的学术经验也存在显著变化。在能够获取数据的211名贡献者中,平均每位研究人员发表了61篇作品,获得超过1000次引用,h指数为10.8,i10指数超过19。6值得注意的是,这些平均值掩盖了双峰分布:许多研究者的学术影响力相对较小,但一个集中的群体在产出和影响力上则远超其他研究者。对于这一群体的中位数引用次数(249)、h指数(7)和i10指数(5)均凸显了这种内部差异。 值得注意的是,为所有五篇论文做出贡献的31名核心团队研究员尤为突出。该团队的平均每位作者引用次数为1,554次,中位数为501次,平均h指数为13.5,i10指数为25.5。中位数——h指数10次和i10指数11次——进一步表明核心团队的影响是持续的,而不仅仅是少数极端值。这些指标提供了额外证据,表明DeepSeek核心团队由具有已获认可学术记录的研究员组成。 当与来自世界顶尖人工智能实验室的一个同行群体进行比较时,这一学术优势变得更加明显。根据来自OpenAI o1系统卡的数据(arXiv:2412.16720), 该发布中列出的265位作者的团队平均引用次数为4,403,但中位数为仅338,表明在少数高度被引用的个人之外存在急剧下降。此外,该群体的中位数h指数仅为6,i10指数为4,反映出在整个群体中影响的一致性更为有限。 相比之下,DeepSeek的完整作者群体及其核心团队在平均表现和中位数表现之间展现出更佳的平衡——这表明不仅在于顶尖实力,而且与OpenAI团队相比,各贡献者之间的差异较小。这些模式可能表明其学术经验基础分布更为均衡,而非过度依赖少数杰出人物。DeepSeek的研究引擎 似乎不仅深邃而且广阔——这是一种组织特质,随着基础模型开发领域竞争的加剧,可能将尤为重要。 Taken together, these comparisons challenge the媒体叙事DeepSeek的迅速崛起是由“未经检验”或经验不足的研究人员推动的。尽管OpenAI继续获得全球认可,但DeepSeek的核心贡献者——至少根据传统的文献计量标准——在突破性成果取得时,其发表成果更为突出,引用更为持续,并且可能拥有更强的学术地位。7 对制度隶属关系的一个纵向视角:中国的主导地位 纵向观察201 DeepSeek作者(已知隶属关系数据),我们发现超过一半(n=111)接受过训练并拥有隶属关系。独家地在中国机构中度过整个职业生涯——这证明了中国在培养世界级AI人才方面的能力日益增强,而无需依赖西方专业知识。此外,DeepSeek作者的绝大多数——89%(n=197)至少与一个中国机构有过去或现在的联系。 四位作者似乎完全没有在中国进行过学习、培训或工作。他们的学术和专业背景涵盖了全球多家机构:李尔杭(Erhang Li)在英国和美国接受培训,现为英特尔英国(Intel UK)的成员;王宇庆(Y. Q. Wang)在德国约翰内斯·格劳特大学(Johannes GutenbergUniversity Mainz)学习;王雨沣(Yuduan Wang)在新加坡国立大学(National University of Singapore)接受教育;黄攀攀(Panpan Huang)在美国普渡大学(Purdue University)学习。虽然这些个体代表了更广泛的DeepSeek生态系统中的例外,但他们的案例凸显了全球人工智能研究界的国际性。然而,他们的数量之少反映出这条路径在DeepSeek贡献者中的普遍性程度之低——进一步强化了这样一个观察结果:中国的本土培养体系现已能够主要依靠自身力量培养世界级的人工智能研究者。 我们发现只有四分之一的DeepSeek研究员(24.3%,n=49)曾经与美国机构有过学术或职业关联——这进一步说明美国机构在这批研究人员形成过程中所起的作用有限。 中国主导着2025年机构隶属关系的快照。 如图2所示,在201名拥有已知隶属关系数据的DeepSeek作者中,有171位在2025年(可获取的最新年份)隶属于中国机构。8 目前只有7%的研究者(n=15)拥有美国本土的隶属关系。这些职位包括知名研究型大学(如石溪大学、北德克萨斯大学和旧金山加州大学)、医疗机构(如波士顿儿童医院)以及科技或生物技术公司(包括谷歌、奥图泰卡和健康第一)。其余研究者分散在少数几个其他国家,包括澳大利亚、加拿大、英国和新加坡,同时在德国、爱尔兰、巴拿马、波兰和台湾也有个别案例。这种地理上的集中趋势围绕中国进一步强化了其国内机构的核心作用——不仅是人才培养基地,更是人工智能领域长期职业发展的目的地。 中国科学院的核心作用 支撑DeepSeek发展的更广泛的制度环境反映了其研究人员完整的职业生涯轨迹,涵盖了其所有已知随时间推移的附属机构。总共,分析的211位作者与全球499个独特机构相关联,其中中国机构有368个(占74%,见图3)。该网络主要锚定在学术界,大学和研究机构构成其支柱,但也包含一些来自私营公司(n=17)、政府机构(n=12)和非营利组织(n=9)的培训。 在此制度背景下,中国科学院(CAS)成为战略重心。尽管直接拥有仅18位作者,但考虑到其下辖153家附属机构的网络,CAS涵盖研究者总数达53人。这种广泛的制度影响——其中“子机构”是指根据OpenAlex定义与其存在从属关系(作为其母机构)的组织(包括研究机构、实验室和专业中心)——结合显著的科研影响力指标(超过84万篇作品和2370万次引用),使CAS成为该生态系统的主导者。9北京大学以21个总机构数量位居第二,但在与20位研究人员建立直接合作关系方面领先。清华大学紧随其后,拥有16位作