AI智能总结
对DeepSeek AI人才的深度洞察及其对美国创新的启示 由艾米·泽加特和艾默生·约翰斯顿 2025年4月21日 对DeepSeek AI人才的深度洞察及其对美国创新的启示 由艾米·泽加特和艾默生·约翰斯顿 中国创业公司DeepSeek AI颠覆了关于人工智能(AI)创新的传统观念。2025年1月发布,该公司的R1语言模型和V3通用大型语言模型(LLM)sent市场震荡,并对美国在前沿人工智能发展方面的技术优越性假设构成挑战。1Although DeepSeek AI’sclaimsthat its V3 model was trained for just $6 million have been widely disputed (experts估计真正的计算成本接近5亿美元,而且DeepSeek AI自己也表示这只是最终训练运行的成本),在V3基础上构建的R1模型展示了前所未有的推理能力和技术成就,超越了美国公司先前设立的基准。 在DeepSeek的技术成就之下,潜藏着一个更为重要的故事:全球AI人才的流动模式,这些模式促成了公司的突破。本文研究了2024年1月至2025年2月期间撰写DeepSeek五篇基础性论文的200多名研究人员的教育背景、职业路径和国际流动性。这五篇论文构成了公司自2023年成立以来公开可用的研究论文库。 我们发现有力证据表明中国已建立起一支强大的本土人才库。DeepSeek的五篇论文背后几乎所有研究人员都在中国接受教育或培训。他们中超过一半never他们前往中国接受教育或工作,这表明中国正在通过完全本土化的培养体系,不断增强培养世界级人工智能人才的能力。尽管近四分之一的DeepSeek研究人员在其职业生涯中曾在美国机构获得过经验,但大多数人最终回到了中国,形成了一种单向的知识转移,从而惠及中国的AI生态系统。 这些人才模式对美国技术领导地位构成了根本性挑战,而出口管制和计算投资单独都无法解决。深Seek是一个关于人力资本——不仅仅是硬件或算法——在 geopolitics中发挥的至关重要作用以及美国人才优势正在衰落的预警指标。 方法论 DeepSeek AI,一家中国人工智能研究公司聚焦于“高性价比、高性能语言模型”,在2024年至2025年间在康奈尔大学的arXiv.org手稿存档中发布了五篇论文。2共有223位作者被归功于这五篇论文。我们能够对其中的211篇进行全面综述。3使用数据来自OpenAlex2025年2月收集的研究目录中,我们收集了详细的作者背景资料(发表记录、引用指标、自1989年起的研究机构关联信息)以及全面的研究机构数据(地理位置、组织类型、研究产出指标),特别注重追踪随时间推移的变化。4:随后,我们通过用于数据收集和分析的自定义Python脚本,绘制了每位研究人员的完整机构历史,揭示了此前未被发现的跨境流动模式。传统分析往往依赖特定时间点的静态人才快照,而我们的方法使我们能够量化人才不仅今天的所在地,还在于其随时间在国家间流动的情况——尤其是中美之间的流动——捕捉了代表战略知识转移机制的“反向人才流失”案例。 DeepSeek 的人才基础设施:跨五篇论文 共有223人被列为DeepSeek五篇论文中的任一篇的贡献者(见图1)。我们的分析发现,有31位研究人员(占总数的约14%——)作者团队)为所有五篇论文贡献了我们所称的“核心团队”。5另有50位作者合著了四篇论文,64位作者参与了三篇论文,55位作者列名于两篇论文,以及22位研究人员仅参与了篇论文。 如表1所示(见附录B),DeepSeek在五篇论文中采用了一种动态的人才分类方式。在第一篇论文(DeepSeek大型语言模型)中,报道的贡献者标签是基于组织而非角色的,53人被归类为业务团队(8人)、合规团队(7人)、数据标注团队(36人)和设计团队(2人)。值得注意的是,这些被标记的贡献者本身并未被列为论文的正式作者,该论文官方列出了86位作者。然而,其中40位贡献者后来在至少一篇后续的DeepSeek论文中被列为作者——这也是他们在此处被记录的原因。这种差异可能表明,第一篇论文的贡献者名单反映了一个更广泛的项目内部合作群体——其中许多人当时未被正式认可,但随着项目的推进最终获得了作者署名权。 论文2和论文4似乎已经转型为更侧重功能描述的类别,这些类别与内部团队结构高度相似。论文2引入了混合型贡献者标签,如“业务与合规”、“数据标注”和“研究与工程”。在总共156名贡献者中,绝大多数(105人)被归类为“研究与工程”,其次是31名“数据标注”和18名“业务与合规”。值得注意的是,有2名贡献者——叶胜峰(Shengfeng Ye)和徐艳红(Yanhong Xu)——被列在多个类别中:叶胜峰同时出现在“研究与工程”和“业务与合规”中,而徐艳红则被归功于“研究与工程”和“数据标注”,这很可能反映了组织内部的职责重叠。论文4(DeepSeek V3),有197位署名作者,采用了相同的分类结构:“研究与工程”(148人)、“数据标注”(30人)和“业务与合规”(17人)。同样,叶胜峰和徐艳红是唯一被分配到两个类别的贡献者——叶胜峰在“研究与工程”和“业务与合规”中,徐艳红在“研究与工程”和“数据标注”中。这种分类体系似乎捕捉了DeepSeek技术工作的核心。在此结构中,31人核心团队的几乎所有成员都被指定为“研究与工程”贡献者,有一个显著例外——徐艳红,正如前文所述,她在论文2和论文4中也担任了“数据标注”角色。 论文3和5通过二分类方式引入了不同贡献级别的划分:贡献者与核心贡献者。这一转变可能表明对研究小组内部等级地位的正式认可。在论文3中,仅39名贡献者中有4名被标记为核心贡献者。类似地,论文5——公司备受国际关注的R1推理模型——在194名总贡献者中指定了18名核心贡献者。在这两种情况下,核心贡献者约占贡献者总体的10%,暗示着精心筛选的领导层级。值得注意的是,论文3中的所有四名核心贡献者——郭大雅、杨德健、朱启豪 Zhihong Shao—也被列为论文5中的核心贡献者,并且这四位作者都对五篇DeepSeek论文都做出了贡献,这很可能表明他们在DeepSeek项目中的核心、长期影响力。 DeepSeek 研究员引用指标:并非真的绿色 主流叙事认为DeepSeek的成功归功于年轻经验不足的研究人员。然而,引文指标表明DeepSeek的人才实际上并非经验匮乏。 虽然DeepSeek的合作结构在参与程度上表现出明显的差异,但不同层级之间的学者经验也存在显著变化。在我们可以获取数据的211位贡献者中,平均每位研究人员发表了61篇作品,获得超过1000次引用,h指数为10.8,i10指数超过19。6值得注意的是,这些平均值掩盖了一种双峰分布:许多研究者拥有相对较小的学术影响力,但一个集中的群体在产出和影响力方面则远高得多。这一群体的中位引用次数(249)、h指数(7)和i10指数(5)都凸显了这种内部差异。 值得注意的是,参与所有五篇论文的31名核心团队研究人员的贡献尤为突出。该团队平均每位作者获得1,554次引用,其中位数为501,平均h指数为13.5,i10指数为25.5。中位值——即h指数为10和i10指数为11——进一步表明核心团队的影响力的持续性,而不仅仅是少数极端情况。这些指标提供了额外证据,证明DeepSeek核心团队由具有已获认可学术业绩的研究人员组成。 当与来自全球顶尖人工智能实验室的同行群体进行比较时,这种学术实力表现得更为明显。根据OpenAI o1系统卡的数据(arXiv:2412.16720), 该发布中列出的265名作者的团队平均引文数为4,403,但中位数为仅为338,表明在少数高被引学者之后出现大幅下降。此外, 该团队的中位h指数仅为6, i10指数为4,反映出在整个团队中影响力的一致性更为有限。 相比之下,DeepSeek的完整作者群体及其核心团队在平均表现与中位数表现之间表现出更大的平衡——这表明不仅顶端实力强劲,而且与其他团队相比,贡献者之间的差异较小。这些模式可能表明其学术经验基础分布更为均衡,而非过度依赖少数杰出人物。DeepSeek的研究引擎 看起来不仅深厚而且广泛——这是一个组织特征,随着基础模型开发竞争的加剧,这可能会变得尤为重要。 Taken together, these comparisons challenge the媒体叙事DeepSeek的迅速崛起是由“未经试验”或缺乏经验的研究人员驱动的。尽管OpenAI继续获得全球认可,但DeepSeek的核心贡献者——至少根据传统的文献计量学标准——在取得突破时,其发表成果更为突出、引用更为持续,并且可能具有更强的学术地位。7 一项关于制度关联的纵向视角:中国的主导地位 纵向分析201名具有已知隶属关系的DeepSeek作者,我们发现超过一半(n=111)的作者都曾接受过培训并有过隶属关系。独家地在中国机构整个职业生涯中——这证明了中国在发展世界级AI人才方面的能力日益增强,而无需依赖西方专业知识。并且,DeepSeek作者的绝大多数——89%(n=197)——至少在过去的某个时间点或目前与某个中国机构有联系。 四位作者似乎完全没有在中国进行过学习、培训或工作。他们的学术和专业背景分布在一系列全球机构中:李尔杭在英国和美国接受培训,并与英特尔英国有联系;王宇琦在德国约翰内斯·古滕贝格大学美因茨学习;王雨田在新加坡国立大学接受教育;黄盼盼在美国普渡大学学习。虽然这些个体代表了更广泛的DeepSeek生态系统中的例外,但它们凸显了全球人工智能研究社区的国际影响力。然而,他们的数量很少,这也强调了这种路径在DeepSeek贡献者中的不寻常——进一步证实了中国的本土人才管道现在已经能够在很大程度上独立培养世界一流的人工智能研究人员。 我们发现,只有四分之一的DeepSeek研究人员(24.3%,n=49)曾与美国机构有过学术或职业渊源——这进一步说明美国机构在塑造这一群体方面所起的作用有限。 中国主导了2025年机构隶属关系的快照。 如图2所示,在201位具有已知隶属关系数据的DeepSeek作者中,到2025年(可获取的最新年份)有171位作者的隶属机构为中国机构。8 目前仅7%(n=15)的研究人员拥有美国籍属关系。这些人员包括在知名研究大学(如石溪大学、北德克萨斯大学和加州大学旧金山分校)、医疗机构(如波士顿儿童医院)以及科技或生物科技公司(包括谷歌、奥曲沙坦和健康第一)的职位。其余研究人员分布在少数几个其他国家,包括澳大利亚、加拿大、英国和新加坡,在德国、爱尔兰、巴拿马、波兰和台湾有零星分布。这种围绕中国的地域集中进一步强化了其国内机构的核心作用——不仅是培养基地,更是人工智能人才的长期职业目的地。 中国科学院的核心作用 支撑DeepSeek发展的更广泛的制度环境反映了其研究人员完整的职业轨迹,涵盖了跨时间的所有已知隶属关系。总共,211位被分析的作者与全球499家独特机构有关联,其中中国机构占368家(74 %)(见图3)。该网络以学术界为主导,大学和研究机构构成其核心,但也包含来自私营公司(n=17)、政府机构(n=12)和非营利组织(n=9)的部分培训。 在这个制度环境中,中国科学院(CAS)成为战略重心。虽然其直接拥有仅18位作者,但考虑到其附属的153个机构网络,CAS涵盖53位研究人员。这种广泛的制度影响力——其中“子机构”是指与CAS存在附属关系(根据OpenAlex定义)的组织,包括研究机构、实验室和专业中心——结合其显著的研究影响力指标(超过84万份作品和2370万次引用),使CAS成为该生态系统的主导力量。9北京大学以21个总合作机构位居第二,但在直接合作方面领先,与20位研究人员有直接合作。清华大学以16位作者紧随其后,随后是中山大学和南京大学,各拥有10位作者。这种分布揭示了中国如何利用其机构基础设施支持人工智能发展,形成一个以中国