您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[胡佛研究所&斯坦福大学以人为本人工智能研究所]:深度洞察DeepSeek AI人才及其对美国创新的影响 - 发现报告

深度洞察DeepSeek AI人才及其对美国创新的影响

AI智能总结
查看更多
深度洞察DeepSeek AI人才及其对美国创新的影响

胡佛研究所TPA白皮书系列 深入探秘DeepSeekAI的人才及其对美国创新的启示 由艾米·泽加特和埃默森·约翰斯顿 2025年4月21日 与斯坦福大学以人为本的人工智能研究所合作 深入探秘DeepSeekAI的人才及其对美国创新的启示 由艾米·泽加特和埃默森·约翰斯顿 中国初创公司DeepSeekAI颠覆了有关人工智能(AI)创新的传统观念。2025年1月发布,该公司的R1语言模型和V3通用大型语言模型(LLM)发送市场动荡不安,并挑战了关于美国在尖端人工智能发展方面技术优势的假设。 1 尽管DeepSeekAI的主张其V3型号仅用600万美元进行训练的说法已被广泛争议(专家估算真实计算成本接近5亿美元,而DeepSeekAI自己也表示,成本只是为了最终训练运行),在V3之上的R1模型展示了前所未有的推理能力和技术成就,超越了美国公司之前设定的基准。 在DeepSeek的技术成就之下,隐藏着一个更为重要的故事:全球AI人才的流动模式促成了公司的突破。本文考察了从2024年1月至2025年2月期间撰写DeepSeek五篇基础论文的200多位研究人员的教育背景、职业路径和国际流动情况。这五篇论文构成了该公司自2023年成立以来的公开研究论文库。 我们发现有力证据表明中国已建立起强大的本土人才体系。DeepSeek五篇论文背后的几乎所有研究人员都是在中国接受教育或培训的。他们中超过一半永不为求学或工作而离开中国,这表明了该国的国内培养体系正不断壮大世界级人工智能人才的能力。并且,虽然近四分之一的DeepSeek研究人员在其职业生涯中曾在美国机构获得过一些经验,但大多数人回到了中国,形成了一种单向的知识转移,这有利于中国的AI生态系统。 这些人才模式对美国技术领导地位构成了根本性挑战,而出口管制和计算投资本身无法解决。DeepSeek是一个关于人力资本——不仅仅是硬件或算法——在geopolitics中发挥的至关重要作用以及美国的人才优势正在侵蚀的预警指标。 方法论 深SeekAI,一家中国人工智能研究公司专注在“低成本、高性能语言模型”上,于2024年至2025年间在康奈尔大学的arXiv.org手稿存档中发布了五篇论文。 2 五篇论文中共有223位作者被署名。我们能够对其中211位进行全面的综述。 3 使用来自OpenAlex2025年2月收集的研究目录,我们收集了详细的作者信息(发表记录、引用指标、自1989年起的组织隶属关系)和全面的组织数据(地理位置、组织类型、研究产出指标) ,特别关注跟踪随时间推移的变化。 4 那么,通过用于数据收集和分析的自定义Python脚本,我们绘制了每位研究员的完整机构历史 ,揭示了以往未被发现的跨境流动模式。虽然传统分析通常依赖于在特定时间点上的人才静态快照,但我们的方法使我们能够量化人才不仅今天的所在地,而且随着时间的推移在国家之间的流动情况——特别是中美之间的流动——捕捉代表战略知识转移机制的“人才回流”案例。 深求人才基础设施跨五篇论文 总共223人被列为DeepSeek的任何五篇论文中的贡献者(见图1)。我们的分析发现,有31名研究人员(约占总数14%——)作者库)为所有五篇我们称为“核心团队”的论文做出了贡献。 5 另有50位作者参与了四篇论文,64位作者参与了三篇论文,55位作者列出了两篇论文,以及2 2名研究人员只参与了篇论文。 图1–DeepSeek论文的作者分布 在五篇DeepSeekAI论文中,222位作者的分布情况,其中31位作者(14%)为所有五篇论文做出了贡献 来源:来自OpenAlex的所有数据。 如表1所示(见附录B),DeepSeek在五篇论文中似乎采用了人才移动分类。在论文1(DeepSeek大语言模型)中,报告的贡献者标签是组织性的而不是基于角色的,其中53个人被归类到业务团队 (8人)、合规团队(7人)、数据标注团队(36人)和设计团队(2人)。值得注意的是,这些标记的贡献者本身没有被列为论文作者,而论文正式列出了86位作者。然而,其中40位贡献者后来至少在一篇后续的DeepSeek论文中被列为作者——这也是他们在此处被记录的原因。这种差异可能表明论文1的贡献者名单反映了一个更广泛的对内合作者群体——其中许多人当时没有正式认可 ,但随着项目的推进,他们后来获得了作者署名权。 论文2和论文4似乎已转变为更功能性的描述类别,这些类别与内部团队结构非常相似。论文2引入了混合贡献者标签,例如“商业与合规”、“数据标注”和“研究与工程”。在156名总贡献者中,绝大多数(105人)被归类为研究与工程,其次是31人属于数据标注和18人属于商业与合规。值得注意的是,2名贡献者——叶胜风和徐艳红——被列在多个类别中:叶胜风同时出现在研究与工程和商业与合规中,而徐艳红在研究与工程和数据标注下获得署名,这很可能反映了组织内部的重叠职责。论文4(DeepSeekV3),列出了197位作者,遵循了相同的分类结构:研究与工程(148人)、数据标注(30人)和商业与合规(17人)。同样,叶胜风和徐艳红是唯一被分配到两个类别的贡献者——叶胜风在研究与工程和商业与合规中;徐艳红在研究与工程和数据标注中。这种模式似乎捕捉到了DeepSeek技术工作的核心。在这种结构中,31人的关键团队中的几乎所有成员都被指定为研究与工程贡献者,有一个值得注意的例外——徐艳红,正如所注,她在论文2和论文4中也担任了数据标注角色。 论文3和论文5通过二元分类引入了一种不同的贡献级别划分:贡献者和核心贡献者。这种转变可能表明对研究小组内部等级地位的正式认可。在论文3中,只有39位贡献者中的4位被标记为核心贡献者。类似地,论文5——公司备受国际关注的首个R1推理模型——在总共194位贡献者中指定了18位核心贡献者。在这两种情况下,核心贡献者占总贡献者基础的大约10%,这表明了一个经过精心策划的领导层级。值得注意的是,论文3中的四位核心贡献者——郭戴亚、杨德建、朱起豪 以及赵志宏—在论文5中也获得了核心贡献者的称号,并且这四位作者都对五篇DeepSeek论文中的每一篇都有贡献,这可能表明了他们对DeepSeek项目核心、长期的深远影响。 深度求研究员引用指标:并非如此绿色 普遍的观点是DeepSeek因为年轻、经验不足的研究人员而成功。然而,引用指标表明DeepSeek的人才其实并不那么青涩。 尽管DeepSeek的合作结构在参与程度上存在明显的差异,但不同层级之间的学术经验也有显著变化。在我们能够获取数据的211位贡献者中,平均每位研究人员发表了61篇论文,获得了超过1000次引用,h指数为10.8,i10指数为超过19。 6 值得注意的是,这些平均值掩盖了一种双峰分布:许多研究者的学术影响力modest,但一个集中的群体在产出和影响力上远超其他研究者。该群体的中位数引用次数(249)、h指数(7)和i10指数(5)都突显了这种内部差异。 值得注意的是,为所有五篇论文做出贡献的31名关键团队研究员非常突出。该团队的人均引用量为1,554次,中位数为501次,平均h指数为13.5,i10指数为25.5。中位数值——h指数为10,i10指数为11——进一步表明关键团队的影响是一致的,而不仅仅是一些极端值。这些指标提供了额外的证据,证明DeepSeek关键团队由已经具备可靠学术记录的研究员组成。 这项学术优势在与世界顶尖人工智能实验室之一的一个同辈群体进行比较时变得更加明显。根据OpenAIo1系统卡片的数据(arXiv:2412.16720),该发布中列出的265个作者的团队平均引用次数为4,403,但中位数为仅338,表明在少数高被引个人之外存在急剧下降。此外,该组的i10指数仅为4,反映出在整个团队范围内影响的一致性更有限。 相比之下,DeepSeek的完整作者库及其核心团队在平均和中位数表现之间表现出更好的平衡— —这表明不仅顶部实力强劲,而且与OpenAI团队相比,贡献者之间的差异较小。这些模式可能表明学术经验的分布更加均匀,而不是过度依赖少数杰出人物。DeepSeek的研究引擎 不仅深而且广——这是一个组织特征,随着基础模型开发竞争的加剧,可能会变得尤其重要 。 综合来看,这些比较挑战了媒体叙事DeepSeek的迅速崛起是由“未经测试”或经验不足的研究人员推动的。尽管OpenAI仍在继续获得全球认可,但在传统文献计量学的标准下,DeepSeek的核心贡献者中,许多人在他们取得突破时,发表的论文更多,引用次数更稳定,并且可能更具学术地位。 7 对制度隶属关系的纵向视角:中国的主导地位 纵向观察具有已知隶属关系数据的201名DeepSeek作者,我们发现超过一半(n=111)接受过培训并有隶属关系专有地在中国机构中度过整个职业生涯——这证明了中国在无需依赖西方专业知识的情况下,培养世界级人工智能人才的日益增长的能力。而且DeepSeek作者的绝大多数——89%(n=197)——至少与一个中国机构有过去或现在的隶属关系。 有四位作者似乎完全没有在中国学习、培训或工作过。他们的学术和专业渊源跨越了众多全球机构:李尔杭在英国和美国接受培训,隶属于英特尔英国公司;王亦庆在德国的约翰内斯·古腾堡大学美因茨学习;王雨田在新加坡的国立大学接受教育;黄盼盼在美国的普渡大学学习。虽然这些个人代表了更广泛的DeepSeek生态系统中的例外,但他们突显了全球人工智能研究社区的国际范围。然而,他们的数量很少说明了在DeepSeek贡献者中,这条道路是多么不寻常——进一步强化了中国的国内管道现在基本上能够独立培养世界级的AI研究人员的观察结果。 我们发现只有四分之一的DeepSeek研究人员(24.3%,n=49)曾经与美国的机构有过学术或职业关系——这进一步说明了美国机构在这个群体形成过程中所起到的有限作用。 中国在2025年机构隶属关系快照中占据主导地位 如图2所示,201名拥有已知隶属关系数据的DeepSeek作者中,有171位在2025年(可获取的最新年份)隶属于中国机构。 8 图2–当前机构隶属的地理分布 201名已知隶属关系的DeekSeekAI研究人员的当前地理分布 来源:来自OpenAlex的所有数据。 目前仅有7%(n=15)的研究人员拥有美国-based的affiliations。这包括在著名研究大学(如石溪大学、北德克萨斯大学和加州大学旧金山分校)的职位,医疗机构(如波士顿儿童医院),以及包括谷歌、奥士康和HealthFirst的科技或生物科技公司。其余研究人员分布在小部分其他国家,包括澳大利亚、加拿大、英国和新加坡,在德国、爱尔兰、巴拿马、波兰和台湾有单个案例。这种围绕中国的地域集中进一步强化了其国内机构的中心作用——不仅是培养基地,而且是人工智能人才长期职业发展的目的地。 中国科学院的中心作用 支持DeepSeek发展的更广泛的制度环境反映了其研究人员的完整职业生涯轨迹,涵盖了其所有已知随时间的隶属关系。总共,被分析的211位作者与全球499个独特的机构有关联,其中中国机构占368个(74%)(见图3)。该网络主要锚定在学术界,大学和研究机构构成了其骨干,但它也包含来自私营公司(n=17)、政府机构(n=12)和非营利组织(n=9)的一些培训 。 图3–按研究人员数量排名前10✁机构 来源:来自OpenAlex✁所有数据。 在这个制度环境中,中国科学院(CAS)成为战略重心。虽然直接拥有18位作者,但考虑到其下辖153家附属机构✁网络,CAS囊括了总共53位研究人员。\"子机构\"✁指与CAS存在附属关系(根据OpenAlex定义)✁组织,包括研究机构、实验室和专门中心——这一广泛✁制度覆盖范围,加上显著✁研究影响力指标(超过84万份作品和2370万引用次数),使CAS成为该生态系统中✁主导力量。 9 北京大学以21个总合作机构位居第二,但在直接合作方面与20位研究人