
美国主导的“算力霸权”体系构建:硬件+算法的双重垄断。回顾标普500成分股市场表现,截至2024/12/31,总市值前八位的公司(苹果、英伟达、微软等)均为AI相关标的,构成了标普500总市值的35%,产业价值增量主要体现在算力和算法板块。2025年1月,拜登政府发布全球AI出口管制规则,要求全面禁止向中国等Tier 3地区出口先进芯片以及部署高性能闭源模型,通过出口管制进一步加强算力、算法垄断优势。 中国以数据要素形成非对称突破,构建中国特色AI发展范式。算力、算法、数据是AI的三大基石,华为、寒武纪等推进国产算力突破,DeepSeek开源带动大模型平权,中国已经逐步实现算力和算法相对于美国的追赶,未来国家之间AI应用的差异化竞争,数据将会起到最关键作用。春节后,中国广泛推广了DeepSeek,背后的动机在于通过制度优势,快速搭建整个人工智能的生态体系。中国产业链价值或向下游转移——通过数据要素激活重构AI产业价值链。中国当下的人工智能战略有望转向充分发挥中国的数据优势,建设高质量数据集,来充分激活面向B/G端,尤其是在生产制造、商贸流通、政务等场景的应用。 中国天然具备数据资源禀赋,公共数据价值蓝海待开发。1)中美数据结构不同,中国的潜力更大。中国的公共数据在全社会数据资源中占比超过70%,且当前大部分都还处于未开化的状态。2)地方债务压力下,数据要素或将开启人类历史上最大规模的资产负债表重构进程。3)中国约4000万公务员与事业单位人员的数据治理潜力非常大。4)制造业是中国经济的重要组成,通过人工智能赋能制造业(即具身智能),对于我国的经济发展有非常大的积极影响。 DeepSeek有望破除数据要素发展障碍。数据要素当前发展主要有以下问题:1)数据治理难度较大;2)数据流通存在安全风险;3)数据利益分配复杂。DeepSeek有望破除数据要素发展障碍:1)治理效率提升:本地化部署实现非标数据快速治理,多部门协同生成垂类模型。2)流通安全保障:通过垂直模型或应用对源数据进行封装,在流通阶段数据的载体是垂直模型或应用,可以真正做到数据不出域、可用不可见。3)方便利益分配:通过将DeepSeek本地化部署、封装成小模型,政府部门可以直接开放API接口,按照调用次数收费,数据权属更清晰的同时,也方便统一定价、收益分配。 中国有望形成在国家基础底座大模型之上训练各地方和各行业垂类模型的局面。我们预期未来各地方都会有自己的大模型,然后自下而上的蒸馏成为市、省、国家级别的大模型,各行业基于全国基础底座大模型再训练出各自的垂直模型,这些过程尤其需要高质量数据集的支持。 数据产业持续推进,地方动作不断。公共数据定价方面,近日,福建省率先发布全国首个公共数据运营服务定价收费标准。数据标注方面,《合肥数据标注产业发展规划(2025-2027年)》发布,提出力争到2027年底,合肥市标注数据规模达3000TB,构建11个以上行业高质量数据集,拉动标注产业规模达30亿元,支撑相关产业规模超千亿。 投资建议:中国已经逐步实现算力降本、模型平权,数据有望成为中国AI产业弯道超车的主要抓手。DeepSeek有望破除公共数据放开障碍,推动数据要素市场化,建议关注数据基础设施、数据标注、数据运营相关标的,以及拥有独特高质量数据集的公司。相关标的:高质量数据集:深桑达A、云赛智联、国新健康、中远海科、易华录、久远银海等。数据标注:海天瑞声等。 风险提示:政策推进不及预期,行业竞争加剧。 1.中美AI产业格局对比:价值链差异与战略选择 美国主导的“算力霸权”体系构建:硬件+算法的双重垄断。回顾标普500成分股总市值和涨跌幅变化,截至2024/12/31,总市值前八位的公司(苹果、英伟达、微软、亚马逊、谷歌、脸书、特斯拉、博通)均为AI相关标的,构成了标普500总市值的35%,在2023/1/3-2024/12/31期间总市值增长超10万亿美金,占标普500总市值增长的62%。 从行业分布来看,这八家公司主要分布在上游半导体(英伟达、博通)、中游云服务和基础模型(微软、亚马逊、谷歌、脸书),下游应用主要集中在AI终端(苹果、特斯拉),上游算力芯片环节,英伟达表现尤其亮眼,在2023/1/3-2024/12/31股价录得820%涨幅,可见美国在OpenAI掀起全球AI变革后,产业价值增量主要体现在算力和算法基础。 表1:美国AI产业核心标的市值变化 美国AI战略:通过出口管制进一步加强算力、模型霸权。2025年1月,拜登政府发布全球AI出口管制规则,芯片禁令正式出台。该规则将全世界国家和地区分为三级(Tier 1,Tier 2,Tier 3),分别接受不同级别的管控。Tier 3将面临最严格的限制级别,适用于中国、俄罗斯等总计约24个所有美国武器禁运的国家和地区,向这些地区的数据中心出口芯片,将被全面禁止。对于AI模型的参数权重,新规要求,企业不能在属于Tier 3的国家和地区部署高性能的闭源模型。如果有AI公司需要对通用开源模型进行微调,且过程需要消耗大量算力,那就必须要向美国政府申请许可,才能在属于Tier 2的国家和地区开展相关操作。 图1:美国颁布全球AI出口管制规则 中国AI战略:以数据要素形成非对称突破,构建中国特色AI发展范式。 习近平总书记指出:“谁能把握大数据、人工智能等新经济发展机遇,谁就把准了时代脉搏。”作为一项通用技术,人工智能是提升国家竞争力、维护国家安全的重要抓手,已成为国际竞争的焦点。 算力方面,以华为、寒武纪、沐曦等为代表的国产芯片厂商持续寻求自主可控技术突破,此外根据路透社,中国计划首次发布指导意见,鼓励在全国范围内使用开源RISC-V芯片,RISC-V有可能发展成和X86、ARM三足鼎立的一个指令集,RISC-V本质上是一种开放标准,将会塑造一个开源芯片新世界,进一步降低下游应用的算力成本。 模型方面,DeepSeek开源带动大模型平权。2024年12月,DeepSeek正式上线V3首个版本并同步开源,2025/2/24-2025/2/28期间,DeepSeek每天开源一个核心技术项目,覆盖AI模型训练、文件系统优化等多个领域。而2025年3月,OpenAI正式上线史上最贵API——o1-pro,o1-pro输入价格150美金/每百万token,输出价格600美金/每百万token,调用定价为DeepSeek-V3的百倍以上。中国通过开源全球领先的大模型实现了模型平权,相当于放弃了部分云业务收入,同样降低了下游应用的成本,同时也限制了美国的商业模式。 人民日报指出,开源开放是破除技术壁垒、实现普惠发展的关键路径。开源开放可以打破闭源人工智能生态围栏,使中小企业能以更低成本获取先进技术,让人工智能带来的技术创新人人可用、处处可及。深化开源开放,要在合法合规前提下,构建语料开放、模型开源服务体系,推动基础模型、算法和数据资源的共享与开放。同时,持续倡导包容开放,鼓励更多开发者投身于人工智能技术的研发、转化与应用。 图2:OpenAI o1-pro和DeepSeek调用价格对比(截至2025年3月20日) 举国体制的人工智能生态搭建。春节后,中国广泛推广了DeepSeek,背后的动机在于通过制度优势,快速搭建整个人工智能的生态体系。完整生态的建立,对于包括人工智能在内的信息技术发展非常重要。所以现在中国从算力和模型上都在为应用的爆发做好准备。 中国产业链价值或向下游转移——通过数据要素激活重构AI产业价值链。算力、算法、数据是AI的三大基石,中国已经逐步实现算力和算法相对于美国的追赶,未来国家之间AI应用的差异化竞争,数据将会起到最关键作用。中国当下的人工智能战略有望转向充分发挥中国的数据优势,建设高质量数据集,来充分激活面向B/G端,尤其是在生产制造、商贸流通、政务等场景的应用。 2.数据要素驱动的弯道超车 习近平总书记指出:“实施创新驱动发展战略,既要推动战略性新兴产业蓬勃发展,也要注重用新技术新业态全面改造提升传统产业。”当前,以人工智能赋能传统产业转型升级成为破局关键。推进数智基础设施建设,构建数据要素全国统一大市场,促进数据要素价值释放,用好多层次、立体化的人工智能技术体系,通过“人工智能+数据要素”这一创新组合,面向传统产业各领域、各场景进行全方位、全角度、全链条改造,推动传统产业在研发设计、生产制造、采购销售、运营管理等方面实现技术运用、资源配置、流程设计等创新性突破,使制造业在生产效率、产品质量、创新能力等方面实现质的飞跃,在努力实现降本增效的同时,形成新业态新模式,使传统产业焕发新生机。 中国天然具备数据资源禀赋,公共数据蓝海待开发。 1)中美的数据结构不同,中国的潜力更大。美国的数据大部分都掌握在大厂手里,并且已经被开发用来加强这些跨国巨头的全球业务。中国的公共数据在全社会数据资源中占比超过70%,且当前大部分都还处于未开化的状态。中国的大厂们通过占比不足30%的企业、个人数据已经创造了几十万亿的GDP,如果可以盘活剩余部分的公共数据,其规模更大、质量更高,则可以大幅提升全社会的生产效率。 2)地方债务压力下,数据要素或将开启人类历史上最大规模的资产负债表重构进程——若盘活政府及央国企的存量数据资产,可有效化解地方债务危机并打造新经济引擎。 3)中国约4000万公务员与事业单位人员的数据治理潜力非常大。此前因缺乏AI底座和模型,数据积累与治理未被重视;DeepSeek普及后,政府有望加快高质量数据集建设。 4)此外,制造业是中国经济的重要组成,通过人工智能赋能制造业(即具身智能),对于我国的经济发展有非常大的积极影响。 数据要素当前发展主要有以下问题: 1)数据治理难度较大。此前大量的公共数据由于没有统一的数据标准,格式不一、未分级分类,数据清洗、脱敏治理工作量大。由于早期各地政府下属委办局之间信息化节奏和水平不一,导致地方各部门数据难以打通,如对于个人基础身份信息的字段标识格式不一,就可能为后续数据整合带来很多困难。 2)数据流通存在安全风险。当前公共数据流通主要把原始数据由地方政府和运营公司合作运营,脱敏治理后出售给数商,数商再面向垂直行业客户需求进行具体数据产品的交付。数据流通涉及环节较多,因此即使完成数据脱敏,数据流通过程中涉及到数据运营、加工等多个环节,仍然存在数据安全风险,从技术上很难做到“数据不出域,可用不可见”,大大降低了各地方开放数据的意愿。 3)数据利益分配复杂。数据具有重要价值已经成为共识,因此各地方不愿意进行数据流通,防止自身利益受损。同时,因为数据难以定价,中央和地方、地方和地方数据的收益分配也存在争议。 DeepSeek有望破除数据要素发展障碍,提供全新有效的技术手段。 1)数据治理方面,DeepSeek的出现提供了可用的工具和方法。通过构建本地化部署的DeepSeek,可以在源数据非标准化、质量低的情况下实现快速治理,各部门只需要在模型输入的统一规则下分头负责自己的数据集整理,安排少量的日常维护人员、模型调优工程师进行数据调优、脱敏即可生成各部门的垂类模型,各部门的垂类模型在DeepSeek统一底座上整合即可实现地方政府公共数据的统一调用。 2)数据流通安全方面,通过垂直模型或应用对源数据的封装,在流通阶段数据的载体是垂直模型或应用,可以做到数据不出域,保障了数据安全,形成“数据不动模型动”的局面。此前如果地方委办局把数据交给软件厂商二次开发后提供给保险、银行等下游客户,如何掌握开放尺度、流通过程中如果出现问题如何控制、减少影响,都需要一事一议,效率较低,风险较大。通过封装成模型调用产品,一旦发现流通过程中存在安全问题,可以直接从源头控制禁止调用,且可以实现对开放尺度的统一管理。 3)数据利益分配方面,基于DeepSeek的垂直模型或应用更易于市场定价。通过将DeepSeek本地化部署、封装成小模型,政府部门可以直接开放API接口,按照调用次数收费,数据权属更清晰的同时,也方便统一定价、收益分配。