您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:国产AI芯片崛起:挑战与机遇并存,大模型生态重塑 - 发现报告

国产AI芯片崛起:挑战与机遇并存,大模型生态重塑

2025-09-19未知机构y***
AI智能总结
查看更多
国产AI芯片崛起:挑战与机遇并存,大模型生态重塑

专家观点: Q&A 当前国产芯⽚在替代进⼝芯⽚⽅⾯的进展如何?⽬前国内主要有哪些类型的芯⽚,其量产和技术成熟度分别处于什么阶段? 国产芯⽚⽬前可以分为四⼤类:第⼀类是以昇腾为代表的MindSpore⽣态芯⽚;第⼆类是寒武纪系列;第三类是海光系列;第四类是N卡(如摩尔线程、壁仞科技等)。在量产和交付⽅⾯,昇腾910B、910C以及寒武纪590等产品已经实现批量供货。截⾄⽬前,华为昇腾的供货规模已达到10万级别,寒武纪约为数万级别,⽽海光从今年第三季度开始批量⽣产,⽬前也达到了⼏万级的交付⽔平。相⽐之下,N卡相关产品仍处于⼩批量阶段,尚未突破数万级。 从技术成熟度来看,⽬前国产芯⽚主要集中在推理任务上,⼤部分CUDA模型可以迁移运⾏,但性能相较英伟达CUDA⽣态下的产品存在⼀定损失。在⾼配置产品中,例如昇腾910C具备⼀定训练能⼒潜质,但由于软件体系与CUDA存在较⼤差异,⽬前仍以推理任务为主,训练功能尚未完全成熟。整体来看,国产芯⽚仍处于⼩批量或初步批量化阶段,其中以昇腾和海光为主导。 当前国家对英伟达H20系列芯⽚采购政策是什么? 当前对H20系列芯⽚采取了限制性政策。对于国有企业明确要求不得采购,⽽⺠营企业则需通过申请流程⽅可购买,但审批周期较⻓且流程复杂。这⼀政策并⾮完全禁⽌使⽤H20,⽽是基于保护国产推理卡市场竞争⼒的考量。此外,由于H20与国产推理卡性能差距不⼤,其引⼊意义有限,因此国家更倾向推动国内企业选择国产替代⽅案。 英伟达H30系列是否可能进⼊中国市场?其性能指标如何? H30系列从性能指标上看显著优于H20,其FP16和FP8计算能⼒以及显存容量均有较⼤提升,可满⾜训练需求。如果该系列能够进⼊中国市场,将成为适合训练任务的平台。政府对此持开放态度,但具体引⼊需经过中美双⽅进⼀步谈判。 阿⾥巴巴⾃研芯⽚当前技术能⼒如何?是否能够承担部分训练任务? 阿⾥巴巴⾃研芯⽚⽬前主要⽤于推理任务,同时具备⼀定后续微调(post-train)的能⼒,但在预训练(pre-train)⽅⾯表现仍然有限。在设计初期,该款芯⽚指标设定较⾼,但因台积电⽣产时需符合合规要求⽽有所降低。⽬前转产⾄国内后,其性能指标得以提升,相⽐英伟达HR系列略强。然⽽,该款⾃研卡虽可胜任推理及微调任务,在完整训练场景中的应⽤仍受限。 当前⼤语⾔模型(如千问)在训练和升级迭代过程中是否仍然依赖英伟达芯⽚?如果国产芯⽚被⽤于替代训练,是否存在技术可⾏性?⽬前有哪些实际案例或进展? ⽬前,⼤语⾔模型的训练和升级迭代仍然⾼度依赖英伟达的GPU芯⽚,尤其是CUDA⽣态系统的⽀持。然⽽,对于存量显卡资源,⼀些企业表⽰其现有库存可以⽀撑到2026年。关于国产芯⽚替代⽅⾯,华为曾尝试基于其达芬奇架构进⾏模型训练,但由于架构本⾝在训练任务中的技术问题,未能取得显著进展。⽬前华为正在同时推进基于CUDA和国产芯⽚的下⼀代模型研发,以观察哪⼀条路径能够率先实现突破。寒武纪⽅⾯,其主要精⼒集中在与字节跳动合作,但应⽤场景以推理为主,⽽⾮⼤规模模型训练。 寒武纪AI加速芯⽚⽬前主要应⽤在哪些场景?其⽣态系统及⼯具链与CUDA相⽐存在哪些差距? 寒武纪AI加速芯⽚当前主要应⽤于推理场景,例如字节跳动在视觉推荐领域的⼀些特定需求。寒武纪拥有⾃⼰的NewareSDK⽣态系统,与主流框架如TensorFlow、PyTorch兼容。然⽽,与CUDA相⽐,其指令集规模较⼩(约3,000个算⼦,相较于CUDA13版本的12,000多个算⼦),⼯具链也相对不够完善,包括编译器、调试器以及性能分析器等。此外,由于寒武纪采⽤ASIC架构,仅适⽤于特定场景处理,需要针对不同客⼾进⾏⼀对⼀适配,这限制了其⼴泛推⼴能⼒。 寒武纪未来是否有可能从ASIC路径转向GPU⽅向?当前产品线及规划如何? 寒武纪当前产品线(如590、690系列)仍沿⽤ASIC架构。未来可能会探索更通⽤的⽅向,例如规划中的790系列,但该产品预计要到2027年才会推出。因此,在短期内,其发展重点仍将集中在ASIC路径上。 与国外⼚商(如博通)的ASIC芯⽚相⽐,寒武纪有哪些差异?这些差异对市场竞争有何影响? 博通与寒武纪同属ASIC领域,两者均需根据客⼾需求提供底层指令集、⼯具集及编译器,并针对具体场景进⾏⼯程适配。然⽽,由于每家⼚商的软件架构和指令集体系各⾃独⽴,因此⽆法直接⽐较两者性能优劣。从市场竞争⻆度看,这种⾼度定制化特性使得每家⼚商都需要投⼊⼤量资源⽀持客⼾适配⼯作,从⽽限制了规模化扩展能⼒。 阿⾥巴巴在⾼性能计算领域采取了哪些策略以应对海外⾼端GPU供应受限的问题?⾃研与外部采购之间如何平衡? 阿⾥巴巴原计划采购H100等⾼端GPU,但因供应受限,已调整策略,将⾃研优先级提升⾄更⾼⽔平,以填补英伟达产品⽆法满⾜的需求。然⽽,⾃研仅占⽬标总量的20%-25%,剩余70%-80%的需求仍需通过外部采购来满⾜。⽬前这⼀⽬标尚未完全实现。 在阿⾥⾃研芯⽚推进过程中,⾯临的最⼤瓶颈是什么?中芯国际对此项⽬⽀持⼒度如何? 最⼤瓶颈包括制程⼯艺调整以及中芯国际产能不⾜的问题。阿⾥的设计需要根据国产制程进⾏改造,同时中芯国际产能有限,需要排产安排⽣产计划。在中芯国际内部优先级排序中,阿⾥位列第三,仅次于⽣存类项⽬和寒武纪。 中芯国际在⽣产阿⾥所需制程时,其原材料采购模式如何运作? 中芯国际负责所有相关原材料(包括晶圆等)的采购⼯作,通过⾃⾝渠道完成供应链管理,⽆需由阿⾥直接参与。 最近两个季度,阿⾥云收⼊结构出现微妙变化。其中基础设施即服务(Infrastructureas a Service, IaaS)板块占⽐约52%,增速为18%-20%。尽管IaaS是基本盘,但其他新兴业务板块的发展也开始对整体增⻓产⽣积极影响。这种多元化布局使得阿⾥云能够保持较强竞争⼒,即便⾯对激烈市场环境,也展现出稳健增⻓态势。 阿⾥云的业务主要分为四个板块:PaaS(⼤数据计算中间件和数据库等产品)、SaaS、模型及服务,以及其他板块。其中,PaaS板块占⽐约为25%,利润率在40%-50%之间;SaaS板块利润率更⾼,可达60%。模型及服务是⼀个新兴板块,其占⽐和增速均在提升。整体来看,这些核⼼业务的增速均⾼于基本盘,⽽AI相关收⼊⽬前已占整体收⼊的20%左右,并且由于AI业务本⾝具有较⾼利润率,对整体利润⽔平形成了拉动作⽤。 增⻓的主要驱动因素包括“繁花计划”的实施,该计划聚焦⼗⼤⾏业(如政企、能源、交通、⾦融、制造业、汽⻋、零售、新能源等),通过扶持头部客⼾打造标杆案例以辐射腰部和尾部客⼾。此外,阿⾥还与合作伙伴(如Salesforce)协同,通过联合服务推动客⼾上云。同时,海外市场表现优异,例如墨西哥和泰国新开设的数据中⼼带来了显著增量,其海外市场增速已超过国内。 阿⾥⾃研芯⽚在性能和功耗⽅⾯与H20相⽐有哪些差异? 阿⾥的⾃研芯⽚在性能上优于H20。例如,其计算能⼒达到接近200TFLOPS,⽽H20为148TFLOPS。此外,⾃研芯⽚采⽤96GBHBM2E显存,但其带宽略低于HBM,因此执⾏性能稍弱。然⽽,由于单卡指标较⾼,⾃研芯⽚整体推理性能接近H20。功耗⽅⾯,⾃研芯⽚约为400⽡。 当前国产HBM显存的发展情况如何?是否存在瓶颈? ⽬前国产HBM显存尚未完全达到⼤规模应⽤⽔平,仅能⽣产容量较⼩(24GB或48GB)的产品,与三星或海⼒⼠的⼤容量HBM相⽐仍有差距。因此,在⾼端应⽤场景中仍需依赖三星或海⼒⼠的⼤容量HBM。不过,国产HBM已经可以投⼊使⽤,只是在性能上略逊⼀筹。 阿⾥近期组织架构调整对其运营效率产⽣了哪些影响? 第⼆季度阿⾥进⾏了组织架构梳理,将原本分散的电商体系收⼊整合到⼀起,包括国内电商(淘宝天猫、本地⽣活等)与国际电商。这种整合带来的好处包括流量集中化以及资源优化配置。例如,通过新增淘宝闪购⼊⼝,将线上线下流量汇集到⼀个平台,同时投⼊500亿元培养⽤⼾习惯。此外,还打通了所有事业部的数据,并简化了汇报线路,使得决策更加集中、⾼效。AI战略也被明确为“AI驱动商业”,并从细分场景⼊⼿进⾏全⾯落地,从⽽提升执⾏⼒。 AI技术⽬前在哪些具体业务场景中对阿⾥产⽣了实际驱动⼒? AI技术已⼴泛应⽤于阿⾥的多个核⼼业务场景。在电商领域,引⼊了⽣成式⼈⼯智能(AIGC),⽤于⽣成商品展⽰海报、图⽚和视频,从⽽帮助商家降低成本;节省下来的资⾦则被⽤于精准⼴告投放,通过AI算法实现更精确的客⼾匹配,提⾼转化率。此外,智能客服系统也全⾯升级,如“店⼩蜜”和“淘⼩蜜”覆盖售前、中、后的服务流程。同时,AI还被⽤于数据分析,为商家提供销售预测及供应链优化建议。在搜索功能上推出了“AIOne Box”,通过整合多平台数据⽀持模糊搜索需求,从⽽缩短⽤⼾购买决策链路并提升体验。 京东进⼊闪购赛道后,对阿⾥的竞争格局造成了哪些影响?阿⾥的应对策略是什么? 闪购赛道竞争激烈,⽬前由阿⾥、美团和京东主导。过去半年内京东曾试图抢占市场,但因骑⼿费⽤较⾼等原因逐渐退却。⽬前状态是阿⾥暂时领先。为了应对竞争压⼒,阿⾥持续投⼊500亿元⾄2025财年,⽤以培养⽤⼾习惯并巩固市场份额。这种策略类似于此前滴滴快⻋时期的⼤规模补贴打法,通过吸引流量将⽤⼾锁定在⾃⾝平台上。 闪购业务是否对其他投资领域,如AI研发预算造成冲突?该模式是否带来了新的增⻓点? 闪购业务与AI研发预算不存在直接冲突,两者分别属于运营⽀出与资本⽀出范畴,各⾃独⽴运作。从结果来看,通过闪购模式确实为电商领域带来了新的增⻓点,例如吸引更多即时消费需求并提升流量利⽤效率。这种⽅式有效弥补了传统电商⻅顶后的增量不⾜问题,同时进⼀步强化了平台⽣态闭环。 当前某平台的GMV增⻓与利润变化之间的关系如何?未来是否有可能实现利润恢复? ⽬前,该平台的GMV正在提升,但由于需要投⼊资源,这对短期利润产⽣了⼀定影响。然⽽,预计在两个季度后,通过调整补贴策略,⽤⼾习惯逐步形成后,将实现⼀定的延续性增⻓。未来,该平台在增速⽅⾯的⼀部分来源将是闪购业务。尽管短期内利润受到影响,但从中⻓期来看,利润有望恢复⾄正常⽔平。 ⾼端芯⽚(如H30或更⾼版本)进⼊中国市场后,是否会对国产芯⽚造成冲击?这种冲击程度是否与其定价有关? ⾼端芯⽚进⼊中国市场后,对国产芯⽚的冲击程度主要取决于其定价策略。如果H30等⾼端芯⽚价格设定在25,000⾄30,000元区间,其对国产芯⽚的冲击较⼩;但若价格降⾄12,000⾄14,500元区间,则可能对国内⼚商(如海光、寒武纪等)造成显著影响,因为这些⼚商产品价格通常在六七万元左右。如果⾼端芯⽚价格维持在国产产品两倍或2.5倍以上,则可以起到⼀定缓冲作⽤。此外,⼤型企业通常会直接采购,⽽中⼩型企业则会更多考虑性价⽐。 阿⾥云提供的“Modelas a Service”服务模式具体是如何运作的?其主要客⼾群体和使⽤场景有哪些? 阿⾥云提供“Modelas a Service”服务模式,主要包括以下两种使⽤⽅式: ·客⼾基于阿⾥云提供的基础模型(basemodel)进⾏微调,从⽽形成专属模型,并将该专属模型部署到阿⾥云上租⽤GPU资源。 ·客⼾选择基础模型,同时选配阿⾥云开发的⼀系列智能体服务和中间件,以构建完整的产品矩阵。这种组合⽅式不仅包括模型,还涵盖AI延伸应⽤和中间件,从⽽满⾜客⼾多样化需求。 客⼾群体覆盖⾦融、制造、零售、电商、汽⻋等多个⾏业。针对不同⾏业需求,阿⾥云提供预先配置好的解决⽅案套餐,使客⼾能够快速选择并搭配适合⾃⾝业务场景的产品。例如,在AI应⽤过程中,客⼾可能需要向量数据库、RAG技术以及BI⼯具进⾏数据分析。这种整合式服务策略通过将基础模型与⾼利润率产品捆绑销售,为客⼾提供更全⾯且易⽤的解决⽅案。 阿⾥云Max从1.0版本升级到2.0版本后,其功能和定位发⽣了哪些变化? Max1.0版本主要聚焦于单⼀模型服务,⽽Max2.0版本则扩展到了应⽤层、中间件以及智能体