摘要 -本周AI聊天应用市场活跃度分化,海外Gemini下降而Perplexity与Claude上升,国内应用则因国庆假期普遍下滑。模型应用方面,OpenAI正式上线迄今最强大的GPT-5Pro API,凭借40万Token超大上下文窗口和多模态能力,瞄准科研、法律等高端市场,定价为每百万Token15美元。谷歌预览了能像人一样操作网页的AI代理模型Gemini2.5 Computer Use,并升级视频模型Veo至3.1版本。此外,谷歌宣布其AI月处理代币数超1300万亿,主要反映了新模型导致后端计算复杂度与成本激增,而非用户活跃度的直接体现。 -Semianalysis发布InferenceMAX推理基准框架,以“TCO每百万token”和“每MW产出”衡量AI推理系统经济性与能效,为AMD与NVIDIA竞争提供统一评估语境。结果显示,NVIDIA在低至中交互性区间凭借GB200/B200与封闭软件栈保持优势,而AMD在中高交互性与vLLM+MX4组合下能效逼近、ROI具竞争力。InferenceMAX使比较从峰值性能转向单位经济性,揭示AI推理竞争将围绕TCO与能效展开。 -英特尔18A节点正式量产,标志公司迈入2nm时代并实现RibbonFET与PowerVia双技术落地,提升能效但制造成本与复杂度同步上升。相较台积电N2,18A在性能与能效上具潜在领先,但晶体管密度与量产良率仍待验证。首批产能来自亚利桑那Fab 52,出货时间延至2025年底。该节点是英特尔重建先进制程信誉的关键一步,但目前仍处“验证期”,能否成为真正领先节点取决于后续Clearwater Forest等产品表现。 -2025年9月,台湾存储产业显著回温。群联电子营收65.15亿元新台币,PCIe SSD控制芯片出货量同比激增近300%,受AI推理与企业级SSD需求带动。华邦电子第三季营收217.7亿元新台币,创12季高点,利基型DRAM合约价上扬与DDR3停产推升DDR4价量齐升。两家公司分别受益于AI存储需求与DRAM价格周期回升,显示台湾存储链在AI驱动下进入结构性复苏阶段。 -2025年8月,中国智能手机销量达到约2080万台,同比下滑6.24%。小米、华为、vivo、OPPO、荣耀以16.21%、15.08%、13.82%、13.79%、13.52%的份额排名前五。具体型号方面,iPhone 16 Pro销量排名第一,OPPO reno 14、iPhone 16 Pro Max排名第二、第三。8月国内PC市场销量基本同比持平,台式机销量约为157万台,同比下滑约1.39%。笔电销量约为232万台,同比增长约2.02%。 风险提示 芯片制程发展与良率不及预期中美科技领域政策恶化智能手机销量不及预期 内容目录 海外市场行情回顾................................................................................3国内AI应用活跃度受假期影响下降,Google发布Computer Use........................................4AMD vs. NVIDIA:在InferenceMAX框架下的性能与投资结论..........................................5英特尔18A节点点评:突破量产门槛,但领先仍在验证期..............................................5AI需求驱动存储链回暖:群联控制器出货创新高,华邦DRAM价量齐升..................................6消费电子动态....................................................................................78月国内智能手机市场销量同比下滑............................................................78月PC市场同比基本持平.....................................................................8风险提示........................................................................................9 海外市场行情回顾 国内AI应用活跃度受假期影响下降,Google发布ComputerUse 来源:Similarweb、国金证券研究所 本周,海外聊天助手类应用活跃度中,Gemini周均环比下降,ChatGPT保持平稳,Perplexity和Claude活跃度均有上升。国内应用中,受国庆假期影响,多数AI聊天类 应用活跃度下降。 OpenAI正式上线其最新人工智能模型GPT-5Pro API,作为其迄今最强大的模型向开发者全面开放。GPT-5Pro拥有高达40万Token的上下文窗口,能处理更复杂的文本内容,适用于科研写作、法律分析等高要求任务,并支持文本与图像输入。该模型定价为每 百万Token15美元,虽比基础模型贵15倍,但反映了其在高端应用场景的价值。 谷歌预览了全新Gemini AI模型——Gemini2.5Computer Use,旨在赋予AI代理通过浏览器导航和交互网页的能力。该模型利用其视觉理解和推理能力,可像人类一样执行填写表单等复杂操作,主要应用于UI测试及为无API用户导航网页界面。此举正值AI代理功能竞争白热化,此前OpenAI发布了新的ChatGPT应用并持续关注Agent功能,Anthropic也已发布带有“计算机使用”功能的Claude模型;谷歌发布Veo 3.1版本,为视频创作者带来视频时长增加、角色一致性增强、输出质量提升及新增的“多镜头多提示”功能,显著提升创作效率。此外,谷歌CEO桑达尔·皮查伊宣布,谷歌AI产品月处理代币数已超1300万亿。分析指出,该数字主要反映AI模型后端计算复杂度的上升,而非用户使用量的直接体现。代币消耗激增或由Gemini2.5Flash等新型推理模型驱动,其单次请求代币量为前代17倍,导致推理成本高出150倍,多模态功能亦计入总量。因此,该数字被视为衡量谷歌后端计算负载与基础设施扩展的指标。 AMD vs. NVIDIA:在InferenceMAX框架下的性能与投资结论 10月10日,Semianalysis发布其InferenceMAX推理性能评估框架,InferenceMAX是一个开源、自动化、按日更新的推理性能基准,核心在于以真实工作负载和可复现方法量化推理系统在“吞吐—交互性”之间的权衡。该框架以“TCO每百万token”与“每MW产出(tokens per MW)”为核心指标,从经济性和能效两维刻画不同软硬件组合的性价比,并通过帕累托前沿展示在当前条件下的最优折中点。这一框架为比较不同GPU与推理栈提供了统一语境,使结论不依赖单点跑分,而锚定在实际交互区间与应用经济性。 在InferenceMAX的全域比较下,AMD与NVIDIA并非单边压制关系。其优劣取决于模型类型、精度设定(FP4/FP8/MX4)、推理引擎(vLLM/SGLang/TRT-LLM)以及目标交互性区间。在低至中交互性区间(如聊天类、agent类服务),NVIDIA通过GB200/B200及其封闭软件栈(TRT-LLM、NVLink并行策略)展现出更强的机架级性能与单位经济性。其硬件与软件协同优化仍在快速演进,帕累托前沿持续下移,意味着其在单位token成本上的领先位置尚未固化,但总体仍保持优势。 在部分vLLM+MX4/FP4组合与特定中高交互性区间(如文档摘要、批量推理任务)中,AMD在TCO归一化后具备显著竞争力。新一代CDNA4架构在能效提升上表现突出,使其在“每MW产出”维度上已逼近NVIDIA同代产品。虽然Blackwell在绝对性能上仍领先,但若考虑TDP、整机定价与部署规模,AMD在部分场景下的ROI接近或超越NVIDIA。 正确的硬件选型与估值应以目标交互性为锚点,在该区间下比较经济性(TCO/每百万token)与能效性(tokens per MW),而非单纯以峰值吞吐或极端并发结果做结论。InferenceMAX通过夜间自动跑分,持续反映软件栈(vLLM、SGLang、TRT-LLM)在内核与并行策略上的迭代优化,使帕累托前沿动态更新、竞争格局持续重排。 短期内,性能公告需在InferenceMAX框架内解读,关注软件栈优化对TCO和交互性区间的边际影响。中期看,单位经济性与能效(tokens per MW)改善速度将决定盈利弹性,AMD若能维持能效追赶并在生态上获得主流推理引擎支持,其竞争力将显著增强。长期来看,生态与机架级方案成熟度成为核心分水岭。NVIDIA仍具先发与生态垄断优势,但AMD若通过开放生态与更优$/TCO路径获得规模化部署,将重塑AI推理市场的利润分布。 InferenceMAX揭示了AI推理硬件竞争的真正衡量维度——不是峰值性能,而是单位token经济性与能效。NVIDIA在机架级生态与分布式性能上领先,但AMD正凭借更优能效与开放栈快速追近。未来AI硬件竞争将围绕交互性区间的TCO而非单卡TFLOPS展开。 英特尔18A节点点评:突破量产门槛,但领先仍在验证期 英特尔宣布其Core Ultra 3“Panther Lake”处理器已在18A节点上进入量产阶段,正式迈入2nm级制程时代。这一节点被视为英特尔重塑制造信誉与技术领导力的关键里程碑,既是公司内部CPU架构与制程技术能力的集中展示,也承载着吸引外部代工客户的战略目标。 来源:英特尔、国金证券研究所 来源:英特尔、国金证券研究所 在技术架构上,18A是英特尔首个在量产工艺中同时实现RibbonFET(GAA)与PowerVia背面供电的节点。与传统前侧供电方式相比,背面供电可释放更多前侧空间用于逻辑互连,减少电阻与功耗,提升整体能效表现。这一并行创新体现出英特尔在制程结构上的进取姿态,但同时也显著提高了制造复杂度与成本,使其更适用于高端计算与AI加速等高毛利应用场景。 与台积电N2相比,18A在性能与能效上有望取得领先,但在晶体管密度上仍略显不足。由于PowerVia将供电网络移至背面,英特尔的有效逻辑面积利用率更高,理论上可在同等面积下实现接近的计算密度。不过,实际晶圆成本更高,且能否在规模量产中保持良率与一致性仍待观察。 在产能布局方面,18A首批量产来自亚利桑那州Fab 52,而Fab 62仍在建设中。PantherLake的正式出货时间被推迟至2025年底至2026年初,反映出工艺爬坡速度慢于预期。虽然英特尔的缺陷密度指标持续改善,但性能与功耗良率的达标仍有不确定性。 从战略层面看,18A的意义在于验证英特尔能否真正重返先进制造竞争行列。若未来ClearwaterForest等产品能顺利量产并展现性能优势,英特尔将重获代工信誉;反之,若产能爬坡与性能兑现再次受阻,18A可能只是一次阶段性追赶。 总体而言,18A标志着英特尔在过去十年最具技术含量的一次工艺跃迁。它实现了从FinFET向GAA的结构转型,也为未来AI时代的能效优化奠定了基础。然而,18A目前仍处于“证明阶段”而非“统治阶段”:它展现了英特尔重新崛起的潜力,但距离真正与台积电并驾齐驱仍需时间与市场验证。 AI需求驱动存储链回暖:群联控制器出货创新高,华邦DRAM价量齐升 2025年9月,台湾存储产业呈现同步复苏态势,群联电子与华邦电子双双创下营收阶段高点,显示AI与企业级存储需求正成为产业核心驱动力。 群联电子9月营收达65.15亿元新台币,环比增长9.8%,同比增长47%,创历史单月次高;其中PCIe