您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:国金计算机科技硅谷随笔这次GTC有幸与非常多硅谷顶级大厂 - 发现报告

国金计算机科技硅谷随笔这次GTC有幸与非常多硅谷顶级大厂

2026-03-23未知机构A***
国金计算机科技硅谷随笔这次GTC有幸与非常多硅谷顶级大厂

这次GTC有幸与非常多硅谷顶级大厂、投资朋友深度交流,也在这儿与国内多家顶级供应链董事长、高管相聚,非常感谢指导,超级时代共享繁华!这两天还继续在这边调研,暂时从自己视角,有些有意思的感受给大家分享: 1、大模型的迭代仍然处于非常快速的时间:Scaling Law仍然有效,在尖端模型比目前规模拓展10X以上,即约几十万亿参数,在数据准备可能、硬件准备上中期看没有问题;基于 【国金计算机&科技】硅谷随笔 这次GTC有幸与非常多硅谷顶级大厂、投资朋友深度交流,也在这儿与国内多家顶级供应链董事长、高管相聚,非常感谢指导,超级时代共享繁华!这两天还继续在这边调研,暂时从自己视角,有些有意思的感受给大家分享: 1、大模型的迭代仍然处于非常快速的时间:Scaling Law仍然有效,在尖端模型比目前规模拓展10X以上,即约几十万亿参数,在数据准备可能、硬件准备上中期看没有问题;基于更高质量的数据工程、更清晰的任务定义、更高效的推理性能也在当前模型规模下不断推动;对于图像模态的融合也不一,谷歌训练数据也仅融合不到10%,看起来全模态可以通向更有意思的智能;也在很多新的底层框架在尝试,不同角度跨越或融合transformer;模型到达一定规模和各类型高质量数据量后似乎不仅是近似数据压缩的再现,很理解很多近似原则(principle)的东西,而现在又是AGENT/局部AGI临界点,近两年应该还是会看到很多领域出现有意思的东西。 2、去年是Coding和低阶Agent时代,目前今年The year of agent已经非常清晰。 从去年年底开始GEMINI 3.0 PRO、GPT5.2、OPUS4.6全面把模型能力推到了中阶Agent阶段(部分人已经把这定义为AGI或局部AGI,即部分能完成人类工作),coding的进步极大推动了Agent的发展(其实gpt 3-codex就有感觉,但大厂们目标也不是都一致),泛化和可靠性大幅度提高。 目前Agent正在进入一个与全球数据、接口、knowhow、idea快速融合的阶段。 垂类来看,Anthropic继claude code后推出了excel、PPT、cowork等,进一步推动了合作伙伴计划,像埃森哲、德勤等咨询公司,Intuit、Harvey&Rogo等应用软件、Snowflake、Gitlab等工具。 通用来看,去年Q3我在国盛写了6篇报告的“自定义Agent”雏形已经出现,OpenClaw允许每个人有能力将不同的模型、自己可以触达的特定的数据、自己的Idea与knwohow融合起来做出千人千面的Agent,去优化自己的工作与生活,虽然目前垂类和通用还非常初级,易用性、完备性还远远不足,但是我们要意识到这是在快速甚至急速迭代的产品,模型与新的四要素(数据、接口、knowhow、idea)都在快速迭代,我们已经进入了不可避免进入了Agent时代。 3、模型大厂的竞争是很有意思的问题,竞争的要素丰富而有趣。 目前大家看到的比较成功的是Claude、Gemini、GPT,Claude相对比较专注,两年前极致地下注了Coding了,然后Coding衍生出来的API Agent这类体系发现应用空间泛化能力都极强,各类指标准确度、幻觉水平都快速地到人类可靠级别,Coding和Agent也成为了现在所有模型都在加强的标杆领域。 谷歌之前把Google Brain分拆到了DeepMind和AI infra两个部分,整个谷歌的技术积淀是三家里最厚的,各个技术路线都有比较好的储备,也是在3年内重新成为王者。 多模态理解、生成和生态能力在三家里应该是最显著的,管理相对温和与稳定,100%使用TPU这点在内部训练上还是比较有特色,对他们自己应该是不错的选择。 大团队的稳定似乎成为Gemini和Claude脱颖而出的原因之一,其他几家大厂似乎在战略、方向、人员上都有较大的波动。 OPENAI前期既想做过原生多模态,后续又转到Claude的路上,近期在围绕OpenClaw这类生态做优化,整体的水平还是非常高、codex对于后端其实蛮不错的,不过人员流动比较快,Sora对外更新也是暂缓,这边对前景评价也是具有争议。 其他几家大厂也在积极追赶,Meta接下来的Llama5(Avocado)预计应该介于Gemini 2.5 pro到Gemini 3 pro之间,微软仍然保持着对模型的追求,文生图半年内做到第三,不过一直拒绝蒸馏这点很有意思。 X AI前期有点太急,重整旗鼓后可能也是强劲的竞争对手。 总体的感觉是模型的竞争远未结束,在下一个大的类似Coding这类路线选择上大家还会再一次下注,会有很多有意思的结果。 4、纯粹的跟随可能比我们之前想得要容易一些,对国内模型可以乐观。 整体来看,硅谷大模型人员流动非常频繁,很多Knowhow传递还比较快,有利于模型的跟随。 无论是预训练、后训练(合成数据、强化学习、SFT)、数据处理、模型结构、方向选择都有大量的knowhow在快速传递,部分领域国内的创新也会被借鉴。 比如字节在文生视频上,数据处理的方式与质量(数据工程类很多工作感觉天然适合国人)将其推到全球顶级。 另外Deepseek关于注意力机制与数据精度的创新也是大家也会借鉴。 蒸馏是另外一种方式的跟随,大模型训练中数据的重要性使得SOTA(最佳)模型很容易成为天然的数据来源,这点对于海外的诸多模型也一样,但也解决不了所有问题。 整个国内的人才水平还是不错,但对顶级人才而言,国内经常讨论的天价薪酬在硅谷大模型这儿也很常见甚至更夸张,大家关于人才的争夺非常激烈。 字节目前人才密度还是比较高,一些技术领袖在硅谷也被认可。 国内模型目前看下来人才水平、信息传递在跟随上可能比预期乐观,水平也突破了Coding与低阶Agent的临界点,商业化在加速,我们觉得可以乐观。 算力确实是很大的限制,硅谷某些大厂可能一个极少数人的团队可以调度万卡,这在训练效率与跨越式基础研究上会是比较大的限制,国内模型目前看整体规模可能也只有这边一线模型的1/3-1/4。 5、对应用厂商而言,要想好大模型吞噬不了的东西,既是挑战也是机遇。 美国比较早进入了SaaS时代,印象深刻的是Servicenow这种工具就像一个网页一样,各个系统完全统一底层,理论上数据转型AI是有机会的。 但目前AI Agent的能力已经从必须Copilot变成可以协助人完成部分工作,规模很多大厂的部分部门在要求员工记录自己非常完整的工作数据与Knowhow。 传统SaaS更多的是管理人、物、钱,所有的软件厂商可能需要跳出来再看看Agent中除模型以外的四要素(数据、接口、knowhow、idea),未来的工作流与各行业格局都会重构,从第一性原理而言,通用模型似乎难以把握这4类要素,即使把握了也不经济,一旦整合成功既有规模效应,又有比传统软件大非常多的市场空间,是所有人的机遇与挑战。 6、机器人的量产不会太远,但真正智能的机器可能还有不短的一段路需要走。 目前行业在探索五条路。 一是只做特定场景不求通用;二是在虚拟仿真里训练;三是回到真实世界用各种方式采数据;四是直接让大模型控制机器人;五是特斯拉那套——先让人远程操控机器人干活,边干边攒数据。 机器人最缺的就是数据,大模型的数据互联网上到处都是,但机器人最顶尖的数据得靠人手把手遥控采集,又慢又贵,所以现在机器人的泛化能力很差,换个环境就不会干活了。 特斯拉目前来看找到了比较好的中间路线:先通过遥操,让人和机器人协同干活,这样一方面可以让薪酬较低区域的工人远程干活(开始具备数万台、推广下具备数十万台量产的可能性),同时可以积累大量的机器人的数据,最后再走数据到智能的这一步。 另一个大家提的比较多的公司是physical intelligence,已经在6-7个自由度的夹爪机器人,大模型方案,在还不错的形态、任务泛化能力下达到80%以上的准确度,这让机器人的智能变得有希望,总体而言,还有不短的一段路要走。 7、存储比预期会紧缺更久。 存储的基本原理已经很清楚,除开大量的训练只能用HBM,大模型实时推理中的KV CACHE只有HBM或DRAM能够接纳,但KV Off load到NAND的趋势十分明确,推理爆发必然会带来存储的需求爆发,各种注意力机制的革新也只能缓解不能改变。 目前从顶尖大厂情况看,26-27年产能已经完全预定,28年可能在比较激进扩产情况下也会远远供不应求。 只要AI保持渗透与进步,需求上需要担心的不多,供给投入的时间也比较长,目前肯定是supercycle,Nand是一个更低阶但爆发起来产能更不足的Dram。 长期来看,Base Die、存储制程的提升、存算一体对三大厂(三星、海力士、美光)是机遇也是挑战,但都不是短期有结果的事情。 8、CPO、OIO的路线很确定,但目前可靠性需要不断验证,光的市场斜率会非常高。 对CPO而言,路线没有太需要质疑的地方,最大的问题是做到一块板子上只要不够可靠更换成本变高,OIO会变得更高。 从时间上看,几个大厂认知有很大区别,NPO、可插拔可能这两年仍然是主流,这也是国内光模块企业的窗口期,需要在技术上紧密跟上,再利用扩产优势(仅靠LITE、COHR不一定能满足量的需求,太旺盛)继续保持巅峰,市场空间整体肯定是倍增以上。 光芯片逻辑更为简单,不用担忧,但也要紧密紧跟技术升级。 9、ASML的壁垒还是非常高,Intel的FAB挺有意思。 目前从光刻机来看:已经从EUV时代向HNA DUV来推进了,可能对于FAB厂来说有机会触达1nm制程。 光源、涂层镜片、机械的三重壁垒都非常高,计算光刻也在发展,ASML的壁垒还是非常高。 国内应该有机会在这几年触达EUV,这对整个半导体与AI的意义巨大,但商业价值与效率可能是个长期追赶的过程,但需要对长期乐观。 中阶、高阶Agent对CPU的需求拉动是显著的,目前已经非常紧缺,早期的比例在修正。 中期可能需要担心的一个事是X86与ARM的竞争,这件事情还是需要考虑。 但Intel确实处在一个更好的状态下了,整体比之前卷不少,Foundry从A18在向A14迈进,良率应该还有很大可以提升的空间,台积电确实先进制程没有产能,一定会溢出,Intel也是美国信创不可或缺的一环,胜率很高。 10、VR/AR的热度在硅谷有所下降,AI手机可能硅谷目前的进度不像国内这么快。 苹果仍然处于观察者的状态,当然它对隐私的重视值得尊重。 无论是苹果还是Gemini目前看起来在AI手机上并没有特别突破性的尝试(除非保密级别极高)。 但模型能力、特别是多模态理解能力持续提升,手机天然是数据、接口统一的完美载体,这可能是非共识产业突破的一个有意思的领域,AI手机提升伴随着也会有整个终端的爆发。 11、只要AI还在快速迭代,英伟达的壁垒还是非常清晰,另外卷真的是AI时代的核心竞争力。 CUDA层以外的RT-tensor、PTX等都有很强的生态,所有人帮他一起激活芯片的每一寸上限。 自己又是卷王,老黄至今还会亲自看论文,不断的提出推动新方向,从芯片到整个系统,决策机制也很敏捷,非常让人尊敬,能感受到里面每个人都很乐观。 卷真的是AI时代的核心竞争力,如此高的斜率只能不断学习,敢于变化,敢于下注。 这次在硅谷也聊了非常多供应链顶级大佬,感觉这是国内供应链企业完美适配AI的原因,Respect,一定要保持信心!12、还有很多感受与细节来不及分享,马上又要去几个顶级大模型朋友们的围炉夜话,很喜欢这边氛围,大家都乐于分享与探讨产业的美妙。