您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[未知机构]:ComputeX英伟达大会同步解读 - 发现报告

ComputeX英伟达大会同步解读

2025-05-19未知机构H***
AI智能总结
查看更多
ComputeX英伟达大会同步解读

假设。 发言人2 01:47那另外的话,本身也是由于像中国这个第sic非常优秀的大明星公司。发言人1 01:54他们所推出的VRR1,不管是训练模型还是推理模型,在国贸出圈以后,也带来了新的一轮基础设施的建设,应该是说国内的不管是云厂商还是第三方,这些蒜粒提供商,包括国内的运营商,大家在这个新的一轮推理和训练的需求的增量上面,也是有比较大的贡献的。发言人1 02:19当然我们也认为是说整个的商业地方来看,依然是需要像AIagent的加速实现,以及各类音乐用,包括智能终端的涌现,所带来这个新的商业闭环的这样一个不可或缺的环节,才能够使得大模型的迭代推动到算命基础设施线上,再到消费者体验的提升,这一轮新的闭环的商业的最终走向成功。发言人1 02:49从算理层面来看的话,我们需要看到一点就是本身云端的算力需求依然是保持比较旺盛的增速的那云端的蒜粒需求来看的话,更加依赖于算力,这个发展过程中间对于算岗的一个充分的支持。发言人1 03:07这五年的话,我们看到今天早上英美达华人间也特别提到对于蒜粒基础设施的这个半定学化。发言人1 03:14更多调研既要添加微信OKOK5892。发言人1 03:17您这个半径的话,不管是在架构上的升级,还是这里面所涉及到的关键的技术环节。发言人1 03:27比如这样内存,带宽这些要求其实越来越高的那我们这里面也初步列了一些我们看到未来的一些技术的结论的要点。发言人1 03:37首先第一点肯定是啊基本的算略的能力间发热性特别急躁,对于英美达的心体而言,在过去的六年时间里面,它的这个算力的增长达到了4000倍,这也是非常可观的一个摩尔定律,叫做超摩尔定律的一个能力的体现。发言人1 03:56当然这里面也必须要提到,这是在内存的在宽提升的速度上面,也是成为未来一个新的投资的热点,就是大容量高存储的带宽。发言人1 04:08那最终的话再加上算法的迭代,不管是大模型的大规模的分布式的计算,还有包括高吞土低延迟的互联架构,这个也是本身从除了芯片角度以外,整个系统端架构的优化和改进,所对于云端应用的一个重要的支持点。 发言人1 04:29另外我们也要看到,就是除了云端以外,端侧的蒜粒需求也是未来的一个消费者能够直接感知到,并且是重要的商业闭环的一个支撑点。发言人1 04:41这里面的话,像现在大家比较关新的这个一体机,或者说大家在用云端的接卡模型的体验过程中间,每个分每秒钟大概是20个talk以上这样一个存储量。发言人1 04:53我们看到的话,未来随着这个终端的应用的不断的涌现,这里面也包括车载端的,像自动驾驶的感知决策,无人机端,以及未来的可能计身计身智能这一块。发言人1 05:08那么对于talking这个输出量的要求也可能会超过目前的20个,甚至1到30个这样一个基本的能力。发言人1 05:17未来可能会超过100个。发言人1 05:19当然到继承智能时代的话,可能会超过每秒1000个头肯。发言人1 05:23换个角度来看这个问题,就是我们对于终端的这个核心芯片,或者SOC芯片领域的成长空间还是非常看好的。发言人1 05:34除了蹲色还有云测这些基本的能力要求以外。发言人1 05:39我们想最重要的或者说在过去的两三年时间里面,甚至未来的两三年时间里面,重要的一个投资的重点,这个是AI的基础设施,或者叫做算了一层的infer r。发言人1 05:50那么算了一层infer的话,之前大家更多的是通过堆叠基本的服务器芯片,追求量的增长。发言人1 06:00那我们相信未来的话,系统的优化效率没上,这个可能成为下一阶段推动AI基础设施,AI inf基本发展的最重要的一个差异点。发言人1 06:13这里面既包括了算法模型、软件系统,也包括了硬件架构和跨区域的大流量数据的调动等等。发言人1 06:21 这些方面的整体的一个整合的能力的提升,从而带来新的AI投资的差异化,并且也是驱动了训练成本和推理成本的快速下降,进一步的拉动终端的需求,最终的体验者也能够获得比较不错的这样一个收益。发言人1 06:42那当然,过去的一段时间里面,大家也要关注的就是像deep个别代表的多元多专家系统,包括XBXB8的这个混合训练精度这些的工程方面的叫做工程的优化。发言人1 06:57不管是在预训练阶段还是后训练阶段,应该说desk不管是V3还是R1,都提供了比较好的一个样本的界限。发言人1 07:07那未来的话,我们相信整个全产业链条的这种工程上的优化和系统端的教学提升,可能会成为一个主流的共识。发言人1 07:18这里面我们也尤其要提到的,就是国产算利,未来迎来新的一轮这种大的发展机会。发言人2 07:18这里面我们也尤其要提到的,就是国产算利,未来迎来新的一轮这种大发展机会。这个可能大家也或多或少会关注过去一段时间美国对于先进技术的一个出口的管制的新的变化。发言人1 07:26这个可能大家也获得或少会关注过去一段时间美国对于先进技术的一个出口的管制的新的变化。我们也看到过去两年时间里面,中国的整个的产业链接。发言人2 07:37我们也看到过去两年时间里面,中国的整个的产业链接,不管是从模型管理基础设施,还是到底层的发展,技术的发展都非常快的那不可否认的就是我们在过去一段时间里面的话,还是有一些环节,存在一些薄弱的技术点,以及需要去打通的这些平邑员。发言人1 07:39然后不管是什么模型,管理基础设施,还是到底层的发展,技术的发展,都是非常快的那不可否认的就是我们在过去一段时间里面的话,还是有一些环节,存在一些薄弱的技术点,以及需要去打通的这些评定点。发言人2 07:58我们也相信未来随着国内算利能力的快速提升,国内这个系统整体的蒜粒系统,蒜粒基础设施的能力的这种不断的往下去加根。发言人1 07:58我们也相信未来随着国内算利能力的快速提升,国内这个系统整体的蒜粒系统,蒜粒基础设施的能力的这种不断的往下去加根。再带动着国内的一系列的AI的终端类型的应用,这个既包括一年也有提成技能,各种人形机器人的变化,也包括一系列的软件的这种迭代,互联网端APP的迭代。 发言人2 08:10再带动着国内的一系列的AI的终端类型的应用。这个既包括一年也有提成技能,各种人形机器人的变化,也包括一系列的软件的这种迭代,互联网端APP的迭代。发言人1 08:25整个构成一个快速的循环系统以后,这个内清华一旦打通,我们也相信中国的生活是AI行业,有望实现全球移民水平。发言人1 08:36那不可这个可能投资者也比较关心一点,就是除了技术端系统端的一个快速迭代与领域以外,国内在资本开支层面,目前的一个进展,以及从过去可比拟的可比较的这个层面来看,过去的一轮的这种国内的资本开支,那么在未来来看的话,究竟有多少的增量和发展潜力。发言人1 09:00首先一点的话,大家可以在这条PP上看到,就是2018年以前,应该是说国内的3G4G在这种移动互联发展周期里面还是提的非常快的那在2018年以后,应该是说我们看到的是这种国内的5G新的一轮建设浪潮兴起,带动的新的这种互联网应用的迭代的出现。发言人1 09:25那在过去的一段时间里的话,大家比较关心的这些在5G的后周期里面,或者在AI的前周期里面,这轮的这个AI的不能开支投入力度究竟能不能持续。那至少从数据上角度来看,2023年,因为我们看到2022年年底是这个please ct,是FAI发布它的trf GPT。发言人2 09:38那至少从数据上角度来看,2023年,因为我们看到2022年年底是这个please ct,是FAI发布它的trf GPT。发言人1 09:47那么2023年、2024年、2025年已经经历了三轮的这种三年的快速的增长周期,那么资本产水总量也将近310美元。发言人1 09:57那我们假冒的话,我们认为未来在随着国内的第一整个的锻炼基础设施系统的能力的完善,再叠加上我们新的AI的各类应用的心情,这个是推动这么开去上行的最主要的两个驱动力。发言人1 10:15展望2026年到2027年,我们认为这轮新的头部的云厂商的新的一轮这么开具的上品周期,还是可以比较期待的。发言人1 10:27对于专硕而言的话,专策的话,这些新的随着优化以后的这种蒸馏技术,使得更多模型可以来端头部署。发言人1 10:37 那么最直观的显现,这是国内的一系列的都非常僵,在一方面至少在逐步的向七两米以下做叠赛。发言人1 10:47另外一块的话也看到终端侧的算命的需求,可能是在十个G套十套次以内,就基上能够满足现在专科模型的一个初步的运行。发言人1 11:00在这种情况之下的话,模型参数的多少和模型的企业其实是有一些这种不是那么强关联的。发言人1 11:09以前大家通常认为说一定要是更大的模型,才会有更好的体验,那现在随着工程优化技术的迭代,以及像deep c这种开源的模型的效率的提升。发言人1 11:19在这点上面的话,基本上国内的这些头部的SOC的均线,它的应用的范围和体验的程度已经得到了一个比较好的一个磨合。发言人1 11:30所以从这点来看的话,端侧的SOC在这种持续迭代之后,服务于多元化的场景的能力,也取得在国内的这些AI的最终消费者的任何路上,可以得到一个比较快速的一个普及。发言人1 11:47从应用层角度来看的话,这个必须要提到的各种规划进行决策、进行动作等等层面,已经形成了一个比较好的一个闭环。发言人2 11:47从应用层角度来看的话,这个必须要提到的各种规划进行决策、进行动作等等层面,已经形成了一个比较好的一个闭环。发言人1 11:57当然这个根本的驱动力还是在于这个大模型本身的这个后面所代表的对于语言的理解能力,对于这个COT倾向boss spv链的理解能力,还有包括有线和葬法的能力,这都是比较好的得到了一个迁移。发言人1 12:14这个2到3年时间里面可能会得到一个比较快的一个普及。发言人1 12:20如果是从市场空间上来看,这个也是从第三方的咨询数据我们看到情况就是如果是本地端的加上云端的这个AI的agent市场,如果说2020年大概是在100亿美元的话,可能在到2030年就可以达到400亿美元,这还是一个非常可观的一个增速的那当然国内除了这四个以外,前一段时间出来的这个没人也是一个比较热点的一个话题。当然没所代表的就是从这个模型的快速的应用普及过程中间,把模型不同的能力做分层以后,不管是从规划,从到验证任务的可实行程度,再到做任务的分解,最后到任务的合同交 付。 发言人2 12:49当然这所代表的就是从这个模型的快速的应用普及过程中间,把模型不同的能力做分层以后,不管是从规划,从到验证任务的可实行程度,再到做任务的分解,最后到任务的合同交付。发言人1 13:08这一整套的任务的执行流程上面,我们也看到了壳的价,虽然大家之前是认为是说可能一切是皆模型的,模型就是产品。发言人1 13:19但是我们也看到过这种叠加到不同的模型能力之后的这种minit这种被代表的agent的价值。发言人1 13:28我在过去的一段时间里的话,大家比较很多的就是在这个模型的执行过程中间,可能一些异常的任务的结束,或者说异常的这种断点。发言人2 13:40我们觉得这个也是在未来的技术优化以后,模型能力的提升以后,包括MCP这种多任务的调度系统执行能力,通用的协议打通以后,还是能够得到比较好的一个解决的那另外一点要能够看到的就是agent本身,有可能未来替代这种新的替代传统的APP,成为新的这种内容分发的入口。发言人1 13:40我们觉得这个也是在未来的技术优化以后,模型能力的提升以后,包括MCP这种多任务的调度系统执行能力,通用的协议打通以后,还是能够得到比较好的一个解决的那另外一点要能够看到的就是agent本身,有可能未来替代这种新的替代传统的APP,成为新的这种内容分发的入口。通常在这种互联网入口发展过程中间的话,因为由于有较强的这种流量聚合能力和这种商业变现能力,所以手机厂商和互联网厂商都是在开发自己的这个agent的这种工具来去掌握新的这种分发的入口的平台。发言人2 14:07通常在这种互联网入口发展过程中间的