AI智能总结
发言人2 04:56那谁是训练生理需求的代表呢?那就那那我觉得越往后看的话就越清晰。首先OKI肯定是的,XI这两家我觉得是代表着全球算力需求,训练算力需求的核心。我就这两家是就我们需要去定的这两家,看他们对AI算力需求方向是什么样子。从来咱们从来没有听说open要砍本材质的,对不对?发言人2 05:26XCI又看开始没有的,所以我想是啊我们今天讲星际之门的一个背景。新智能就代表了OKI他自己对算力的一个需求的一个载体。那么OK这个信息智能产生的背景,其实背后可能也会有微软的一些因素在。所以当时大家看信息智能刚成立的时候说,为什么没有微软的声音呢?那现在就也就是也不也不会有这样的疑问了,肯定没有微软的声音,因为大家的这个对AI的理念发生一些变化。我想今天的话我们就把OKI信息智能最新的一些进展给大家汇报一下。我们去跟踪一下到底OK他现在在他的整个AHI道路上的进展到哪一步了。所以我们认为今年下半年其实AI大模型上会有一些新的进展。发言人2 06:25基础就是信息智能在今年下半年就开始交付了。首先先由我同事啊啊啊介绍一下信息智能的一些最新一些变化,我们再看一下后面一些趋势是什么。好,我们时间交给浩天。发言人3 06:44好,各位领导晚上好。今天给大家汇报一下新基之门的进展情况。我们看新之门这个项目其实是在25年年初的时候提由三猫奥特曼提出,然后计划建计划是投资5000亿美元。然后目前之前刚开始有这个提议的时候,其实大家资本市场对他对他的怀疑森林还是很多的。就是说软银,甲骨文不能融到这么多钱去进行建设。不过从最新的发布的纪录片来看,其实整个的建设还是在很顺利进行中的。包括首期的1000亿美金,然后再到在这个新的纪录片中啊啊啊软银虽人意也是说也是进一步强调了未来会有5000亿美元的支持。然后我们再从3m门的现场的最新的进展情况。发言人3 07:48然后今天我们来就来看一下这个最新的进展已经进展到什么程度了。首先他这个纪录片上来其实也是给大家介绍了一个背景,就是建立新金门的目的,到底是为了什么?其实刚才也像小学刚才提到的,就是我们去看这些大厂资本开支,其实更多的是在于这个推理端的这个算力需求又没有起来。但是我们再去看这个训练段的话,其实无论是从前几天跟大家汇报的这个QV5的业绩来看,包括Q对于未来他的这些包括open I的订单,包括对于未来的这个收入预期来看,还是说从XAI和open I的两家大型算力集群的建设进度来看,其实训练端的继续建设其实也没有没有大家想象那么慢。发言人3 08:39然后首先看欧文亚的话,他自己他第一期这个阿比林,德州阿比林这个算集群是规划是在我们已经下班了,就是40万片,就买了CPU,然后总总的电力规模达到1.2几瓦的这样的规模。然后再看另一家叉XAI来看,目前首批20万张GPU已经落地。然后马斯克也承诺未来会有100万像GPU降大的规模,在20年年底之前进行落地。所以从去年端的角度,我们也一直给大家强调就是新的模型架构也都在探索中。然后最大的我们去用这个大型算集群,40万卡的GPU,最后能做出一个什么效果,这个还是很值得关注的。然后在训练端的这块的推动,还是要看用大型科技股。因为他有其他的自己本身的业务,所以说在这个投资方面,还是在大型商业集群投资方面,其实还是比较谨慎的。对于训练端来说,所以最终的重回前训练的这个丁老,最后我们还是要看这两家的一个进展。 out在5月8号的时候,在推特上其实也要不断的试图关于新之 发言人3 09:58好,这里先给大家过一下支持这个closet,也就是说这个马斯克的XAI项目的进展情况。然后在首批来看是已经有20万张GPU已经落地,然后目前也是保持满载运行的一个状态。然后马克也正在强调,这个呃close2期项目也正在进展。目前已经在孟菲斯也是买了买了一片新的土地,来进行新的CPU的部署的建设。然后计划量也是将GPU规模拓展到100万块,然后这个工地上来看也是达到几瓦级别。然后整个的节奏来看的话,也是刚才也说到是在26年年前完成,所以就回到了我们想想说就是21年末到20年年初,可能整个的在前训练的skinlaw的叙事将会有一个新的起点。在整个纪录片中,其实这里有大家三毛奥特曼又强调说也是问到三三这个district的这种带来算力通缩会是不是会给他减少算力集群的铺色节奏。发言人3 11:18然后在在这个视频中也表示目前可能我们从这张图来看,目前无论是软件效率优化还是硬件效率优化,可能要把整个的成本降低10分之1。而降低10分之1之后使用次数就会增加,包括像推理模型带来了更多的token的调用量。所以整个的对于欧莱雅来说,它的这个算力需求还是存在一个很大缺口。然后因为去满足他的用户人数的不断增长,包括尤其是他的生成图片和视频的模型出来之后,有更大的一个token量的调用。然后他不得不将一部分的训练方面的算力,一到推理方面来来来来来进行使用。所以最开始的时候其实在建设新智能,最开始的时候其实有一部分的算力是还是去满足推理方的这个需求。不过从三方方面的口径,最后的口径来说,肯定是最后达到目标就是为赢得通用人工智能ATI的这个。而且也就是说重回到模型本身的提升,也就是重回训练这块的一个相对的需求。发言人3 12:42奥特也是在对于ACI的预测是也是最乐观的一家。我们看这几家的对于AGI达成的一个时间轴的对比来看,我还是表示不止一次在公开场合表示,将会在2025到2029年去实现ATI的目标。然后微软、谷歌和英伟达基本都是在2030年前后。然后meta的话是最保说一下,可能会说说的会就是会还会有更长一段时间去实现AGI的目标。发言人3 13:24好,下面我们来来具体看一下,目前新之门的一期工程已建设到一个什么样的程度。然后它是规划的一共有8座,就是下从下面这个图,但是其实这是一座建筑,一共有8座这样的建筑会进行布设。然后一共每个建筑会将会容纳5万片GPU的所这个算力集群,然后最终中的规模将会达到40万片的这样一个规模。然后整个项目建设其实在24年年终的时候就已经开始动工了。从一片荒地到目前的已经形成两座主体建筑,这样的一个速度来看,其实进展还是非常快的。然后这两栋建筑中其实已经有接近10万块集群已经进行落地。然后这部分将会在今年夏季来进行投入使用,然后整个的项目完成将会在明年的年中。发言人3 14:31然后这里面给大家讲解一下,就是oracle在其中去作为一个什么样的角色。然后他其实对于英伟达下单,其实都是由这个oracle进行完成的。然后他主要是负责中间的这个,包括核心的最中间架构,然后布线和机架都是由oracle进行完成。然后目前来看的话,就是前几天的那个新闻,也是表示已经去给去下了40万片的订单,然后之后再将这个算力去以租赁的形式去提供给。发言人3 15:14 然后这里面还有一个比较重要的角色,就是整个项目的一个承建方,就是crucial这家公司。这家公司是干啥的呢?他其实就是整整个项目的电网的建设,包括他其实在最开始的时候也是他其实跟这个科瑞5其实有着相同的一个定位。发言人3 15:34创始人其实最初是一个量化教研出身,然后也是最早期去运用了强化学习的思想,去在这去预测这个证券回报。然后后来他就是离开金融业去建立去进行,在这个实物钻井平。他发现这个实物钻井平台去产生的这个副产品天然气无法被收集。然后然后在在这个天然气旁边直接去建立了这样的一个建立了发电厂,然后不但是发射这些电也无法去进行直接的商业化。然后他就把这个算力机房去直接移到了天然气油田的旁边去。把进一步的把从天然气转换成电力,再转化成算力的这个形式去进行无法收集的资源的一个商业化。发言人3 16:26然后最早的时候其实也是在部署了很多GPU去进行挖矿。然后在后面这个币圈的价格崩盘之后,也是进行了转型,去提供GPU的算力的这样的一这样这样的服务,其实跟前天汇报的这个我的定位其实是非常像的。然后在这个阿比林一期项目的建设中,这个手去提供了提供商的这样的一个角色。然后看这家公司的话,他在最后他在去年12月的融资中,最新估值也是达到了28亿美元。然后我们可以发现,英伟达其实也投资了这家公司。发言人3 17:12然后他除了在这种普通的这样的电力是提供之外,其实他也有自己的这个算力集群去进行出租。其实也是靠着跟他的合作关系,有一定的拿卡能力。然后25年的营收达到了224年就达到了2.76亿美元。然后创始人也是预计是25年这个数字将达到10亿美元。发言人3 17:41然后他作为他为什么会选他会在这个大城市穿集群中扮演一个比较重要的角色。就是因为他有很多的电力方面的关键组件的一个自主供应的能力,他的子公司去帮助去生产算机群中的电力系统所需要的这些电力组件。然后目前从阿比林一期项目的现场视频来看,我们也可以看到就是为了满足这个大型算集群的巨大的算力消耗的需求,他也是在这个集群旁边去建立起了燃气的发电厂。发言人3 18:24然后这里比较有意思的一点就是说,为什么会一期项目会选择在阿里落地?其实也是考虑到能源的需求。因为在德州这个地方,它其实有很多的风电资源去可以利用,而且整个的电力供给大于跟需求的还是。发言人2 18:44远远大于。发言人3 18:45这个电力需求的。所以会选择在阿比林这个地方去进行这个算力集群的布置。然后在纪录片中其实也提到了,就是说未来AI的竞争的关键因素也是在于能源。我们可以看到就是和20年前的PPU主导的数据中心相比。然后目前一一个机架1CPU刚才说错了,CPU的算力中心相比,目前一个由GPU主导的这个机架的功耗,已经达到了之前整个分整个数据中心的这样的一个功耗规模。而且给出了一个比较有意思的在 能源不是算力方面的对比。而能源方面的对比就是像GT提问一次的能量消耗量,已经达到了谷歌搜索去搜索之前一次搜索的时对。然后也是预计到2035年,数据中心将会消耗掉整个美国8%以上的电力的规模。然后从2.01期项目的液冷的方案来看,也是去使用了这个液冷的方式去进行GP的散热。然后他是去创新了一种这种闭环冷却系统的这样的一个方案,就是将冷却的水一次性注入,然后不会这些水在这整个算力集群中进行冷却,然后额外就不需要更多的水的注入了。发言人3 20:20最后再跟再跟再跟大家更新一点,就是除了在美国本土的新智能的项目在顺利开展之外,然后我们可以看到这个open I其实之前在官网上也去试出了他的这个AI for country这样的概念。也就是说主权AI正在逐步落地。因为前几让我们看也可以看到,川普也是去访问了中东,去签了6000亿美元的大单。然后其中有1000亿以上是去直接投向这个GPU的。然后5月22日我回来也是宣布在阿联酋去建立一个海外第一个第一个星之门海外版的数数据中心集群。然后此次合作对象是包括哀求的本土的AI公司,743。他是为本土为在在中东本土提供VI服务的这样的一家公司。然后他的整个的算力集群的规划的规模是在5G瓦这样的规模,五五千瓦这样的规模其实对比刚才他我们提到的2.017项目的1.2G瓦,就是这个规模,说起来还是还是蛮大的。发言人3 21:38然后整个项目从公开信息来看,整个项目将会分阶段推进。第一阶段将会建立一个一级瓦的集群,然后第一阶段先去部署10万张GPU,然后去进行其中的200兆瓦,先去进行这个实验实验去实验疫情,然后将在2026年去投入。第一阶段的这个三级群将会投入运营。然后这个跟美国本土的新金门项目的不同一点,我们可以看到这里面有一个新的公司加入,就是思科。然后思科在整个项目中的一个角色就是提供思科的产品,去提供这个网络安全客观性硬件的这样的一些解决方案。然后如果我们对比阿比林项目的这个1.2G瓦,40万张GPU测算的话,其实它的这个就是5G瓦的容量,其实去对应车的话,其实已经达到了160万张这样的一个巨大的数字。不过最后他到底能够这个项目最后能够去落地多大的一个算集群,还是需要有待去进一步关注的。发言人3 22:51然后这里还有一个比较有意思的一点,就是安全去跟欧文I去去进行了官方的合作。就是欧朋I阿联酋决定跟给全国人民去免费送这个柴油GPTplus的订阅。就相当于其实我们可以看到他