真正的AI竞技场:供应链,而不仅仅是算法 来自人工智能前线的警钟 2024年初,微软悄然搁置了两个大型AI数据中心项目的计划。分析师们猜测,这并非由于需求减缓——而是因为限制因素。电力短缺、供应链瓶颈和芯片成本的飙升迫使这个科技巨头重新思考其AI扩张战略。与此同时,Nvidia的GPU在溢价销售,云计算提供商在努力确保足够的硬件以满足需求。大约在同一时间,微软推出了自家的AI芯片Azure Cobalt 100和定制AI加速器Maia 100,旨在打破Nvidia的硬件垄断。 这些事件在整个行业引起了强烈反响。教训显而易见:人工智能竞赛不仅仅关乎开发更好的模型——它还关乎确保支撑这些模型的 infrastructure 的安全。在一个沉迷于创新的行业中,真正的斗争在于供应链。 明天的真正AI超级大国将是那些掌握大规模AI部署所需10个关键要素的国家: AI人才– 构建和优化人工智能系统的研究人员、工程师和数据科学家 人工智能模型人工智能能力的核心基础,通过持续的研究和创新发展而成。 人工智能芯片——专门处理器,如GPU、TPU和AI加速器,它们为人工智能计算提供动力 4人工智能训练数据– 有效训练人工智能模型所需的巨量数据集 这些前四个是AI革命明显的核心要素。然而,剩下的六个则是隐藏的供应链陷阱,这可能决定谁能在AI竞赛中胜出或败北。 数据中心建设– 建立建筑物涉及的物理服务,包括从服务器到备用发电机的所有基础设施的交付和集成,以及冷却解决方案。 数据中心基础设施设备冷却系统、电源分配单元和网络设备对于人工智能操作至关重要。 计算硬件– 处理器、网络交换机、存储阵列和用于支持人工智能工作负载的高带宽内存 电力生成——不断增长的电力需求和可持续、可扩展的能源来源的需求 房地产业– 对适合AI基础设施扩展的土地和位置的策略性收购 电信基础设施——光纤网络、5G和海底电缆,这些设施能够实现高速数据传输 掌握这些六个隐藏要素建立最佳人工智能模型同样至关重要。让我们在这场高风险竞赛中逐一分析每个方面。 人工智能模型需要惊人的计算能力,而这种能力来源于数据中心。微软、亚马逊和谷歌都在纷纷努力建设和扩展它们的数据中心容量。然而,空间、电力可用性和冷却解决方案正成为主要限制因素。 在人工智能工作负载比传统计算需求高10-100倍能量的情况下,数据中心正迅速演变以适应更高的功率密度环境。据报道,微软已在弗吉尼亚州、德克萨斯州、爱荷华州、亚利桑那州和乔治亚州寻找地点,以容纳大规模的下一代人工智能数据中心。科技巨头们也在探索新的设计,例如水下数据中心和液体冷却,以优化效率。 数据中心基础设施设备:被忽视的AI骨干 为了人工智能模型能够有效运行,它们需要大量的计算能力,这是数据中心所提供的。然而,扩展人工智能基础设施不仅仅是获取服务器。设计和维护专门用于人工智能的数据中心所需的专业知识严重短缺,这造成了重大的障碍。 除人才短缺之外,人工智能数据中心成本巨大。高昂的初始建设投资、专门的冷却系统和节能硬件可能会减缓扩张。随着人工智能工作负载对能源的需求增加,公司必须整合液体冷却、高效电力分配和替代能源解决方案,以防止运营成本上升和电网压力加大。 安全是另一个不断增长的挑战。人工智能数据中心拥有世界上最敏感的知识产权之一,使其成为网络和物理威胁的主要目标。组织必须实施人工智能驱动的安全系统、高级监控系统以及多层访问控制,以保护基础设施。 人工智能快速发展的步伐意味着数据中心也必须适应新的硬件架构,而无需进行昂贵的改造。未能将其基础设施中的可扩展性整合的公司将会难以跟上。那些不仅掌握技术,还能应对人工智能数据中心在可持续性、安全和物流方面的挑战的公司,将在争夺人工智能主导权的比赛中占据优势。 计算硬件:不止是GPU 人工智能芯片本身是不够的——它们必须得到高性能计算生态系统的支持。对先进计算集群的需求正在激增,但供应链中断持续导致延迟。同时,GPU、AI加速器和网络组件的成本仍然是扩大人工智能项目规模的重大障碍。 整合这些组件到现有IT基础设施中增加了另一个复杂的层级。 兼容性问题、软件优化以及在支持硬件方面的额外投资均属必要,以最大化人工智能的性能。掌握这些要素的公司能够大规模部署人工智能,避免阻碍准备不足的竞争对手的瓶颈。 发电:人工智能增长的致命弱点 人工智能是能源消耗巨大的行业。国际能源署预测,到2026年,人工智能和数据中心电力消耗将翻倍,达到相当于日本全部电力使用量的水平。没有在电力生产和分配方面的重大创新,这是不可持续的。 科技公司正在投资可再生能源项目、核能合作以及电网基础设施以满足人工智能无法满足的能源需求。微软和谷歌正在推动实现碳中和的人工智能,其中微软在2023年与Helion Energy签订了核能协议,以确保人工智能工作负载长期、低碳的电力供应。但现实是,如果没有大规模的电力基础设施扩张,人工智能的增长可能会遭遇瓶颈。 人工智能基础设施需要物理空间,而这个空间正变得越来越稀缺。数据中心的位置受能源可用性、气候条件(用于冷却)以及接近高人口密度区域以实现低延迟处理的影响。 公司如Meta和Google一直在战略性地收购土地用于建设AI数据中心。Meta在俄亥俄州和德克萨斯州积极扩张,而谷歌则在弗吉尼亚北部继续扩张,将房地产业视为竞争优势。 寻找合适的地点正变得越来越困难,原因是房地产成本上升、连通性需求和长期租赁限制。在平衡人才池附近的位置与运营需求之间也是一个挑战。那些在靠近能源来源和光纤网络的主要地点取得优势的人将在扩展人工智能运营方面拥有显著的优势。 电信基础设施:人工智能无声的英雄。 人工智能不仅仅需要计算能力;它需要快速移动大量数据。这就是为什么电信基础设施,包括光纤网络、5G和边缘计算,正成为人工智能供应链的关键部分。 低延迟、高带宽的网络对于自动驾驶汽车、实时视频处理和生成式AI等AI应用至关重要。亚马逊网络服务(AWS)一直在大力投资其光纤网络,而谷歌和Meta正在铺设海底互联网电缆以支持全球AI工作负载。没有强大的电信基础设施,AI的潜力将严重受限。尽管这些公司可能没有成为头条新闻,但像AT&T、Verizon以及全球电信提供商这样的公司现在已经是AI竞赛中的关键玩家。 结论:人工智能领导者必须成为供应链大师 人工智能革命不会仅由最优秀的科技创新者引领——它将由那些也建立了有效基础设施以支持它的人赢得。人工智能的供应链是一场关键战场,科技公司在芯片、数据中心、能源和电信网络等领域展开了一场争夺主导权的竞赛。 人工智能的未来不仅仅关乎软件突破——它关乎谁能构建、维持并扩展使人工智能成为可能的基础设施。那些掌握供应链的人将决定人工智能的未来。 GEP®提供基于人工智能的采购和供应链解决方案,帮助企业实现更灵活、更具韧性,更高效、更有效地运营,获得竞争优势,提升盈利能力和增加股东价值。 作者 潘纳夫·帕达戈恩卡尔 清新思维、创新产品、无与伦比的领域专业知识、智能、热情的人们——这就是GEP SOFTWARE™、GEP STRATEGY™和GEP MANAGED SERVICES™共同提供前所未有的规模、力量和有效性的采购和供应链解决方案。我们的客户是全球最好的公司,包括超过1000家财富500强和全球2000强行业领导者,他们依赖GEP来实现雄心勃勃的战略、财务和运营目标。 在多个 Gartner Magic Quadrant 中处于领先地位的 GEP,其云端原生软件和数字商业平台始终保持优势,连续获得来自行业分析师、研究机构和媒体机构的奖项和认可,包括 Gartner、Forrester、IDC、ISG 和 Spend Matters。 GEP亦被ALM、Everest Group、NelsonHall、IDC、ISG和HFS等机构定期评为顶级采购和供应链咨询及策略公司,以及领先的托管服务提供商。GEP总部位于新泽西州的克拉克,在欧洲、亚洲、非洲和美洲设有办事处和运营中心。欲了解更多信息,请访问www.gep.com. GEP SMART是一款基于AI的、云原生的直接和间接采购软件,它在一个用户友好的平台上提供全面的源到付款功能,包括支出分析、采购、合同管理、供应商管理、采购到付款、节省项目管理及跟踪、发票及其他相关功能。 GEP NEXXE是一个统一且全面的供应链平台,为当今复杂、全球化的供应链提供端到端规划、可见性、执行和协作功能。 基于大数据、人工智能和机器学习的基础,GEPNEXXE是一款下一代软件,帮助企业将供应链变成竞争优势。 100 Walnut Avenue, 克拉克, 新泽西州 07066 | 电话:732.382.6565 | 电邮:info@gep.com | 网站地址:www.gep.co 克拉克,新泽西州 | 奥斯汀 | 芝加哥 | 亚特兰大 | 多伦多 | 墨西哥城 | 圣何塞 | 圣保罗 | 都柏林 | 伦敦 | 阿姆斯特丹 | 德国的多特蒙德 | 法兰克福 | 奥斯陆 | 布拉格 | 斯德哥尔摩 | 波兰托鲁恩 | 罗马尼亚克卢日-纳波卡| 芬兰坦佩雷 | 赫尔辛基/埃斯波 | 拉脱维亚里加 | 南非比勒陀利亚 | 阿联酋阿布扎比 | 印度孟买 | 印度科伊姆巴托尔 | 印度海得拉巴 | 马来西亚吉隆坡 | 新加坡 | 印度尼西亚泗水 | 中国上海 | 中国大连 | 日本东京 |澳大利亚悉尼 版权所有 © 2025 GEP。保留所有权利。