AI智能总结
边缘记忆:驱动生成式人工智能的下一个前沿 ©版权所有CounterpointResearch。保留所有权利。 2025年6月 内容 执行摘要3 第一部分:未来智能手机——从通讯中心到智能代理4 市场前景:快速扩散正在进行中4 代理式人工智能:转型的核心6 情境感知:个性化引擎7 第二部分:设备端要务与硬件挑战8 边缘智能的必要性:为何设备端至关重要8 不断增长的硬件需求:系统级升级9 第三部分:边缘人工智能的内存驱动未来11 解锁性能:内存的作用11 驱动未来GenAI智能手机:下一代存储解决方案12 量化和小语言模型14 结论—行业行动与协作呼吁16 动量累积:生态系统内各行业的行动与投资16 致产业界的消息:协同一致,加速发展,合作共赢16 执行摘要 智能手机正经历其迄今为止最深刻的变革,从通信中心演变为智能、感知环境且越来越自主的智能体。在生成式人工智能(GenAI)的快速发展和特别是智能体人工智能能力的驱动下,这些设备正从响应命令转变为主动理解意图并代表用户行动。CounterpointResearch将GenAI智能手机定义为“利用大规模、预训练的生成式人工智能模型来创建原创内容或执行感知环境的任务”,这标志着移动计算的深刻变化。 市场采用正在急剧加速。Counterpoint预测,具备GenAI功能的智能手机将从2024年出货量的约20%增长到2027年的45%,在安装基础上超过一亿台。由三星、谷歌以及现在集成Perplexity云AI进行系统级AI体验创新的摩托罗拉等先驱引领的这波增长,表明AI正成为智能手机体验的核心支柱。 然而,要充分发挥代理式人工智能的潜力,关键在于强大的设备端处理。对低延迟、增强用户隐私、成本效益和离线功能的需求,使得边缘智能成为一项必需品。虽然量化等技术显著提高了大型语言模型的效率和可部署性,但它们单独并不能克服硬件限制。运行高级人工智能工作负载仍然对智能手机硬件造成前所未有的压力。尽管芯片组需要重大升级(由高通和联发科等 领导者推动),内存系统正成为最关键的瓶颈。 随着人工智能模型的日益增大和复杂化,同时运行多个模型的需求,以及实时上下文处理的要求 ,凸显了当今存储芯片制造商面临的主要挑战。当前的旗舰级dram容量(12gb+)正变得基准,需求可能达到32GB或更多带宽需求正在上升 14.4Gbps(LPDDR6)及以上而在高级NAND闪存UFS4.x和ZonedUFS(ZUFS)对于快速模 型加载和缓存至关重要。并且,所有这些需求的核心是功率效率,这一点始终是首要的。 满足这些和未来的需求需要协同创新。LPDDR6、内存内处理(PIM)、WideI/O、先进封装技术(例如异构封装)和优化的闪存存储等解决方案至关重要。美光、三星、SK海力士等业界领导者以及苹果公司可能正在积极开发这些技术。 然而,没有单一实体能够单独成功。全生态范围内的协作、强大的标准化(例如,JEDEC)以及战略性投资(包括政府举措)对于打破这些瓶颈并usherintheeraofthetrulyintelligent,agenticsmartphone至关重要。 第一部分:未来智能手机——从通讯中心到智能代理 智能手机经历了多个不同的世代,每一代都增添了变革性的功能。我们现在正进入一个由生成式人工智能(GenAI)深度融合定义的新时代,超越简单的功能增强,迈向创造真正智能、自主的伴侣。 计数点研究将一款GenAI手机定义为“利用大规模、预训练的生成式AI模型来创建原创内容或执行上下文感知任务。”这些设备越来越多地处理多种数据类型——文本、图像、语音、传感器——直接在边缘执行复杂操作,标志着个人计算范式的转变。在边缘实现这种级别的功能需要更快的数据处理和更大的容量,这些问题将在后续章节中进行探讨。 表1:GenAI智能手机定义 来源:CounterpointResearchAI360服务。 市场前景:快速扩散正在进行中 智能手机对生成式人工智能能力的采用正在迅速加速,从设备作为通信中心向智能代理的转变正在全面进行中。 运量增长:计数点研究估计具备生成式人工智能功能的智能手机•2024年市场份额超过20%,预计到2027年将渗透率约为45%,到2030年将接近三分之二。预计几年内安装基础将超过十亿台。 OEM部署:已有15家以上OEM厂商已推出100台以上具备GenAI功能的• 模型。三星和谷歌是早期进入者,小米正在迅速部署,而苹果被广泛预期将显著推进这一类别 。 SoC格局:高通和联发科目前主导着GenAISoC领域,• 为这些功能提供核心处理能力。 市场渗透率:而最初主要集中在高端(批发$600和• 在上面)的细分市场中,GenAI功能将通过到2027年的中端($400-$599)快速级联下降,并预 计到2030年将成为大多数价格段的基本预期。 图2:生成式人工智能智能手机出货量预测 来源:CounterpointResearchAI360服务。 这次增长并不仅仅是关于更快的处理速度;它标志着智能手机角色的根本变化以及用户如何与之互动。 代理式人工智能:转型的核心 GenAI在移动端最具有变革性的方面是代理式AI—那些不仅响应显式指令,而且能主动理解意图 、做出决策并代表用户自主行动的系统。这些能力将智能手机从工具转变为伙伴。 与其让用户手动在不同应用间切换,AI代理充当协调员角色,无缝协调任务和信息流。像MediaTek这样的芯片组供应商通过其自主性定义智能体AI,嵌入(如AIStack或DimensityAI)等引擎进行观察、预测和执行。在MWC等活动中,像Honor和Qualcomm这样的公司展示了能够在多个应用中协调整日活动的设备,且只需极少用户输入。 一个最近的商业例子是新出的摩托罗拉Razr折叠手机,它将PerplexityAI深度集成,不仅是作为一个应用程序,而是作为设备体验中的一个主动、代理层。作为一个系统级助手,它解释上下文、回答复杂查询,并在界面中驱动交互。这标志着从传统的以应用程序为中心的设计向以人工智能优先、大型语言模型(LLM)为中心的操作系统范例转变的第一个具体步骤。未来,我们期待这种“超级代理”的编排会普及,并且会看到更多类似于GeminiNano的设备端实现。 图3:跨应用代理式AI任务编排 来源:CounterpointResearchAI360服务。 其意义深远:智能手机正成为具备复杂意图识别和实时适应能力的主导性数字伙伴,根本性地改变了用户体验。 情境感知:个性化引擎 自主型人工智能依赖于深度语境理解——超越“你+”(人工智能协助你)到“你²”(人工智能是你的数字化延伸)。这种提升需要处理丰富的数据流:位置、日程表、通信历史、传感器读数、用户习惯和环境。 像检索增强生成(RAG)这类本地实现的技术,允许大型语言模型安全地访问和整合这种个人上下文,从而在不会泄露隐私的情况下,提供高度相关和个性化的回应。这种深度个性化是智能体AI价值主张的关键,但它需要强大且高效的本地设备处理能力。 其他技术,如量化——通过降低数值精度来压缩模型——有助于在智能手机上部署先进的AI模型。 但最终,最大的挑战存在于硬件层面,在智能手机的严格电池、处理和内存限制内为不断增长的人工智能能力宇宙提供动力。 第二部分:设备端要务与硬件挑战 虽然云人工智能仍然相关,但代理式人工智能的核心功能——实时响应、深度个性化和主动协助 ——需要显著设备端 处理。转向边缘智能是由引人入胜的优势驱动的,但创造了巨大的硬件障碍。 边缘智能的必要性:为何设备端至关重要 直接在智能手机上处理AI工作负载提供了关键优势: 低延迟:消除云往返延迟,实现即时响应 对无缝交互和实时任务(例如:翻译、AR叠加)至关重要。 •增强隐私:在设备上保留敏感的个人和上下文数据,最大限度地减少暴露并建立用户信任— —这是系统学习用户亲密细节的关键。 成本效益:避免与运行相关的显著计算成本 在云端大规模部署复杂模型,如LLMs。(单个云端GenAI查询可以)比标准谷歌搜索大约贵40倍。) 离线访问:确保核心人工智能功能即使没有可靠网络连接。 带宽效率:减少对网络带宽的依赖,节省数据成本和改善网络连接不良区域的性能。 •个性化:允许模型根据本地存储的私有用户数据持续进行微调,从而带来真正个性化的体验。 图4:设备端与云服务AI优势对比 源:CounterpointResearchAI360服务 共识很明确:为了使自主AI兑现其承诺,必须进行大量的本地计算。这一要求反过来又要求智能手机硬件组件的能力发生重大飞跃。 不断增长的硬件需求:系统级升级 实现强大的本地人工智能需要全面大幅度的进步: 图5:当今GenAI智能手机的典型硬件组件 源:CounterpointResearchAI360服务 •处理器(SoC):人工智能处理的核心需要越来越强大的CPU、GPU,尤其是专用NPU(神经处理单元)withtensofTOPS为了高效处理人工智能工作负载。像高通(骁龙)和联发科(天玑)这样的领导者正在迅速增强其设备端人工智能能力。在架构、并行处理和先进制程 节点(迈向1纳米)方面的创新至关重要。 •内存(LPDRAM):内存面临着来自更大模型、多任务AI代理以及需要保持低功耗的巨大压力。 o容量:旗舰基线正超过12GB;未来的并行GenAI体验可能会需要32GB或更多. o带宽:这需要从LPDDR5X速度~10.7Gbps大幅增加至LPDDR6速度(14.4Gbps+ )防止计算单元饥饿。 •存储(NAND闪存):存储必须更快更大,以存储多个大型AI模型,处理快速加载/缓存,并管理AI生成数据的激增。需要高速接口,如UFS4.x已成為關鍵。•电池:设备端密集处理需要更高容量的电池和更智能的电源管理系统。需要快速充电和潜在的新电池化学成分。传感器和互连:更丰富的传感器数据为上下文人工智能提供燃料,而高效的内部门户数据通路必不可少。先进的封装技术对于有效集成这些组件至关重要。 •散热管理:散发持续AI工作负载产生的热量对于维持性能至关重要。需要先进的冷却解决方案。 对更高容量、带宽大幅增加、存储访问更快,以及内存和存储系统严格的功耗效率的同步需求,已成为限制边缘人工智能性能的显著瓶颈。 第三部分:边缘人工智能的内存驱动未来 随着系统级芯片(SoC)的处理能力不断进步,内存子系统的要求也迅速提高,以满足高级设备上人工智能快速高效地提供数据的需求。满足这些需求对于用户体验至关重要,因为人工智能模型复杂度、响应需求和多任务处理能力都在急剧增加。 解锁性能:内存的作用 OEMs和开发者面临在内存较少的手机(例如8GBvs.16GB+)上部署完整、设备本地、带宽消耗大的AI功能集和模型的挑战。这种情况与HPC/数据中心领域类似,其中像HBM这样的创新是必要的,才能为强大的GPU提供动力。在移动设备上,电源、成本和空间的限制使得这一挑战更加严峻。 值得注意的是,“计算”(NPU/GPU)性能增长已超过“内存”(DRAM)带宽速度增长,在移动设备中,仅仅是增加更多的传统DRAM并不是一个可行的长期解决方案。为了应对这一挑战,架构创新至关重要。 图6:加速硬件创新 来源:美光、高通、CounterpointResearch。 驱动未来GenAI智能手机:下一代存储解决方案 该行业正积极研发多种关键技术,以确保内存解决方案能满足GenAI智能手机日益增长的需求: 1.高级LPDDR(LPDDR5X、LPDDR6) lpddr5x:当前标准,提供高达~10.7gbps的速度• LPDDR6:下一代由JEDEC开发的DRAM标准,目标为• 显著更高的带宽(高达14.4Gbps或更高)和提高了电源效率,这对于为高需求的AI 加速器供电至关重要。 展品7:LPDDRRAM速度演进(Gb