行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

AI终端白皮书：AI与人协作、服务于人

信息技术 2024-06-26 - 华为&清华大学 ShenLM

AI终端白皮书：AI与人协作、服务于人

产业趋势与AI终端白皮书概述

AI终端白皮书聚焦于AI与人类的协作与服务，强调AI在终端设备上的应用与发展。白皮书指出，AI技术正以前所未有的速度改变着消费电子产业的格局，尤其是通过生成式AI技术的引入，有望在未来十年内推动科技领域收入显著增长，并改变人们的生活方式。

AI终端的发展阶段

AI在终端产品中的集成经历了从应用层集成AI、系统层融合AI到以AI为中心的全新OS三个阶段。这一过程旨在逐步深化AI在终端产品中的作用，从增强单点特性、全面融入操作系统，直至构建统一的AI子系统底座，实现OS各组件间的高效AI应用。

AI与人协作的新时代

随着AI技术的深入发展，终端设备正迈向全新人机交互时代。AI助手演变为AI智能体，能更好地理解用户意图，实现服务的全场景跨设备流转，提供更加个性化的体验。华为HarmonyOS作为代表，展示了如何通过分布式通信和AI能力，实现多设备间的无缝连接与交互优化。

多模态AI的兴起

生成式AI为终端设备带来了更自然、全面的交互方式，支持多种模态数据的融合与理解。这不仅提升了人机交互的自然度，也为终端设备形态的多样化提供了可能，如穿戴设备、机器人等。

全场景智能服务

未来的终端设备将不仅仅是单一功能的载体，而是能够提供基于场景的、连续性的智能服务。AI驱动的服务分发机制将实现从人找服务到服务找人的转变，提升服务的连续性和个性化。

轻量级AI集成

轻量级终端设备集成生成式AI功能已成为发展趋势，以满足用户在不同场景下的智能化需求。这不仅要求AI模型的轻量化，也强调云侧与端侧模型的协同，以提供更强大、更高效的智能服务。

未来展望

AI技术的持续进步将促使更多任务达到甚至超越人类专家水平。AI终端设备的未来愿景是构建一个全面智能的生态系统，通过AI实现人与设备间的深度互动，提升生活质量，激发新的生态价值。

这份总结提炼了AI终端白皮书的主要观点和趋势，涵盖了AI技术在终端领域的应用、AI与人类协作的新型模式、全场景智能服务的实现，以及未来AI终端发展的方向。

ҒᝓFOREWORD ϧጒᮧ㘪喍"SUJGJDJBM*OUFMMJHFODF喎᭜ᠴ̭ㆨᎬ∈⮱ឭᱜ喑ᬕౕប㵹ᝃ䒲ߖႹ᜽Вݺग㘪⩞ϧㆨᮧ㘪Ⴙ᜽⮱䃑ⴒШߎȡⰛݺ喑๔็᪝ϧጒᮧ㘪㈨㐌䘪᭜ധλᱧக႓΍喍.BDIJOF-FBSOJOH喎ឭᱜ჋⣝⮱ȡᱧக႓΍᭜̭㈨݄䕇䓴ౕ๔㻱὎᪝ᢛ䯳̷䃚㏰⮱ឭᱜ喑Ҭϧጒᮧ㘪὎ಸ㘪์Ą႓΍ą㐌䃎ᣕ᫚喑ᎣᏁ⩕䔆ψ὎ಸᲒ䶱≸Ⱕڠ䬛䷅⮱めᵵȡౕ 䓴ࣨ⮱࡮็Ꭱ͚喑䃥็ϧጒᮧ㘪ឭᱜጟ㏼䔽⌽᜽⛌ౝᏁ⩕λ⊵䉦㔲㏵〜ϔ৮͚喑Ҹຯ喑जВ䕇䓴ᠴ㏦䃳ݘȠϧ㙥䃳ݘᲒ㼐䨮䃫ิ喑ᝃ᭜ϻఫ׼͚᣽ः᪴᱙喑Ꭳजᄳڣ㔨䃾̺ͧ ह⮱䄚㼭喑ᝃ᭜䃳ݘϧㆨキࢂ⮱䄚䴠ᠴБᎣប㵹䃫ิ᧺҉喑ᝃ᭜ധλ↪䒓̷ऱ⻺эᙌக䛴䯳⮱᪝ᢛ䔈㵹䒲ߖ侫侣ᝃ㜗ߕ侫侣ȡ 䓾ᎡᲒ喑Ą⩌᜽ᐼ"*ą䔆̭ ឭᱜःᓄγᑂϧ∕Ⱋ⮱䔈ᆂ喑ຯ≮㵹⮱$IBU(15Ƞ(FNJOJȠ$MBVEFȠⰅऑȠ᪴ᓰ̭㼭Ƞ䕇Ͷࡰ䬛Ƞ䃜下ᭌ▘Ƞ$IBU(-.ぶȡ䔆ψ὎ಸധλ๔ಸฺᱯ⮱⌞Ꮣ⺋㏼㑾㐉㐀Ჱ喑䛴⩕ο㖁㑾̷⊤䛼⮱᪝ᢛ䃚㏰喑Ꭳ䒲В๔䛼⮱ϧጒࣺ亵ᄦ὎ಸ䔈㵹хࡃহᩦ䔈喑ᰭ㏵䃚㏰ڤܧᰶ᪝࡮Ϭ⩇㜠᪝̴Ϭ࣯͗ ᪝⮱὎ಸȡऄ⯷λ⊤䛼᪝ᢛȠ⊤䛼࣯᪝Ƞ⊤䛼ツ߈⮱Ą㻱὎Ⴧᒸ喍TDBMJOHMBX喎ą喑⩌᜽ᐼ"*ڤᰶᰡສ⮱㶕䓫㘪߈হᰡ∈ࡃ⮱Шߎ㘪߈ȡ ⩌᜽ᐼ"*䛺ൾγ⩌ϔ߈喑ᄳౕڲღ݈҉Ƞ䒜УᐭࣾȠ᪆㗟ڙߋぶ็͗ 䶳ഌ๔๔᣽ࡴϧЙ⮱ጒ҉᩵⢴ȡहᬣ喑⩌᜽ᐼ"*䔅ᄳ䉸εᮛ䕇ϧĄ䊲㘪߈ą喑ᝡ̷ڤิ"*㘪߈⮱ज⾬ᝡ䃫ิ喑⃼͗ϧ䘪जВ᠒ᰶ 䔉䊲ϧㆨ➖⤳ᙌჅ㇫ᏓȠ䃝ᓳ᩵ ⢴Ƞ䌕䄚㼭㔨䃾ぶ㘪߈ȡₑใ喑⩞λ⩌᜽ᐼ"*ᑧ๔⮱Ą⩌᜽ą㘪߈喑㘪์㜗ߕ⩌᜽ऱ⻺ڲღ喑ຯ᪴ႄȠఫ׼Ƞ䴠ͽহ㻳䶾喑๔๔ౝ䭺ѻγऱ⻺Шߎ⮱݈҉䬕Ἀ喑⃼͗ϧ䘪जВ䔈㵹㞧ᱜ䃫䃎Ƞᐭࣾ⼸Ꮌ喑⩇㜠⠙⿸ݣ҉⩢ᒞহᄼ⍥᜼ȡ ᆂ᱈᱗Გ喑᜾Йₐౕ䔈ڒ"*ൾ䕍᫝⮱⩌ϔ᫦ᐼȠ⩌≨὎ᐼВࣷᕊ㐡᫦ᐼ⮱̓⩹喑᪝ႄࡃȠᮧ㘪ࡃ⹫чₐౕߍ䕌ݝᲒ喑〆ౕ䔆̭अ䲖⮱ݺ⇬喑᜾ЙᄳВ㵹䌢㼭喑䃖⃼͗ϧᢹᤎ"*⮱߈䛼喑Ҁ侹ឭᱜअ䲖ፓᲒ⮱⩌ϔ߈হ⩌≨䉕䛼⮱下䋰ȡ ϔ͇䊸߬ "*ឭᱜౕ㏵〜ϔ৮⮱㲺ڒᏓ䔽ₒ⌞ࡃ喑ᣕߕᕔ㘪̻Ҁ侹ࣹ䛺ࡴ㏔ ᮧ㘪Ҁᄳᑂ䶳㏵〜䔈ڕڒ᫝ϧᱧϑοࣷᮧ㘪ࡼ҉⮱ᬣА ็὎ᔮ๔὎ಸፓᲒᰡ㜗♣Ƞᰡڕ䲏⮱ϧᱧϑοҀ侹"*㜗ͨࡃ⼸Ꮣ䊷Გ䊷倅喑ĄВᘼఫ͚ͧᓰą⮱"*̻ϧࡼ҉᫦ᐼₐౕᐧ⿸๔὎ಸহᮧ㘪Ҁ侞ߕ̸̭Аᰡᮧᚔ⮱᧺҉㈨㐌 ⊵䉦㔲䰭㺮ᰡߍᮧ㘪ࡃȠο㖁ࡃহϧᕔࡃ⮱ڕ౧ᮜᮧ㘪᰺ߎҀ侹 ็䃫ิȠ็౧ᮜ᜽ͧ⊵䉦㔲Ҭ⩕㏵〜䃫ิ⮱፥ᔮڕ౧ᮜ䌕䃫ิ≮䒙⮱᰺ߎ䰭㺮ᰡߍ䒨䛼ࡃহӬᢤࡃ*"侞ߕ⮱᰺ܳߎࣾ᣽ӈ᰺ߎ䔋㐚ᕔҀ侹喑Ჱᐧ᰺ܳߎࣾ᫝㠰ᐼ ᰡᑧ๔Ƞᰡ倅᩵⮱㏵〜ᮧ㘪䰭㺮កⵡ䃫ิহᏁ⩕䓦⩹ 䒨䛼㏔㏵〜䃫ิ䯳᜽⩌᜽ᐼ"*ߌ㘪ᄳ᜽ͧͨ≮ധλ⩕ᝤ౧ᮜ⮱〜ξࡼह"*ᄳᲱまⱌₐᑧ๔⮱ڕᅭࡃᮧ㘪 ᱗Გ౧ᮜᆂ᱈ ᆂ᱈̭ጒ҉ ᆂ᱈ι⩌≨ ᆂ᱈̶႓΍ ᆂ᱈ఈཞͽ "*㏵〜ᮧ㘪ܳࡃ㏔ᴴ۳̻ڠ䩛ឭᱜ➦ᒮ "*㏵〜ᮧ㘪ܳࡃ㏔ᴴ۳ ڠ䩛ឭᱜ➦ᒮ ࣌⩌ᮧ㘪04ڕ౧ᮜ㲺वᙌⴒ㈨㐌䊲㏔ᮧ㘪Ҁ〜ξࡼहႶڕजԎ⩌ᔮᐭᩫ Վ䃛 ڞᐧ"*㏵〜ᮧ㘪ܳࡃ㏔ᴴ۳Ҁ㈨喑➢ᑂϔ͇倅䉕䛼ࣾᆂ卬㧆"*⩌ᔮᐭᩫࡼ҉喑ڞᐧڞ䊏 ࣯㔰䉱᫆ 生成式 AI 对各行各业的产业提升效应是巨大的，行业研究数据表明，随着企业改变经营方式并对产品和服务进行强化，到 2032 年，生成式 AI 有望在硬件、软件、服务、广告、游戏等众多领域创造 1.3 万亿美元收入，占科技领域总支出从目前的不足 1% 扩大到 10%-12%，复合年增长率达到约 42%[1]。而在生成式 AI 对消费者的影响方面，一项针对全球 37 个国家和地区的公众调查显示，2023 年，认为人工智能将在未来三到五年内极大影响他们生活的人比例从 60% 上升到 66%。此外，52%的人表示对人工智能的产品和服务感到紧张，比 2022 年上升了 13%，36% 的人认为在未来 5 年内，AI 将取代自己的工作[2]。人们对 AI 充满了既爱又怕的矛盾，既认同 AI 能够改变世界，又担心 AI取代人，人类变成了机器的仆人。 AI 与人协作、服务于人，是华为终端一贯坚持的技术理念。正如计算机帮助人类提升生产效率、手机帮助人类让沟通无处不在一样，AI 可以帮助人类突破自身身体局限，让自己看得更清、听得更清、记得更牢、理解得更透彻。同时，AI 还能帮助人类增强、扩展信息的处理能力，面对海量信息，能够化繁为简，面对碎片信息，能够见微知著，面对无序信息，能够归纳推理。通过无处不在的全场景智能，华为终端致力于让 AI 帮助提升人的工作效率和生活品质，并赋予人们实现梦想和创造未来的能力。当前，生成式 AI 技术与消费终端的融合正在加速，不断推动行业创新和社会变革。华为终端与多家顶尖智库、研究机构及学术高校合作，通过深入调研和分析，总结出了四大终端 AI 产业发展趋势。 AI 技术在终端产品的融入度逐步深化，推动性能与体验双重升级1.1 AI 技术在终端产品落地时，一般经历 “应用层集成 AI”、“系统层融合 AI”、“以 AI 为中心的全新 OS”三个阶段：阶段一，应用层集成 AI：单点特性的智能增强，如在翻译，图片处理，文字识别等领域引入 AI 能力，以增强单点特性的功能体验。阶段二，系统层融合 AI：AI 能力全面下沉 OS，为上层应用和服务提供开箱即用的原子化、控件级 AI 能力。同时，对系统高频应用和服务进行智能化改造，如图片一键消除、图库检索、图片文字提取、日程自动生成等，提升 OS 系统的智能感。阶段三，以 AI 为中心的全新 OS：下一代原生智能 OS 架构，统一的 AI 子系统底座使得 OS 各个组件内部和彼此之间都能够灵活高效地使用 AI 技术；此外，内置于 OS 内的系统级 AI Agent 出现，使得原生智能 OS 不仅仅是一个操作系统，更是能够深度理解用户、自主闭环用户任务的、智慧的、常驻的超级智能体。 ࡻͧᠮ㐚ᑂ䶳"*Ҁ侹݈᫝ 以华为终端为例，在历经三个阶段的终端 AI 能力进阶后，将实现系统级原生智能，开启全场景智能新时代。 ·实时在线的服务：系统级入口和全局可用的超级智能体，实现智能服务无处不在。 ·更自然的多模态交互：基于 LUI（Language User Interface，自然语言用户接口）与 GUI（Graphical User Interface，图形化用户接口）相结合的交互和反馈，多维度识别用户意图，让用户更便捷地使用智能服务。 ·全场景智能体验：通过端云协同、AI+ 元服务的全场景智能，在生活、办公、出行、创作等全场景领域为用户提供个性化、超预期的创新服务。 ·全面开放的 AI 生态：从开放 AI SDK/API、到开放高阶 AI 服务、再到开放 Agent开发平台和开放 Agent 应用市场，助力提升每一个终端应用的 AI 浓度。智能体将引领终端进入全新人机交互及智能协作的时代 1.2.1 多模态大模型带来更自然、更全面的人机交互体验模态是指承载信息的模式或方式，不同类别的信息来源或形式都可以称为一种模态。模态基于人的感官可分为听觉、视觉、嗅觉、味觉、触觉，基于信息传递的媒介可分为图像、语音、视频、文本等，除此之外还有传感器的模态数据，如雷达、红外、GPS、加速度计等各种模态数据。人类生活在一个由多种模态信息构成的世界，会同时收到多个互补的、融合的、不同模态的感官输入，多模态更符合人类感知周边、探索世界的方式。生成式 AI 为终端设备带来更自然、更全面、更多维的人机交互方式，打破了传统单一独立 I/O 通道输入方式的限制，极大地丰富了人机交互的维度。多模态理解大模型可以让用户使用文本、图像、声音、视频、传感等多种数据类型与终端进行交流，大大拓展了用户同终端的交互形式。多模态生成大模型能够生成各种跨媒体内容，为用户提供更为直观的信息表达，从而实现更加高效丰富的沟通体验。这也为更多样性的终端硬件形态如穿戴设备、机器人等提供了更有力的支撑。华为 HarmonyOS 通过其分布式软总线的通信协同能力，实现了多设备、全场景下的无缝连接，此外，HarmonyOS 充分利用其丰富的硬件传感和软件感知能力，结合 AI 意图框架、语言大模型、多模态大模型，深入理解用户意图和当前所处场景的上下文，为用户提供触摸、手势、语音、眼动、自然语言、图像等更自然、更全面、更贴合使用习惯的交互体验。 1.2.2 AI 自主化程度越来越高，“以意图为中心”的 AI 与人协作方式正在建立目前，基于生成式 AI 的 LLM（Large Language Model，大语言模型）在自然语言理解、推理、思维链等能力上取得的突破性进展，受益于此，AI 完成任务的能力越来越强，从简单指令执行，演进到自主拆解目标并自主完成任务的高阶智能体。 “Agent”（智能体）这一概念起源于哲学，描述了一种拥有欲望、信念、意图以及采取行动能力的实体。基于 LLM 的 AI Agent 更多是指“一种智能体，可以自主地理解意图、规划决策、执行任务、调用工具，并具有记忆能力。”AI Agent 的出现，意味着 AI 与人的协作方式将发生颠覆性变化，从传统的“以用户指令为中心”，转变到“以用户意图为中心”。 “以意图为中心”是一种提升用户体验的设计理念：用户只需要表达出需求或期望，而将实现需求的过程交由系统来完成。以手机为例，当用户希望在飞行途中继续观看视频剧集，早些时候，他只能自己告诉手机上的 AI 智慧助手逐步执行“打开华为视频”、“找到 xx 视频”、“下载第 5~8 集”等操作。但在以意图为中心的设计理念下，AI 智慧助手演进成 AI Agent，用户只需要告诉 AI Agent“我坐飞机时想看我正在追的剧”，AI Agent 就能够自动处理如下任务： 1.检索到用户第二天有一班从北京飞深圳的航班，航班飞行时长为 3 小时。 2.根据用户日常习惯，发现用户近期正在华为视频上看 xx 视频，看完了第 4 集，每集视频时长约 40 分钟。 3.推理出 3 小时飞行时长需要下载 5 集。 AI Agent 会主动规划并执行上述步骤，同时确保视频下载时手机处于 Wi-Fi 连接状态。现在大多数应用的设计是以功能为中心的，是复杂专业且具有技术门槛的，比如办公类软件中有 10000 多个细微功能，但前端只有 100 左右按钮位置，大部分好用的功能并没有被普通用户感知到。随着 AI Agent 的出现，在以意图为中心的设计理念下，AI Agent 将成为处理用户需求的第一入口：用户只需要向 AI Agent 说出自己的需求，AI Agent 基于用户的意图直接调用后端对接的应用服务的细粒度功能，或是进行多个功能的组合、编排，以满足用户诉求。AI Agent 的出现，可以让应用“既简单又专业”。 1.2.3 大模型和智能体驱动下一代更智慧的操作系统近年来，终端操作系统经过持续优化变得更加直观和友好，但从根本上讲，它们仍然是建立在静态规则和预定义逻辑流程上，其设计初衷是满足通用化和普适性需求。然而，面向未来，更智慧的操作系统应该是动态的、自主的和自适应的，它将像一个值得信赖的伙伴，不断适应用户，满足他们的需求，预测他们的诉求，并迎合他们的喜好。在大模型和智能体的技术驱动下，未来真正理解用户、为用户量身定制的原生智能 OS 将进一步拓展传统终端 OS 的内涵

点击免费查看完整报告

AI终端白皮书：AI与人协作、服务于人

产业趋势与AI终端白皮书概述

AI终端的发展阶段

AI与人协作的新时代

多模态AI的兴起

全场景智能服务

轻量级AI集成

未来展望

你可能感兴趣

组织AI数智化转型白皮书：迈进人与智能体协作新时代

2024未来会议：AI与协作前沿趋势白皮书

人眼折服多元布局，AI终端业务持续成长

中国联通5G AI终端白皮书（2025年度）

2025中国联通元景大模型 AI终端合作白皮书V2.0

2024中国联通元景大模型AI终端合作白皮书V1.0

AI崛起，职场变革与人的适配

【点金互动易】AI政务+AI智能体，AI产品服务于海关总署，多个省、市公安机关等，AI超融合一体机支持DeepSeek的开箱即用和本地化部署，这家-公司拥有企业级的

让AI服务于公众：ALT视角

6G基站与终端协作感知关键技术报告