AI智能总结
ҒᝓFOREWORD ϧጒᮧ㘪喍"SUJGJDJBM*OUFMMJHFODF喎᭜ᠴ̭ㆨᎬ∈⮱ឭᱜ喑ᬕౕប㵹ᝃ䒲ߖႹВݺग㘪⩞ϧㆨᮧ㘪Ⴙ⮱䃑ⴒШߎȡⰛݺ喑๔็ϧጒᮧ㘪㈨㐌䘪᭜ധλᱧக႓喍.BDIJOF-FBSOJOH喎ឭᱜ⣝⮱ȡᱧக႓᭜̭㈨݄䕇䓴ౕ๔㻱ᢛ䯳̷䃚㏰⮱ឭᱜ喑Ҭϧጒᮧ㘪ಸ㘪์Ą႓ą㐌䃎ᣕ喑ᎣᏁ⩕䔆ψಸᲒ䶱≸Ⱕڠ䬛䷅⮱めᵵȡౕ 䓴ࣨ⮱็Ꭱ͚喑䃥็ϧጒᮧ㘪ឭᱜጟ㏼䔽⌽⛌ౝᏁ⩕λ⊵䉦㔲㏵〜ϔ৮͚喑Ҹຯ喑जВ䕇䓴ᠴ㏦䃳ݘȠϧ㙥䃳ݘᲒ㼐䨮䃫ิ喑ᝃ᭜ϻఫ͚ः᪴᱙喑Ꭳजᄳڣ㔨䃾̺ͧ ह⮱䄚㼭喑ᝃ᭜䃳ݘϧㆨキࢂ⮱䄚䴠ᠴБᎣប㵹䃫ิ᧺҉喑ᝃ᭜ധλ↪䒓̷ऱэᙌக䛴䯳⮱ᢛ䔈㵹䒲ߖ侫侣ᝃ㜗ߕ侫侣ȡ 䓾ᎡᲒ喑Ą⩌ᐼ"*ą䔆̭ ឭᱜःᓄγᑂϧ∕Ⱋ⮱䔈ᆂ喑ຯ≮㵹⮱$IBU(15Ƞ(FNJOJȠ$MBVEFȠⰅऑȠ᪴ᓰ̭㼭Ƞ䕇Ͷࡰ䬛Ƞ䃜下ᭌ▘Ƞ$IBU(-.ぶȡ䔆ψಸധλ๔ಸฺᱯ⮱⌞Ꮣ⺋㏼㑾㐉㐀Ჱ喑䛴⩕ο㖁㑾̷⊤䛼⮱ᢛ䃚㏰喑Ꭳ䒲В๔䛼⮱ϧጒࣺ亵ᄦಸ䔈㵹хࡃহᩦ䔈喑ᰭ㏵䃚㏰ڤܧᰶϬ⩇㜠̴Ϭ࣯͗ ⮱ಸȡऄ⯷λ⊤䛼ᢛȠ⊤䛼࣯Ƞ⊤䛼ツ߈⮱Ą㻱Ⴧᒸ喍TDBMJOHMBX喎ą喑⩌ᐼ"*ڤᰶᰡສ⮱㶕䓫㘪߈হᰡ∈ࡃ⮱Шߎ㘪߈ȡ ⩌ᐼ"*䛺ൾγ⩌ϔ߈喑ᄳౕڲღ݈҉Ƞ䒜УᐭࣾȠ᪆㗟ڙߋぶ็͗ 䶳ഌ๔๔ࡴϧЙ⮱ጒ҉᩵⢴ȡहᬣ喑⩌ᐼ"*䔅ᄳ䉸εᮛ䕇ϧĄ䊲㘪߈ą喑ᝡ̷ڤิ"*㘪߈⮱ज⾬ᝡ䃫ิ喑͗ϧ䘪जВ᠒ᰶ 䔉䊲ϧㆨ➖⤳ᙌჅᏓȠ䃝ᓳ᩵ ⢴Ƞ䌕䄚㼭㔨䃾ぶ㘪߈ȡₑใ喑⩞λ⩌ᐼ"*ᑧ๔⮱Ą⩌ą㘪߈喑㘪์㜗ߕ⩌ऱڲღ喑ຯ᪴ႄȠఫȠ䴠ͽহ㻳䶾喑๔๔ౝ䭺ѻγऱШߎ⮱݈҉䬕Ἀ喑͗ϧ䘪जВ䔈㵹㞧ᱜ䃫䃎Ƞᐭࣾ⼸Ꮌ喑⩇㜠⠙⿸ݣ҉⩢ᒞহᄼ⍥ȡ ᆂ᱈᱗Გ喑Йₐౕ䔈ڒ"*ൾ䕍⮱⩌ϔᐼȠ⩌≨ᐼВࣷᕊ㐡ᐼ⮱̓⩹喑ႄࡃȠᮧ㘪ࡃчₐౕߍ䕌ݝᲒ喑〆ౕ䔆̭अ䲖⮱ݺ⇬喑ЙᄳВ㵹䌢㼭喑䃖͗ϧᢹᤎ"*⮱߈䛼喑Ҁ侹ឭᱜअ䲖ፓᲒ⮱⩌ϔ߈হ⩌≨䉕䛼⮱下䋰ȡ ϔ͇䊸߬ "*ឭᱜౕ㏵〜ϔ৮⮱㲺ڒᏓ䔽ₒ⌞ࡃ喑ᣕߕᕔ㘪̻Ҁ侹ࣹ䛺ࡴ㏔ ᮧ㘪Ҁᄳᑂ䶳㏵〜䔈ڕڒϧᱧϑοࣷᮧ㘪ࡼ҉⮱ᬣА ็ᔮ๔ಸፓᲒᰡ㜗♣Ƞᰡڕ䲏⮱ϧᱧϑοҀ侹"*㜗ͨࡃ⼸Ꮣ䊷Გ䊷倅喑ĄВᘼఫ͚ͧᓰą⮱"*̻ϧࡼ҉ᐼₐౕᐧ⿸๔ಸহᮧ㘪Ҁ侞ߕ̸̭Аᰡᮧᚔ⮱᧺҉㈨㐌 ⊵䉦㔲䰭㺮ᰡߍᮧ㘪ࡃȠο㖁ࡃহϧᕔࡃ⮱ڕ౧ᮜᮧ㘪ߎҀ侹 ็䃫ิȠ็౧ᮜͧ⊵䉦㔲Ҭ⩕㏵〜䃫ิ⮱፥ᔮڕ౧ᮜ䌕䃫ิ≮䒙⮱ߎ䰭㺮ᰡߍ䒨䛼ࡃহӬᢤࡃ*"侞ߕ⮱ܳߎࣾӈߎ䔋㐚ᕔҀ侹喑Ჱᐧܳߎࣾ㠰ᐼ ᰡᑧ๔Ƞᰡ倅᩵⮱㏵〜ᮧ㘪䰭㺮កⵡ䃫ิহᏁ⩕䓦⩹ 䒨䛼㏔㏵〜䃫ิ䯳⩌ᐼ"*ߌ㘪ᄳͧͨ≮ധλ⩕ᝤ౧ᮜ⮱〜ξࡼह"*ᄳᲱまⱌₐᑧ๔⮱ڕᅭࡃᮧ㘪 ᱗Გ౧ᮜᆂ᱈ ᆂ᱈̭ጒ҉ ᆂ᱈ι⩌≨ ᆂ᱈̶႓ ᆂ᱈ఈཞͽ "*㏵〜ᮧ㘪ܳࡃ㏔ᴴ۳̻ڠ䩛ឭᱜ➦ᒮ "*㏵〜ᮧ㘪ܳࡃ㏔ᴴ۳ ڠ䩛ឭᱜ➦ᒮ ࣌⩌ᮧ㘪04ڕ౧ᮜ㲺वᙌⴒ㈨㐌䊲㏔ᮧ㘪Ҁ〜ξࡼहႶڕजԎ⩌ᔮᐭᩫ Վ䃛 ڞᐧ"*㏵〜ᮧ㘪ܳࡃ㏔ᴴ۳Ҁ㈨喑➢ᑂϔ͇倅䉕䛼ࣾᆂ卬㧆"*⩌ᔮᐭᩫࡼ҉喑ڞᐧڞ䊏 ࣯㔰䉱᫆ 生成式 AI 对各行各业的产业提升效应是巨大的,行业研究数据表明,随着企业改变经营方式并对产品和服务进行强化,到 2032 年,生成式 AI 有望在硬件、软件、服务、广告、游戏等众多领域创造 1.3 万亿美元收入,占科技领域总支出从目前的不足 1% 扩大到 10%-12%,复合年增长率达到约 42%[1]。 而在生成式 AI 对消费者的影响方面,一项针对全球 37 个国家和地区的公众调查显示,2023 年,认为人工智能将在未来三到五年内极大影响他们生活的人比例从 60% 上升到 66%。此外,52%的人表示对人工智能的产品和服务感到紧张,比 2022 年上升了 13%,36% 的人认为在未来 5 年内,AI 将取代自己的工作[2]。人们对 AI 充满了既爱又怕的矛盾,既认同 AI 能够改变世界,又担心 AI取代人,人类变成了机器的仆人。 AI 与人协作、服务于人,是华为终端一贯坚持的技术理念。正如计算机帮助人类提升生产效率、手机帮助人类让沟通无处不在一样,AI 可以帮助人类突破自身身体局限,让自己看得更清、听得更清、记得更牢、理解得更透彻。同时,AI 还能帮助人类增强、扩展信息的处理能力,面对海量信息,能够化繁为简,面对碎片信息,能够见微知著,面对无序信息,能够归纳推理。通过无处不在的全场景智能,华为终端致力于让 AI 帮助提升人的工作效率和生活品质,并赋予人们实现梦想和创造未来的能力。 当前,生成式 AI 技术与消费终端的融合正在加速,不断推动行业创新和社会变革。华为终端与多家顶尖智库、研究机构及学术高校合作,通过深入调研和分析,总结出了四大终端 AI 产业发展趋势。 AI 技术在终端产品的融入度逐步深化,推动性能与体验双重升级1.1 AI 技术在终端产品落地时,一般经历 “应用层集成 AI”、“系统层融合 AI”、“以 AI 为中心的全新 OS”三个阶段: 阶段一,应用层集成 AI:单点特性的智能增强,如在翻译,图片处理,文字识别等领域引入 AI 能力,以增强单点特性的功能体验。 阶段二,系统层融合 AI:AI 能力全面下沉 OS,为上层应用和服务提供开箱即用的原子化、控件级 AI 能力。同时,对系统高频应用和服务进行智能化改造,如图片一键消除、图库检索、图片文字提取、日程自动生成等,提升 OS 系统的智能感。 阶段三,以 AI 为中心的全新 OS:下一代原生智能 OS 架构,统一的 AI 子系统底座使得 OS 各个组件内部和彼此之间都能够灵活高效地使用 AI 技术;此外,内置于 OS 内的系统级 AI Agent 出现,使得原生智能 OS 不仅仅是一个操作系统,更是能够深度理解用户、自主闭环用户任务的、智慧的、常驻的超级智能体。 ࡻͧᠮ㐚ᑂ䶳"*Ҁ侹݈ 以华为终端为例,在历经三个阶段的终端 AI 能力进阶后,将实现系统级原生智能,开启全场景智能新时代。 ·实时在线的服务:系统级入口和全局可用的超级智能体,实现智能服务无处不在。 ·更自然的多模态交互:基于 LUI(Language User Interface,自然语言用户接口)与 GUI(Graphical User Interface,图形化用户接口)相结合的交互和反馈,多维度识别用户意图,让用户更便捷地使用智能服务。 ·全场景智能体验:通过端云协同、AI+ 元服务的全场景智能,在生活、办公、出行、创作等全场景领域为用户提供个性化、超预期的创新服务。 ·全面开放的 AI 生态:从开放 AI SDK/API、到开放高阶 AI 服务、再到开放 Agent开发平台和开放 Agent 应用市场,助力提升每一个终端应用的 AI 浓度。 智能体将引领终端进入全新人机交互及智能协作的时代 1.2.1 多模态大模型带来更自然、更全面的人机交互体验 模态是指承载信息的模式或方式,不同类别的信息来源或形式都可以称为一种模态。模态基于人的感官可分为听觉、视觉、嗅觉、味觉、触觉,基于信息传递的媒介可分为图像、语音、视频、文本等,除此之外还有传感器的模态数据,如雷达、红外、GPS、加速度计等各种模态数据。人类生活在一个由多种模态信息构成的世界,会同时收到多个互补的、融合的、不同模态的感官输入,多模态更符合人类感知周边、探索世界的方式。 生成式 AI 为终端设备带来更自然、更全面、更多维的人机交互方式,打破了传统单一独立 I/O 通道输入方式的限制,极大地丰富了人机交互的维度。多模态理解大模型可以让用户使用文本、图像、声音、视频、传感等多种数据类型与终端进行交流,大大拓展了用户同终端的交互形式。多模态生成大模型能够生成各种跨媒体内容,为用户提供更为直观的信息表达,从而实现更加高效丰富的沟通体验。这也为更多样性的终端硬件形态如穿戴设备、机器人等提供了更有力的支撑。 华为 HarmonyOS 通过其分布式软总线的通信协同能力,实现了多设备、全场景下的无缝连接,此外,HarmonyOS 充分利用其丰富的硬件传感和软件感知能力,结合 AI 意图框架、语言大模型、多模态大模型,深入理解用户意图和当前所处场景的上下文,为用户提供触摸、手势、语音、眼动、自然语言、图像等更自然、更全面、更贴合使用习惯的交互体验。 1.2.2 AI 自主化程度越来越高,“以意图为中心”的 AI 与人协作方式正在建立 目前,基于生成式 AI 的 LLM(Large Language Model,大语言模型)在自然语言理解、推理、思维链等能力上取得的突破性进展,受益于此,AI 完成任务的能力越来越强,从简单指令执行,演进到自主拆解目标并自主完成任务的高阶智能体。 “Agent”(智能体)这一概念起源于哲学,描述了一种拥有欲望、信念、意图以及采取行动能力的实体。基于 LLM 的 AI Agent 更多是指“一种智能体,可以自主地理解意图、规划决策、执行任务、调用工具,并具有记忆能力。”AI Agent 的出现,意味着 AI 与人的协作方式将发生颠覆性变化,从传统的“以用户指令为中心”,转变到“以用户意图为中心”。 “以意图为中心”是一种提升用户体验的设计理念:用户只需要表达出需求或期望,而将实现需求的过程交由系统来完成。 以手机为例,当用户希望在飞行途中继续观看视频剧集,早些时候,他只能自己告诉手机上的 AI 智慧助手逐步执行“打开华为视频”、“找到 xx 视频”、“下载第 5~8 集”等操作。但在以意图为中心的设计理念下,AI 智慧助手演进成 AI Agent,用户只需要告诉 AI Agent“我坐飞机时想看我正在追的剧”,AI Agent 就能够自动处理如下任务: 1.检索到用户第二天有一班从北京飞深圳的航班,航班飞行时长为 3 小时。 2.根据用户日常习惯,发现用户近期正在华为视频上看 xx 视频,看完了第 4 集,每集视频时长约 40 分钟。 3.推理出 3 小时飞行时长需要下载 5 集。 AI Agent 会主动规划并执行上述步骤,同时确保视频下载时手机处于 Wi-Fi 连接状态。 现在大多数应用的设计是以功能为中心的,是复杂专业且具有技术门槛的,比如办公类软件中有 10000 多个细微功能,但前端只有 100 左右按钮位置,大部分好用的功能并没有被普通用户感知到。随着 AI Agent 的出现,在以意图为中心的设计理念下,AI Agent 将成为处理用户需求的第一入口:用户只需要向 AI Agent 说出自己的需求,AI Agent 基于用户的意图直接调用后端对接的应用服务的细粒度功能,或是进行多个功能的组合、编排,以满足用户诉求。AI Agent 的出现,可以让应用“既简单又专业”。 1.2.3 大模型和智能体驱动下一代更智慧的操作系统 近年来,终端操作系统经过持续优化变得更加直观和友好,但从根本上讲,它们仍然是建立在静态规则和预定义逻辑流程上,其设计初衷是满足通用化和普适性需求。然而,面向未来,更智慧的操作系统应该是动态的、自主的和自适应的,它将像一个值得信赖的伙伴,不断适应用户,满足他们的需求,预测他们的诉求,并迎合他们的喜好。 在大模型和智能体的技术驱动下,未来真正理解用户、为用户量身定制的原生智能 OS 将进一步拓展传统终端 OS 的内涵