
前言 1、智能体行业发展概述 1.1智能体发展历程及分类介绍1.2智能体分级说明1.3智能体在L3级及更高级别的能力提升机会点1.4智能体的核心特征 2、智能体的体验设计综述 2.1智能体体验设计的定义与范围2.2智能体体验设计的目标、原则与价值2.3智能体体验设计的流程与创新 3、智能体体验设计的交互新范式 3.1智能体交互的范式/模式的概述3.1.1智能体交互范式的概述3.1.2 L3级智能体的交互新范式3.2基于L3智能体的设计洞见3.2.1用户信任与协作控制感的平衡3.2.2交互反馈的及时性、有效性与认知减负3.2.3意图理解与动态调整的流畅性3.2.4多模态交互的深度融合3.2.5多任务并行及交互呈现的可控性3.3L3级智能体的交互设计规范3.3.1设计策略3.3.2用户-AI场景链路3.3.3唤醒方式3.3.4产品形态 4、智能体产品的用户体验评估体系介绍 4.1智能体用户体验评估体系构成4.1.1智能体体验评估指标内容4.1.2用户主观评价4.1.3专家走查4.1.4行为数据埋点4.1.5智能体体验数据基线建立4.2智能体用户体验评估方法4.2.1定量评估方法4.2.2定性评估方法4.2.3大数据分析4.3体验数据的沉淀与价值挖掘5、联想智能体体验设计创新的应用示例6、智能体交互设计的未来新趋势7、参考文献 前言 2022年ChatGPT的爆发性普及,标志着人工智能进入全新阶段:大语言模型(LLM)不再局限于特定任务的执行,而是通过自然语言理解、动态规划与多模态融合,展现出接近人类水平的开放式问题解决能力。这种技术突破催生了一个关键概念——智能体(AI Agent)。 智能体(AI Agent)是一种能够自主感知环境、做出决策并采取行动的智能程序或实体。它具备自主性、适应性和交互性,能够通过推理、规划和执行任务来达成预设目标。智能体正在加速渗透至办公、生活、医疗、教育、人文创作等社会生产生活的关键场景,成为推动企业数字化转型和提升用户价值的核心引擎。作为全球领先科技企业,联想坚持前沿探索与实践落地并重,在智能体领域开展了一系列卓有成效的布局。针对多样化的需求和场景,联想推出了“联想天禧”和“联想乐享”两大超级智能体,前者聚焦个人用户的智能生活与高效学习需求,后者则致力于为企业用户提供全方位的智能服务支持;与此同时,联想还深耕垂直场景,针对智能销售、智能运营、智能办公等具体领域,开发了一系列专业化的领域类智能体。在此过程中,联想总结出一套从前期战略规划到中期设计开发再到后期运营优化的端到端工作流程,其中体验设计赋能贯穿全程,构建意图驱动与多模态融合的交互新范式,并提炼出可量化的体验评估指标与闭环改进机制,通过技术创新与场景融合,持续推动智能体技术在多维度的落地应用。 智能体的蓬勃发展,其背后既有算法与算力的革新,也离不开以用户为中心的体验设计方法创新。本书聚焦于L3级别数字智能体的体验设计实践,以需求驱动与数据支撑为双重线索,系统阐释构建智能体从“能力体验”到“情感共鸣”再到“共生协作”的完整体验体系:如何从传统的页面或流程设计,改变为以对话驱动和意图感知为核心的闭环创新流程;如何在界面、语义、人格等维度创新交互范式;以及如何通过用户评价、专家走查与行为数据埋点三管齐下,持续优化智能体性能与用户信任度。全书既有对方法论的高度概括,也配以真实案例与可量化指标,帮助读者在复杂业务环境中快速定位设计难点、制定可执行方案,并在实践中迭代升级。 1、智能体的概述 1.1智能体发展历程及分类介绍 智能体(Agent)并不是大模型时代才提出的概念,其思想最早可追溯至20世纪60年代AI的起点。随着技术的发展,智能体逐渐从学术理论走向应用层面,并在2022年底迎来实质性爆发。 2022年11月,OpenAI推出的ChatGPT引发了全球范围内的广泛关注,人工智能领域由此迎来了重大突破,基于大模型的智能体更是成为众人瞩目的焦点。ChatGPT展现出了前所未有的自然语言处理能力,它能够理解复杂的问题,并生成逻辑连贯、内容丰富的回答,与用户进行流畅的对话。这一成果让人们看到了人工智能在语言交互方面的巨大潜力,也为智能体的发展注入了强大动力,众多科研团队和企业纷纷加大在相关领域的投入。 从2023-2024年,智能体领域的竞争愈发激烈,国内外科技巨头均明显加快了智能体的落地步伐,智能体正在加速渗透至办公、医疗、教育、人文创作等社会生产生活的关键场景,成为推动企业数字化转型和提升用户价值的核心引擎。进入2025年,智能体技术持续蓬勃发展,智能体已开始展现出L3级别的能力。这一能力级别的智能体通过多模态感知、复杂推理与动态决策实现端到端任务闭环,突破了传统依赖API调用的局限性。某些智能体能够直接与网页进行交互,自主完成如填写在线表单、上网购物、创建表情包等复杂任务。在购物场景中,用户只需给出购买特定商品的指令,智能体便能自行在购物网站中搜索商品、对比价格、选择合适的商品并完成下单流程,整个过程体现出了强大的自主决策和任务执行能力。这些智能体的实际应用,标志着智能体技术在2025年取得了更为显著的突破,正逐步改变着人们的生产生活方式,为各行业带来更多创新与变革的可能。 随着智能体技术在应用场景中的深度渗透,其分类体系也基于系统架构与应用逻辑形成了不同的维度划分。从应用范围、系统集成度、服务对象以及是否具有物理载体等不同视角,智能体可被划分为多种类型,每类智能体在功能定位与技术路径上呈现出显著差异。 智能体的分级(L1/L2/L3/L4/L5)通常用于描述智能体的自主性、决策能力以及对环境的适应能力。这种分级方式广泛应用于自动驾驶汽车、机器人等领域,用于衡量智能体的智能化水平。从L1到L5,智能体的能力逐渐增强,最终达到完全自主的水平。从L1到L5,智能体的能力呈现出逐步增强的趋势,最终朝着完全自主的方向发展。这一进化过程涵盖了感知、决策、适应和自主性等多个关键维度,每一级的提升都意味着智能体在这些方面取得了显著的进步。 L1(基础辅助智能体):处于L1阶段的智能体,可以被看作是智能化的初级形态。它们主要通过简单的传感器和预设的规则来感知环境,并在有限的范围内提供辅助功能。例如,在自动驾驶汽车的L1阶段,车辆可能仅具备基本的车道保持辅助或自动紧急制动功能。这些功能虽然能够为提供驾驶员一定程度的帮助,但仍然需要人类驾驶员时刻保持对车辆的控制,并对环境做出主要的判断和决策。在通用智能体软件领域,早期版本的ChatGPT座位L1级别的智能体只提供基础的对话工具,能够根据预设的规则进行对话,但无法进行复杂的任务规划。 L2(增强辅助智能体):当智能体发展到L2阶段时,其自主性和决策能力开始有所提升。它们能够更全面地感知环境信息,并在一定程度上进行自主决策。以自动驾驶汽车为例,L2级别的车辆可以在特定条件下实现部分自动驾驶功能,如在高速公路上自动调整车速、保持车距等。然而,驾驶员仍然需要随时准备接管车辆的控制权,因为智能体在复杂路况或突发情况下的决策能力仍然有限。ChatGPT(当前版本)作为典型L2级通用智能体已经可以通过集成网页搜索、代码执行和文件解析功能,处理更复杂的任务。 L3(有限自主智能体):L3阶段的智能体标志着自主性的一个重要转折点。它们能够在特定条件下完全自主地执行任务,但在某些复杂或关键的情况下,仍然需要人类的干预。在自动驾驶汽车领域,L3级别的自动驾驶车辆可以在高速公路上实现自动驾驶,但在遇到恶劣天气、道路施工或其他特殊情况时,系统会提示驾驶员接管车辆。这种级别的智能体在感知和决策方面已经具备了一定的复杂性,能够处理多种环境因素。例如,它们可以通过高精度的地图和先进的传感器系统,实时感知车辆周围的交通状况,并做出合理的路径规划和速度调整。L3级通用智能体典型代表Manus能自主操作电脑完成复杂任务,如文档整理、数据录入和邮件管理,并通过“行动-反馈-再行动”的闭环机制优化任务执行。 L4(高度自主智能体):L4阶段的智能体已经具备了高度的自主性和决策能力。它们能够在大多数情况下独立完成任务,无需人类的干预。在自动驾驶汽车领域,L4级别的车辆可以在城市道路和高速公路上实现完全自动驾驶,能够应对各种复杂的路况和交通情况。这些智能体通过先进的感知技术和复杂的人工智能算法,能够实时分析环境信息,并做出精准的决策。例如,它们可以识别交通标志、行人、其他车辆等,并根据交通规则和安全要求进行合理的行驶。青藤无相AI作为软件安全行业发布的首个L4级领域智能体已具备全链路自动化追溯、精准预警研判和动态修正能力,能都独立完成从威胁监测到响应处置的全流程任务并实施执行数万步复杂操作,显著提升效率与正确性并超越人类专家水平。 L5(完全自主智能体):L5阶段的智能体是智能化的最高水平,它们能够完全自主地适应各种环境和任务,无需任何人类的干预。在自动驾驶汽车领域,L5级别的车辆可以在任何道路条件下实现完全自动驾驶,无论是城市街道、乡村小路还是高速公路,都能安全、高效地行驶。这些智能体不仅能够感知和理解复杂的环境信息,还能够进行深度学习和自我优化,不断提升自身的性能。未来的L5级智能体虽然目前尚未完全实现,但它将能完全代表用户进行自主拆解目标、寻找资源、选择工具并完成全部工作目标。 智能体的L1至L5分级为智能体产品提供了一个清晰的框架,用于衡量智能体的智能化水平。从L1的辅助智能体到L5的完全自主智能体,每一级智能体在感知、决策、适应和自主性方面都有显著提升。这种分级方式不仅有助于理解智能体的能力范围,还为智能体的交互设计提供了明确目标。在设计智能体与人类或其他智能体的交互时,可以根据智能体所处的级别,制定相应的交互策略和规则。例如,对于L1和L2级别的智能体,设计着眼于提供更加直观、易于操作的交互界面,以便人类能够方便地对其进行控制和干预;而对于L3及更高级别的智能体,就可以更多地关注如何实现自然、高效的交互,让智能体能够更好地理解人类的需求和意图,从而更好地为人类服务。 总之,智能体的分级(L1-L5)为产品设计提供了一个清晰的视角,能够更好地理解和把握智能体的发展趋势和能力水平。 1.3智能体在L3级及更高级别的能力提升机会点 ⚫多模态感知与融合能力 在L3级及更高阶段,智能体需要处理更复杂、多样的环境信息。提升多模态感知能力,在切换模态时能提供没有停顿感的体验。例如将文本、图像、语音等多种数据类型进行融合,智能体能与用户进行无缝的沟通,且做出更精准的决策。 ⚫多Agent协作与群体智能 在L3级及更高级别,智能体之间的协作能力至关重要。通过多Agent系统的构建,智能体可以实现任务分解、资源共享和协同决策,从而提升整体效率和性能。例如,在复杂的物流调度中,多个智能体可以协同工作,优化运输路径和资源分配。 ⚫长期记忆与动态规划 L3级及以上的智能体需要具备长期记忆和动态规划能力,以应对复杂任务和长期目标。通过记忆历史数据和经验,智能体可以更好地预测未来趋势,制定更优的长期策略。例如,能对用户历史输入的全量信息进行分析与洞察,为用户提供更符合用户个人特征的服务。 ⚫人机协作与交互优化 L3级及以上的智能体具备处理复杂的任务能力达数百步甚至数万步操作的能力,在该工作量的任务中,智能体需要优化人机协作能力,提升交互的自然性和效率,将用户端的前台操作简单化、自动化,以便用户跟智能体更好的合作。 智能体在L3级及更高级别的能力提升机会点涉及多模态感知、多Agent协作、长期记忆、人机协作等多个方面。这些能力的提升将使智能体更好地适应复杂环境,满足多样化需求,推动智能体技术的持续发展和广泛应用。 1.4智能体的核心特征 智能体与传统程序的核心差异——它不仅是工具的执行者,更是目标的主动追求者。而在设计视角下,智能体的价值已超越单纯功能实现,转向构建人机协作的共生关系。智能体具备三大核心特征:自主性、适应性与交互性。 ⚫自主性:从被动响应到独立决策的进化 自主性标志着智