您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [未知机构]:AI Agent或开启AI原生应用时代 - 发现报告

AI Agent或开启AI原生应用时代

2024-03-18 - 未知机构 一切如初
报告封面

大模型AI agent应用场景商业化竞争格局风险监管AI场景应用游戏电商生产力多任务GPT LangChain个性化机器人场景优势颠覆式创新 全文摘要 本次电话会议是中国国际金融股份有限公司中金公司闭门会议,仅限受邀嘉宾参会。会议讨论了AI agent的重要应用场景,包括与大模型的关系、传统个人助手的局限性、应用发展、竞争格局、风险和监管情况。AI agent有望成为大模型时代的重要应用,海外巨头也对其关注度高。 关键词 大模型AI agent应用场景商业化竞争格局风险监管AI场景应用游戏电商生产力多任务GPT LangChain个性化机器人场景优势颠覆式创新 全文摘要 本次电话会议是中国国际金融股份有限公司中金公司闭门会议,仅限受邀嘉宾参会。会议讨论了AI agent的重要应用场景,包括与大模型的关系、传统个人助手的局限性、应用发展、竞争格局、风险和监管情况。AI agent有望成为大模型时代的重要应用,海外巨头也对其关注度高。讨论还涉及情感类聊天机器人、character点AI和豆包等产品,强调了它们的定制化和UGC生态特点。然而,情感类机器人也存在社交限度和数据安全问题。此外,会议还讨论了AI在娱乐领域的应用和发展趋势,以及在电商平台和生产力场景中的应用情况。最后,对单一任务场景的通用agent要求、LangChain框架、传统互联网龙头的机遇和挑战、AI对齐、Google的机器人学习能力和大语言模型的智能提升进行了探讨。 章节速览 00:00 AI Agent:A重要的应用场景 本次会议为中国国际金融股份有限公司中金公司闭门会议,仅限受邀嘉宾参会。未经中金公司和演讲嘉宾书面许可,任何机构和个人不得将会议内容和相关信息对外公布、转发、转载、传播、复制、编辑、修改等。中金公司保留追究相关方法律责任的权利。本次电话会议将解读AI agent的重要应用场景,包括大模型和AI agent的关系、传统个人助手的局限性、agent的应用发展、竞争格局以及可能带来的风险和监管情况。AIagent有望成为大模型时代的重要原生应用场景,海外AI巨头也对其关注度高。 10:45基于大模型的AI agent及其应用场景 本对话片段介绍了基于大模型的AI agent的特点和发展趋势。同时,对于单一任务场景应用和多任务场景应用进行了分类讨论。其中,情感类聊天机器人作为典型代表,具有陪伴和情感需求的特点。此外,对于character点AI和豆包等产品进行了详细介绍,强调了它们的定制化和 UGC生态的特点。然而,情感类机器人也存在社交限度和数据安全等问题,需要引起注意。 17:30 AI在娱乐领域的应用及发展 本文讨论了AI在娱乐领域的应用和发展趋势。在传统社交媒体方面,AI通过个性化服务提升用户使用体验,例如交互、推荐和内容生成。在音视频领域,内容生成和内容推荐是主要发展方向,但目前二者尚未形成良好的连接。在游戏领域,AI的应用分为生产环节优化、用户交互体验提升和以agent思维驱动游戏发展三个阶段。游戏资产生成和NPC改进是其中的典型案例。此外,斯坦福小镇是一个出色的AI agent案例。整体来看,AI在娱乐领域的应用前景广阔,特别是在内容推荐方面。 24:23 AI在电商平台和生产力场景的应用 本文总结了AI在电商平台和生产力场景的应用情况。在电商平台中,AI agent主要以导购客服的形式存在,如淘宝问问和京东的金小智。另外,还有一站式购物网站shop IIII推出的由AI聊天机器人驱动的shop APP,通过启发式提问实现精准获取用户需求。在生产力场景中,AIagent辅助传统行业提效,如纹身视频、办公领域等。此外,许多传统互联网公司也在产品中嵌入了AI agent的功能,如微软和谷歌,其商业化收费也开始实施。 28:03通用agent与多任务场景 单一任务场景的总结,通用agent的要求更高,能够提供调配不同秘书之间资源的框架,形成通用agent能力。举例GPT store,保护应用开发者和用户隐私,但生态混乱,需要规范。场景化落地解决具体问题,承接大模型能力和用户需求间的平衡。积累应用数据的飞轮,理解特定用户需求。 31:29 LangChain:一个开源的AI agent框架 LangChain是一个开源的agent框架,用于建立用户和大模型之间的桥梁。它包括不同语言模型之间的调用、解决模块、语言转换器等功能。用户可以使用该框架简单地定制或构建agent。对于agent来说,个性化是一个重要的前提,具备问题解决能力和理解用户的需求是关键。此外,大模型与机器人的结合有望补齐机器人学习的能力,使整个系统更加智能。 35:37 AI agent的发展路径及传统互联网龙头的机遇与挑战 本文探讨了AI agent的发展路径以及传统互联网龙头在其中的机遇和挑战。在AI agent的发展初期,基于传统底层场景的AI agent可能是主旋律,但其探索水平相对较低。传统互联网龙头具有优势,如原有的底层场景和核心用户商业场景,使得他们在AI agent发展中更有优势。然而,大模型的能力不足和AI agent的快速进化也带来了一些挑战。长期来看,传统互联网龙头具有用户飞轮和场景优势,但也可能面临颠覆式创新和组织调整的劣势。 40:41 AI对齐与AIagent风险控制 AI对齐是确保AI系统行为符合人类意图和价值观的命题。AIagent的风险包括数据隐私风险、法律道德伦理风险以及可能替代人类的问题。AGI的初始设计思路应尽量杜绝风险因素,使AI可控。科学家Stewart提出了AGI开发的三个原则:最大化人类偏好、不确定的目标、机器学习。监管对AIagent持谨慎态度,认为人类必须可控。投资建议包括模型、场景和新产品三个维度,如OpenAI、Google、文心一言等。社交聊天龙头characterAI可能成为未来优胜者。 45:14关于机器人学习能力的比较与分析 本对话片段主要讨论了Google的RT two机器人和飞科one机器人在学习能力方面的差异。同时,还探讨了使用世界模拟器进行机器人学习的优势和深度学习派和强化学习派在路径选择上的差异。最后,提出了大语言模型可能需要合成数据和强化学习来提升智能能力的观点。 52:16 AI Agent的流量入口优势及发展策略 本文讨论了AI Agent的流量入口优势及其发展策略。从物理反应和化学反应两个维度探讨了AI Agent的场景优势,包括手机硬件、微信社交等。同时,也讨论了国内大模型与海外的差距以及基础设施的建设对应用开发的影响。最后,指出国内应用开发在用户意图和商业模式上的优势,并呼吁行业仍在底层进化的过程中,未来应用领域值得期待。 问答回顾 发言人1问:本次会议的主题和要求是什么? 发言人1答:本次会议是中国国际金融股份有限公司中金公司组织的闭门会议,仅限受邀嘉宾参会。未经中金公司和演讲嘉宾书面许可,任何机构和个人不得以任何形式将会议内容和相关信息对外公布、转发、转载、传播、复制、编辑、修改等。 发言人1问:这次电话会议的主要内容是什么? 发言人1答:本次电话会议解读了一篇关于AI时代分叉点,探讨AI agent开启AI原生应用时代的深度报告。报告主要关注AI应用场景和潜在商业模式,以及大模型技术如GPT在商业化场景中的突破和用户实验的突破。 发言人1问:报告的主要内容包括哪些方面? 发言人1答:报告主要分为四个部分:大模型和AI agent的关系及其应用场景;传统个人助手或agent存在的局限性和瓶颈;agent应用的现状、分类方式、进展以及未来发展的竞争格局;AI agent发展过程中可能带来的风险以及监管情况。 发言人1问:报告第一章的着眼点是什么? 发言人1答:第一章从AI大模型和AI浪潮的发展触发,落脚到AI agent应用场景的角度,讨论了大模型在逻辑推理等方面的显著突破,以及各大厂商在AI方面的军备竞赛,同时指出大模型未来可能走向多模态发展。 发言人1问:如何从类人性的角度理解大模型未来的应用场景? 发言人1答:从类人性的角度理解,大模型基于神经网络的基础原理,模仿人类大脑的运作,具备分析问题、拆解问题、解决问题的能力。根据经典书籍《思考与快思考》理论,大模型可能胜任未来系统二的工作,成为人类处理复杂事物的重要助手或agent。 发言人1问:大模型未来可能如何使用工具解决自身不能解决的问题? 发言人1答:大模型在认知能力提升后,虽然自身不能解决所有问题,但可以通过使用工具来解决问题。例如,ChatGPT推出的GPT store构建了一个应用生态或工具集,大模型可以借助这些工具来统一解决复杂问题。 发言人1问:open I如何定义agent的核心功能? 发言人1答:open I提出的agent核心功能被划分为大元模型、规划、记忆和工具使用四个关键方面。这表明agent需要具备基础智能能力(如大语言模型),能够进行规划、拥有记忆,并能灵活运用工具,这些构成agent产品的重要组成部分。 发言人1问:移动互联网时代的原生应用场景与延伸场景有何区别? 发言人1答:在移动互联网时代,原生应用场景如移动支付、移动打车等是在移动互联网时代中才出现并被广泛接受的新场景,而像游戏、音乐和长视频则是典型的延伸场景,它们在移动互联网出现之前就已存在,并在移动互联网时代得以进一步发展。 发言人1问:AI巨头为何对AI agent关注度极高? 发言人1答:海外互联网巨头在大模型发布后对AI agent表现出高度关注和共识,这反映出AI agent作为探索AI应用方向的重要方向,其重要性得到了主流市场的认可。 发言人1问:基于大模型的AI agent相较于上一代AI agent有何显著提升? 发言人1答:基于大模型的AI agent相比上一代AI agent(基于知识图谱),智能程度明显提高,出货量增速显著下降。AI agent根据场景特点可分为单一任务场景应用和多任务场景应用,其中,大模型成为多任务场景应用的基础,体现了AI具备更高阶的自主决策能力和处理复杂任务的能力。 发言人1问:在聊天场景下,character AI这款产品有何特点? 发言人1答:character AI是由google前大模型拉姆达团队的开发者共同开发的一款情感类聊天机器人产品。它具备强大的模型能力基础,专注于定制化角色扮演,用户可以在平台上自行设置角色,包括名人角色等,为用户提供陪伴和情感需求的解决方案。 发言人1问:Character AI如何实现其通用模型能力和UGC生态的独特优势? 发言人1答:Character AI之所以在通用模型能力上表现优异,是因为其两位创始人来自Google顶级AI团队,具有大模型的设计和应用经验。此外,该AI采用UGC(用户生成内容)生态来构建用户和数据飞轮,其创始人曾强调不会指定角色,而是鼓励用户自由创造角色,这与互联网上许多UGC社区成功案例相契合,满足了用户自下而上的精神需求。 发言人1问:Character AI可能如何在未来成为垂类用户交互入口? 发言人1答:Character AI创始人曾表示希望构建通用的AI而非垂直领域专用AI。这预示着,在技术足够先进的情况下,Character AI的不同人物设定或许能成为某些特定领域用户交互的 入口,从而承担平台型职责,成为真正的通用AI。 发言人1问:字节跳动豆包与Character AI有何相似与不同之处? 发言人1答:豆包作为字节跳动的定制化多风格AI智能体,与Character AI类似,旨在提供富有同理心的对话体验,支持用户在不同场景和心境下的交互。然而,豆包目前更侧重于开发者AI能力,而Character AI则更为多元化且普适性强。 发言人1问:情感类机器人面临的社交限度风险有哪些? 发言人1答:情感类机器人在社交互动中面临的主要风险在于掌握用户隐私信息,涉及数据安全问题。此外,人机交互,