
智能体平台应用开发实践 腾讯云智能高级产品架构师赵旭东 基于TCADP平台打造“营销客服场景”解决方案 基于TCADP平台打造营销客服场景的核心价值 以前:√现在:以前:√现在: AI营销助手(营销转化) 开源:成单转化率提升 AI客服助手(客服响应) 节流:客服人力成本降低 以前: AI质检助手(风控质检) 节流:显著降低人工成本 √现在: 腾讯云智能体开发平台产品定位:大模型应用开发平台 大模型的应用开发平台,提供RAG、Workflow、Agent框架,助力企业加速大模型应用落地。 腾讯云智能体开发平台:三大应用框架,满足客户多样需求 AI营销助手 让智能体学习金牌销售经验,从话术辅助到逐步替代 某驾校客户用”AI营销助“手引导用户报名,提升成单转化率 ⚫场景:用户通过微信添加销售人员,“AI营销助手”通过话术辅助销售,提升成单转化,并逐步替代普通销售人员; 学习金牌销售的角色风格和话术经验,提升检索召回质量 ⚫从金牌销售话术中检索召回⚫让大模型学习金牌销售话术,和其风格经验;⚫大模型模拟金牌销售,并参考历史会话信息,与用户沟通; ⚫敷衍回答时,仍不断引导用户报名 高质量Prompt写法对端到端效果的影响至关重要 ⚫Prompt包括SystemPrompt和UserPrompt;⚫SystemPrompt:相当于导演给演员的角色设定和表演指导,例如:“你扮演一位经验丰富的医生,语气要温和而专业。”⚫User Prompt:相当于你给演员的台词或者问题,例如:“医生,我最近感觉身体不适,你能帮我看看吗?” ⚫Prompt优化对效果影响非常大⚫Wrokflow中某节点的prompt调整会影响其他节点或端到端的效果; 参考历史会话记录 AI客服助手 基于问题处理SOP构建AI客服助手,逐步替代初中级客服人员 某智能硬件客户通过AI客服助手替代初级客服人员实现降本 ⚫场景:通过AI客服助手提升自助服务效果,并逐步替代初中级客服人员,实现人力降本 某智能硬件客户通过AI客服助手替代初级客服人员实现降本 ⚫方案对效果的影响: 1)保守方案:在sop范围内回答,超出转人工或兜底回复;2)开放方案:由大模型在一定范围内与用户沟通,尽可能抑制幻觉; 家政管家使用AI客服助手场景效 AI质检助手 基于质检标准SOP构建AI质检助手,提升质检准确率,释放人力 某二手车客户通过AI质检助手大幅提升质检准确率 ⚫场景: 1)风控质检,担心绕过平台,私自建立联系等,捕获负向语义2)SOP质检,品牌价值宣导、流程介绍等话术,捕获正向语义 ⚫指标要求: 针对风控质检的场景飞车风险和私下简历联系方式的精准率和召回率85% 1)精确率=被预测正确的正例样本数量/预测为正例的样本数量 2)召回率=被预测正确的正例样本数量/实际正例样本数量 Prompt写法 TCADP核心优势 落地难点1(RAG):基于复杂文档的知识库处理精准度问题 落地难点2:识别精度低、元素易丢失 亮点能力1(RAG):全链路解决企业多模态知识处理难题,提升大模型知识问答体验 基于OCR大模型,突破复杂版面分析、元素识别等技术瓶颈 ➢业界首个支持200MB以上超大文档vs.业内普遍100MB内➢丰富的文档类型,超过26类vs.➢业内普遍10类以内➢支持图文混排(多列排版)版面分析、图文表/公式/页眉等元素识别 落地难点2(RAG):结构化表格数据庞大,检索困难 ⚫Query:“非智能且在售,并且一级分类是天棚灯的产品包含哪些” ⚫文档中的“大表格”和“非标准表格”: 1)嵌套表格,无法用Text2SQL进行精确检索。 2)完整的表格文本长度往往大于32K,一次性 非标准表格 综合使用摘要/关键词/向量检索、提升不规则大表格的问答准确率 落地难点3(RAG):用户对话信息多模态,包含图文交错复杂信息输入 亮点能力3(RAG):读懂理解文中“图文关系”,提升问答准确率及答案出图率 落地难点4(Workflow):对话与流程的耦合,工作流节点难以灵活跳转 ⚫典型场景举例 问题1:已运行过的节点无法回退 场景:挂号场景中,更改过往已提取到的挂号科室 ⚫期望的表现:“科室”参数值改为“新生儿科”,并使用“新生儿科”运行后续的工作流节点。 ⚫期望的表现:退出退订酒店工作流,并给出回复:“如果您有其他需求,请继续提问”。 落地难点4(Workflow):对话与流程的耦合,工作流节点难以灵活跳转 ⚫业界友商的工作流效果 ⚫Dify工作流的效果: ⚫Coze工作流的效果: ⚫工作流从前到后运行,即使当前节点收集不到关键信息,也会向后运行,并不会反问用户。⚫用户期望的效果:保持在当前节点并询问用户,获取信息。 ⚫用户表达更改前序节点信息时,工作流仍然会卡在当前节点,反复收集当前节点的信息。 ⚫用户期望的效果:回退到前序节点,更改已收集到的信息。 亮点能力4(workflow):解决业务中灵活的多轮对话难题,工作流提供智能方案 工作流内置具有全局视野的Agent,负责接管对话、控制节点跳转、识别全局意图 ➢对话接管:所有与工作流相关对话都会经过Agent统一处理➢节点跳转控制:Agent根据用户对话内容智能跳转到对应节点➢全局意图识别:全局识别“不继续执行工作流”等退出意图及“好的”、“没问题”等寒暄意图,并智能回复用户 Thanks AI创未来·共筑生态 实时互动X泛娱乐赛道 新趋势与新玩法 崔立鹏丨腾讯云音视频产品总监 Part 1AI+实时互动行业趋势Part2腾讯云AI实时对话解决方案Part3腾讯云私域直播行业解决方案Part4腾讯云TRTC产品介绍 目录 AI+泛娱乐沿着虚拟陪伴和提升效率两条路进化 2.AI提升效率 1.AI陪伴分类 1.1情感陪伴 •虚拟体验需求,一段虚拟的剧情体验,用户使用该产品的目的性比较明确,通过和AI的互动获得 •AI僚机 •NSFW可能是目前AIGC产品里停留时长和付费意愿最强的品类•据了解有些做海外的已经实现了盈利(主要靠擦边和强收费) •AI主持人•AI粉丝•AI陪玩 「情绪价值」 •想办法满足更广泛人群的虚拟体验需求,成为一个大DAU的产品 AI+泛娱乐——从“真人匹配”到“虚拟陪伴” LinkyAI:通过其独特的AI互动机制对真人约会(Dating)市场形成了多维度冲击 •情感需求的分流:LinkyAI提供深度情感陪伴功能,用户可创建定制化虚拟角色,通过自然语言交互获得即时回应与情绪支持 •时间与精力成本的优化:用户无需投入大量时间维护真人关系,LinkyAI的“实时聊天角色扮演”和“沉浸式故事体验”可快速满足情感需求 •LinkyAI的下载量增长迅猛:部分用户从Tinder、Bumble等真人平台转向AI社交,导致前者活跃度下降 AI陪伴:头部产品加入voice call功能后留存和对话轮次均大幅提升 APP:Talkie发行商:Minimax APP:C.ai发行商:Character.AI •在C.ai24年6月发布语音功能后,7月相比6月下载量有96%的增长•对话轮次随着voicecall能力的增长显著,从20次/天上升到27次/天•主要付费来源是美国用户,20%的下载量贡献了60%的收入•57.07%的用户是18-24岁的青少年,平均使用时长达2小时 •Minimax的出海产品Talkie于24年7月发布了calling实时通话功能,留存和对话轮次都有显著提升•Talkie主要受众在美国,40%的用户为18-24岁的青少年,其中女性较多•平均每天使用时长约70分钟 AI主持人:全民K歌通过AI主持人提升效率 用户场景刚需 •主持需同时承担房间管理(迎送用户、控制麦序)、氛围营造(活跃冷场、活跃引导)、送礼答谢等多种类型的任务 实现效果 •AI主持大拿可通过语音播报和弹幕消息与用户进行双向互动,对于歌房内的点歌、演唱、上下麦、送礼等事件均能产生有效的反馈 AI粉丝:通过AI生成的虚拟观众和互动场景,满足用户对“被追捧”的心理需求 •App:Fameify: Be Famous & Live Fame•开发者:BigBrainLTD•覆盖区域:美国、英国、澳大利亚 Fameify主要玩法 •主题定制:用户开播前需选择话题(如时尚、游戏、运动),AI评论与话题高度相关,增强真实感 •情绪模式:可调整观众情绪(如欢乐、兴奋),适配用户直播内容风格•环境分析:通过语音和场景识别优化互动反馈(如根据背景音乐调整评论•粉丝分层:免费用户可拥有≤500名观众,付费解锁更高人气(如千人直播间)。 AI陪玩:OOPZ实时AI语音助手「桌宠-缪斯」 •App:Oopz•开发者:绍兴未来山海科技有限公司•覆盖区域:中国 •Oopz自2023年12月公测以来,4个月内用户规模增长20倍,日活跃用户(DAU)突破10万,成为游戏语音赛道增长最快的黑马 •在游戏语音工具市场,Oopz通过差异化功能组合(语音开黑+社区交友+AI聊天)切入用户需求,与竞品形成错位竞争。其主打“低门槛、高质量、无干扰”的体验,精准吸引年轻游戏玩家群体 •方案亮点 •开黑时按住快捷键,桌宠缪斯即刻语音支援•每个人都有自己专属缪斯,不影响本身开黑体验•针对开黑场景的AI降噪优化 AI陪玩最新能力:支持多用户同时与一个智能体语音互动 ✓在同一个语聊房里,用户A和用户B可以聊天,此时不会唤醒AI助手✓和AI助手相关的话题(如王者荣耀相关),AI语音助手会进行回复;和AI助手不想关的话题,AI助手不会回复✓AI和用户A聊天时,用户B不能打断✓一些业务流程可自定义 2025年AI对话新趋势 潜在机会 关注点 •语音交互更加自然流畅,能够准确识别各种口音和复杂语义,用户通过语义打断•视觉交互取得新突破 视频多模态的应用场景如何和AI陪伴结合起来? 多模态交互升级 •垂直场景进一步深化,目前还属于探索期,25年有可能迎来新的爆发,例如,教育领域出现单月使用超100小时的AI辅助教学场景 声音的agent和泛娱乐各个场景的结合是不是能孕育一个新交互模式的抖音应用机会? 垂直场景深化 •“物理实体”是“陪伴赛道”中与“智能”同等重要的要素:搭配了物理实体的“AI陪伴”产品可以走得更远 消费电子终端Agent化能够带来哪些新的应用场景和机会? 物理实体 方案概述 现有的AI语聊场景主要是基于IM场景的离线文字聊天或者语音聊天,GPT-4o的发布,把多模态大模型的应用场景提升到了实时的语音或者视频交互。 使用Tencent RTC,结合第三方的大模型和TTS等,您可以轻松创建一个媲美GPT-4o所演示的AI实时交互体验,应用到您的业务场景内。 功能特点和技术优势 功能特点 精准的ASR识别 实现超低延迟的AI对话 支持多种语言,包括英语、西班牙语、日语、韩语、中文以及23种方言和130种国际语言。 音视频端到端延迟低于300ms,AI对话延迟低于1000ms。 第三方LLM和TTS无缝集成 高兼容性 支持多个平台,兼容超过20,000种设备模型。 配置LLM和TTS服务的账户凭证,无缝集成到服务后台。 红框内客户自定义 ⚫腾讯侧:客户端和服务端的一体化集成方案,提供智能打断、降噪能力。⚫客户侧:自定义大模型和TTS,接入到腾讯AI服务,保持业务灵活性。 多模态能力:当大模型有了「眼睛」 •具有跨文本、音频和视频进行实时推理的能力,可实现更自然的人机交互•AI可以进行流畅的实时视频通话,人可以实时打断AI•通过手机的摄像头与人互动,可通过视频流理解对话当前的环境(包括人物状态/背景环境) 场景很丰富,现在需要探索多模态能力对于AI解题、绘画设计、音乐学习等需要视觉和听觉才能进行反馈指导的科目,非常关键 语音识别与