殷杰百度智能云高级产品经理 理想中的智能体无所不能 客户服务 内容创作 激发灵感,自动生成高质量文章、设计、视频 现实中的智能体开发坑坑不断 启动前 选题:从小切口、痛点入手 选题:从小切口、痛点入手 选题:从小切口、痛点入手 选型:没有标准答案,可持续发展 解技术储备充足、成本敏感免费、开源框架、高代码平台技术和预算充足,效果导向开源或自研平台、取各家优质模型与组件能力技术团队有限、预算充足开/闭源商业平台、无代码/低代码平台,可扩展至高代码 选型:没有标准答案,可持续发展 解技术储备充足、成本敏感免费、开源框架、高代码平台技术和预算充足,效果导向开源或自研平台、取各家优质模型与组件能力技术团队有限、预算充足开/闭源商业平台、无代码/低代码平台,可扩展至高代码 方法论:太阳底下没有新鲜事 开发中 模型:关注效价比和可持续提升 模型:关注效价比和可持续提升 模型:关注效价比和可持续提升 提示词:就像写PRD一样 像写PRD一样写PROMPT 目标模糊,不知所求上下文缺失,无从发挥缺乏结构化表达忽略输出约束靠模型猜、缺乏示例 ①能讲明白的一定要讲明白:指令明确、术语一致、格式清晰②讲不明白的可以用场景及示例补充:人设、场景、对象、黑话③随机应变:给出思考方法、直给中间结果 提示词:就像写PRD一样 像写PRD一样写PROMPT 目标模糊,不知所求上下文缺失,无从发挥缺乏结构化表达忽略输出约束靠模型猜、缺乏示例 ①能讲明白的一定要讲明白:指令明确、术语一致、格式清晰②讲不明白的可以用场景及示例补充:人设、场景、对象、黑话③随机应变:给出思考方法、直给中间结果 RAG:离线在线两手都要抓 知识库管理:定期更新、建立版本管理机制 召回不准答非所问 离线加工:解析策略、切片策略、知识增强、测试验证在线召回:多检索模式、召回数量、匹配分、扩展上下文信息等 数据不管理,老旧冲突离线加工缺失,难检索利用检索召回策略单一,适应性差 更多进阶能力:同义词/专有名词配置、网页搜索增强 同义词/专有名词配置、搜索增强 RAG:离线在线两手都要抓 知识库管理:定期更新、建立版本管理机制 召回不准答非所问 离线加工:解析策略、切片策略、知识增强、测试验证在线召回:多检索模式、召回数量、匹配分、扩展上下文信息等 数据不管理,老旧冲突离线加工缺失,难检索利用检索召回策略单一,适应性差 更多进阶能力:同义词/专有名词配置、网页搜索增强 同义词/专有名词配置、搜索增强 RAG:离线在线两手都要抓 知识库管理:定期更新、建立版本管理机制 召回不准答非所问 离线加工:解析策略、切片策略、知识增强、测试验证在线召回:多检索模式、召回数量、匹配分、扩展上下文信息等 数据不管理,老旧冲突离线加工缺失,难检索利用检索召回策略单一,适应性差 更多进阶能力:同义词/专有名词配置、网页搜索增强 同义词/专有名词配置、搜索增强 工具:找得到、用得稳、调得准 工具找不到,生态分散工具适配差,标准缺失智能体用不好,未协同训练 找得到 用得稳 调得准 •标准化:MCP协议•预处理:好的工具描述、场景化设定默认值、精简出入参•高准入:效果、性能、稳定性 •量大管饱上聚合平台:百度搜索开放平台•特色能力上智能体开发平台:组件/MCP广场•单点能力上官方平台:各个开发平台、官网 •通 过 小 样 本 训 练 提 升特定工具调用精准度•结构化prompt模板•酌情引入工作流•调试和监控调优 解 工具:找得到、用得稳、调得准 工具找不到,生态分散工具适配差,标准缺失智能体用不好,未协同训练 找得到 用得稳 调得准 •标准化:MCP协议•预处理:好的工具描述、场景化设定默认值、精简出入参•高准入:效果、性能、稳定性 •量大管饱上聚合平台:百度搜索开放平台•特色能力上智能体开发平台:组件/MCP广场•单点能力上官方平台:各个开发平台、官网 •通 过 小 样 本 训 练 提 升特定工具调用精准度•结构化prompt模板•酌情引入工作流•调试和监控调优 解 工具:找得到、用得稳、调得准 工具找不到,生态分散工具适配差,标准缺失智能体用不好,未协同训练 找得到 用得稳 调得准 •标准化:MCP协议•预处理:好的工具描述、场景化设定默认值、精简出入参•高准入:效果、性能、稳定性 •量大管饱上聚合平台:百度搜索开放平台•特色能力上智能体开发平台:组件/MCP广场•单点能力上官方平台:各个开发平台、官网 •通 过 小 样 本 训 练 提 升特定工具调用精准度•结构化prompt模板•酌情引入工作流•调试和监控调优 解 内容安全底线:多级纵深保障 内容安全底线:多级纵深保障 内容安全底线:多级纵深保障 上线后 企业高可用:全面覆盖,不留短板 缺乏监控告警,响应滞后缺乏扩缩容机制,高峰崩溃缺乏容灾机制,系统单点故障缺乏日志记录,问题难追溯 进行扩缩容机制设计 建立健全的容灾机制 持续优化:可观测、可量化、可闭环 完善的日志、Trace、报表等进行效果观测建立量化效果评价基线,定期分析和评估构建用户反馈体系,进行针对性优化 用户难反馈,问题反复出现 回顾十大坑与解 启动前 上线后 开发中 ⚫模型:关注效价比和可持续提升⚫提示词:就像写PRD一样⚫RAG:离线在线两手都要抓⚫工具:找得到、用得稳、调得准⚫安全:多级纵深保障 ⚫选题:从小切口,痛点入手⚫选型:没有标准答案,可持续发展⚫方法论:太阳底下没有新鲜事 ⚫企业高可用:全面覆盖,不留短板⚫持续优化:可观测、可量化、可闭环 Thanks Thanks Thanks