陈发强(踏天) 蚂蚁集团国际数据库负责人 2024/7/6 目录 背景DB-GPT架构介绍智能体应用实践与挑战未来规划1234 AI给数据领域带来的挑战与机遇? 1.1大模型出现之后,交互方式的变化 1.2多维数据 企业的真实数据1.结构化数据,如Excel、数据库 2.非结构化、文本、文档数据、日志数据3.多维关系数据,如图、数据库4.离线数据,数仓、数据湖等 1.3数据的下一代交互范式 02|DB-GPT架构解读AI原生数据应用架构思考、设计与实践 2.1项目介绍 DB-GPT是一个开源的AI原生数据应用开发框架AINativeDataAppDevelopmentframeworkwithAWEL(AgenticWorkflowExpressionLanguage)andAgents 目的是构建大模型领域的基础设施,通过开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单,更方便。 数据3.0时代,基于模型、数据库,企业/开发者可以用更少的代码搭建自己的专属应用。 项目优势 1、支持AI原生数据应用开发2、智能体工作流编排3、私域问答&数据处理&RAG(Retrieval-AugmentedGeneration)4、多数据源&GBI(GenerativeBusinessIntelligence)5、服务化多模型管理6、Text2SQL/Text2NLU微调7、数据驱动Agents框架8、私有化部署、隐私安全9、完全开源,采用宽松的MIT协议 2.2架构介绍 2.3隐私安全 2.4智能体架构 03|数据智能体应用数据智能体在实际场景中的应用与挑战 3.1数据库专家智能体-Kevin 数据库专家智能体应用 3.2效果展示-Web端 3.3效果展示-移动端 Kevin-数据分析助手 Kevin-问答助手 3.4构建技术 3.5知识构建 3.5意图识别 3.6智能体构建流程 3.7诊断智能体构建 3.8智能体构建 3.8智能体调试与发布 3.8智能体评测与使用 智能体的评测会从主观打分与客观打分两个维度进行评测 1.客观评测需要根据领域准备具体的专业评测数据集。2.主观评测一般是采用专家打分、真实用户反馈等。 3.8技术挑战 1.意图识别:如何准确理解用户意图,并匹配到对应的Agent 2.Agent-Linking:多Agent如何提供一个统一入口,回答多个领域专业问题的同时,还可以自由对话。 3.召回准确率:如何准备高质量的问答与知识库,结合多种RAG检索技术,准确召回相关内容。 4.多轮对话进行参数补充:比如意图识别中,用户单次的对话无法满足场景的参数要求,需要智能体反问用户达到槽位填充的目的。 5.角色认定与永久记忆:在实际应用中,真正能够长期有用的智能体需要有明确的角色认定,并且对于历史的对话记录行程长久的记忆,这样才能越来越符合人类交互的范式,形成长期服务与陪伴。 04|未来思考DB-GPT接下来的一些发展计划 4.1DB-GPT存在的问题 1.开发门槛高:框架本身很全面、强大。但上手开发难度大。 2.默认场景效果待提升:虽然提供了六大默认场景,但因为定位是框架,所以针对具体场景的优化不够深入。 3.与Dify、Coze等产品相比,产品化能力不足。 4.文档、教程、案例较少。 4.2版本计划 DB-GPT长期会深耕数据领域,目前我们看到社区的主要矛盾是更加便捷的开发使用,应用到生产环境。所以在接下来V0.6.0的版本中,我们会重点发力端到端的产品化能力,主要有以下能力。 1.更强的产品化能力,更加简单易用,包括应用管理、AWEL开发、Agent开发、Prompt调优等。 2.提供意图识别、Text2NLU、Text2GQL等效果微调。 3.提供3+以上通用标杆应用场景智能体的构建教程并内置智能体,如财报助手、数据库专家、混合检索专家。 4.更完善的文档与教程。 5.智能体应用一键集成发布到平台Copilot、钉钉、飞书、微信等平台。 社区微信 开源地址: https://github.com/eosphoros-ai Thank you!