行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

AI原生数据应用架构与落地探讨

信息技术 2024-10-14 陈发强蚂蚁集团李强

AI原生数据应用架构与落地探讨

1. 背景

挑战与机遇：大语言模型（如ChatGPT、通义千问等）的出现带来了新的交互方式，如CodeSQL、NLU等。
数据多样性：企业的真实数据包括结构化（如Excel、数据库）、非结构化（如文本、文档数据、日志数据）、多维关系（如图、数据库）和离线数据（如数仓、数据湖），这些数据需要多样化的处理方法。

2. DB-GPT架构解读

项目介绍：DB-GPT是一个开源的AI原生数据应用开发框架，旨在简化围绕数据库构建大模型应用的过程。
核心功能：
- 多模型管理（SMMF）
- Text2SQL效果优化
- RAG框架优化
- 多数据源处理
- 智能体工作流编排（AWEL）
- 数据洞察可视化
优势：
- 支持AI原生数据应用开发
- 智能体工作流编排
- 私域问答与数据处理
- 多数据源处理与生成业务智能（GBI）
- 服务化多模型管理
- Text2SQL/Text2NLU微调
- 数据驱动的智能体框架
- 隐私安全保护
- 完全开源，采用MIT协议

3. 数据智能体应用

数据库专家智能体：如Kevin，应用于智能问答、智能诊断等领域。
构建流程：
- 资源准备（知识库、API、算子、插件）
- Agent构建
- Workflow编排
- 应用调试与发布
- 应用对话与使用
- SDK集成
技术挑战：
- 意图识别
- Agent-Linking
- 召回准确率
- 多轮对话参数补充
- 角色认定与永久记忆

4. 未来规划

存在问题：
- 开发门槛高
- 默认场景效果待提升
- 产品化能力不足
- 文档、教程、案例较少
版本计划：
- 更强的产品化能力
- 提供意图识别、Text2NLU、Text2GQL等效果微调
- 构建更多通用标杆应用场景智能体
- 完善文档与教程
- 一键集成发布到平台（如Copilot、钉钉、飞书、微信）

开源地址

GitHub

感谢参与！

陈发强（踏天）蚂蚁集团国际数据库负责人 2024/7/6 目录背景DB-GPT架构介绍智能体应用实践与挑战未来规划1234 AI给数据领域带来的挑战与机遇？ 1.1大模型出现之后，交互方式的变化 1.2多维数据企业的真实数据1.结构化数据，如Excel、数据库 2.非结构化、文本、文档数据、日志数据3.多维关系数据，如图、数据库4.离线数据，数仓、数据湖等 1.3数据的下一代交互范式 02|DB-GPT架构解读AI原生数据应用架构思考、设计与实践 2.1项目介绍 DB-GPT是一个开源的AI原生数据应用开发框架AINativeDataAppDevelopmentframeworkwithAWEL(AgenticWorkflowExpressionLanguage)andAgents 目的是构建大模型领域的基础设施，通过开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力，让围绕数据库构建大模型应用更简单，更方便。数据3.0时代，基于模型、数据库，企业/开发者可以用更少的代码搭建自己的专属应用。项目优势 1、支持AI原生数据应用开发2、智能体工作流编排3、私域问答&数据处理&RAG(Retrieval-AugmentedGeneration)4、多数据源&GBI(GenerativeBusinessIntelligence)5、服务化多模型管理6、Text2SQL/Text2NLU微调7、数据驱动Agents框架8、私有化部署、隐私安全9、完全开源，采用宽松的MIT协议 2.2架构介绍 2.3隐私安全 2.4智能体架构 03|数据智能体应用数据智能体在实际场景中的应用与挑战 3.1数据库专家智能体-Kevin 数据库专家智能体应用 3.2效果展示-Web端 3.3效果展示-移动端 Kevin-数据分析助手 Kevin-问答助手 3.4构建技术 3.5知识构建 3.5意图识别 3.6智能体构建流程 3.7诊断智能体构建 3.8智能体构建 3.8智能体调试与发布 3.8智能体评测与使用智能体的评测会从主观打分与客观打分两个维度进行评测 1.客观评测需要根据领域准备具体的专业评测数据集。2.主观评测一般是采用专家打分、真实用户反馈等。 3.8技术挑战 1.意图识别:如何准确理解用户意图，并匹配到对应的Agent 2.Agent-Linking:多Agent如何提供一个统一入口，回答多个领域专业问题的同时，还可以自由对话。 3.召回准确率:如何准备高质量的问答与知识库，结合多种RAG检索技术，准确召回相关内容。 4.多轮对话进行参数补充:比如意图识别中，用户单次的对话无法满足场景的参数要求，需要智能体反问用户达到槽位填充的目的。 5.角色认定与永久记忆:在实际应用中，真正能够长期有用的智能体需要有明确的角色认定，并且对于历史的对话记录行程长久的记忆，这样才能越来越符合人类交互的范式，形成长期服务与陪伴。 04|未来思考DB-GPT接下来的一些发展计划 4.1DB-GPT存在的问题 1.开发门槛高：框架本身很全面、强大。但上手开发难度大。 2.默认场景效果待提升:虽然提供了六大默认场景，但因为定位是框架，所以针对具体场景的优化不够深入。 3.与Dify、Coze等产品相比，产品化能力不足。 4.文档、教程、案例较少。 4.2版本计划 DB-GPT长期会深耕数据领域，目前我们看到社区的主要矛盾是更加便捷的开发使用，应用到生产环境。所以在接下来V0.6.0的版本中，我们会重点发力端到端的产品化能力，主要有以下能力。 1.更强的产品化能力，更加简单易用，包括应用管理、AWEL开发、Agent开发、Prompt调优等。 2.提供意图识别、Text2NLU、Text2GQL等效果微调。 3.提供3+以上通用标杆应用场景智能体的构建教程并内置智能体，如财报助手、数据库专家、混合检索专家。 4.更完善的文档与教程。 5.智能体应用一键集成发布到平台Copilot、钉钉、飞书、微信等平台。社区微信开源地址: https://github.com/eosphoros-ai Thank you!

点击免费查看完整报告

AI原生数据应用架构与落地探讨

AI原生数据应用架构与落地探讨

1. 背景

2. DB-GPT架构解读

3. 数据智能体应用

4. 未来规划

开源地址

感谢参与！

你可能感兴趣

数据技术嘉年华：智能·云原生·一体化——DB与AI协同创新，模型与架构融合发展

数据技术嘉年华：智能·云原生·一体化——DB与AI协同创新，模型与架构融合发展

《AI原生应用架构白皮书》解读

林清山（阿里云中间件）：阿里云中间件持续进化：从分布式应用架构向云原生AI应用架构全面升级

AI原生应用架构白皮书

云原生架构与应用专场

从AI云底座到AI原生云加速AIGC应用落地

金融行业大模型应用落地白皮书：AI原生开启金融智能新未来

传媒行业深度报告：国产AI视频大模型应用落地先行，行业空间、降本幅度、竞争格局探讨

【电报解读】大力推动人工智能赋能新型工业化！这一领域AI应用将迎快速落地和发展，机构测算行业复合增长率达30%，该公司正围绕ERP&ERPII、智能制造解决方案打造自身产品方案架构

AI原生数据应用架构与落地探讨

你可能感兴趣

数据技术嘉年华：智能·云原生·一体化——DB与AI协同创新，模型与架构融合发展

数据技术嘉年华：智能·云原生·一体化——DB与AI协同创新，模型与架构融合发展

《AI原生应用架构白皮书》解读

林清山（阿里云中间件）：阿里云中间件持续进化：从分布式应用架构向云原生AI应用架构全面升级

AI原生应用架构白皮书

云原生架构与应用专场

从AI云底座到AI原生云 加速AIGC应用落地

金融行业大模型应用落地白皮书：AI原生开启金融智能新未来

传媒行业深度报告：国产AI视频大模型应用落地先行，行业空间、降本幅度、竞争格局探讨

【电报解读】大力推动人工智能赋能新型工业化！这一领域AI应用将迎快速落地和发展，机构测算行业复合增长率达30%，该公司正围绕ERP&ERPII、智能制造解决方案打造自身产品方案架构

从AI云底座到AI原生云加速AIGC应用落地