AI智能总结
李剑楠研发工程师 DataFunSummit#2024 背景介绍 ChatDBA架构 挑战与解决思路 未来展望 01 背景介绍 可以完成基本问答,但对DBA的日常工作实际价值不大 •答案很泛泛,逻辑不够强。虽然没错误,但对实际工作指导性不大 •故障诊断场景中一个故障现象可能对应多个故障原因,不同的原因又有不同的排查手法和解决方案 •大模型倾向基于已有的信息推测所有的可能结果,和DBA的工作习惯并不相同 ChatDBA是一款基于大模型的智能数据库助手。通过对话交互的方式进行数据库故障诊断、数据库专业知识学习、SQL生成与SQL优化等功能,大幅提升数据库从业者工作效率。无论中小企业还是大型组织,ChatDBA都能提供强大的数据库支持,确保业务平稳高效运行。 02 技术架构 03 挑战与解决思路 ChatDBA技术挑战:多轮交互中的排查逻辑 ChatDBA技术挑战:故障诊断树的准确性 ChatDBA技术挑战:信息检索 ·关键字和向量检索各从不同角度处理搜索,二者功能互补。 ·向量检索通过语义匹配,对拼写错误、同义词和措辞差异具有较强的鲁棒性,且能适用于跨语言搜索。 ·关键字搜索凭借直接匹配,能够有效识别并优先处理文本中的特定重要单词。 ChatDBA技术挑战:信息检索 ChatDBA技术挑战:信息检索 ChatDBA技术挑战:信息检索 ChatDBA技术挑战:文档处理 ChatDBA技术挑战:文档处理 ChatDBA技术挑战:多轮交互 ChatDBA技术挑战:长短时记忆 自信息压缩:自信息是信息论中的一个概念,用于量化某个特定事件发生的信息量。自信息的大小与事件发生的概率成反比,即一个事件发生的概率越小,该事件的自信息就越大。这意味着,如果一个事件总是发生,那么它并不提供任何新的信息。因此,我们可以利用自信息来识别prompt中的关键信息,将其保留下来,而忽略那些不提供新信息的部分。 Question-Aware Coarse-Grained Compression问题感知的粗粒度压缩。不再单独查看每个文档,而是检查每个文档与问题的关联性。Question-Aware Fine-Grained Compression问题感度的细粒 度压缩Subsequencerecovery子序列恢复 ChatDBA技术挑战:意图识别 ChatDBA技术挑战:问题延伸 ChatDBA技术挑战:长流水线的弊端 ChatDBA技术挑战:系统评估 ChatDBA的核心特性 ChatDBA的核心特性 ChatDBA的核心特性 ChatDBA的核心特性 04 未来展望 ChatDBA的未来方向 the text‘cat’ picture of‘cat’ THANKS




