您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[全球人工智能开发与应用大会]:下一代RAG引擎的技术挑战与实现 - 发现报告

下一代RAG引擎的技术挑战与实现

下一代RAG引擎的技术挑战与实现

演讲人:张颖峰 目 录 01下一代RAG引擎 02数据抽取模型 04高级RAG 03混合搜索 下一代RAG引擎01 RAG架构模式 当前RAG面临的挑战 ◼挑战一:向量的召回无法满足要求 ◼挑战二:文档结构复杂,数据太乱,GarbageIn,GarbageOut ◼挑战三:问题和答案所在文档关联不大,很难通过问题找到正确文档 下一代RAG架构 Infinity + RAGFlow =Infiniflow 数据抽取模型02 调整抽取模型的RAGFlow对比 表格识别模型 ◼单元格边界判定 ◼表头信息判定 ◼单元格合并判定 ◼表格跨页判定 表格识别模型 文档“大”模型 “雕花”还是多模态LLM? 混合搜索03 Indexing Database Benchmark RAG数据库选型对比 几路召回? 排序模型 ColBERT的收益 ColBERT的收益 ColBERT ranker还是reranker? 延迟交互是RAG的未来 answerai-colbert-small-v1基于JaColBERT 33M参数 ◼超过BGE 110M◼每个Token 96维◼Binary量化后每个Token 12 byte 延迟交互是RAG的未来 高级RAG04 Agentic RAG——复杂问答 Agentic RAG——复杂问答 知识图谱 知识图谱 下一代RAG平台 THANKS 智能未来,探索AI无限可能Intelligent Future, Exploring theBoundless Possibilities of AI https://github.com/infiniflow/infinityhttps://github.com/infiniflow/ragflow