行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

⼤模型最强外挂——向量数据库

2025-06-11 腾讯罗鑫涛Robin

向量数据库助力大模型激活企业内部数据价值

长文本杀不死RAG

向量数据库：作为大模型的重要外部知识库，通过将非结构化数据转换为向量形式存储，实现快速相似性检索。
企业数据挑战：企业面临预训练模型局限、私域数据利用不足等问题，非结构化数据占比高达80%，检索需求日益增长。
向量数据库优势：构建企业内部数据枢纽，升级搜索、推荐等应用系统，结合大模型实现效率与用户体验提升。

召回率提升最佳实践

索引支持：多类型索引（Flat、Hnsw、IVF、DiskANN、DiskFlat）满足不同场景需求，如HNSW优化性能提升50%+，DiskFLAT多租户场景成本下降90%。
AutoIndexNext：根据数据规模自动构建最佳召回率索引。
Hybrid Search：融合向量检索（语义）和全文检索（关键字）优势，提高召回率，适用于RAG、搜索等场景。

企业应用场景介绍

腾讯云向量数据库（Tencent Cloud VectorDB）：源自腾讯自研OLAMA引擎，2019年上线，集团内部60+业务使用，日均处理超8500亿次检索请求。
发展历程：2019年内部推出，2023年8月正式对外发布，2024年3月支持混合检索，2025年1月提供精细化权限管理。
应用案例：
- 智能客服系统：集成智能客服，提升用户接入效率，降低人力成本。
- 拍照搜题：以图搜图能力提升效果，运维成本低，性能高。
- 内容推荐：基于用户画像及内容向量实现个性化推荐，支持千亿级数据存储，性能领先行业1.5倍以上。

⼤模型最强外挂⼀向量数据库腾讯云向量数据库助⼒⼤模型激活企业内部数据价值主讲⼈：腾讯云向量数据库产品经理熊鑫章节⽬录 1.长⽂本杀不死RAG 2.召回率提升最佳实践 3.企业应⽤场景介绍 01长⽂本杀不死RAG ⼤模型的通病正确的废话知识停滞预训练模型的局限外部知识库补充私域数据历史公域数据 ChatGPT3.5 2021年实时公域数据企业.. 企业B 企业A 据IDC预测，⾄2025年，全球每年产⽣的数据量将达到175ZB，这表明注重数据价值的时代已经来临，并逐渐取代了从模拟数据向数字化转变的时期；且其中超过80%的数据为⾮结构化数据企业对向量的采⽤⽐ AIGC应⽤向量采⽤占⽐权威机构Gartner预测，在2026年将出现⼤规模向量数据增长结构化数据：20% ⾮结构化数据：80% 文本图片 Embedding模型音频视频向量数据向量数据库向量数据库是⼀种专门进⾏⽂本、图⽚、⾳视频等⾮结构化数据存储和检索的数据库系统，其核⼼是将⾮结构化数据转换成向量的形式存储在数据库中，并通过相似性检索的⽅式快速查找和⽬标数据最相近的结果 0.2837 0.5182 0.1928 ... 0.1293 0.2837 0.5182 0.1928 ... 0.1293 0.2837 0.5182 0.1928 ... 0.1293 搜索/推荐通过将企业内部的结构化和⾮结构化数据转为向量并存储于向量数据库中，即可构建企业内部的数据枢纽，相较于之前的单⼀的检索逻辑，借助向量的相似性检索，可做到对企业搜索、智能推荐等应⽤系统进⾏全⾯升级，并结合⼤模型LLM的能⼒，实现效率、⽤户体验等⽅⾯质的飞跃企业知识库代码助手部门数据架构数据 Upsert Search 应⽤数据多云数据向量数据库 DeepSeek AI数据打标企业数据…… 02召回率提升最佳实践 Flat Hnsw IVF DiskANN DiskFlat 数据规模 <100K <100M >100M <10M <10KPer Search 召回率 100% ~90% ~90% ~90% 100% 成本(100%Mem) 100% 100% 100% 20% 5% 性能(PerNode) <1k <50K <100K <10K <1k HNSW优化性能提升50%+ 向量量化成本降低50%-75% DiskFLAT 多租户场景成本下降90%召回率100% AutoIndex Next：根据数据规模⾃动构最佳召回率索引向量检索(稠密向量) 优势:语义检索,能够召回近义、关联内容不⾜:可能会过度泛化,混⼊⽆关内容全⽂检索(稀疏向量) 优势:全⽂检索⽅案,精确匹配关键词不⾜:可能遗漏语义相关的内容,也可能检索出⽆关结果混合检索(HybridSearch) 融合向量&关键字两种检索⽅式的优势,各取所长,提⾼召回率向量检索（ANN） •语义搜索 •多语言支持 •输入容错性稀疏向量检索（关键字） •精确匹配 •关键词汇匹配 •倒排索引性能提升、内存压缩重排序（Rerank） •按权重排序 •RRF排序 •模型排序向量+关键字双路检索⽅案，融合向量语义检索和关键字全⽂检索，提⾼RAG、搜索等场景的检索召回率 03企业应⽤场景介绍腾讯云向量数据库（TencentCloudVectorDB）源自腾讯集团自研向量检索引擎OLAMA，自2019年上线至今，经过6年打磨，集团内部已有60+业务线上使用，覆盖搜索、推荐、AI场景，日均处理超8500亿次检索请求 OLAMA向量引擎日检索量（亿次/天） 9000 8000 7000 6000 5000 4000 3000 2000 1000 2019/12/1 2020/4/1 2020/8/1 2020/12/1 2021/4/1 2021/8/1 2021/12/1 2022/4/1 2022/8/1 2022/12/1 2023/4/1 2023/8/1 2023/12/1 2024/4/1 2024/8/1 0 腾讯云向量数据库发展关键历程内部推出OLAMA 向量检索引擎腾讯云向量数据库正式对外发布首家上线Embedding及AI套件功能腾讯云向量数据库正式商业化迭代新版内核吞吐提升两倍支持“关键字+向量”两路混合检索提供精细化权限管理功能 2019年 2023年8月 2023年11月2024年3月 2024年6月 2024年9月 2025年1月业务场景在智能CRM系统中集成智能客服，通过机器人识别用户意图、分析多轮对话，从知识库中提取相关内容并精准回复，从而提升用户的接入效率、降低接入门槛知识条目向量数据向量写入文档拆分企业知识导入方案效果 •一站式方案：一站式知识检索方案，同时提供数据切分和Embedding服务，降低算法客户问题 ①输入问题向量数据库VectorDB Embedding ③问题向量化 ④向量搜索工程投入、提升效率 •准确率提升：通过腾讯云向量数据库为大模意图识别上下文对话 xxx大模型智能平台生成答案知识检索型提供外部知识库，提高大模型回答的准确性，人力成本大幅降低 ②提炼问题 ⑤相关知识+问题 ⑥输出答案业务场景在拍照搜题的应用场景中，除了文本检索之外，还有1/4的题目包含图片信息，希望借助向量数据库以图搜图的能力，进一步提高拍照搜题的效果和准确率业务痛点 •自建数据库运维难度高、服务不稳定 •性能要求高，其他产品难以满足客户收益 •运维成本低：开源数据库（Milvus）运维难度高，腾讯云VDB云上托管，99.99%可用性承诺替换自建Milvus •高性能：分布式架构，平均QPS2000+，延迟 <20ms •双库切换：支持别名，模型更新后业务无感切换 性能提升 替换⾃建，免运维业务场景根据用户画像及内容的向量，计算某用户画像下感兴趣的内容或用户阅读过内容的相似内容，从而实现个性化推荐核心能力 •满足大规模数据存储、稳定性要求：单机群可支持上千节点的管理，单索引可支持千亿级数据存储规模，SLA>99.99% •多年沉淀，性能领先：分布式向量数据库架构，针对向量检索场景专门优化，性能领先行业平均水平1.5倍以上 THANKS

点击免费查看完整报告

⼤模型最强外挂——向量数据库

向量数据库助力大模型激活企业内部数据价值

长文本杀不死RAG

召回率提升最佳实践

企业应用场景介绍

你可能感兴趣

布局AI底座向量数据库，汲取行业红利

1-2 苏鹏-大模型与向量数据库：敏捷运维的创新引擎

计算机行业大模型应用落地的重要软件基础设施：向量数据库助推RAG加速大模型应用

广发计算机刘雪峰团队 | AI行业深度报告：向量数据库-AIGC时代的必备基础

腾讯云（邹鹏）：AGI时代向量数据库的发展趋势

TensorDB向量数据库白皮书.

东吴计算机持续推荐NVGPU直连SSD带来存储新方向向量数据库

Zilliz-李晨-解密大模型时代的AI Native向量数据库Milvus

中国数据库行业分析报告：向量启航，引擎加持（2022年10月）

重视AI向量数据库“从0到1突破”的产业机遇，关注星环科技和中亦科技