行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

云原生向量数据库PieCloudVector助力多模态大模型AI应用

信息技术 2024-08-22 邱培锋 - 车伟光

国内AGI发展趋势

InfoQ研究中心预计，2030年中国AGI应用市场规模将达到4543.6亿元人民币，2024-2027年市场增速将超过100%，2028年起年增速保持在50%以上，并于2027年突破千亿人民币。企业市场规模预计到2030年达到3024.6亿元人民币。中国AGI市场分为基础设施层、模型层、中间层和应用层四层结构。

AI Agent推动AI迅速发展

AI Agent作为探索通用智能的新路径，受关注度提升，以克服大模型的局限性。

大模型时代向量数据库的必要性

大模型无法完全满足企业需求，向量数据库可整合企业私域数据和特定业务场景，降低算力门槛，提高模型准确性和可用性。向量数据库还能保障数据隐私、实时更新和查询、支持模型动态调整。

向量计算引擎的核心能力要求

向量数据库需解决高维向量快速准确检索问题，核心能力包括数据结构（如R树、M树）、近似检索（如IVF/HNSW）、硬件加速（GPU、FPGA）。

云原生向量数据库PieCloudVector

基于postgres内核，支持单机/分布式部署，提供ACID向量标量混合查询，内置模型服务，支持主流向量索引和ANN算法，可集成LLM（如ChatGLM、LLaMA），具备索引管理、向量检索、数据存储等功能。

RAG工作流程

RAG（Retrieval-Augmented Generation）存在知识库内容缺失、TopK截断、上下文整合丢失、有用信息未识别、提示词格式问题、准确性不足、答案不完整等问题。

新一代GraphRAG架构

通过向量或关键词搜索找到初始节点，遍历图获取节点信息，并使用图排名算法（如PageRank）重新排名文档。

AIGC全生命周期管理

以某金融客户AIGC应用实践为例，展示文本、图片、音频数据分析流程，通过PieCloudVector实现数据Embedding和相似度检索。

结语

乐知乐享，同心共济。知行合一，不负所托！

助力多模态大模型AI应用目录国内AGI发展趋势01 02云原生向量数据库 AIGC全生命周期管理 03 04 中国AGI市场增长趋势预测 ⚫InfoQ研究中心预计，2030年中国AGI应用市场规模将达到4543.6亿元人民币。⚫2024-2027中国AGI应用市场将经历过速启动期;每年市场增速都将超过100%，2028年起，市场将进入快速成长期，年市场增速保持在50%以上。并于2027年突破千亿人民币市场规模。⚫InfoQ研究中心认为，中国AGI应用市场规模发展将由企业市场引领主导，到2030年企业市场规模预计达到3024.6亿元人民币。国内AGI市场分层 ⚫中国AGI市场自下向上分为基础设施层、模型层、中间层和应用层四层，这四层结构共同构成了中国AGI市场的技术框架。 AIAgent推动AI迅速发展 ⚫AI Agent正逐渐成为探索的核心路径。随着时间的推移，大模型的一些局限性开始显现，尽管大模型在模仿人类认知方面取得了显著进步，但要达到真正的通用智能，仍需克服重重困难。因此，AI Agent作为新的研究方向，开始受至越来越多的关注。大模型时代向量数据库的必要性大模型在训练过程中并未接触过企业的私域数据和特定业务场景，因此，它们无法完全满足企业实际需求，也无法优化企业的具体业务流程。可以将其与企业内部的特定知识和数据进行整合。这种融合不仅降低了算力门槛，还大大提高了模型在特定应用场景中的准确性和可用性。在很多应用场景中，特别是涉及敏感信息的企业应用，数据隐私是一个不可忽视的问题。通过在本地或专有云上部署大模型，并结合向量数据库，企业可以在不暴露任何敏感信息的前提下，充分利用模型的计算能力。大模型通常需要处理海量的数据，如果不能实时更新和查询，其应用价值就会大打折扣。向量数据库通过其高效的索引和检索能力，可以实时地存储和更新模型的向量信息。这不仅大大提高了模型的响应速度，还使其能够准确地反映最新的数据状态。传统的数据库由于其设计限制，难以支持模型的动态调整。而向量数据库则通过持久化存储向量信息，为大模型提供了一种形式的“长期记忆”。这使得模型能够根据历史数据和最新信息做出更加精准的预测和决策。向量计算引擎的核心能力要求文字，语音和图像通常会通过内嵌(embedding)操作转换成高维向量，如何快速而准确地对海量向量数据进行检索是一个巨大的技术挑战。向量数据库需要采用更高级的技术和算法来解决这一问题。数据结构近似检索最近邻搜索硬件加速在传统的数据库中，B树和哈希表是最常用的数据结构。然而，在向量数据库中，由于需要处理的向量数据通常是高维的，因此需要使用更加复杂的数据结构，如R树、M树等。这些数据结构能够更有效地组织和存储高维数据，从而提高检索效率。最近邻搜索（k-NN）是向量数据库要解决的核心问题，即在给定向量数据集中找到与之距离最小的K个向量。简单的全局搜索与向量维度和总数据量成正比，对于大数据集显然需要更高效的搜索方法。如果可以接受近邻索的精度(recall)有一定程度的损失，那么有一类算法可以大幅提升检索效率，这一类算法我们通常称为近似检索(ANN)算法，常见的如IVF/HNSW等，目前没有一个通用算法能在任意数据集上达到所有指标(recall/qps/内存)均最优，一般都需要做取舍以达到整体平衡。把计算量非常大的工作分配给专门的硬件来处理以减轻CPU的工作负载，向量数据的计算可借助新硬件进行加速，如GPU、FPGA等，把常见的KNN/ANN算法、PQ算子、Index算法进行优化和集成，由专有硬件进行执行，做到从CPU的Offload。云原生向量数据库PieCloudVector 基于postgres内核：单机/分布式部署完整ACID向量标量混合查询SQL/REST/Python接口兼容Langchain等主流框架内置模型服务：丰富的模型算法，可根据需求扩展可集成LLM，如ChatGLM、LLaMA等索引管理： ➢支持主流向量索引➢索引缓存加速向量检索：支持主流的ANN算法近似向量搜索KNN-ANN，可牺牲部分精度加速搜索支持CPU和GPU加速数据存储：原始数据向量数据向量压缩支持Json格式数据类型 RAG工作流程基于向量RAG问题 •知识库内容缺失：现有的文档其实回答不了用户的问题，系统有时被误导，给出的回应其实是“胡说八道”，理想情况系统应该回应类似“抱歉，我不知道”。 •TopK截断有用文档：和用户查询相关的文档因为相似度不足被TopK截断，本质上是相似度不能精确度量文档相关性。 •上下文整合丢失：从数据库中检索到包含答案的文档，因为重排序/过滤规则等策略，导致有用的文档没有被整合到上下文中。 •有用信息未识别：受到LLM能力限制，有价值的文档内容没有被正确识别，这通常发生在上下文中存在过多的噪音或矛盾信息时。 •提示词格式问题：提示词给定的指令格式出现问题，导致大模型/微调模型不能识别用户的真正意图。 •准确性不足：LLM没能充分利用或者过度利用了上下文的信息，比如给学生找老师首要考虑的是教育资源的信息，而不是具体确定是哪个老师。另外，当用户的提问过于笼统时，也会出现准确性不足的问题。 •答案不完整：仅基于上下文提供的内容生成答案，会导致回答的内容不够完整。比如问“文档A、B和C的主流观点是什么？”，更好的方法是分别提问并总结。新一代GraphRAG架构 ➢首先进行向量或关键词搜索，以找到一组初始节点。 ➢然后遍历图，获取这些节点相关的信息。这可以通过图数据库中的查询来实现，比如使用图遍历算法。 ➢最后，可以选择使用基于图的排名算法(如PageRank)对文档进行重新排名。 AIGC全生命周期管理 AIGC应用组织某金融客户AIGC应用实践联合某高校打造多模态数据分析课程文本数据分析 1.加载Wikipedia数据集，该数据集包括id、url、title、text等字段内容，数据Embedding后写入PieCloudVector；2.选取有关四月的维基百科英文文本，通过sentence_transformers工具，采用paraphrase-MiniLM-L6-v2模型算法进行Embedding，得到一个384维的向量；3.向PieCloudVector发送query来查询，使用L2 Distance寻找最相似的10条文档。图片数据分析 1.加载图片数据，该数据集包含了服装图片、类型等数据，数据Embedding后写入PieCloudVector；2.选取一张鞋子图片，通过Embedding后得到一个768维的向量；3.向PieCloudVector发送query来查询最相似（与目标数据向量距离最近）的10个单品。这里我们计算距离使用的算法为L2 Distance。音频数据分析 1.加载音频数据，该数据包含了不同口音、来自不同地区、性别各异的个体使用英语朗读数字的音频数据；2.选择一段音频数据，采样率为4000，音频向量的长度在3000左右；3.向PieCloudVector发送query来查询最相似的音频，采用IP算法返回的结果更为准确，判断标准为 a)性别b)口音c)朗读的数字备注：一份音频数据中，包含音频文件路径、音频波形矩阵，以及波形所对应的采样率。数据集中波形的采样率为48000，较高的采样率虽然更精准，但也会导致矩阵较大（一个矩阵中有超过3万个数字），为之后的计算带来负担。乐知乐享，同心共济。知行合一，不负所托！

点击免费查看完整报告

云原生向量数据库PieCloudVector助力多模态大模型AI应用

国内AGI发展趋势

AI Agent推动AI迅速发展

大模型时代向量数据库的必要性

向量计算引擎的核心能力要求

云原生向量数据库PieCloudVector

RAG工作流程

新一代GraphRAG架构

AIGC全生命周期管理

结语

你可能感兴趣

【财联社早知道】英伟达联手Zilliz发布全球首个GPU加速向量数据库，将助力AI大模型的发展，这家公司与英特尔联合发布AIGC向量数据库解决方案，能够实现海量向量数据的高实时性查询、检索、召回等功能-20240323

百度智能云千帆大模型平台加速企业多模态生成式AI应用落地

计算机行业大模型应用落地的重要软件基础设施：向量数据库助推RAG加速大模型应用

国君计算机|向量数据库助推RAG加速大模型应用

国君计算机向量数据库助推RAG加速大模型应用向量数据库专

Zilliz-李晨-解密大模型时代的AI Native向量数据库Milvus

【点金互动易】多模态+大数据+鸿蒙，推出首批金融行业大模型应用产品，拥有多模态技术储备，这家公司入股核心系统厂商同方软银、国产数据库企业南大通用，还储备了鸿蒙系统相关技术人员

2026面向行业的‘云+AI’应用研究报告-AI行业云平台助力行业大模型应用落地

AI应用跟踪谷歌发布首个原生多模态嵌入模型跨模态检索能力显著提升

【公告全知道】华为鸿蒙+机器人+AI智能体+算力+多模态AI+信创！这家公司产品率先完成原生鸿蒙-应用的开发与适配