您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [华创证券]:本地知识库的配置与应用:量化看市场系列之十二:让AI更懂你 - 发现报告

本地知识库的配置与应用:量化看市场系列之十二:让AI更懂你

文化传媒 2026-04-02 华创证券 喜马拉雅
报告封面

【点评报告】 量化看市场系列之十二:让AI更懂你——本地知识库的配置与应用 华创证券研究所 ❖摘要 证券分析师:王小川邮箱:wangxiaochuan@hcyjs.com执业编号:S0360517100001 在没有AI的时代,我们的资料往往散落在一个个文件夹中,或存放在各种笔记软件里。想要找到某条信息,只能依赖记忆去定位,或者通过软件的关键词搜索功能来查找。这种方式不仅效率低下,还容易出现遗忘——即便搜到了,返回的也往往是一个包含关键词的“资料原文”,需要你从头到尾翻阅、理解、归纳,才能提炼出真正想要的答案。 相关研究报告 《量化看市场系列之十一:Token太贵?让“龙虾”使用本地大模型》2026-03-29《量化看市场系列之十:给龙虾插上形态学的翅膀--形态学Skills(huachuang-morphology-skills)上线》2026-03-26《量化看市场系列之七:使用OpenClaw快速搭建AI助理团队》2026-03-10《量化看市场系列之六:OpenClaw金融行业必备Skills推荐与实战应用》2026-03-09《量化看市场系列之五:如何叫你的AI更聪明、运行更有效率——Skills的设置与使用》2026-02-17《量化看市场系列之四:使用“OpenClaw”搭建属于自己的私域AI助理》2026-02-03 而有了AI知识库之后,这一切发生了本质变化。AI会提前对你的所有文档资料进行理解、分析和向量化处理,构建起一个结构化的知识网络。当你提出问题时,AI能够精准理解你的意图,从资料库中快速匹配最相关的内容片段,并将这些内容整合成一份清晰、直接、可用的答案——你得到的不是“在哪段资料里可能找到答案”,而是“答案本身”。这种转变,意味着信息管理从“人去找信息”,进化到了“信息去找人”。 目前,想要在本地搭建属于自己的AI知识库,有多种可供选择的方案,分别适用于不同的场景和人群。 本文介绍了三种相对成熟的方法,可以通过anythingLLM、OpenClaw原生机制或第三方笔记软件如Obsidian构建自己的知识库。 如果你需要让AI“读懂”你的大量文档,并基于它们进行问答,那么AnythingLLM是成熟、容易上手的方案。它尤其适合学生、研究者或需要构建企业知识库的团队。 如果你希望AI不仅能回答问题,更能成为你的“数字管家”,替你执行具体任务,那么OpenClaw代表了下一代AI应用的方向。它适合追求极致自动化、有一定技术背景的开发者。 如果你是重度笔记用户,更看重知识体系的长期构建、链接和数据100%掌控,那么Obsidian是最好的选择。虽然它不直接提供AI问答,但可以通过其他工具联动来实现“AI赋能”。 ❖风险提示: 即使是基于本地知识库的问答,大语言模型仍可能生成不准确、不完整或完全错误的内容。关键决策场景下务必人工复核。 目录 一、AI知识库理论知识.........................................................................................................4 (一)为什么要搭建AI知识库?.................................................................................4(二)AI知识库的原理是什么?..................................................................................4(三)搭建AI知识库需要哪些软件?.........................................................................5 二、实践操作...........................................................................................................................5 (一)AnythingLLM操作与配置...................................................................................5(二)运用Openclaw自带的知识库能力...................................................................11(三)利用Obsidian构建知识库.................................................................................12 三、总结.................................................................................................................................16 四、风险提示.........................................................................................................................17 图表目录 图表1 AnythingLLM官方网站.............................................................................................6图表2 AnythingLLM环境.....................................................................................................6图表3 AnythingLLM配置....................................................................................................7图表4 AnythingLLM知识库上传........................................................................................8图表5 AnythingLLM案例展示............................................................................................9图表6 AnythingLLM API开启页面...................................................................................10图表7 Openclaw调用知识库示例......................................................................................10图表8 Openclaw原生调用知识库......................................................................................11图表9 Obsidian官网............................................................................................................12图表10 Obsidian目录创建..................................................................................................14图表11 Obsidian与OpenClaw的通信...............................................................................14图表12三种本地建立知识库方案对比.............................................................................16 在过往的量化报告中,我们或运用多种指标对个股、指数及ETF进行择时判断,或从形态视角对不同类别资产展开分析,并基于此构建配套的量化产品,供客户参考使用。《量化看市场》系列报告致力于进一步拓展量化方法在市场研究中的应用:或围绕市场热点提供量化视角的解读,或分享原创性的思考结论,以此实现从提供产品策略到直接输出观点的转变,从而更高效地辅助投资决策。本系列报告所涉及的相关模型,我们将在https://xingtai.pro/opinion网站持续更新专题内容与最新研判,欢迎访问。 一、AI知识库理论知识 (一)为什么要搭建AI知识库? 在没有AI的时代,我们的资料往往散落在一个个文件夹中,或存放在各种笔记软件里。想要找到某条信息,只能依赖记忆去定位,或者通过软件的关键词搜索功能来查找。这种方式不仅效率低下,还容易出现遗忘——即便搜到了,返回的也往往是一个包含关键词的“资料原文”,需要你从头到尾翻阅、理解、归纳,才能提炼出真正想要的答案。 而有了AI知识库之后,这一切发生了本质变化。AI会提前对你的所有文档资料进行理解、分析和向量化处理,构建起一个结构化的知识网络。当你提出问题时,AI能够精准理解你的意图,从资料库中快速匹配最相关的内容片段,并将这些内容整合成一份清晰、直接、可用的答案——你得到的不是“在哪段资料里可能找到答案”,而是“答案本身”。 (二)AI知识库的原理是什么? AI知识库可以理解成一个“能理解语义的搜索系统”,整个过程分为三步: ⚫把文档转为向量 当用户导入一份PDF、Word文档或Markdown笔记时,系统并不会将其作为整体存储,而是首先进行文本分块(chunking)。系统会将长文档按语义边界(如段落、章节或固定长度)拆分为若干较小的文本片段。分块粒度的选择直接影响后续检索的精度:块过大会引入冗余信息,块过小则可能丢失上下文。 随后,系统调用嵌入模型(embedding model),将每一个文本片段转换为一个高维向量——即一串浮点数序列。这个向量的核心作用在于将语义信息编码为空间位置:语义相近的文本,其向量在向量空间中的距离也相近;反之则远。 这一阶段完成后,所有文本片段都被映射为向量,并存储于本地向量数据库中,等待后续检索调用。 ⚫语义检索 当用户提出问题时,系统进入检索阶段。 用户的问题同样会被传入同一个嵌入模型,转换为与文档片段同一语义空间下的向量。随后,系统在向量数据库中执行相似度搜索(similarity search),通常采用余弦相似度或欧氏距离等度量方法,计算问题向量与每一个文档片段向量之间的空间距离,并返回相似度最高的若干片段。 这一机制的关键在于,检索依据的是语义相似性而非关键词命中。即使用户使用的词汇与文档中的表述不完全一致,只要意图相同,系统仍能定位到相关内容。 ⚫大模型生成答案 系统将第二阶段检索到的相关文本片段作为上下文(context),连同用户的原始问题一起,构建成一条提示词(prompt),输入到大语言模型中。模型的任务并非自由发挥,而是严格基于所提供的上下文内容,生成一段自然语言回答。这一过程在技术领域被称为检索增强生成(Retrie