AI智能总结
随着生成式AI技术的快速发展,金融行业也正积极探索大模型在各类业务场景中的应用落地。当前也出现了许多应用产品能提升各环节的工作效率,然而产品类型主要属于智能客服、金融知识问答这些,核心优势也主要在于其背后的数据库质量,本质上依然属于“工具”而非“应用”,还未真正发挥大模型自身具备的丰富潜力。而Manus、Deep Research这类产品展现了大模型成为真正通用或专业化智能体的可能性,这也是它们曾带来轰动的原因。如何更进一步搭建金融领域的专业Agent? 为什么我们需要Dfy? Dify作为专业化的工作流应用搭建工具,其高自由度、模块化与低代码的产品特征使其能充分解决大模型在金融投研领域落地的痛点:处理流程长、信息整合度高、高度数据依赖。Dify兼顾了专业化与便捷性,不仅相比此前的LangChain等框架有大幅效率提升,在同类产品的横向比较中同样定位突出,成为构建金融AI投研应用的首选。当然,Dify也保持着高度的可拓展性,能与RAGFlow这类专业化知识库相连接,也能支持MCP工具接入,可进一步拓宽应用的能力边界。 强大的功能与简单的配置 我们对Dify内部的工具、知识库、Agent与工作流等关键功能进行详细介绍,展示了其中自定义工具、搭建Agent与工作流等操作的具体方法。Dify允许多样化的工具来源,除了官方提供的工具接口外,也可以通过MCP、自定义等方式连接工具,甚至允许将用户自己构造的工作流作为工具重复使用。工作流中我们也可选择功能丰富的节点,低代码完成AI应用的搭建。同时,我们也对部署本地版Dify、配置大模型接口、构建知识库等基础操作进行展示,并对诸如文档分块、检索算法等可能影响应用效果的节点进行说明。 应用构建实战——Dify为投研应用带来丰富想象空间 最终,我们结合三个案例,展示了Dify应用的巨大想象空间。 第一个案例,我们设计了“时间提取”工具,解决了自然语言对话中存在的时间范围指代模糊的问题,能自动识别解决用户需求所需要的确切数据时间范围。该工具可以嵌套进任意其他工作流或Agent之中,实现重复使用。 第二个案例,我们设计了专业化的“金融分析师”。它首先会对用户提问的范畴进行划分,确认是“个股”、“行业”、“概念”还是“宏观”类问题,再分别接入相对应的细分流程进行针对性分析。每个细分流程则会有专门设计的Agent进行分析工作,它们运行流程、知识库、工具与提示词等方面都有所不同,能最大化专业程度。 第三个案例,我们介绍了“地理信息检索”Agent,展示Dify在搭建投研应用方面的巨大潜力。该Agent可以对年报中出现的地址进行经纬度定位,并同时搜索附近区域内出现的目标地点,譬如我们在案例中设定的“养殖场”这一目标。本质上,但凡是涉及金融与其他领域信息整合的需求,都可以在Dify的辅助下更高效完成。 整体而言,Dify易于上手也兼具专业性,为金融应用带来了丰富的想象空间,是目前搭建大模型投研应用的最佳选择。 风险提示 本次研究基于v1.3.0版本的Dify进行,未来版本更新可能带来功能变化;知识库的具体表现结果受到模型选择影响,不同模型配置下知识库效果可能存在差异;大语言模型使用可能会受到限制,模型输出结果具有一定波动性;本次研究中的推荐参数与模型选择、任务需求等具体情形有关,在具体使用中应根据情况及时调整。 一、为什么我们需要Dify? 1.1Dify破解金融大模型落地的核心痛点 随着生成式AI技术的快速发展,金融行业也正积极探索大模型在各类业务场景中的应用落地,当前也出现了许多具有丰富功能的应用产品,提升了各环节的工作效率。然而,当前市面上较成熟的大模型产品主要属于智能客服、金融知识问答这些类型,产品的核心优势还是在于其背后的数据库质量,本质上依然属于“工具”而非“应用”,还未真正发挥大模型自身具备的丰富潜力。而Manus、Deep Research这类产品展现了大模型成为真正通用或专业化智能体的可能性,这也是它们曾带来轰动的原因。 当然,金融投研领域对AI应用的专业化程度有更高要求,这也是复杂应用落地难的另一个原因。目前投研领域的AI应用还有以下关键痛点: 、处理流程长 在实际工作中,用户通常需要处理长链条的任务。譬如在进行个股分析时,我们一般要从财务基本面、公司业务、行业趋势、宏观政策多个维度进行分析,而其中每个维度分析所需要的信息、以及分析的逻辑又有所不同,每个任务需要设计专门对应的AI功能模块才能最大程度满足专业性需求。现有大模型产品还主要是专业化的功能模块,若用户想依靠大模型完成这类复杂分析任务,还需要手动衔接各个模块的反馈,全流程自动化程度依旧较低,这也体现出当前AI应用定制化功能少的问题。 、信息整合度高 金融分析一般会涉及到较多工具的联动。除了基础的财务基本面数据与行情数据外,文本信息如研报、公告、网络舆情乃至专业论文也是主要的信息来源,此外另类数据还包括商品价格、地理信息、交通信息等,金融分析则需要整合以上所有信息进行判断。然而当前AI应用背靠各自的信息来源,与用户拥有的信息、相互之间均存在数据孤岛现象,无法有效整合。出于数据安全的考虑,真正有效的应用只能在客户本地定制化落地。 c)、高度数据依赖 投研分析对数据的依赖度高,需要处理大量的结构化数据。但大模型天然不擅长处理数字类信息,譬如无法充分理解其中数据结构、数字变化中蕴含的信息,在进行一些基础运算时也容易出现错误,这是实际应用中难以接受的。当前的解决方案是为大模型配置传统数据库的交互工具,搭配专门设计的计算工具辅助计算,以实现相应的数据处理工作。 但常见情况是懂数据库内部逻辑的前台人员不会设计工具,会构建工具的工程师还需要花时间了解业务需求,导致应用难落地。 Dify有望解决以上应用落地中存在的问题。Dify是一款开源的大语言模型(LLM)应用开发平台,是专业化的工作流构建工具,致力于协助开发者、企业、尤其是非技术人员迅速搭建、发布和维护大模型应用。其开源特性赋予开发者极大灵活性,可根据特定需求对平台进行定制。Dify的优势可以使用以下几个关键词进行概括:自由度高、模块化、低代码开发。 Dify自由度高体现在兼容性强、功能丰富。Dify能够无缝对接数百种商业和开源LLM,涵盖商业模型如OpenAI GPT、Anthropic Claude、Google Gemini,开源模型如Llama 2、Mistral、ChatGLM,以及本地部署模型如Ollama、Xorbits Inference等;其搭载的RAG引擎功能强大,支持多种文档格式,也能与Weaviate、Milvus等向量数据库集成;Dify也支持用户根据需求构建自己的AI Agent,能按照用户需求灵活规划并实现复杂任务; 也允许调用外部工具,如Google搜索、自动绘图等。更详细的内容我们将会在后文进行介绍。 图表1:Dify平台框架 Dify作为专业的工作流搭建工具,优势还体现在内部功能的高度模块化。Dify允许用户搭建Workflow类型应用,可以自由搭配不同功能的组件,以串联或并联的逻辑完成长链条工作;工具也都以统一的参数输入、输出形式呈现,并且支持在不同工作区、不同账户之间进行分享,初次创建即可服用。这一优势恰好对应了投研应用中所需的长链条处理需求,能进一步提升大模型应用的自动化与定制化。 同时,Dify中搭建应用是低代码化的。Dify支持通过拖拽方式构建AI应用,凭借其独特的低代码甚至零代码特性和直观的可视化界面,极大地降低了大模型应用开发的门槛,让非技术人员都能轻松上手构建复杂的工作流应用。这一点对前台投研人员非常友好,能帮助其更好利用所掌握的信息来源,也能与本地的数据库轻松建立连接。 图表2:Dify的模块化、带代码工作流 1.2与传统工具相比,Dify降低了搭建AI应用的门槛 Dify这类带有图形化界面的AI工具将大模型应用开发带入新的时代。最初,大模型只有API调用一种形式,此时若要搭建AI应用非常复杂,所有功能都需要自己设计并实现。 随后,出现了LangChain这类框架产品,一度成为AI应用的必备利器,但也逐渐暴露出过度工程化等问题,并且学习曲线陡峭,对非技术人员不够友好。 Dify能自动处理集成细节,简化了开发流程;多API集成与管理也十分方便,能帮助实现高度定制化的大模型应用,显著提升开发效率与应用的可扩展性;图形化界面也使得非技术人员学习成本低,人人都可上手;同时,Agent、工作流等功能也保持了搭建应用的自由度高,并没有因为方便而牺牲实用性。 图表3:Dify与传统AI应用开发方式的对比 作为LLMOps平台,Dify重构了AI应用开发的生产流程,通过可视化编排和低代码工具,将AI开发门槛从专业技术群体下沉到普通开发者和业务人员,且对专业人士来说也能显著提升开发效率。 图表4:使用Dify前后开发AI应用的各环节差异 1.3与同类相比,Dify兼顾实用性与便捷性 当然,在AI应用搭建工具方面Dify并非完全没有竞争对手,当前使用量较多的还有FastGPT与Coze。但在当前AI平台的发展格局中,Dify凭借其功能全面、支持自建部署、支持工作流编排与知识库集成等能力,在众多工具中占据了“灵活可定制”的差异化定位。 Dify的一大亮点在于其工作流与应用构建能力。相较于Coze仅支持基础操作,FastGPT更偏向“封装好即可调用”的模式,Dify支持从零自定义复杂工作流,拥有丰富的节点类型与变量管理能力,支持函数调用、条件逻辑与上下文传递,使其在任务拆解、数据处理、流程自动化等方面具备强大的工程支持。这一点对于需要构建特定业务逻辑或进行二次开发的用户尤为重要。 相较之下,虽然FastGPT支持更专业化的数据库功能与节点编排功能,但存在本地部署难度高、应用调试困难等问题,更适合作为企业级部署解决方案,对初学者不够友好;而Coze又过于简单,一方面接入模型的选择有限,另一方面在搭建应用时可以选择的功能很少,只适合初学者上手体验,无法搭建复杂应用。 在知识库方面,Dify支持文本上传、网页抓取、Notion同步等多种数据源,具备结构化处理、分段设定、索引调节等能力。尽管在管理体验上不如FastGPT丰富直观,但其整体设计更具透明性与可控性,更符合专业用户的使用习惯。 图表5:Dify与同类产品的功能对比 Dify以其工程能力和适配复杂需求的潜力,逐渐成为中高级用户与开发团队关注的焦点。 总体来看,Dify在功能覆盖度、扩展性、平台灵活性方面表现均衡,尤其适合那些既需要工具灵活性,又希望在知识库、工作流等环节拥有高度自主控制权,具备特定定制需求的用户。而FastGPT更适用于对性能和部署效率要求极高的企业级用户,Coze则偏向初学者与C端应用构建者。 1.4Dify+RAGFlow、MCP带来丰富想象空间 Dify还能和RAGFlow、MCP等其他专业化功能进行连接,提高应用的广度与深度。 知识库是当前大模型应用必不可少的环节,涉及文档问答、专业知识增强等需求的应用都需要配备高质量的RAG系统,才能够有较好的表现。当前在RAG方面专业化程度最高的就是RAGFlow,其突出特点在于深度文档理解功能,能够适配多种格式的文档类型,同时追求较高的输入与检索质量,坚持“Quality in,Quality out”的目标。其内部使用DeepDoc进行文本分块、Raptor策略实现召回增强、混合搜索与多路召回等多种机制,共同实现最终检索效率的大幅提升。更为重要的是,RAGFlow同样支持对结构化数据进行检索,这对金融投研应用来说是必不可少的。Dify与FastGPT等工具虽然自带知识库功能,但也无法和RAGFlow的专业化程度相比较,因此RAGFlow的接入可以显著提升Dify应用的专业化程度。 我们可以在RAGFlow中配置好API服务器,再在Dify中选择“外部知识库API”,对应输入服务器地址与API密钥,快速完成知识库的连接。 图表6:在Di