深度学习揭秘系列之四:DeepSeek大模型如何助力投研? Table_ReportTime]2025年4月22日 [Table_Title]深度学习揭秘系列之四:DeepSeek大模型如何助力投研? 证券研究报告 金融工程研究 [TableReportType]金融工程深度报告 2025年4月22日 [Table_Author]于明明金融工程与金融产品首席分析师执业编号:S1500521070001联系电话:+86 18616021459邮箱:yumingming@cindasc.com [Table_Summary]DeepSeek系列模型通过持续技术突破,在开源大模型领域树立了性能与成本效益的双重标杆。尤其在金融等垂直领域,其专业场景适配能力正重塑行业智能化转型的价值标准,为产业升级提供高性价比解决方案。 性能对齐海外领军闭源模型,垂直领域应用价值凸显。通过持续技术创新,DeepSeek实现了开源大模型性能与国际顶尖闭源模型的全面对标。其显著的成本优势使其成为当前最具性价比的AI大模型之一,尤其适合金融等垂直领域。 孙石金融工程与金融产品金融工程分析师执业编号:S1500523080010联系电话:+86 18817366228邮箱:sunshi@cindasc.com DeepSeek-V3:架构创新驱动效能跃升。优化的模型架构设计、多Token预测目标与FP8混合精度训练等技术亮点使模型在保持参数数量级优势的同时达成单位算力效能的最大化释放。 DeepSeek-R1:推理能力突破认知边界。DeepSeekR1-Zero展示了诸如自我验证、反思和生成长思维链的能力,标志着研究界的重要里程碑。为解决可读性差和语言混乱等问题,并进一步提高推理性能,结合多阶段强化学习以及监督微调,最终训练出强大的DeepSeek-R1。 DeepSeek网页版已构建起覆盖知识管理全流程的智能服务体系,用户通过自然语言交互即可实现多模态智能问答、跨格式文档解析、学术资源智能检索、可视化思维建构、自动化办公输出,其创新交互范式正在重塑企业级知识生产力工具的应用形态。 DeepSeek官网实现智能问答与文档解析功能。依托其强大的自然语言处理能力,用户仅通过DeepSeek官方对话网页即可实现智能问答、跨格式文档解析等功能。 秘塔AI实现学术资源智能检索。秘塔AI集成了DeepSeek-R1深度思考功能,结合学术搜索算法,能够限定搜索范围,在提供精准答案的同时自动给出详细的信息来源、相关事件、相关组织。 纳米AI实现可视化思维建构。纳米AI能够将复杂问题拆解为可执行任务流,对分步实现的回答能够同时生成思维导图,支持对节点的进一步提问优化。 腾讯元宝擅长公众号内容调用。腾讯元宝支持多种文件的上传处理,与微信公众号文章联系紧密,其回答参考资料多为公众号内容。 信达证券股份有限公司CINDA SECURITIES CO.,LTD北京市西城区宣武门西大街甲127号金隅大厦B座邮编:100031 DeepSeek结合Kimi+,能够实现自动生成PPT的功能。通过DeepSeek与Kimi+的跨平台协作,能够实现从大纲到PPT自动流程,而且支持PPT大纲编辑、模板替换等功能。 作为网页版的功能进阶形态,DeepSeek API具有更高的灵活性与可拓展性,为开发者与企业用户提供更具工程价值的接入方案。 DeepSeek模型可选API丰富,用户可以结合自身需求进行参数的灵活设置。 以火山引擎为例使用Deepseek API,通过python或Excel VBA实现相关功能。DeepSeek API支持Python、Excel VBA等多语言调用,实现金融数据处理、行情获取等功能。 本地部署适用于处理敏感数据、需要满足定制化需求、或者需合规性保障的用户,但是对于配置条件有一定的要求。 建议有需求的用户结合最低显存估算选择相应模型通过Ollama部署,进一步可以利用浏览器插件实现联网、构建本地知识库等功能。 CherryStudio是一款集多模型对话、知识库管理、AI绘画、翻译等功能于一体的全能AI助手平台,支持本地部署大模型与多方API的调用。 ➢作为深度整合的智能工作平台,用户可以通过CherryStudio调用云端DeepSeekAPI以及本地部署大模型。➢嵌入模型有本地部署与外部API两种配置方式。构建知识库之前,用户可以通过Ollama部署本地嵌入模型,也可以通过外部API配置嵌入模型,文中介绍了通过Jina AI网站获得免费tokens的方式。➢通过多种文件添加方式,用户可以便捷创建本地知识库,构造多模态智能知识中枢,结合大模型实现不同场景赋能。 风险因素:研究基于历史情况,存在失效及偏差风险;大语言模型输出存在幻觉与随机性,不同模型性能具有差异,产品功能具有时效性局限。 目录 一、DeepSeek开源模型兼具高性能与高性价比..............................................................................61.1、兼具高性能与高性价比,DeepSeek开源模型引发市场关注....................................61.2、DeepSeek-V3:多重技术亮点实现性能与性价比双重突破.......................................81.3、DeepSeek-R1:基于DeepSeek-V3的强大的推理模型............................................10二、网页对话实现智能服务体系.....................................................................................................122.1、网页版DeepSeek访问渠道丰富............................................................................122.2、DeepSeek官网实现智能问答与文档解析功能........................................................122.3、秘塔AI实现学术资源智能检索............................................................................132.4、纳米AI实现可视化思维建构................................................................................142.5、腾讯元宝擅长公众号内容调用..............................................................................152.6、DeepSeek结合Kimi+实现自动化办公输出............................................................16三、DeepSeek API实现智能中枢构建.............................................................................................183.1、DeepSeek模型可选API丰富................................................................................183.2、以火山引擎为例使用Deepseek API.......................................................................193.3、DeepSeek API接入Excel与Python.......................................................................20四、DeepSeek本地部署条件与功能................................................................................................224.1、DeepSeek本地部署GPU估算...............................................................................224.2、通过Ollama进行DeepSeek本地部署...................................................................234.3、利用浏览器插件实现联网、构建本地知识库.........................................................24五、利用交互应用软件构建知识库.................................................................................................255.1、Cherry Studio的使用方式......................................................................................255.2、Cherry Studio嵌入模型配置..................................................................................255.3、Cherry Studio构建本地知识库...............................................................................26风险因素............................................................................................................................................29 表目录 表1:DeepSeek R1等模型性能对比.................................................................................................6表2:DeepSeek模型部分网页访问渠道.........................................................................................12表3:DeepSeek模型部分API访问渠道........................................................................................18表4:DeepSeek API建议场景设置温度..........................................................................................18表5:DeepSeek本地部署最低显存估算.............................................................