中兴新云北京国家会计学院 财务领域AI DeepSeek驱动下的财务创新 扫码下载本报告电子版 财务领或“A:DeepSeek驱动下的财务创所 日录 目录 1人工智能与大模型发展概述1 11人工智能与大模型的相关概念1 12认识DeepSeek 3 2DeepSeek的核心能力与优势 s 21DeepSeek的核心能力5 文本生成6 自然语言理解与多模态处理7 逻辑推理与数据分析 8 编程与代码 22DeepSeek的差异化优势 9 10 算法与系统工程颠覆性创新11 全链路成本集约化管理14 本地垂直场景适配度更优14 促进开源生态与AI普惠化14 3DeepSeek的部署与使用 15 31如何部署DeepSeek 32如何设计提示词 15 15 提示词概述 DeepSeek提示词具体实践指南 15 33DeepSeek在企业中的应用路径 16 DeepSeek提示工程 20 21 DeepSeek检索增强生成 DeepSeek小模型 21 21 DeepSeek指令微调 34通用大语言模型的局限性 21 22 财务域AI’:DeepSeek要动下的财务创新 日录 4DeepSeek在财务领域的应用 23 41智能交互与自动化支持 24 智能采集 智能填报 24 智能审核 25 26 智能问答 42财务规划与资源配置 27 28 预算编制28 成本优化 税务筹划28 28 43数据分析与报表报告 数据治理 29 29 数据分析OE 合同分析31 报表生成与检查 财报分析31 32 管理报告生成 44风险防控与预警预测 32 司库风险防控 EE 33 财务风险预警 客商信用风险评估 34 35 收入预测 现金流预测 36 37 45战路决策与业务优化 市场选择决策 BE 产品选择决策 BE 智能产能规划 6E 投资组合推荐 6E 39 结语 40 财务领或AIDeepSeek驱动下的其务创断 人工智能与大模型发展概述 人工智能与大模型发展概述 11人工智能与大模型的相关概念 人工智能ArtificialIntelligence,Al是计算机科学的一 典型的深度学习模型包括卷积神经网络、循环神经网络、 个分支,旨在开发能够模拟、延伸和扩展人类智能的技术。 Transformer模型等,其中,Transformer型开创性地采 它通过算法和数据分析,赋予机器感知、学习、推理、决策 用自注意力机制(SelfAttention),能够高效捕提序列中 和交互的能力。机器学习MachineLeaming)作为实现 各部分的关系,支持并行计算,适用于语义理解、文本生成 人工智能的核心技术,聚焦于通过数据驱动的经验学习范 式,使系统能够从样本数据中自动发现统计规律,并据此 问答等自然语言处理任务。基于Transfomer架构的大模 型(LareeModels)通过百亿至万亿级参数规模的预训练 优化决策性能。作为机器学习重要分支,深度学习Deep 和指令微润等,在知识涌现能力、多模态处理能力、逻辅推 Learning)通过构建多层神经网络架构,每一层都将数据进 理能力等方面取得突破性进展。其中,大语言模型Large 行一系列非线性变换,逐步提取和抽象数据的特征,莫定了 LanguageModels,LLMs是以自然语言处理为核心方向 处理复杂模式识别任务的模型基础。 的大模型,通过对海量末标注文本数据的自监督预训练,结 合标注数胆的指令微调,捕提语言统计规律,进而实现意图 理解与连贯文本生成。 图11人工智能与大语言模型的技术层级关系 人工智能 机器学与 大语言模型 大模杂 文 chatGPTGemini 深度学习 大语言 模型 Llama、Kimi豆包、 言通叉干问、 DieepSeek 重门大学大数据教学团队,大模型量念、技术与应用实践R2025 人工智能与大模型发属损过 财务辑域AlDeepSeek要动下的财务创新 2022年11月,随着ChatGPT的发布,大语言模型广泛进 2025年1月,DeepSeekR1模型发布,迅速成为全球人工 入公众视野,推动全球Al产业迎来爆发式增长,Gemini、 智能领域的焦点,该模型在继承Transformer架构的基础上, 模型参数规模不断膨胀(如图12所示),技术突破不仅体 Llama、文心一言、通义千问等众多国内外大模型相继涌现, 现在语言任务性能提升,更扩展至多模态(音频、图片、视频等)理解、逻辑推理等方向。且随着算力基础设施升级、 训练数框规模扩大与算法持续改进,大语言模型的能力边界 进行了多项技术的创新优化,通过引入多头注意力机制、混 合精度训练等技术,显著提升模型的推理分析能力,并实现 了训练成本的大幅降低。DeepSeek以其“技术普惠化”的 理念,通过高性价比的解决方案降低了A技术的使用门槛, 赋能各行各业的诺多使用场景,为智能体构建、多模态融合 持续拓展。 奠定了实践基础。 图12大模型发展历程 2022年11月 OpenAI发布 2022年12月 2023年03月 2023年04月 2023年07月 2023年09月 StabilityAI开源视 OpenAIL发布 PouunorPIN Meta开源 Anthropic发布 频生模型Stable GPT4多模态、理 V5脂本胍片组图 LLaMA2可高用 Claude2长上 Diffusion20 辑推理能力提升 生T 大模型 下文理解 ChatGPTGPT35 2022年 G SD 2024年06月 KimiChatF级 2024年05月 Google发Veo 对据5ora视频 生成模型 Q 2024年03月 开源Grok1模型 版发布支持200 发布3148参效 万字长文本 巨损型 2024年02月 OpenAI发布Sora文本生成1 分钟高质量规频 2023年12月 Google发布Gemini多接 性非照期GTP4 引发AIGC滤 2024年09月 2024年12月 2025年01月 OpenAl发布o1 DeepSeek发 Deep5eek发布 模型,专注于复 孕推理任 布V3模型,性 R1模型,引发现 级关注 2025年 2资料来源于网络 8L3agdaaoIV 人工智能与大模型发展概述 12认识DeepSeek DeepSeek于2024年初开始相继发布开源大语言模型如图13 DeepSeekR1通过强化学习与冷启动策略提升推理能力 所示,其中,DeepSeekV3、DeepSeekR1和DeepSeek 在逻辑推理、数学计算及代码生成等复杂任务中表现卓越 JanusPro模型在技术特性与场景应用等方面各有优势,能 适用于财务数据分析、异常监测等场量。DeepSeekJanus 够满足多样化的应用需求(如表11所示):DeepSeekV3 Pro依托SigLIPL视觉编码器与LlamaGen图像生成模型, 采用混合专家架构等技术,显著提升多任务处理能力,尤其 实现多模态理解与图像创作,可用于票据识别、图表数据关 撞长多语言翻译、信息检索与问答、文本生成等,适用于合 联分析等场景。三者协同构建语言、逻辑与多模态融合的智 同条款解析、政策法规匹配等场景。 能解决方案。 图13DeepSeek研发开源模型时间轴 o20240105 DeepSeekLLM O20240311 O20240617 20241213 O20250120 DeepSeekVL DeepSeekCoderV2 DeepSeekVL2 DeepSeekR1 LLM Math Janus lanus Pro 20240205 DeepSeekMath0 20240507 20241017 20241226 20250128 DeepSeekV20 DeepSeekJanusO DeepSeekV3 0 DeepSeekJanusProO 表11DeepSeek三款模型对比分析 合同条款解析、政策法规匹配等 多语言翻译、信息检索与问答、文本生成 MOE架构、多Token 预测等 2024年12月26日 DeepSeekV3 适用场景示例 造长领城 核心技术 发布时间 名称 DeepSeekR1 2025年1月20日 强化学习、冷启动策略 财务数据分析、异常监 逻辑推理、数学计算、 代码生成等复杂任务 测等 DeepSeek JanusPro 2025年1月28日 SigLIPL和LlamaGen 多模态架构 多模态理解、图像生成 票据识别、图表数据关联分析等 3资料来源于网络 4南京审计大学,置尚审计行业Deep5eek大模型线作指南R2025 财务错域“AI’DeepSeek要动下的财务创新 在语言处理能力方面,DeepSeek生成的内容在逻辑连费性、 语义准确性等方面表现突出。在情感分析、知识问答等多个 源架构是其技术突破的重要基础。开源不仅促进了技术开放 与共享,还显著降低了硬件成本,提供了灵活的部署选项。 人工智能与大模型发属损过 DeepSeek的快速增长并非偶然,其核心能力在于以下三个 在技术研发创新层面,DeepSeek在模型结构与训练方法上 方面: 有着独特的设计,其庞大的参数规模和较低的训练成本背后 有着高效的算法和优化的训练体系。此外,DeepSeek的开 具体应用场景中,DeepSeek也展现出了较高的准确率和稳 定性。 在逻辑推理能力方面,DeepSeekR1能够完美复现OpenAl 01的深度推理能力,通过完全强化学习的方法让AI自发涌 现出深度推理能力,在数学、代码、自然语言推理等任务上 具有显著优势,该模型同时延续了该公司高性价比的优势, 其训练成本远远低于诸多科技巨头在人工智能技术上投入的 数亿美元乃至数十亿美元。 财务域AI:DeepSeek驱动下的财务创所 DeepSeek的植心能力与优势 DeepSeek的核心能力与优势 21DeepSeek的核心能力 DeepSeek通过技术创新构建起覆盖文本生成、自然语言理解与多模态处理、逻 辑推理与数据分析、编程与代码处理的核心能力矩阵(如图21所示),在语义 解析精度、逻辑连贯性、垂直场景适配度等关键维度实现突破,为企业提供高效 智能解决方案。 图21DeepSeek核心能力 o0 文本生成 编程与代码 逻辑推理 自然语言理解 与多模态处理 01 04 核心能力 02 03 与数据分析 DeepSeek的格心力与优 财旁锂域“AlDeepSeek要动下的财务创新 文本生成 DeepSeek文本生成功能聚焦于精准、安全与场景适配,尤其适用于专业性、结构化输出需求的任务。在信息处理上,DeepSeek能精准萃取长文本核心要点 生成简洁明确的摘要,并通过简化文本降低内容复杂度;针对结构化输出需求,可绘制表格、列表等,生成详组且专业的文档(如图22所示);针对不同创作 场景,通过垂直领域专项训练,提供适配方案,如创作诗歇、小说及剧本,定制 营销文案、广告语及社交媒体内容,撰写邮件、报告及演讲稿等。 图22DeepSeek文本生成功能示例部分结果 8LasdaagN DeepSeek的心能力与优势 自然语言理解与多模态处理 DeepSeek具备卓越的人类语言理解与多模态处理能力(如图23所示),主要体现在五个方面:一