行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

腾讯税务行业大模型解决方案介绍

2025-04-15 腾讯顾小桶🙊

腾讯大模型税务行业解决方案介绍

大模型技术和应用演进图谱

技术演进历程：从2016年NVIDIA大规模AI架构GDX-1到2023年ChatGPT等AGI技术的爆发，大模型技术经历了多个重要里程碑，包括Transformer架构、GPT系列、文心一言、ChatGPT等。
商业化应用：大模型在多个领域实现商业化应用，如多模态生成、模型调用API、自主Agent等。
AGI相关技术：包括多模态生成、深度求索（DeepSeek）等，DeepSeek系列模型在知识类任务和复杂推理任务上表现出色，具有低成本、高效能等优势。

腾讯税务领域大模型建设的思考

DeepSeek模型的局限性：虽然DeepSeek在公开评测中表现优异，但在实际应用中仍存在幻觉率高、指令遵循弱、拒答率高等问题，需要结合应用框架和工程优化。
大模型应用构建流程：从0到1构建大模型应用需要四个步骤：算力建设、模型选型、模型部署、行业模型打造。
大模型应用落地策略：组织拥抱大模型需要小步快跑、快速迭代，并考虑模型的领域适配和算力优化。

腾讯税务大模型重点产品和解决方案

技术底座建设

高性能算力集群：提供分布式文件存储和缓存加速，以及高速通信网络。
工具平台-Ti：覆盖大模型训练和精调工具链，支持一键部署和训练加速。
技术平台-知识库：提供RAG、工作流、Agent等多种应用开发方式。

内容安全

天御系统：从问题侧、模型侧、答案侧三个层面进行敏感信息过滤和规避。

私有化部署

私有化方案的优势：满足网络与业务连续性、行业合规性、定制化与知识产权保护、长期成本控制等需求。
公有云方案：支持多种业务场景，数据私密性要求高，利用行业公开数据，快速资源需求。

知识引擎&大模型联动流程

知识引擎的作用：帮助LLM突破知识在时间和空间上的限制，降低成本，节约LLM计算成本。
应用场景：包括网通办政务、电子说明书、虚拟导游、金融数智人等。

智能客服

文件助手：提供强大RAG能力，搭建精准的知识问答应用，支持复杂文档解析、切分、检索、推理、生成。
员工服务专家助手：自动化服务开发票、挂号、预约办事、大厅服务等。

知识引擎“工作流”

复杂应用构建能力：支持用户快速编排复杂应用，提供10+画布节点，编排复杂应用，执行准确率和对话完成率效果领先。

腾讯Ima 0成本尝鲜方案

税务行业知识库快速落地案例：提供模型开发全生命周期场景选型、模型构建、部署、应用等方案。

腾讯云TI平台

TI-ONE：面向数据开发人员，提供从数据预处理、模型训练、自动学习、模型评估到模型发布部署的全流程支持。
TI-Matrix：面向AI应用开发者，快速接入模型、数据和智能设备，提供模型部署、应用工作流编排、云边端调度等功能。
DeepSeek精调方案：支持SFT，提供全流程训推工具链，内置Angel加速能力，切实提升训推效率。

内容安全 - 贯穿模型训练和内容生成全流程

内容风控平台：从接口输入、内容预处理、模型识别、策略辅助、平台调度分析共5个维度为用户提供完整的内容安全解决方案。
天御系统：覆盖多场景、全类型内容的私有化内容审核方案，快速响应大模型各类审核需求，保障商用落地。

目录CONTENTS 01 腾讯税务大模型重点产品和解决方案腾讯税务领域大模型建设的思考大模型技术和应用演进图谱 AGI技术革命性爆发，国内外大模型蓬勃发展 DeepSeek“出圈” DeepSeek是“深度求索”开发的一系列人工智能模型。DeepSeek通过持续的技术创新和市场拓展，在自然语言处理和大型语言模型方面取得了显著进展，在国际市场上获得了广泛认可。其中： ●DeepSeek-V3是在14.8万亿高质量token上完成预训练的一个强大的混合专家(MoE)语言模型，其在知识类任务（知识问答、内容生成等）领域表现出色。拥有6710亿参数（每token激活参数370亿）。作为通用大语言模型，。2048个H800 GPU（两个月） ●DeepSeek-R1是基于DeepSeek-V3-Base训练生成的强化推理能力模型，通过无监督的自主强化学习、以及MLA、GPRO等创新算法，在数学、代码生成和逻辑推断等复杂推理任务上表现优异。更低的研发成本*$5.6M vs. OpenAI’s $100M+ 开源打破大模型重挫美国科技公司股价，英伟达市值下跌5900亿比肩头部大模型60%+指标优于Llama3.1Claude-3.5 GPT-4o 人工智能的Sputnik时刻被美国及其盟友列入各种限制更高效资源利用使用~2,000 GPUs,竞品使用10,000+ GPUs DeepSeek开源+低成本将带来大模型应用的无限可能目录CONTENTS 01 腾讯税务大模型重点产品和解决方案腾讯税务领域大模型建设的思考大模型技术和应用演进图谱混元大模型&Deepseek双轮驱动支持Deepseek 元宝App AI代码助手知识库腾讯混元持续演进，助力腾讯业务发展大模型底座需要结合应用框架实现应用快速落地 •DeepSeekR1在数学、代码生成和逻辑推断等复杂推理任务等领域表现出优异的效果，但仍有一些局限性算法方面：当前DeepSeek在各大公开测试集上评分较高，这是实验室数据。在多项公开评测中，非强推理场景会幻觉率更高，另外实际测试应用中有指令遵循较弱、拒答率高等问题。商业化方面：DeepSeek模型刚发布，目前没有大规模的商业化案例，服务不稳定，实际应用场景和效果还需要进一步验证。模型类型： DeepSeek当前仅有文生文大模型 •在商用的过程中，仍需结合一定的应用框架（RAG、工作流、Agent等）和工程优化，来保障大模型应用政府级端到端效果。从0到1，构建大模型应用的流程算力建设模型安全提高效率激发创新 DeepSeek到来之后，我们发现： 1.凡是落地大模型应用场景的组织，都是基于自身的明确需求，以小步快跑的方式快速迭代 2.由于大模型的迭代频率以超乎想象的速度发生，组织拥抱大模型既不能步子迈得太大，也不能一点不动 3.按照以上四步即可实现行业大模型应用从0到1构建，从1到100则需要根据业务场景的复杂程度，考虑模型的领域适配和算力优化目录CONTENTS 01 腾讯税务大模型重点产品和解决方案腾讯税务领域大模型建设的思考大模型技术和应用演进图谱核心技术突破保障大模型应用释放效能行业模型打造模型安全大模型底座技术平台-知识库内容安全内容安全-天御工具平台-Ti 技术底座技术底座建设高性能、高带宽、低时延的技术底座是发展大模型的重要基础建设高性能、高带宽、低时延的技术底座是发展大模型的重要基础应用技术平台,提供RAG、工作流、Agent多种应用开发方式，助力行业及开发者加速大模型应用落地问题侧、模型侧、答案侧三个层面进行敏感信息过滤和规避，让最终答案符合安全、规范的要求问题侧、模型侧、答案侧三个层面进行敏感信息过滤和规避，让最终答案符合安全、规范的要求覆盖大模型训练和精调工具链，覆盖大模型开发全生命周期，支持一键部署和训练加速 Ø问题侧防护，不能提问Ø模型侧防护，拒绝回答Ø答案侧防护，少答或不答Ø问题侧防护，不能提问Ø模型侧防护，拒绝回答Ø答案侧防护，少答或不答 ØRAG，构建行业专属知识库Ø工作流，快速编排复杂业务流程ØAgent，任务自主规划和工具调用 ØFine-tuning，模型精调RL/SFTØ多模态数据标注，灵活配置ØAngel-llm，训练/推理加速框架 Ø高性能算力集群Ø分布式文件存储和缓存加速Ø高速通信网络Ø高性能算力集群Ø分布式文件存储和缓存加速Ø高速通信网络公有云or私有化-私有化方案是首选行业合规性限制网络与业务连续性长期成本控制定制化与知识产权保护 Ø高频调用场景下，私有化部署的边际成本可能低于公有云按次付费模式（如客服系统每日处理百万级回答）敏感数据（如用户隐私、商业秘密等）需物理隔离，避免通过公有云或第三方服务外泄（如金融、医疗行业） Ø政府需将大模型深度适配内部业务流程Ø防止核心算法外流，保持技术壁垒（如芯片制造厂私有化部署的缺陷分类模型，防止技术泄露） Ø网络隔离要求（如涉密机构禁止连接互联网）Ø工业控制、实时决策等场景需极低延迟和确定性响应（如工厂在边缘服务器部署私有化视觉检测模型）需符合行业监管政策（如GDPR、国内《数据安全法》），或满足政府机构对数据本地化存储的强制要求（如政府、国央企）私有化部署通过数据物理隔离+业务深度集成+确定性性能的组合优势，在政府、金融、制造、医疗等强监管或高价值场景中成为刚需知识引擎&大模型联动流程知识引擎帮助LLM以较低成本突破 •解决私域数据的空间限制•敏感数据无需进入模型训练•知识库实时更新•比Tuning低几个数量级的成本•基于缓存方案大幅节约LLM计算成本腾讯云知识引擎能力介绍聚焦严谨场景，打造大语言模型应用开发平台,提供LLM+RAG、工作流、Agent多种应用开发方式，来助力行业开发者，加速大模型应用落地。强大RAG能力加持，搭建精准的知识问答应用复杂文档解析、切分、检索、推理、生成准确率保持领先高准确的综合检索能力高准确的复杂文档解析、切分能力上线基于LLM的embedding模型，多文档信息召回率从85%提升到92%；混合检索+Text2SQL能力，提升超大表格单表检索及跨表检索准确率，SQL执行准确率80%+ 基于OCR大模型，打造的解析引擎，突破图文混排版面分析、复杂表格识别等文档解析技术瓶颈，支持超过20类文档类型。 Ø业界首个支持200MB以上超大文档vs.业内普遍100MB内 Query Ø丰富的文档类型，超过26类vs.业内普遍10类以内 “非智能且在售，并且一级分类是天棚灯的产品包含哪些” 通过SQL检索表格信息 Ø支持图文混排（多列排版）版面分析、图文表/公式/页眉等元素识别识别精度高、图片元素不丢失充分考虑文、图两种模态的检索优化说明书样例腾讯云RAG+DeepSeek：图文并貌的产品操作说明适合处理过程复杂且分支较多、对结果准确性要求高的业务场景知识引擎“工作流”：支持用户快速编排复杂应用面向复杂业务流程场景，升级复杂应用构建能力提供10+画布节点，编排复杂应用，复杂流程的执行准确率和对话完成率效果领先。 Ø通过可视化拖拉拽的方式编排不同的原子能力，零代码/低代码构建业务流程。 Ø其中参数提取节点，支持多参数同时提取、基于对话历史进行多轮反问澄清等优势能力，对话效果更优势。 Ø大模型相关的节点均接入DeepSeek R1和V3模型，可支持自由选择和切换。腾讯Ima 0成本尝鲜方案税务行业知识库快速落地案例 Ti-One提升模型开发效能腾讯云TI平台腾讯云TI平台（Tencent Cloud TI Platform）是基于腾讯先进AI能力和多年技术经验，面向行业提供的全栈式人工智能开发服务平台，致力于打通包含从数据获取、数据处理、算法构建、模型训练、模型优化、模型评估、模型部署、到AI应用开发的产业+AI落地全流程链路，帮助用户快速创建和部署AI应用，管理全周期AI解决方案，从而助力政企单位加速数字化转型并促进AI行业生态共建。应用和解决方案开发者基于腾讯云TI平台的开放能力，结合行业特点构建应用解决方案。充分发掘AI价值，助力各行各业数字化转型机器学习平台TI-ONE 面向数据开发人员，提供从数据预处理、模型训练、自动学习、模型评估到模型发布部署的全流程支持 AI应用服务平台TI-Matrix 面向AI应用开发者，快速接入模型、数据和智能设备。提供模型部署、应用工作流编排、云边端调度等功能，快速构建智能应用 TI平台的DeepSeek精调方案 DeepSeek全系大语言模型支持SFT 核心收益注重灵活性、扩展性的生产级大模型精调工具链 DeepSeek全系列 R1、V3满血版满血版模型一键精调 •全流程训推工具链，注重实战灵活性、扩展性•内置Angel加速能力，切实提升训推效率•训练过程白盒化、资源碎片监控、训练资源调度灵活可配，切实提升资源利用率 •256卡H20•全参SFT•8小时蒸馏后模型多模式精调 •全参+LoRA双模式•低至1卡A10 TI ONE精调场景_同花顺:大模型云端一站式精调方案整体架构项目背景应用于同花顺APP客服“i问财”，主要用来训练投顾、投研领域文本生成，对话大模型训练规模 1.8万亿Token中英文语料4000亿Token金融语料40台8卡H800130亿参数技术亮点 •用户可直接通过Ti-one将云服务器接入，享受训练平台稳定，高效的任务调度能力•支持20+主流开源模型基于TI ONE的精调服务•高稳定性任务调度，故障节点自动隔离，任务自动重试，稳定支持单任务2～3个月持续运行•灵活的任务调度策略配置，提升小资源任务的并发处理能力内容安全-贯穿模型训练和内容生成全流程大模型生产的数据量级规模大，从接口输入、内容预处理、模型识别、策略辅助、平台调度分析共5个维度为用户提供完整的内容安全解决方案覆盖多场景、全类型内容的私有化内容审核方案，快速响应大模型各类审核需求，保障商用落地税务行业场景+腾讯大模型方案=？

点击免费查看完整报告

腾讯税务行业大模型解决方案介绍

腾讯大模型税务行业解决方案介绍

大模型技术和应用演进图谱

腾讯税务领域大模型建设的思考

腾讯税务大模型重点产品和解决方案

技术底座建设

内容安全

私有化部署

知识引擎&大模型联动流程

智能客服

知识引擎“工作流”

腾讯Ima 0成本尝鲜方案

腾讯云TI平台

内容安全 - 贯穿模型训练和内容生成全流程

你可能感兴趣

腾讯MaaS：提供一站式行业大模型解决方案

腾讯大模型产品能力介绍以及应用探索

腾讯健康医药赋能行业产品介绍

腾讯物流行业解决方案

腾讯乐享金融行业全场景解决方案

游客体验差，景区管理难？腾讯问卷文旅行业解决方案

信息收集难、隐私风险高？腾讯问卷教育行业解决方案

腾讯智慧零售酒水行业数字化解决方案

腾讯智慧零售商超行业数字化解决方案

腾讯智慧零售宠物行业数字化解决方案