行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

腾讯Data×AI内部实践

2025-06-24 腾讯徐红金

内部实践背景及痛点

需求响应时间长：临时分析需求需数据部门排期配置新报表，响应时间长达天至周级别。
分析门槛高：经营分析数据指标多且复杂，结论依赖专业分析师人工解读，业务部门理解困难。
使用场景局限：原有经营分析系统逻辑复杂，仅支持PC端，外出查看不便。
缺乏知识沉淀：分析思路离散在分析师脑海中，难以沉淀和复用。

内部实践实现思路

问答式分析：通过大模型实现对话式分析，提升效率，降低使用门槛。
自动化解读和归因：大模型自动解读数据并输出分析结论，解决人工解读难题。
精简交互逻辑：优化为对话式分析，支持移动端，满足外出场景需求。
构建知识库：沉淀业务黑话、计算逻辑、分析思路等，实现知识复用。

内部实践落地挑战及解决思路

挑战1：复杂计算及方言适配问题
- 问题：NL2SQL在复杂计算和SQL方言转换中易出错。
- 解决方案：采用NL2DSL为主、NL2SQL为辅的方案，由BI系统转换SQL，降低模型难度并复用方言能力。
挑战2：经营分析数据指标口径多，用户提问口语化严重
- 问题：用户提问模糊，如仅问“腾讯云BI收入”无法确定具体口径和时间。
- 解决方案：新增意图澄清模块，主动触发用户明确时间、字段等要素。
挑战3：经营分析业务黑话多
- 问题：业务黑话（如“渗透占比”）和客户别名（如“某某帮”）难被模型理解。
- 解决方案：构建知识库，录入业务黑话解释和客户别名，自动提供数据表信息，沉淀分析思路。
挑战4：用户权限不一
- 问题：同一份数据不同用户权限不同，如部门老板仅看部门数据。
- 解决方案：支持行列权限控制，实现差异化数据访问。
挑战5：用户不知该问哪张数据表
- 问题：业务用户不熟悉数据表结构，难以选择正确表格。
- 解决方案：训练大模型根据提问内容智能选表，支持单表或多表关联分析。

总结

智能分析Agent在腾讯内部经营分析场景落地，通过对话式分析、自动化解读、知识库沉淀等功能，大幅提升分析效率，降低对分析师的依赖，支持移动端使用，并解决权限控制和选表难题，实现业务部门低门槛、高效率的数据分析需求。

腾讯 DataXA内部实践周树豪腾讯云大数据智能分析Agent产品负责人目录 01 内部实践背景及痛点 02 内部实践实现思路 03 内部实践落地挑战及解决思路内部实践背景及痛点分析门槛高经营分析数据指标口径多且复杂，分析结论一般由专业的经营分析师人工解读后输出给各业务部门及老板，分析门槛高需求响应时间长如果有临时性的分析需求现有报表无法满足，则需要提需求让数据部门排期配置新的数据表和报表。这个过程往往需要天~周级别，需求响应时间长。智能分析Agent内部实践背景及痛点缺乏知识沉淀不同分析场景的分析思路离散在各经营分析师脑海里，难以沉淀和复用使用场景局限原先经营分析系统由于逻辑较为复杂仅支持PC端如果在外需要临时查看数据很不方便腾讯内部经营分析场景成本等大量经营数据，各业务部门及老板需要腾讯在售卖各类云产品时，产生了收入、利润、在经营分析系统上查看经营数据报表，来了解经营情况内部实践实现思路搜索引擎沉淀知识库构建经营分析知识库，沉淀使用过程中遇到的业务黑话、计算逻辑、潜在分析思路等，让小白也能复用沉淀知识快速进行数据分析问答式分析小白都会用自动化解读总结数据情况并给出业务建议内置业务归因模型可一键定位指标波动根因智能分析Agent实现思路：通过大模型实现对话式分析，大幅提升分析效率通过大模型实时问数用户提问后通过大模型实时生成查询语句并出数，解决临时需求多需要排期的问题自动化解读和归因通过大模型自动对数据结果进行解读和归因，输出分析结论，解决原先强依赖经营分析师人工解读，分析门槛高的难题精简交互逻辑构建移动端原先拖拉拽字段进行数据分析的方式优化成对话式分析，交互逻辑大大精简，构建移动端变得可能，能满足外出问数场景内部实践落地挑战及解决思路挑战1：复杂计算及方言适配问题 NL2SQL(旧方案) Q示例：2024年10月腾讯云BI收入同比变化多少？大模型直接生成 NL2DSL为主，NL2SQL为辅(新方案) Q示例：2024年10月腾讯云BI收入同比变化多少？大模型先生成 SELECTDATE_FORMAT(`ftime`,'%Y-%m')AS`定账月`,年同比增长率(SUM(`shouldincome_after`))AS`收入(不含税)的同比变化率`FROM`CSIG经营数据`WHERE `prod_class4_name`IN('腾讯云BI')AND`ftime`='2024-10'GROUPBY`定账月`ORDERBY`定账月`ASCLIMIT10000 挑战：维度：无指标：收入计算方式：年同比条件：产品名称=腾讯云BI、时间=2024年10月亮点： BI系统再转换成SQL 1、复杂计算易出错：同环比等计算需要生成的SQL语句较为复杂，此时NL2SQL容易在时间转换函数、格式上出错； 2、SQL方言问题：经营分析数据存放在 Clickhouse里，而大模型生成标准SQL的准确率较高，转换成Clickhouse后就容易出错。 1、降低大模型生成难度，模型只需给出BI系统需要的元素，由BI系统转换成SQL再执行，大大提升了整体准确率； 2、大模型无需处理方言转换，直接复用BI系统兼容SQL方言能力； 3、如果需要基于数据表原始字段计算后得到新字段才可回答，大模型会生成SQL片段，塞入BI的计算字段内，例如表里有利润和收入时用户询问利润率，这种方案即有NL2DSL的稳定性，又兼顾了NL2SQL的灵活性。挑战2：经营分析数据指标口径多，用户提问口语化严重 Q示例：腾讯云BI收入？解决方案：新增意图澄清模块，当问题存在时间、字段、取值不明确等情况时，主动触发让用户明确意图，而不是将模糊信息传递下去，让大模型去挑战： 1、经营分析数据指标口径多，仅收入就有收入(含税)、收入（不含税）等10多种口径，大模型难以通过“收入”两个词判断用户究竟需要查询什么数据； 2、落地时发现用户的提问比想象中还口语化，容易缺失时间等元素，像示例问题模型不知道应该查询25年的收入还是24年的收入。 “猜测揣摩”用户意图字段澄清时间澄清挑战3：经营分析业务黑话多 Q示例：某某行业自研产品渗透占比如何？某某帮的消耗怎么样？华北地区的收入是多少？挑战： 1、“渗透占比”属于经营分析场景下的业务黑话，指的是不含税收入占比，但大模型很难理解正确； 2、“某某帮”这家公司，在数据表里的实际名称是另一个名字，但大模型事先并不知道便会生成“客户名称=某某帮”导致查不出数； 3、问“华北地区的收入”时，大模型会生成“收入区域=华北地区”的条件，但数据表里实际取值是“华北”，两边对不上导致查不出数据。解决方案：构建知识库，一方面用户可录入“渗透”、“掉量”、“损益情况”等业务黑话的解释，另一方面我们可以将客户别名等知识批量录入。最后数据解读、波动归因等潜在分析思路也可沉淀进知识库，让小白也能复用沉淀知识快速进行数据分析此外系统将自动将数据表的表头和枚举值信息作为知识提供给大模型，例如“华北：属于字段收入区域”，帮助模型加强对数据表的理解，解决查询语句出错的问题。挑战4：用户权限不一，同样一份数据不同用户看到的数据结果不一样挑战：由于腾讯内部的经营分析数据十分敏感，需要严格做好权限控制，对于同一张数据表，不同用户能看到的数据范围不一，例如 1）不同部门老板只能看到自己部门的数据，腾讯云最高层能看到所有部门的数据； 2）不同字段敏感级别不同，高敏感字段只有部分角色可看。解决方案：同一张数据表时，只能查看指定的数据行或者数据列。智能分析Agent系统支持行列权限能力，可实现不同用户在查看挑战5：用户不知道自己应该问哪张数据表挑战：经营分析场景下由于字段不同、时间聚合粒度不同，形成了多张数据表，不同分析主题需要使用不同数据表回答。最开始我们让用户手动选择要对哪张表进行提问，但落地时发现，用户只知道自己想问什么问题，并不知道具体应该选哪张表问。因为数据表是由数据部门构建的，业务部门的用户并不清楚数据情况。解决方案：训练大模型根据用户提问、数据表名称、数据表备注、字段名称、字段备注等信息进行语义理解后，智能选表回答。支持选一张表或选择多张表关联后进行回答。总结内部实践落地情况：目前智能分析Agent已在腾讯内部经营分析场景落地，各业务部门及老板可通过低门槛的对话方式问数，并由大模型自动对数据结果进行解读和归因分析，无需强依赖经营分析师，帮助腾讯内部大幅提升经营分析效率，降低开发成本。小程序端体验 Thanks 感谢您的聆听

点击免费查看完整报告

腾讯Data×AI内部实践

内部实践背景及痛点

内部实践实现思路

内部实践落地挑战及解决思路

总结

你可能感兴趣

内部人士回应腾讯元宝发力AI社交据悉腾讯旗下AI助手元宝低调开

腾讯AI协同办公前沿实践白皮书

腾讯联合HRflag，解读HR领域AI发展的前进方向与落地实践

2024腾讯云安灯AI大模型应用实践与探索

破界·深耕：腾讯AI大模型技术落地实践

【T112017-人本数据和智能分会场】Smart Data Lab-数据科学基础设施搭建的探索与实践

从统一数据治理到下一代企业级 Data Agent 的实践与创新

趣丸数据架构的演进之路——Data Mesh 的架构实践

基于统一语义层的data agent实践

腾讯高管3月18日在财报发布后的媒体会上透露HY30正在内部业务测试中计