行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

Data+AI下一代数智平台建设指南

2025-06-24 腾讯丁叮叮叮

生成式AI时代的数据挑战：企业转型的核心瓶颈

数据挑战：企业面临四大核心挑战：
- 非结构化数据处理：非结构化数据占比高达70%-90%，传统工具难以满足GenAI应用需求，需要升级工具链和方法论。
- 数据到智能的转化壁垒：数据管理与AI开发割裂，导致响应迟钝，影响决策质量。
- 海量实时数据处理：对系统的吞吐能力、实时性和横向扩展性提出挑战。
- 可信的数据治理与安全体系：数据源激增、数据孤岛严重，需要动态、可追溯的数据治理体系，避免“幻觉输出”与隐私风险。
驱动企业构建Data+AI平台的核心要素：
- 主动选择：头部企业突破现有能力范畴，构建新的AI应用场景。
- 被动应对：
  - 通过AI赋能优化现有数据资产，解决现有问题。
  - 提升团队对数据资产的管理能力，降低整体成本。
  - 构建数据和AI在统一平台高效联动，形成相互促进的良性循环。
企业构建Data+AI平台需要具备的关键能力：
- Data与AI技术的可组装性：模块化架构，支持快速更换组件、动态扩展和成本可控。
- 端到端的Data+AI全生命周期开发与业务集成：涵盖数据处理、模型构建、大模型训练等环节，实现数据与AI的深度融合。
- 多模态数据（结构化非结构化数据）的处理与增强：将多模态数据转化为机器可理解、业务可操作的“智能燃料”。
- 统一元数据驱动的治理与合规：统一治理方案，实现数据和AI的全面管理。
- 自主代理分析（Agentic Analytics）：智能化数据管理、自动化决策和主动式分析能力。
- 云原生弹性架构与多云部署：解耦的云服务架构，优化资源使用，实现跨云数据合规与成本可控。

驱动企业构建Data+AI平台的核心要素

主动选择：头部企业构建面对AI赋能的大数据平台，突破现有能力范畴，构建新的AI应用场景。
被动应对：
- 现有的数据资产通过AI赋能进行优化，以解决现有的问题。
- 通过AI提升团队对数据资产的管理能力，降低整体成本。
- 构建数据和AI在统一平台高效联动，提高快速应对业务复杂性的能力。
- 提升业务敏捷与控制创新浪费。

Data+AI典型行业应用场景

金融：风险控制、场景金融、数据决策。
制造业：生产优化、供应链管理。
医疗：疾病预测与分析、智能穿戴设备、传染病传播模型。
零售：精准需求预测、AI驱动的商品推荐系统、智能辅助驾驶。

腾讯云Data+AI产品方案及优势

WeData Agent：基于多智能体协作的超级智能体，具备数据开发、数据治理、数据分析等专家能力。
腾讯云数据分析智能体（TCDataAgent）（即将上线）：整合、检索和分析结构化&非结构化数据，帮助用户更直观的理解数据，并提取有价值的洞察。
腾讯云BI智能助手ChatBI：基于大语言模型能力/RAG/NL2DSL等技术，能准确理解客户的语义，执行数据分析并返回数据结论。
WeData Notebook：开箱即用的交互式分析IDE，简化数据分析流程，实现数据处理、模型训练和分析流程的一体化。
WeData DataOps：构建完整的数据全生命周期自动化管理体系，提升开发效率、智能质量管控和全链路可观测。
WeData MLOps：实现Data和AI的一体化，解决模型全生命周期难管理、模型服务不可持续、跨团队协作困难等问题。
WeData Unity Semantics：打破巴别塔困境，让财务、运营、技术等部门用同一种“语言”理解数据、分析数据。
Oceanus流批增量一体化：AI驱动的代码开发与智能运维管理，结合流处理与实时AI深度融合，解决开发效率低下、运维成本高企、实时AI能力缺失等问题。
数据湖计算DLC：提供一体化、更简便易用、高性价比的DataOps+MLOps解决方案。
AI数据湖服务TCLake（即将上线）：提供覆盖结构化数据、非结构化数据、AI模型的多模态数据存储及管理。
ES向量搜索：支持多模态和语义检索，助力RAG应用搭建。
TBDS多模态数据湖仓：实现跨模态分析应用，支持统一元数据管理。
腾讯云数据库AI服务：通过智能自治释放数据价值。
腾讯云向量数据库：大模型访问企业数据的“必备方案”，企业落地AI应用的“最佳拍档”。
TDSQL-C：海量洪峰数据流量下，提供高性能存储和智能优化能力。
腾讯云智能体开发平台TCADP：提供多种LLM+RAG、Multi-agent、Workflow等应用开发框架。
腾讯云TI平台：提供面向实战的大模型精调部署工具链。
Data Platform数据平台解决方案：提供数据存储、训练加速、数据“智”理端到端的存储解决方案。
Data Engine数据枢纽解决方案：提供一站式AI存储解决方案，解决自动驾驶、大模型训练、HPC等场景下海量数据的高性能存储需求。
数据万象MetaInsight：支持全媒体数据类型的向量与结构化标签的混合检索。
日志服务CLS：提供端到端MLOps能力，构建“数据智能中枢”。
腾讯云数据和智能安全：构建“数据+AI”一体化的安全能力体系，实现端到端的风险管控。

Data+AI未来发展

Data+AI结合应用场景广泛：涵盖金融、制造、医疗、零售等多个行业。
Data+AI平台一体化发展：数据与AI更紧密，推动企业AI建设实现飞跃。
未来技术升级方向：
- 数据管理市场的融合。
- 自然语言交互的普及。
- 生成式AI在现有平台的深度整合。
- 数据质量与治理的强化。
- 代理型AI（Agentic AI）的崛起。
- 数据基础设施的适应性与合规性提升。

本报告版权属于腾讯云计算（北京）有限责任公司，并受法律保护。转载、摘抄或利用其他方式使用本报告文字或观点的，应注明“来源:腾讯云计算(北京)有限责任公司”。违反上述声明者，公司保留追究其法律责任的权利。企业构建Data+AI平台需要具备哪些关键能力03目录Data与AI技术的可组装性 / 07端到端的Data+AI全生命周期开发与业务集成 / 07多模态数据（结构化非结构化数据）的处理与增强 / 07统一元数据驱动的治理与合规 / 07自主代理分析（Agentic Analytics） / 07云原生弹性架构与多云部署 / 08驱动企业构建Data+AI平台的核心要素02主动选择：主要是针对头部企业在构建面对AI赋能的大数据平台时，需要突破现有的能力范畴，构建新的AI应用场景 / 05被动应对：主要是针对现有的数据资产通过AI赋能进行优化，以解决现有的问题，通过AI提升团队对数据资产的管理能力，降低整体成本 / 05生成式AI时代的数据挑战：企业转型的核心瓶颈0 1 Data+AI未来发展06Data+AI典型行业应用场景05腾讯云数据分析智能体（TCDataAgent）（即将上线） / 14腾讯云BI智能助手ChatBI / 17WeData Notebook / 19WeData DataOps / 20WeData MLOps / 22WeData Unity Semantics / 24Oceanus流批增量一体化 / 27数据湖计算DLC / 28AI数据湖服务TCLake（即将上线） / 29ES向量搜索 / 31TBDS多模态数据湖仓 / 32腾讯云数据库AI服务 / 36腾讯云向量数据库 / 38TDSQL-C / 39腾讯云智能体开发平台TCADP / 42腾讯云TI平台 / 43Data Platform数据平台解决方案 / 44Data Engine数据枢纽解决方案 / 46数据万象MetaInsight / 48日志服务CLS / 50腾讯云数据和智能安全 / 52腾讯云Data+AI产品方案及优势04WeData Agent / 11 060401 58 数据是数字化时代企业的核心战略资产。生成式AI（GenAI）与大语言模型（LLM）的崛起，正深刻重构企业的生产力范式、协作模式、业务流程与组织架构。它推动企业从“部门割裂”走向“跨职能协同”，从“层级管控”迈向“网状协作”。在LLM日益商品化与生态多极化的背景下，提升数据管理能力以赋能业务价值，已成为企业唯一可持续的竞争差异点。DeepSeekR1等模型的开放与低推理成本加速了这一趋势，竞争焦点正从“模型竞争”转向“高价值数据资产竞争”——AI发展的核心瓶颈日益凸显于数据质量而非算法本身，企业亟需构建系统性数据工程能力，通过持续迭代优化数据（而非频繁调整模型）来释放AI潜能。Gartner表示，企业组织数据的关键差异不在于拥有多少数据，而在于拥有多少高价值数据，而这些数据是其他公司难以复制的。一家拥有宝贵数据却未能将其应用于人工智能和分析计划的公司，本质上是在迎接颠覆。然而，传统数据平台在应对生成式AI带来的新型数据需求时，正面临严峻挑战：Gartner研究表明，非结构化数据占当今组织数据的70%至90%。受生成式人工智能（Generic AI）计划、多模态数据处理需求的爆炸式增长以及合规性压力的推动，企业对非结构化数据管理的需求急剧增长。因此，非结构化数据处理支出在数据管理总支出中所占的份额将越来越大。Gartner预测到2027年，专注于多结构化数据管理的IT支出将占数据管理技术和服务总IT支出的40%。传统数据处理工具在元数据提取、智能分块、摘要生成和高效向量化存储等方面能力不足，难以满足GenAI应用的复杂要求。升级工具链与方法论，是释放海量非结构化数据价值的先决条件。腾讯基于以上挑战，推出了开放、统一数据湖服务TCLake，混合搜索的ES；而应对私有化场景的海量非结构化、多模态数据挑战，腾讯也推出了TBDS多模态数据湖仓服务。如何激活沉睡的数据资产，释放非结构化数据价值AI的真正价值在于将企业蕴藏的庞大数据资产转化为可行动的智能。然而，调研显示企业AI项目平均落地周期长达数周甚至数月，远落后于业务需求的快速迭代节奏。其核心瓶颈在于传统模式下，数据管理与AI开发严重割裂——数据团队的工作台与AI工程师的训练/部署平台互不相通，形成巨大的协作断层。导致：如何打破壁垒，实现数据到智能的高效转化随着生成式AI在企业业务中加速渗透，海量、实时、动态的数据处理需求不断涌现：无论是客户服务中的对话生成、金融风控场景（譬如信用卡盗刷、秒级放贷），还是供应链中的动态预警，都对系统的吞吐能力、实时性和横向扩展性提出了挑战。如何驾驭数据洪流，应对海量数据高并发协作、实时数据处理的新挑战腾讯基于以上挑战，推出了Data+AI一体化解决方案：DLC+WeData DataOps+WeData MLOps，将大数据与AI、机器学习等功能集成于一体，实现更好体验和更低成本。- 02时效性差：从数据到分析预测涉及多系统、多团队、多流程，响应迟钝（如零售销售预测因周期长导致库存问题）。效果不稳定：实验室里表现优异的模型，到了真实业务场景中常常“水土不服”（因为数据环境变了却难以及时更新），影响决策质量；重复投入成本高：数据工程师大量精力耗费在跨平台数据搬运、格式转换与系统对接上，而非创造差异化AI应用。生成式AI时代的数据挑战：企业转型的核心瓶颈01 然而传统数据架构为批处理而生，难以支持流式数据的秒级响应与动态查询；数据与AI的交互过程更进一步拉高了对数据读写和加工时效性的要求。腾讯基于以上挑战，推出了Oceanus 深度融合流处理和AI，保障业务实时性。在生成式AI应用场景中，数据质量、合规性和安全保障成为企业面临的核心难题。一方面，企业面临数据源激增、数据孤岛严重的挑战（据统计企业平均管理400+异构数据源）；另一方面，企业需打造动态、可追溯的数据治理体系，避免“幻觉输出”与隐私风险。根据2023年Gartner分析和人工智能采用调查，解决风险和治理问题以及对发现的分析/指标缺乏信任是自助服务分析开发人员面临的最大挑战。根据2024年Gartner数据和分析治理调查，近一半的受访者认为“难以在不同部门/业务单位之间标准化数据”是其组织面临的最大D&A治理相关挑战之一。同时，在上述2024年网络研讨会上，当受访者被问及不在ABI平台内利用GenAI的原因时，28%的受访者强调GenAI功能未得到内部安全/法律/合规团队（内部政策）的批准，另有20%的受访者提到对数据质量缺乏信心。然而，传统数据平台在数据治理上还有很多不足：缺乏统一的数据标准和业务口径；依赖静态规则，难以灵活应对生成式AI场景下动态多变的数据访问需求（如基于上下文的敏感信息实时脱敏）；治理流程自动化程度低、效率差。企业需要更智能、更动态的数据治理和隐私保护机制。腾讯基于以上挑战，推出了WeData Unity Semantics和WeData DataOps，破解数据孤岛、业务技术鸿沟和治理难题。如何构建可信的数据治理与安全体系生成式AI时代要求企业从数据中提升效率、获取洞察的速度大幅提升——例如产品销售型企业需要更实时地解读客户反馈，供应链型企业要能更及时地预测物流风险。这要求三类人群快速提升数据能力：如何让数据智能赋能全员，加速组织效率然而，当前传统平台依然使得开发者陷入低效重复工程，业务人员的数据需求响应周期长达数周。导致组织难以挖掘数据价值、对于市场响应迟滞于竞争对手。为了让数据智能赋能全员，腾讯云推出了一系列智能产品，其中WeDataAgent服务数据工程&数据科学人员；TCInsight服务运维人员；针对业务人员、管理者如何能更高效获得洞察，腾讯推出了专注于解析数据的ChatBI，和强调探索分析的TCDataAgent，真正促进组织转型。由此可见，生成式AI时代的数据挑战核心在于：挖掘非结构化数据的价值、打通数据到智能的转化壁垒、驾驭海量实时数据洪流的处理需求、构建可信的数据治理与防护体系，以及实现数据能力的全员普惠。数据工程人员需要提升效率：传统的编码方法需要手动拼接SQL和Python工具链，单个数据分析管道的部署通常需要数天时间。未来，AI增强的数据集成工具将使管道设计、错误修复和数据映射方面的人工工作量大幅减少。运维人员需提效：过往大企业需要多个5年以上经验的运维团队。但如果通过工具提效，运维团队需要的人数、所需经验都可大幅下降。业务人员需零门槛获得洞察：一线人员因无法用自然语言直接提取数据（如“请列出上月退货率＞5%的产品”），被迫依赖IT团队中转，延误业务决策时机。自然语言将成为数据生态系统交互的标准接口，利用语义抽象来掩盖底层技术复杂性，从而显著提升业务用户的数据消费效率。03 - 02驱动企业构建Data+AI平台的核心要素数据资产是AI时代的“新石油”，而Data+AI平台则是驱动数据价值转化的“精炼引擎”。高质量训练数据决定LLM模型性能的上限，企业要在这场AI浪潮中胜出，必须构建Data+AI双轮驱动的一体化平台——这是企业智能决策与业务创新的核心基石。通常来说，驱动企业构建Data+AI平台主要分为主动选择以及被动应对两个方面的因素：主动选择：主要是针对头部企业在构建面对AI赋能的大数据平台时，需要突破现有的能力范畴，构建新的AI应用场景，包括以下两个部分：被动应对：主要是针对现有的数据资产通过AI赋能进行优化，以解决现有的问题，通过AI提升团队对数据资产的管理能力，降低整体成本，包括下面三个部分：大模型微调、多模态数据处理、提示工程等能力需要高度专业化人才；AI价值需通过人才实现从“技术可用性”到“业务适配性”的转化（例如将通用大模型改造为行业专属模型）。而统一Data+AI平台能够减少重复性投入：通过企业级Data+AI平台统一技术栈，避免各部门重复搭建数据管道、训练基础模型；破除单一数据源的协作壁垒，减少因数据孤岛产生的内耗，降低跨部门数据对齐的沟通成本；可视化低代码工具让业务人员自主完成80%的常规分析，释放技术人才聚焦高价值任务。针对统一平台与数据基座降低“非必要成本”Data+AI能够提供更高效治理的数据（包括非结构化数据），让企业在AI实际落地的场景中去规避数据安全隐私的问题，减少AI的幻觉，增强用户使用AI所带来的用户体验和正反馈。需要提升数据治理的质量，以便保护已有的数据资产Data+AI能够让数据和AI团队在一个平台上进行协作，端到端的完成AI开发，数据管理为AI应用提供高效数据支撑，而AI又能反向增强数据管理的智能化水平（例如基于LLM构建Copilot等），进而形成Data和AI相互促进相互提升的良性循环。构建数据和AI在统一平台高效联动提高快速应对业务复杂性的能力高层对于Gen AI等新技术对业务落地有紧迫性。而另一方面，市场上GPU资源非常难采购且非常昂贵。导致数据团队负责人需要在Data+AI部署时既要兼顾业务价值敏捷迭代又要兼顾投资费用。需要提升业务敏捷与控制创新浪费生成式AI（GenAI）与主动元数据管理结合，可自动化数据摄取、清洗及转换等繁琐流程，减少人工干预。通过统一数据生态系统整合分散的数据管理组件，减少多平台维护复杂度。自动化数据流程提升效率05 - 03企业构建Data+AI平台需要具备哪些关键能力 07 -在技术高速迭代的时代，Data与AI技术的可组装性（Composability）已成为企业构建数智平台的核心挑战。当前技术迭代速度飞快，技术生命周期缩短，关键组件的有效性窗口期急剧压缩。例如，AI领域的大语言模型平均每3-5个月即出现代际升级（如从GPT-3到GPT-4），数据管理领域的向量检索、湖仓一体架构等技术也在快速演进，半年前的技术方案可能在短期内被颠覆。单一技术很难长期占据核心地位。以数据平台为例，当前向量数据库因支持AI语义理解而成为关键能力，但随着图计算、神经

点击免费查看完整报告

Data+AI下一代数智平台建设指南

生成式AI时代的数据挑战：企业转型的核心瓶颈

驱动企业构建Data+AI平台的核心要素

Data+AI典型行业应用场景

腾讯云Data+AI产品方案及优势

Data+AI未来发展

你可能感兴趣

中国AI算力下一站：政府算力平台建设与国产化–20230625

储能+时代数智运维与创新系统解决方案

计算机行业跟踪周报：中国AI算力下一站：政府算力平台建设与国产化

国央企基于5A架构的Data+AI一体化融合建设方案

《大数据平台在DATA+AI时代下的融合创新》

新一代数据可视化分析平台建设指南

王洋-中信建投证券数智研运一体化平台建设探索与实践

十三五时期政务服务平台建设指南：“互联网+政务服务”发展白皮书

计算机行业周报：基金持仓进一步集中化，工信部印发平台建设指南

一体化政务大数据建设指南发布，看好平台建设和数据安全厂商