腾讯数据闭环平台产品介绍
产品概述
腾讯数据闭环平台通过集成传统数据管理流程与先进技术,驱动提效。平台基于云服务、预标注大模型、多模态大模型和海量数据集,赋能数据采集、存储、清洗、标注、生产、品控、检索的闭环链路,服务于自动驾驶、空间计算等领域。作为模型训练和调优的数据管理平台,其核心功能包括数据标注、模型训练、模型部署等。
智能驾驶研发阶段与痛点
智能驾驶研发分为起步、迭代和极致三个阶段,每个阶段面临不同痛点:
- 起步阶段:从零开始积累场景数据。
- 迭代阶段:场景打磨,数据采集和标注效率低。
- 极致阶段:余下1%的cornercase和极端case难以采集,导致模型迭代慢。
核心痛点包括:
- 数据采集和标注效率低下(17元/帧,3帧/人天,50W帧需16.7W人天)。
- 场景数据难以积累,模型迭代慢。
- 数据效率与成本问题突出("Data Hungry")。
腾讯自动驾驶数据闭环解决方案
解决方案通过四大工具链实现数据闭环:
- 4D动态标注工具链:利用多模态云端识别大模型自动化标注,降低标注成本。
- 静态真值生成工具链:基于HD Map母库重定位检索,实现10倍标注效率提升,降低90%标注成本。
- 多模态样本挖掘工具链:通过文图检索大模型自动化检索传感器样本数据,批量化积累案例数据。
- 场景重建编辑工具链:结合4DGS重建和车辆行为仿真,实现端到端自动驾驶评测。
核心技术与工具
- 4D时空自动标注:融合激光和视觉数据,实现高效标注。
- 激光分割工具链:自动分割标注模型,提供高质量初始标注。
- 静态真值生成工具链:通过HD Map母库重定位检索,生成静态建图真值标注。
- 场景样本挖掘工具链:利用多模态图文大模型自动化检索和生成样本真值集。
- AI编辑引擎与检索引擎:支持场景数据编辑和检索。
自主可控优势
平台具备全自研数据闭环链路、业内领先的自动化标注及挖掘能力,核心引擎和工具帮助快速实现自主可控的数据平台。
腾讯数据闭环平台
产品介绍
数据闭环平台-产品概述
数据闭环平台:基于云服务、预标注大模型、多模态大模型、海量数据集,赋能数据采集、存储、清洗、标注、生产、品控、检索闭环链路,服务于自动驾驶、空间计算等领域模型训练和调优的数据管理平台
海量训练数据集
智能驾驶研发三个阶段和研发痛点
数据闭环解决方案—4D标注工具链
痛点:感知真值标注时间成本、人力成本过高,需要高能力上界的预标注算法模型,提供高质量初始标注。
数据闭环解决方案—激光分割工具链
痛点:激光分割标注耗时耗力,需要预标注算法模型,提供高质量初始标注。
解决方案:自动分割标注模型,完成数据预标注。
数据闭环解决方案—静态真值生成工具链
数据闭环解决方案—静态真值生成工具链
数据闭环解决方案—场景样本挖掘工具链
业务痛点:场景问题case需要补充案例数据,case难以批量化收集,模型迭代慢。
跨模态云端文图检索大模型
解决方案:文本自动化检索同样语义的传感器样本数据,批量化累积该类问题的样本数据;结合云端推理大模型,直接形成针对性样本真值集。
数据闭环解决方案—场景重建编辑工具链
自主可控
助力快速实现自主可控
•全自研数据闭环链路•业内领先自动化标注及挖掘能力•核心引擎和工具帮助快速实现自主可控的数据平台