以数据为中心的人工智能
公司介绍
Magic Data 是一家专注于人工智能模型及数据领域的公司,成立于2016年,总部位于北京。公司创始人张晴晴拥有丰富的科研和创业背景,曾任职于中国科学院声学研究所和法国国家实验室LIMSI-CNRS。Magic Data 的核心团队包括张晴晴、张涛、Kenneth Pang和罗磊等,具备深厚的行业经验和技术实力。
公司自成立以来,经历了起步阶段、成长期和飞速发展期,目前已在智能汽车、金融、社交、家居和终端等五大行业提供服务,供应商数量超过300家,服务全球200多家客户。Magic Data 获得了多项荣誉,包括北京市“专精特新”小巨人企业、国家高新技术企业等,并入选了多个行业报告和奖项。
以数据为中心的AI
Magic Data 强调以数据为中心的AI方法论,认为数据是AI的“原油”,优质的数据是AI成功的关键。与传统以模型为中心的AI相比,以数据为中心的AI更关注如何系统性地迭代数据输入和数据标签来提高效能。MLOps是实现“以数据为中心的AI”高效系统的方法论,通过数据采集、标注、模型训练和优化等环节,实现AI的持续迭代和优化。
Data-Centric MLOps介绍
Data-Centric MLOps 是Magic Data提出的一种高效的数据管理方法论,通过数据Ops和机器学习Ops的结合,实现数据的自动化管理和优化。Data-Centric MLOps的工作流程包括场景定义、数据采集、数据标注、模型训练、模型优化和模型部署等环节,通过CI/CD的循环,实现AI的持续迭代和优化。
汽车行业应用实践
Magic Data 在智能汽车行业拥有丰富的应用实践,特别是在智能座舱(人机交互ASR)领域。公司通过数据采集、标注和模型训练,帮助客户提高人机对话的自然对话语音识别率和噪音环境下的识别率。具体案例包括:
- 数据采集:在实车舱内环境下采集命令控制数据。
- 数据标注:包括语音标注(ASR)、文本标注(意图槽位)和图像标注(OMS)。
- 模型训练:通过Annotator®智能标注平台提供API对接外部预识别模型,实现降本增效。
- 模型优化:通过预识别模型拟合实验场景,逐步迭代优化预识别模型。
对比实验显示,使用Magic Data的自然对话成品数据集,自然风格的语音识别错误率下降30%,噪音环境下的人机交互识别错误率下降10%。
总结
Data-Centric AI 强调对数据的管理,通过数据采集、标注和模型训练等环节,实现AI的持续迭代和优化。数据是解决AI难点和重点的关键,目前算法工程师有80%在解决数据问题。Data-Centric MLOps 可以降低机器学习技术门槛,帮助业务快速实现智能化。Magic Data 通过其数据开源社区Magichub,汇聚全球AI开发者,推动AI技术的普及和应用。
联系方式
公司官网:www.magicdatatech.cn
开源社区:www.magichub.com
联系电话:400-900-5251
商务咨询:business@magicdatatech.com