您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[发现报告]:海天瑞声机构调研纪要 - 发现报告

海天瑞声机构调研纪要

2025-10-20发现报告机构上传
AI智能总结
查看更多
海天瑞声机构调研纪要

调研日期: 2025-10-20 北京海天瑞声科技股份有限公司成立于2005年,是我国最早从事AI训练数据解决方案提供商之一。海天瑞声作为AI数据行业首家主板上市公司,致力于为AI企业、研发机构提供AI数据集及服务。公司覆盖多语言、跨领域、跨模态的人工智能数据,包括智能语音、计算机视觉、自然语言等多个核心领域,覆盖全球近200个主要语种及方言。海天瑞声与全球810家科技互联网、社交、IoT、智能驾驶等领域的主流企业,以及教育科研机构等建立了深度合作关系,成功交付数千个定制项目,深得客户信赖。 1、公司三季度收入增长的原因是什么? 2025 年第三季度公司营业收入增长主要得益于境内、境外业务的协同发力。在境内市场,随着文生视频技术在内容创作、影视制作、广告营销等领域的深入应用,行业对生成视频在语义一致性、画面准确性等方面的要求持续提升,进而推动了对高质量多模态训练与精细化评测数据的旺盛需求;与此同时,公司在政企侧的业务布局初见成效,多语种文本类业务开始持续贡献收入,共同带动境内业务收入大幅增长。 在境外市场,一方面受益于海外科技巨头持续推进以智能终端为代表的国际化战略,其对高质量、多语种的OCR识别与多语言文本理解数据的需求增长强劲;另一方面,公司去年在东南亚部署的本地化数据交付体系已进入稳定运营阶段,成功开拓了面向海外客户的定制化数据服务市场,为公司带来了持续增长的海外业务收入。境内外业务的共振发力,共同推动了公司三季度整体收入的提升。 2、25年第三季度公司的收入增速相较于前几个季度增速略有下滑,请问主要原因是什么?三季度收入增速放缓,主要系部分大额政府项目收入节点确认影响。目前,相关项目均正常履约、推进,预计相应收入将在第四季度或期后陆续确认。因此,将带动四季度的单季度收入增速提升,并有望带动公司2025年全年收入实现较好增长。 3、公司第三季度毛利率为何同比出现下滑? 主要是第三季度,毛利率较高的标准化数据集产品收入占比下降,导致公司整体毛利率水平出现一定比例下滑。 4、请问目前公司政府类业务进展如何? 目前,我们与地方政府的合作已形成清晰的模式:一是基于地方特色数据(如农业、文旅)建设行业高质量数据集;二是搭建可信数据空间 ,保障数据安全;三是参与建设数据交易平台,促进数据流通;四是向下游延伸,开展场景化模型开发与应用落地。 在项目进展方面,公司已与成都、长沙、保定等国家级数据标注基地试点城市建立合作,同时与广西、呼和浩特地方政府已启动具体项目推进。今年第三季度,公司已完成呼和浩特首批高质量行业数据集,以及首批广西东盟语料库数据的交付。 5、公司在菲律宾基地收入持续增长,请问这块业务未来的规划如何?是否会考虑在海外拓展其他类似基地?公司基于在东南亚基地的成功经验,下一步会考虑极规划在东南亚其他地区拓展类似基地。通过新基地拓展,一方面,持续为公司带来稳定的收入和利润增量;另一方面,将通过拓展的基地进一步推动海外定制业务的发展,并重点开拓高端数据标注市场。这一布局将有助于我们更好地服务全球客户,提升在国际市场的竞争力。 6、请问公司如何看待具身智能数据业务?海天在该方向上有具体的计划吗? 公司非常看好具身智能数据领域作为高增长的新兴赛道,已组建具身智能数据专项团队开展相关业务,并开始在全国多个城市启动专项公司的选址。 一方面,国家已将具身智能列为未来产业予以重点培育。另一方面,控制机器人认知决策等"大脑"仍处于发展早期,大模型在泛化能力上仍有不足,因此想实现规模化落地将依赖大量高质量、细颗粒度的训练数据,因此这一领域市场潜力巨大。 当前,国内、外多家头部科技企业已启动具身智能数据的规模采购,需求涵盖机器人在真实场景下的交互数据、构建仿真世界模型所需数据等。同时,部分地方政府也在积极规划建设"具身智能训练场",旨在采集高质量数据,赋能科研与产业应用。 目前,公司已与多家机器人本体厂商展开合作,并与多家头部科技大厂及地方政府启动订单需求对接,正在推进相关样例数据交付与训练场方案的设计与落地,为下一步具身智能数据业务的加速发展奠定坚实基础。 7、OpenAI 发布了 Sora2,目前许多大厂在文生视频领域进行战略布局,请问公司怎么看这块需求,以及自身在相关数据方面的竞争优 势? (1)市场需求 文生视频技术仍处于发展早期,当前模型的生成效果远未成熟,常出现画面扭曲、违背物理规律等问题。其核心瓶颈在于高质量视频-文本对数据的严重短缺。 目前,视频大模型每年需约数千万对图像/视频-文本数据用于迭代训练,视觉数据存在巨大需求。 (2)公司竞争优势 公司在此领域已建立起明确的先发优势。公司已连续两年成为国内某头部视频模型厂商的核心数据供应商。通过深度合作,积累了大量的文生视频标注经验,构建了专业的标注团队和高效的作业体系,能够持续稳定交付模型训练所需的高质量数据。 8、目前公司传统的科技类企业的需求是什么?未来的需求增量是什么? 基于公司前三季度的业务情况,目前科技类企业客户的需求主要集中在多语种数据领域,包括语音识别、手写体及文本数据等。展望未来,我们观察到三类主要需求增量:一是多语种数据需求将持续旺盛;二是高端专业化数据需求将快速增长,涵盖数学、物理、医疗、金融等专业领域;三是交互自然度相关数据需求将显著提升,特别是在多情感表达、自由对话和双工交互等方向。公司已在这些领域开展标品数据的布局和建设。