您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东吴证券]:Scale AI:AI时代卖水人 - 发现报告

Scale AI:AI时代卖水人

2025-08-04王紫敬东吴证券庄***
AI智能总结
查看更多
Scale AI:AI时代卖水人

Scale AI:AI时代卖水人 2025年08月04日 增持(维持) 证券分析师王紫敬执业证书:S0600521080005021-60199781wangzj@dwzq.com.cn ◼Scale AI是美国人工智能数据标注领域头部公司之一。公司成立于2016年,主要业务可以分为三大类:AI构建、AI应用和AI评估。Data Engine是公司的核心产品,提供数据标注、数据管理、模型评估等服务。AI应用主要包括为国防部打造的Donovan、全栈式的AI开发平台ScaleGenAI Platform。AI评估业务通过多元化的专家网络来执行LLM评估和识别风险。公司发展经历了从早期类似“劳动力成本套利”的纯人工标注,到强化AI标注能力,落地AI大模型厂商和政府客户,目前已经和政府、头部大厂深入合作。 ◼Scale AI收入持续高增长,尚未盈亏平衡。公司2022年收入为2.9亿美元,2024年已达到8.7亿美元。公司2024年毛利率为49%,EBITDA亏损超过1.5亿美元,尚未实现盈亏平衡。公司预计2025年收入达到20亿美元,并实现EBITDA盈利,2026年销售额接近40亿美元。公司订单主要来自大厂和政府。公司部分高管具备政府背景,2020年以来,公司多次获得百万美元级以上的美国国防部订单。 相关研究 《新方向:机器人遥操作》2025-08-03 ◼Scale AI最新估值290亿美元。但Meta进入后中立性受损。2025年6月,Scale AI宣布已获得一笔来自Meta Platforms的重大投资,相应投资令该公司估值达到290亿美元,在获得投资的同时,该公司联合创始人兼首席执行官Alexandr Wang将加入Meta。Meta此次支付了143亿美元。客户普遍担心,在数据标注过程中泄露的专有数据与技术路线给Meta这一竞争对手,如谷歌已计划停止合作。 《AI Agent:智能经济时代的生产力解压缩器》2025-07-28 ◼Scale AI启示:质量优先、价值链延伸、保持中立。生成式AI时代需要完成的任务不止图像识别,而是写诗、编程、数学证明、美学鉴赏等,生成式AI时代所需要的数据质量没有上限。未来AI训练需要的数据会越来越复杂,如强化学习环境,环境中的轨迹通常非常丰富且漫长,并且需要多个奖励信号。以AI训练数据为核心,可以提供包括自动标注平台、模型评估等多项附加产品和服务,并且可以向下游应用落地延伸。在合作中,客户通常会与Scale AI共享包括专有数据和产品原型在内的商业机密,因此服务商中立性非常重要。 ◼Scale AI收入持续高增长,海外大厂和政府需求旺盛,反应AI发展对于高质量数据刚需。AI训练数据产品服务专业性强,有规模效应,第三方厂商优势显著。持续推荐高质量数据集相关领军企业:海天瑞声、深桑达A。 ◼风险提示:政策推进不及预期,行业竞争加剧,技术发展不及预期。 内容目录 1.1.发展历程.....................................................................................................................................41.2.主要业务.....................................................................................................................................61.2.1. AI构建-Data Engine.........................................................................................................61.2.2. AI应用-Donovan、Scale GenAI Platform......................................................................71.2.3. AI评估-Scale Evaluation..................................................................................................71.3.订单、业绩和融资.....................................................................................................................82. Scale AI启示:质量优先、价值链延伸、保持中立........................................................................93.投资建议和相关标的........................................................................................................................104.风险提示............................................................................................................................................10 图表目录 图1:公司主要产品和应用场景...........................................................................................................4图2:公司业务概览...............................................................................................................................6图3:Scale Evaluation部分功能...........................................................................................................7 表1:Scale美国军方部分订单.............................................................................................................8表2:Scale AI历史融资情况................................................................................................................9 1.从标注外包到解决方案 Scale AI是美国人工智能数据标注领域头部公司之一,成立于2016年。公司最初业务为AI数据标注外包,现已逐步转型为提供端到端的AI解决方案提供商,公司客户亦由B端企业逐渐扩展至G端。 1.1.发展历程 公司业务发展逐步由纯外包服务转向数据标注平台以及多元的AI数据解决方案。 1)第一阶段(2016-2018年):从纯人工数据标注到弱AI标注阶段,挖掘自动驾驶领域需求 19岁的Alexandr Wang与22岁的Lucy Guo在Y Combinator孵化后创立ScaleAPI,Scale最初只是一个用于人类任务的简单API。Scale提供了一个按需调用的人力劳动者团队,执行算法无法完成的任务,所有这些都可以通过一行代码访问。公司可以通过这些工人完成任务,例如内容审核、数据提取和安排预约。Scale使用API来简化请求工作的过程,并在后端通过同行评审系统对人员进行审查和培训,以确保高质量的输出。 在Scale AI成立几个月后,他们发现了自动驾驶领域对于数据标注的大规模和刚性需求。自动驾驶技术的发展依赖于大量高精度的标注数据,例如道路场景、行人和其他 物体的图像数据,车企需要成千上万小时的视频数据进行标注来训练和验证其算法,而当时大部分的数据标注都是以人工为主,因此当时数据标注被认为是一个劳动密集型业务,很多公司不愿意也没有精力去自己管理,导致标注数据的获取的过程既耗时又昂贵。 Scale AI的早期业务模式类似“劳动力成本套利”。公司接洽到有标注需求的客户,对数据进行简单的预处理和清洗之后,将其外包给非洲、东南亚等劳工对数据进行标注。他们成立了内部外包机构Remotasks,在肯尼亚、菲律宾、委内瑞拉等地设立了几十家机构,培训了万名的数据标注员,大部分为按件计酬,一次标注的收入低至几美分,很多合约工在时薪甚至不到1美元。在此阶段,公司的标注业务更多地依赖于人工标注。 2018年,Scale AI将其网址从Scaleapi.com改为Scale.ai,正式将标注重心转向用于训练自动驾驶的数据标注,与丰田、本田、Cruise等自动驾驶客户深度合作。同时,ScaleAI开始将人工、自主开发平台和机器学习相结合进行数据标注的核查,来提高其数据标注的速度以及准确性。 2)第二阶段(2018-2020年):强化AI标注能力,落地AI大模型厂商和政府客户 这一阶段,Scale AI开始将人工、自主开发平台和机器学习相结合进行数据标注的核查,来提高其数据标注的速度以及准确性。2019年,公司开始与Open AI进行合作,并深度参与了GPT-2及以后GPT模型的数据标注工作。 2020年,Scale AI推出数据调试SaaS「Nucleus」,签下了美国国防部9100万美元大单,首次进入政府市场。 3)第三阶段(2021年至今):政企合作逐步深入,拓展AI应用 2021年,美国企业高管、前政府官员迈克尔·克拉西奥斯(MichaelKratsios)加入Scale AI公司并担任董事总经理兼战略主管,公司注册设立了服务政府业务的独立法人实体Scale AI Government, Inc.。 2022年,公司与美国国防部签订订单,单笔金额达到2.5亿美元,参与梅文计划,公司为美国政府与军方提供了大模型测试与评估、Donovan AI平台、开源数据集评估等多项服务,标志着Scale AI开始从服务提供商向平台供应商转型。公司的Donovan AI平台接入了美国军方的数据源,并通过该平台对军方收集的战场图像进行标注。在获取数据后,公司在该平台上通过调用并微调第三方模型完成私有数据集上的大模型训练,进而通过微调模型对军方实时提供的战场图片进行判读、毁伤评估和态势感知,大幅提高了军方对战场情报的分析效率和反应速度。 2023年,美国陆军选择将Donovan系统用于第18空降军的加密网络,用于该空降 部队的决策制定。同年,Scale AI宣布推出企业生成AI全栈平台(EGP),(企业客户可通过该平台访问领先的商业和开源基础模型,使用客户的专有数据集对其进行自定义,并实现企业级安全与安保控制)。 Open AI将Scale视为优先合作伙伴,优先推荐企业客户使用Scale提供的微调服务,公司协助提升GPT-3.5 Turbo和GPT-4大语言模型的性能。 2024年,公司推出了全新的AI Lab平台,该平台旨在研发人工智能的基础层、技术层、应用层和服务层,展示了人工智能在未来的发展方向。Scale AI董事总经理MichaelKratsios被任命为白宫科技政策办公室主任,公司与美