您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[发现报告]:每日互动机构调研纪要 - 发现报告

每日互动机构调研纪要

2025-02-07发现报告机构上传
AI智能总结
查看更多
每日互动机构调研纪要

调研日期: 2025-02-07 每日互动股份有限公司成立于2010年,是一家专业的数据智能服务商,致力于用数据让产业更智能。公司将深厚的数据能力与行业“Know-How”有机结合,为互联网运营、用户增长、品牌营销、金融风控等各行业客户提供丰富的数据智能产品、服务与解决方案。2019年3月,公司登陆创业板成为国内率先在A股上市的“数据智能”企业。每日互动公司聚焦数据智能赛道十余年,构建了“数据积累-数据治理-数据应用”的服务生态闭环。公司以开发者服务为基础,不断夯实数据底层,强化数据能力,为互联网客户提供便捷、稳定的技术服务与智能运营解决方案。同时,公司通过构建数据中台——“每日治数平台”,将数据挖掘、萃取和治理能力向各行各业输出,帮助合作伙伴将数据资源打造成为数据资产,并进一步实现数据的价值兑换。多年来,公司将数据能力深度运用于各细分业务场景,沉淀了深厚的行业知识和丰富的服务经验,并打造了面向企业和政府部门的一系列数据智能产品与解决方案,增能各行业数字化升级。作为数据智能领域的创新者和实践者,每日互动始终坚持“每日生活科技改变”的初心,积极通过技术和数据的力量,为客户和社会创造更多价值。 一、公司介绍 公司在上市之后就始终专注在数据智能领域,在技术上追求“极致”。我们非常喜欢鲸鱼的文化,我们的大楼也是鲸鱼的形状。鲸鱼大多数时间很低调地沉在水面之下,但每当需要时,它便能立刻浮上水面,喷出巨大的水柱。就像日常我们的SDK在手机中,大家是没有感知的,当国家有需要的时候就浮出水面,比如健康码、地震预警等,我们都深度参与。 关于大家关心的话题,我们在DeepSeek2.5的时候就做了深度集成,在3.0版本更进行了深化。它的每个版本,我们是在第一时间集成。在春节期间,我们也没有停下,思考如何在可信数据空间里面去构筑可控大模型,这对于产业界放心深度地使用大模型非常重要。中国(温州)数安港近日发布了全国首个基于可信数据空间和DeepSeek的可控大模型服务,为各行业提供更为安全、高效的大模型应用解决方案,我们也深度参与。 大模型对产业赋能最好的开启方式是可信数据空间里面的可控大模型。我和很多全国头部企业沟通,比如500亿以上市值的企业大多数都会选择私有化部署一套大模型,费用在千万级,但自己的数据输入大模型是大家没把握的。所以,人工智能发展除了在线的toC的服务之外,可信数据空间里面的可控大模型是大模型产业落地的很好方式。 但我们和幻方和DeepSeek都没有股权关系,幻方的一个重要股东曾是我们的创始核心骨干成员。在20年前,我们就追求技术的“极致”。最早我们做“备备”手机充电器,做到了“缩到极致”,那时候的手机操作系统约50个,1,000多款手机的同步软件有几十G。我们把几十G做到了几十K的代码。后续我们的推送产品也做到了“省到极致”。一个是省流量,当时推送一个月得耗费30M流量,我们把它做到了0.8-1.2M每个月;另外就是省电,每日耗电仅15-50毫安时;最后是省成本,我们运用了长链接的技术,使得我们的推送成本最低只需要甲方自己做成本的1%。所以很多头部APP也在用我们。我们在速度上也“快到极致”,高并发、高吞吐、高速度、高可靠。我们 可以做到亚秒级就能够把消息送到手机端,所以地震预警我们也在做。在发生地震的时候,我们的集群能做到亚秒级千万人员的消息分发。 回顾了历史,再讲讲现在。五年前,我们提到的数据智能。这里面包含着两个非常重要的概念,“数据”和“智能”,大白话来讲就是吃进去是数据,吐出来是智能。当大模型出来之后,这个比喻就变得非常具象。从我们营收构成来看,我们大概是“数据要素”含量最高的公司之一,那么接下去智能的东西会更多地体现在我们的未来。在战场上,我们定位在充分数字化的领域里,做数据智能化,帮助客户完成数据治理。在战术上,我们一直围绕“DMP(Data-Machine-People)”三层来展开。在战略上来讲,第一步是自数,就是合规地把我们自己的“数”拿出来服务于别人;第二步治数,就是客户相信我们的能力,我们在客户侧帮它的数据加上我们的数据进行治理;第三步的时候我们提出“置数”,就是数据的“加工贸易”,后面有了数安港,这就可以落地了。我们要做的是数据积累、数据治理、数据应用,做到数尽其用、器尽其专、人尽其才。大家可以看看我们上市后财报,我们的方向一致都没变过。 前段时间我们发布了2024年再融资的预案,而在2020年的时候,我们也发过一轮再融资,虽然终止了,但大家感兴趣可以把之前公告拿出来看,里面仔仔细细讲了我们的五年战略,那时候讲的是治数平台,目前已经落地,现在不停地去升级和迭代。这次我们两个募投项目也反映了未来五年我们干的事情。第一个是公共与产业数据价值融合开发的平台,我们也叫它“发数站”,对标发电站,这中间非常重要的是数据价值,是要构筑合规机制加上安全装置,技防加人防。同时,我们要强调的是,我们必须为产业创造出价值,然后分享价值。第二个项目叫可控智算能力平台建设与行业垂直模型产业化项目,这里面除了算力的打造,非常重要的是强调可控性,包括空间的可控性、算力的可控性,更加专注于在行业里面的垂直模型,拓展更多场景,强化我们的AI能力和多源数据。 我具体讲讲“发数站”是什么概念。“发数站”全称是公共与产业数据价值融合开发平台,大家在数据要素领域会把数据认为是一个非常危险和不确定性的东西,这和核燃料很类似,我们讲“核能危险,封闭预防;热能管控,局部流动;电能安全,开放传输”,数据也是从原始数据,到数据中间件,再到数据应用。数据的特点是无形性、非排他性和可复制性,一旦离手无法回收。中国(温州)数安港构筑了“中立国” 模式,多方数据可以放在这里面进行联合计算,算完之后结果经审计输出,原始数据就地销毁。我曾经提出数据使用除了分级分类管理之外,一定要做到“分场景、封场景”使用。同一份数据在A情况下使用是合法,到B场景就是违法的,比如说数据用来合规的精准营销没问题,用来诈骗就是违法的;第二就是封闭,在物理上就不允许数据转移到域外去,就是可信数据空间。所以我们用机制保证分场景,用装置保证封场景使用。因此我们就构筑了“发数站”,底下是企业数据和产业数据,通过可信连接器进行接入,运用可信数据空间技术,上面是业务系统管理等,最终从下到上实现“供得出、流得动、用得好、保安全”。不同的数据需要不同的处理方法,我们提出了“挖、挑、捡、淘、萃”的方法论,发数站也是一样,未来也要根据不同的数据去配发数站,实现不同数据资源的转化,接下来我们会携手我们交通、医疗等领域数智生态伙伴到全国各个城市建发数站。谢谢! 二、问答环节 问1:我们注意到DeepSeek-R1-Zero是以无监督训练的方式进行,所以对于无标注的低质量数据依赖度减少,相反公司手里的高质量数据更加关键。我想再请教一下。公司在“微调”或者“蒸馏”的过程当中,具体做了哪些工作?有没有落地的客户? 答: CEO:我认为数据是模型训练非常重要的原料,目前公司没有向DeepSeek提供语料数据,我们对于DeepSeek能力的应用以自用为主。我们已经把大模型的能力应用在营销、公共服务等领域,比如公司的“AITA智选人群”(Artificial Intelligence TargetingAudience)功能,我们运用了自研的数据编织算法,用于提升营销效能。技术上可以请我们的CTO讲一下。谢谢! CTO:感谢投资者的提问。大家知道人类的学习是两种,一种是模仿学习,再进一步是探索学习。模仿学习就像是预训练,探索学习可以理解 为强化学习,目前高质量数据面临了一定程度的枯竭,所以必须要从模仿学习进入到探索学习。DeepSeek-R1-Zero是利用新的强化学习的方式进行探索,呈现出来的能力非常令人惊讶,并且通过模型之间相互的训练实现了能力的提升。对于“微调”和“蒸馏”,我们会使用自己的数据来做一些产品,比如惠企政策智配大模型,政府发布政策后,运用我们的产品就能知道有多少企业是符合要求的,以后希望企业享受政策的时候不用再去申请,政府直接把政策下发到目标企业。 AI的三要素是算力、算法和算料(数据),所以高质量的数据是企业或者国家重点关注的内容,如何经治理成为高质量数据也是非常重要的问题。我们的战略是自数-治数-置数,第一个自数就是指使用自己的数据,第二个治数,是客户可以运用我们的数据智能操作系统(DiOS)治理成高质量数据,但后续你就会发现自己的数据可能不够用,我们就需要从外面“置换”数据,即置数。因此我们不仅能把自己的数据用好,还可以把数据价值输出到行业里面去,产生更大的经济效益。谢谢! 问2:大数据联合计算中心目前推广的进度如何?另外,方总提到运用可信数据空间赋能产业,这个如何理解? 答: CEO:中国(温州)数安港成立至今大概2年半的时间,刚刚提到的很多产品都在上面运行,尤其是一些需要多方数据融合的场景。我们的发数站到每个城市也要和产业伙伴一起落地,就像一个城市可以有多个发电站,因此我们的模式是要先创造价值,然后再分享价值。对于第二个问题,我指的是在可信数据空间里面建可控大模型,针对不同体量的企业提供不同的服务。比如工业类企业想提升良品率,就要把生产过程中的数据放到大模型中去训练调优,对于预算充足的大型企业,我们可以为其进行私有化部署;对于中型企业,我们可以对可控大模型进行进一步“瘦身”;对于小型企业,我们就可以在中国(温州)数安港构筑一个可信的数据空间,在政府、数据安全公司的监督下,帮助小型企业实现“原始数据非必要不流转,数据价值流转”使用大模型。谢谢! 问3:公司每天处理的数据量非常大,这些数据如何产生价值? 答: CEO:我觉得可以从两个方面来回答这个问题,第一是从数据资产入表的角度来看,这是以成本计价,第二是运用数据产生更大的产业价值。举个例子,在营销场景中,我们积累了丰富的特征层数据,通过和品牌客户的种子数据融合并共同建模,实现20%的预测人群覆盖80%的购买人群。但如果客户不愿意提供种子数据,我们通过编织的技术,借助大模型对产品和品牌的理解力,哪怕是从来没卖过的新产品,没有种子数据,都可以推导出相关的人群特征。因为数据具有可复制性等特点,同样一份数据可以在多个领域进行运用,就像我们的数据在商业服务、公共服务等多个领域进行了使用,这个市场空间会很大。谢谢! 问4:数据是定期更新的,以前软件公司会有很多定制化的内容,数据的定期更新会不会加快行业从定制化到SaaS化的转变。 答: CEO:我之前写了一篇文章,叫《树立数件与软件硬件等效意识》,其中提出一个概念叫Dataware(数件),呼吁政府部门的数字化采购能够从项目制走向产品化、走向服务化。任何行业在垂直应用的时候,一定会有定制化的部分,因此我们公司定下了“721原则”,就是70%必须是标品,20%是轻量化部署,10%是定制化需求。同时,产业数据的更新不只是定期更新,是流式更新,比如智慧交通场景中,交通流量数据一直有规律性的变化,绿波带设置后,会对交通流量产生连锁影响,这就需要不断的微调和迭代。谢谢! 问5:公司部署了一定规模的算力,如何使用? 答: CTO:我们在算力使用的过程中希望获得最大的效能。DeepSeek是在基础模型训练上极致地降低成本,对于企业使用来说,在推理的时候是在不同的硬件和环境下进行部署的,所以部署完算力光跑起来是不够的,还得跑起来没有问题,能用得好。DeepSeek专注在基础模型,我们希望在应用端把模型成本降下去,大家会有各自的分工。谢谢!