AI智能总结
积极拥抱AI产业趋势,加码布局垂直行业大模型。通用大模型使用的大规模训练语料来自互联网公开的通用数据,提供的是通用能力,适用于通用场景应用,在行业应用的专业度、精度、深度方面存在局限。公司积极拥抱大模型发展,启动了trsGPT的研发,可分为trsGPT-G(政务专业模型)、trsGPT-F(金融专业模型)、trsGPT-M(媒体专业模型),在政务、金融、新闻媒体等垂直领域做应用落地。 多年深耕融媒体行业,拥有大量主流央媒客户资源,行业卡位优秀。融媒体是公司的成熟业务版块,主要面向各级新闻媒体单位围绕新闻生产策、采、编、发、评、运、屏全流程提供融媒体内容生产、用户行为资产、媒体大数据等综合服务。目前公司的融媒体业务已经合作了人民日报、新华通讯社、中央广播电视总台等主流央媒及其他新闻出版单位。截至2022年,公司融媒体用户已经覆盖了72%的中央媒体,61%的省级媒体,40%的行业媒体。 具备深厚新闻媒体领域高质量数据积累,为垂直领域大模型效果打下基础。1)部分ToB场景中,用户对安全性、一致性、规范性、意识形态敏感性的要求更高,需要更多的定制和额外的相关工作等等,对训练数据质量提出更高要求。2)数据层面,拓尔思从2010年自建数据中心以来,已采集了超过10年的互联网公开数据,拥有规模及质量均位列业界前茅的另类数据资产。目前,拓尔思拥有来自境内外、各行各业的公开数据规模超1300亿条,数据总量达100TB以上。拓尔思长年深耕政务、媒体、金融、专利等行业的信息化建设,已积累了30+专业知识库,覆盖媒体、舆情、金融风控、产业投研、智能消保、开源情报、政务应用等场景;公司在新闻媒体等行业的深厚数据积累,将有利于公司将大模型在垂直领域fine-tuning后做落地,为公司垂直领域大模型的效果打下基础。 AIGC赋能新闻媒体行业,融合大模型技术后公司未来有望实现产品化快速落地。 近年来,公司积极与客户携手在AIGC相关领域,事实上,在ChatGPT出现之前,公司在AIGC领域已有一定的业务布局。根据公司2022年年报披露,2022年公司在AIGC领域(机器写作、自动报告生成、对话式AI机器人、虚拟人播报等)的用户数已达103家,业务收入达852万元。近来,公司尝试在自研的自动写作产品基础上,基于大模型进行融合迭代,进一步提升现有AIGC产品的内容生成质量,取得一定效果。我们预计,伴随着公司未来trsGPT大模型的推出,公司有望快速实现AIGC产品化的落地,为客户带来更优秀的AI辅助创作效果。 维持“买入”评级。我们预计公司2023-2025年将实现收入11.77/14.61/18.05亿元,实现归母净利润2.03/2.25/3.24亿元,维持“买入”评级。 风险提示:AI技术迭代不及预期风险;经济下行超预期风险;行业竞争加剧风险。 财务指标 财务报表和主要财务比率 资产负债表(百万元) 现金流量表(百万元) 1.泛政府领域NLP龙头,积极拥抱大模型产业趋势 公司是政府政务领域NLP龙头。1)拓尔思成立于1993年,以“语义智能+”为发展战略深耕近30年,业务主要面向三大重点板块:内容安全和互联网空间治理、数字政府和数据智能,覆盖从党政机关到企事业单位的众多行业市场,提供大数据检索、智能风控营销、舆情监控等服务。公司以深耕多年的大数据积累与行业领先的NLP技术成为国内政府政务领域NLP龙头,截至2022年,公司融媒体用户已经覆盖了72%的中央媒体,61%的省级媒体,40%的行业媒体;政府网站集约化用户已经覆盖80%的中央和国务院机构,60%的省级政府,50%的地市政府。金融风险防控全链条云产品用户已经覆盖了55%的全国省市两级金融监管机构。政务舆情用户覆盖了全国近50%的省级政府。 图表1:拓尔思是国内泛政府领域NLP领军企业 积极拥抱AI产业趋势,加码布局垂直行业大模型。通用大模型使用的大规模训练语料来自互联网公开的通用数据,提供的是通用能力,适用于通用场景应用,在行业应用的专业度、精度、深度方面存在局限。公司积极拥抱大模型发展,启动了trsGPT的研发,其技术栈可以分为5层: 应用层:将trsGPT生成的trsGPT-G(政务专业模型)、trsGPT-F(金融专业模型)、trsGPT-M(媒体专业模型)。三大行业模型(可通过接口)集成到自研云服务或面向用户的应用程序,运行自有模型或通过第三方接口运行模型,帮助用户使用trsGPT带来的人工智能协作能力和生成能力,形成各类行业应用,如公文辅助写作、投研自动报告生成、智能投研问答、新闻资讯知识型搜索、以文生图配稿等。 接口层:将应用层和模型层衔接,方便应用层调用,使得开发者和用户能够以编程方式与模型进行交互。这可以简化trsGPT在实际应用中的部署和调用,从而降低使用门槛。 模型层:trsGPT支持接入各类主流大模型,包括各类开源或非开源模型,以及各种模型的共享平台。大模型负责向trsGPT模型输出模型能力,trsGPT模型更精确地处理自己“擅长”的任务。这一层提供了不同的模型数据和功能,通过接口层为应用层提供专业模型的功能支持,包括各种调用API和数据中心调用工具,同时提供对应的提示工程接口和模型精调接口等。 框架层:提供训练或云部署的深度学习框架和中间件等,包括PyTorch、TensorFlow等知名深度学习框架和中间件。 计算层:为模型层提供模型计算和调度的各种算力支持,为训练AI模型运行训练和运行推理任务提供基础设施。计算层包括了各种云计算平台和计算芯片。 图表2:拓尔思trsGPT技术栈 2.深度卡位融媒体行业,高质量数据赋能AIGC 多年深耕融媒体行业,拥有大量主流央媒客户资源,行业卡位优秀。融媒体是公司的成熟业务版块,主要面向各级新闻媒体单位围绕新闻生产策、采、编、发、评、运、屏全流程提供融媒体内容生产、用户行为资产、媒体大数据等综合服务。融媒体内容生产服务平台是以内容资产为核心的新一代数据型媒体业务平台,涵盖了报、网、端、微、视和自媒体平台的全流程内容生产发布管理,该平台由数据资源聚合、融合生产创作、选题策划分析、传播效果分析、协调指挥调度、用户资产运营、大屏综合管理等多个平台组成。目前,公司的融媒体业务主要以“软件产品+大数据服务”的融合模式为客户提供服务,已经合作了人民日报、新华通讯社、中央广播电视总台、解放军报、光明日报、经济日报、中国日报、科技日报、中国纪检监察报、工人日报、农民日报、中国新闻社等各类主流央媒及其他新闻出版单位。截至2022年,公司融媒体用户已经覆盖了72%的中央媒体,61%的省级媒体,40%的行业媒体。 图表3:公司优质央媒客户资源丰富,坐拥优质行业卡位 具备深厚新闻媒体领域高质量数据积累,为垂直领域大模型效果打下基础。 1)在部分ToB场景中,可用的数据集是有限的,需要更多工程化和特定方法的干预; 部分ToB场景中,用户对安全性、一致性、规范性、意识形态敏感性的要求更高,需要更多的定制和额外的相关工作等等。而这些都是拓尔思不断在思考、研究、开发和应用实践去解决的问题。 2)数据层面,拓尔思从2010年自建数据中心以来,已采集了超过10年的互联网公开数据,拥有规模及质量均位列业界前茅的另类数据资产。目前,拓尔思拥有来自境内外、各行各业的公开数据规模超1300亿条,数据类型涵盖新闻、资讯、政策、视频、图片、百科、社交等多模态,数据总量达100TB以上。公司的海贝数据库有千余家重量级客户在使用,可用于公共安全、政务公开与媒体融合等领域。算法层面,拓尔思长年深耕政务、媒体、金融、专利等行业的信息化建设,已积累了30+专业知识库,涵盖通用语义分析、人物/机构、行业分类、专利、媒体、金融、科技情报、乡村振兴等领域;30000+标签模型,覆盖媒体、舆情、金融风控、产业投研、智能消保、开源情报、政务应用等场景;350+深度学习算法模型,包括NLP、金融监管、风控征信、公共安全、产业服务、传播分析、事件研判、舆情态势等通用模型、指数模型、领域模型等。公司在新闻媒体等行业的深厚数据积累,将有利于公司将大模型在垂直领域fine-tuning后做落地,为公司垂直领域大模型的效果打下基础。 图表4:公司的海贝数据库可用于安全、政务、媒体等领域 AIGC有望赋能新闻媒体行业,辅助智能写稿与内容生成。近年来,公司以数据智能应用为核心赋能不同行业的数字化转型与降本增效的场景应用,积极与客户携手在AIGC相关领域,如机器写作、对话式AI、内容人机协同和自动报告生成等应用场景相继打造出一批实践案例,在经济日报、浙江日报等新闻媒体出版单位已有落地应用。早在2016年,拓尔思在浙江日报报业集团的融媒体智能传播服务平台(简称浙报媒立方)率先推出了机器写作,主要根据拓尔思的全网资讯大数据自动生成体育、气象和财经等领域的主题稿件,推送到浙报媒立方。 图表5:拓尔思AIGC实践案例 融合大模型技术后,公司未来有望实现产品化快速落地,为客户带来更好的AIGC使用效果。事实上,在ChatGPT出现之前,公司在AIGC领域已有一定的业务布局。根据公司2022年年报披露,2022年公司在AIGC领域(机器写作、自动报告生成、对话式AI机器人、虚拟人播报等)的用户数已达103家,业务收入达852万元。2022年发布的9款SaaS服务产品中,有8款是融合了大数据和人工智能技术,如麦文智创云服务作为一款农产品电商直播脚本的自动写作产品,在第七届广东省农村电子商务峰会暨数美汕尾助农电商消费节上正式向社会各界发布,得到业界一致好评。近来,公司尝试在自研的自动写作产品基础上,基于大模型进行融合迭代,进一步提升现有AIGC产品的内容生成质量,取得一定效果。我们预计,伴随着公司未来trsGPT大模型的推出,公司有望快速实现AIGC产品化的落地,为客户带来更优秀的AI辅助创作效果。 3.投资建议 维持“买入”评级。根据以下盈利预测,我们预计公司2023-2025年将实现收入11.77/14.61/18.05亿元,实现归母净利润2.03/2.25/3.24亿元,维持“买入”评级。 图表6:公司盈利预测 4.风险提示 AI技术迭代不及预期风险:若AI技术迭代不及预期,NLP技术理解人类意图水平未能取得突破,则对产业链相关公司会造成一定不利影响。 经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响,NLP技术应用落地将会受限。 行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。