您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[东方证券]:算力网文件正式发布,大模型应用加速落地 - 发现报告

算力网文件正式发布,大模型应用加速落地

信息技术2024-01-01浦俊懿、陈超、谢忱、杜云飞东方证券Z***
AI智能总结
查看更多
算力网文件正式发布,大模型应用加速落地

⚫上周计算机板块上涨2.27%,与各主要指数基本持平。我们认为,元旦前的持续反弹使得市场情绪有所修复,投资者有望继续围绕数据要素、算力等政策主线做布局并关注业绩确定性品种。 ⚫全国一体化算力网加速构建:周五,发改委等五部委正式发布《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,建设联网调度、普惠易用、绿色安全的全国一体化算力网。在算力网加速建设的背景下,算力行业将从现在垂直一体化的方式走向算力提供、算力调度、算力运营等多个产业链环节,其中算力的调度和运营,是将分散的算力基础设施进行连接、实现算力低门槛、普惠化的关键,是未来算力建设最受益的的方向。 浦俊懿021-63325888*6106pujunyi@orientsec.com.cn执业证书编号:S0860514050004陈超021-63325888*3144chenchao3@orientsec.com.cn执业证书编号:S0860521050002谢忱xiechen@orientsec.com.cn执业证书编号:S0860522090004杜云飞duyunfei@orientsec.com.cn执业证书编号:S0860523120001 ⚫多模态大模型进展较快,未来应用空间广阔:我们认为,多模态大模型一方面有利于形成图片、视频等更加生动活泼、更具交互性的应用,从而有助于C端爆款的诞生;另一方面,多模态大模型能真正打通物理世界和数字世界的障壁,用最基础的感知世界能力直接生成操作,实现与物理世界最自然的交互,从而对自动驾驶、人形机器人等具身智能领域的突破提供有力支撑。 ⚫数据要素产业催化与落地值得期待:近期,发改委发布《“数据要素×”三年行动计划(2024-2026)》征求意见稿,推动数据要素在制造、农业、商贸、交通、金融、医疗等12个行业场景端落地。而上市公司也在加紧与地方数据集团合作,如银之杰近期与青岛公共数据运营方签订战略合作协议。我们认为,在政策加持下,行业落地有望提速,而投资者将更为关注。 覃俊宁qinjunning@orientsec.com.cn宋鑫宇songxinyu@orientsec.com.cn 投资建议与投资标的 ⚫算 力 网 为 代 表 的 数 字 基 建 领 域, 建 议 关 注中 科 曙 光(603019, 买 入)、 思 特 奇(300608,未评级)、海光信息(688041,买入)、亚康股份(301085,未评级)、众合科技(000925,未评级)、首都在线(300846,未评级)、铜牛信息(300895,未评级)、优刻得-W(688158,未评级)等。 ⚫大模型正加速向B端和C端落地渗透,建议关注金山办公(688111,增持)、新致软件(688590,未评级)、虹软科技(688088,未评级)、科大讯飞(002230,买入)、中科创达(300496,买入)、彩讯股份(300634,未评级)、万兴科技(300624,未评级)。 ⚫数据要素板块,建议关注银之杰(300085,未评级)、广电运通(002152,未评级)、中科江南(301153,未评级)、久远银海(002777,未评级)、上海钢联(300226,增持)、通行宝(301339,未评级)、每日互动(300766,未评级)、深桑达A(000032,未 评 级)、 云 赛 智 联(600602, 未 评 级)、 三 维 天 地(301159, 未 评 级)、 易 华 录(300212,未评级)、山大地纬(688579,未评级)等标的。 ⚫其他:建议关注远光软件(002063,买入)、航天宏图(688066,买入)、普联软件(300996,未评级)等标的 风险提示 技术落地不及预期;政策监管风险 目录 一、本周行业观点..........................................................................................4 二、本周行业专题:RAG技术在大模型应用中的作用....................................4 2.1 RAG:检索增强生成....................................................................................................42.2 RAG是构建AI智能体应用的重要组成部分..................................................................6 投资建议与投资标的......................................................................................8 风险提示........................................................................................................8 图表目录 图1:常见的模型幻觉现象...........................................................................................................4图2:RAG技术发展历程.............................................................................................................4图3:RAG的工作流程.................................................................................................................6图4:由LLM驱动的自主智能体系统的架构................................................................................6图5:Assistant API功能..............................................................................................................7图6:Assistant创建页面.............................................................................................................7图7:百度智能云千帆AppBuilder平台框架.................................................................................7图8:AppBuilder界面 ..................................................................................................................7 表1:RAG和微调的比较.............................................................................................................5 一、本周行业观点 上周计算机板块上涨2.27%,与各主要指数基本持平。我们认为,元旦前的持续反弹使得市场情绪有所修复,投资者有望继续围绕数据要素、算力等政策主线做布局并关注业绩确定性品种。 全国一体化算力网加速构建:周五,发改委等五部委正式发布《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,建设联网调度、普惠易用、绿色安全的全国一体化算力网。在算力网加速建设的背景下,算力行业将从现在垂直一体化的方式走向算力提供、算力调度、算力运营等多个产业链环节,其中算力的调度和运营,是将分散的算力基础设施进行连接、实现算力低门槛、普惠化的关键,是未来算力建设最受益的的方向。 多模态大模型进展较快,未来应用空间广阔:我们认为,多模态大模型一方面有利于形成图片、视频等更加生动活泼、更具交互性的应用,从而有助于C端爆款的诞生;另一方面,多模态大模型能真正打通物理世界和数字世界的障壁,用最基础的感知世界能力直接生成操作,实现与物理世界最自然的交互,从而对自动驾驶、人形机器人等具身智能领域的突破提供有力支撑。 数据要素产业催化与落地值得期待:近期,发改委发布《“数据要素×”三年行动计划(2024-2026)》征求意见稿,推动数据要素在制造、农业、商贸、交通、金融、医疗等12个行业场景端落地。而上市公司也在加紧与地方数据集团合作,如银之杰近期与青岛公共数据运营方签订战略合作协议。我们认为,在政策加持下,行业落地有望提速,而投资者将更为关注。 二、本周行业专题:RAG技术在大模型应用中的作用 2.1RAG:检索增强生成 检索增强生成(Retrieval-Augmented Generation,RAG)是一种使用外部知识库来补充大语言模型(LLM)的上下文并生成响应的技术。常见的LLM会接受大量的训练数据,将广泛的常识知识存储在神经网络的权重中。然而,当我们在提示大模型生成训练数据之外的知识时,例如最新知识、特定领域知识等,LLM的输出可能会导致事实不准确,这就是我们常说的模型幻觉。传统的解决方法是通过微调神经网络模型来适应特定领域的专有信息。尽管这种技术很有效,但它属于计算密集型的,并且需要技术专业知识,使其难以灵活地适应不断变化的信息。2020年学者们在知识密集型NLP任务中提出了一种更灵活的技术,称为检索增强生成。简单来说,RAG对于LLM来说就像学生的开卷考试一样。在开卷考试中,学生可以携带参考材料,例如课本或笔记,可以用来查找相关信息来回答问题。 图1:常见的模型幻觉现象 图2:RAG技术发展历程 数据来源:TowardsData Science,东方证券研究所 和传统的针对特定领域微调方法相比,RAG技术要更加简单且高效。微调能够对模型的知识产生显著的改进,但是要耗费大量的计算资源,成本较高,并且对不太常见和更加具体的知识来说微调的效果不明显。而RAG则是基于对外部知识的检索实现的,对于计算资源的要求相比微调显著降低,并且能够通过对外部知识的不断更新来保证LLM的知识更新。 RAG的目的是让LLM的推理能力与事实知识分离。LLM将参数知识——即在训练期间学习到的知识,隐式存储在神经网络的权重中。将非参数知识存储在外部知识源中,例如向量数据库等, 再通过RAG技术进行检索,实现让LLM更加注重自身的推理能力。常见的RAG可以分为检索、增强和生成三个步骤: 1)检索:根据用户请求从外部知识源检索相关上下文。需要先使用Embedding模型将用户查询嵌入到与向量数据库中的外部知识相同的向量空间中,以便与向量数据库中的信息进行比对。通过这种相似性搜索,可以找到向量数据库中最匹配的前k个数据。 2)增强:接着,将用户的查询和检索到的额外信息一起嵌入到一个预设的提示模板中。3)生成:最后,这个经过检索增强的提示内容会被输入到大语言模型(LLM)中,以生成所需的输出。 2.2RAG是构建AI智能体应用的重要组成部分 Agent应用需要长期记忆,RAG技术不可或缺。随着生成式AI技术的不断发展,AIAgent这一应用载体成为了大家关注的热点,有望成为大模型落地应用的最佳形态。OpenAI的应用研究主管Lilian Weng撰写了一篇