AI智能总结
AI大模型持续更新迭代,大模型产业生态不断完善。Meta发布最新开源大模型Llama 3,共有80亿和700亿参数两种版本,并在测试表现中都得到了显著提升。百度举办Create 2024 AI开发者大会,发布三款AI开发者工具,持续打造AI开发者生态。同时,我国大模型渗透率持续加速,文心一言用户数量已突破2亿,获得翻倍式增长。我们认为,随着Meta、xAI等海外厂商持续对开源大模型的升级,百度、华为等我国头部互联网厂商对AI的持续布局,为AI应用开辟了更广阔的发展空间,有望加速拓宽AI开发平台的应用场景,新产品新应用有望加速落地。 联想举办2024创新科技大会,AI向PC等端侧应用演进。4月18日,联想举办2024创新科技大会。大会全面展现了公司基于混合式人工智能判断的核心主张、战略图景和最新技术成果,重磅发布了包括内置个人智能体“联想小天”的AI PC系列及多项产品。随着生成式AI技术不断迭代演进以及由云端延伸至边缘侧,AI技术与PC等终端设备紧密结合和商业化落地成为大势所趋。终端和云端将协同工作,在适当的场景和时间下分配AI计算的工作负载,以提供更好的体验,并高效利用资源。在一些场景下,计算将主要以终端为中心,在必要时向云端分流任务。伴随AI持续向端侧应用演进,海内外各厂对AI端侧的不断布局,未来将会形成算力、模型、应用多层开放的繁荣生态。 全球6G技术大会召开,AI+6G将催生新应用场景。4月16-18日期间,全球6G技术大会召开,大会集聚全球6G领域顶尖学者和行业专家,围绕6G关键技术、通信AI融合、未来应用等开展深度交流,全面展现6G研发最新成果,共同推进前沿创新与国际合作。大会指出6G的应用将扩展到卫星通信和低空无人机领域,支持人工智能的下沉,推动智能终端、算力、智能网联车等领域的创新。随着人工智能的产业应用加速,6G将催生多个万亿元规模产业,智能网联车、卫星互联网和低空无人机等都将是一个新的应用场景。 我们认为,我国持续对6G技术的研发以及AI算力的不断投入,智能网联车、卫星互联网及低空经济等新应用场景有望持续开辟,我们持续看好算力及相关产业链投资机会。 市场回顾:本周(2024年4月15日-2024年4月19日,下同)通信(申万)指数下跌0.67%;沪深300指数上涨1.89%,行业跑输大盘2.57pp。 重点推荐(已覆盖):中国移动、中国电信、中国联通、中兴通讯、紫光股份、工业富联、共进股份、三旺通信、中际旭创、天孚通信、美格智能、鼎通科技、瑞可达、深南电路、崇达技术、腾景科技、经纬恒润、德赛西威、中科创达、四维图新、和而泰、拓邦股份、朗特智能、淳中科技、千方科技。 建议关注的标的:运营商/国资云:中国移动、中国电信、中国联通、深桑达A、易华录;主设备商&服务器:浪潮信息、紫光股份、星网锐捷、中科曙光; 光模块:新易盛、华工科技、剑桥科技、博创科技;光器件:太辰光;光芯片:仕佳光子、源杰科技;IDC:润建股份、英维克、佳力图、申菱环境、数据港;卫星互联网:海能达、海格通信、中科星图;PCB:兴森科技、沪电股份、深南电路、世运电路、崇达技术;连接器:鼎通科技,瑞可达;掩模版:路维光电、清溢光电;线缆:新亚电子;算力模组:美格智能、移远通信、广和通;工业互联网:工业富联、三旺通信;汽车智能化:经纬恒润、德赛西威、均胜电子、朗特智能、和而泰、拓邦股份、中科创达、光庭信息; MR产业链 :蓝特科技、兆威机电、领益制造、鹏鼎控股、长盈精密。 风险提示:市场竞争加剧风险;关键技术突破不及预期风险;下游需求不及预期;原材料价格波动风险。 1.近一周行情表现 本周(2024年4月15日-2024年4月19日,下同)通信(申万)指数下跌0.67%; 沪深300指数上涨1.89%,行业跑输大盘2.57pp。 图表1:本周通信行业涨跌幅前5个股 图表2:本周通信行业涨跌幅后5个股 在TMT各子板块:电子、通信、传媒以及计算机中,通信周涨幅居第一位。 图表3:TMT各子行业涨跌幅对比(截至2024年4月19日) 通信板块最新估值(市盈率为历史TTM_整体法,并剔除负值)为20.03倍,位于TMT各行业第四位。 图表4:TMT各子行业历史市盈率比较(各年份数据取自当年12月31日) 2.本周专题解析 2.1AI大模型持续更新迭代,大模型产业生态不断完善 2.1.1 Meta发布最新开源大模型Llama 3,引领AI产业深化发展 4月18日,Meta发布最新开源大模型Llama 3,共有80亿和700亿参数两种版本,公司称是最强大的开源大语言模型。新一代Llama在广泛的行业基准测试中展示了最先进的性能,并提供了新的功能,包括改进的推理能力。Meta希望通过处理开发人员的反馈意见来提高Llama 3的整体实用性,同时继续在部署大语言模型方面发挥领导作用。并表示该版本是Llama 3模型系列中的第一个LLM,未来要将Llama 3成为多语言、多模态、具有更长上下文的模型,并继续提高核心功能的整体性能,如推理和代码。 Llama 3 70亿参数版击败了Gemini 1.5 Pro,同时优于Claude 3系列的Sonnet模型,展现出更灵活易用的特点。 图表5:Meta Llama 3模型表现 Meta在开发Llama 3的过程中设计了一套更高质量的人类评估标准,其中包括1800个测试项、12个主要应用场景,囊括了角色扮演、逻辑推理、开放及封闭式问题等多项标准。基于这一评估标准,相较于Claude Sonnet、Mistral Medium以及GPT-3.5模型,Meta Llama3的提升更为显著。 图表6:Llama 3在人类评价测试中表现 同时Llama 3预训练模型与Mistral、Gemma以及Gemini相比,在测试中表现都更为优秀。 图表7:MetaLlama 3预训练模型表现 Meta Llama 3主要围绕四大核心要素: 模型架构:与前一代Llama2相比,Llama3进行了关键性能改进。首先,Llama3采用128K token的分词器,以提高编码语言效率;其次,8B和70B规模模型采用GQA技术,最多可以处理8192个Token序列,并且通过掩码技术规范模型的自注意力机制,以防跨越不同文档界限。 训练数据:与前一代Llama2相比,Llama3的训练集规模扩大了7倍、代码数据量增加了4倍,在预训练数据投入了更多资源,基于超过15T的Token,覆盖了超30种语言。并且,训练过程中,为保障优质数据,还打造了包含应用启发式过滤器、NSFW内容过滤、语义去重技术和文本质量分类器等一系列高效数据过滤流程。 训练规模:训练数据的提升使训练规模也需要跟上节奏。为挑选出最佳的数据处理方案,Llama 3制定了一套详尽的Scaling Laws以确保多场景下的能力表现。为训练目前为止最大规格的Llama 3模型,Meta采用了三种并行技术:数据并行、模型并行和流水线并行。以此达到在16K的GPU上同时训练,最高效可以实现每个GPU超400TFLOPS的计算利用率。总体而言,相较Llama 2,Llama 3的训练效率提升了大约三倍。 指令微调:为了提高聊天应用场景的效能,Llama 3还通过指令微调的办法完成创新性改进。关于Llama 3的训练策略融合了监督式微调、拒绝抽样、近端策略优化和直接策略优化等多种技术,以此提升Llama 3在逻辑推理和编程任务上的表现。 此外Meta表示公司目前最大的模型参数,已经超过4000亿,但还在训练中。未来几个月中将发布多种具有新功能的模型,包括多模态、多语言对话能力、更长的上下文窗口以及更强的整体能力。 图表8:Meta Llama 3 400亿参数模型 1.1.2百度推出AI开发工具,持续打造开发者生态 4月16日,百度举办Create 2024 AI开发者大会,据C114通信网数据,文心一言在2023年底突破1亿用户,为国内第一。截至大会时间,已突破2亿,获得了翻倍式增长,显示出大模型的渗透率正在加速。此外,文心一言API日均调用量突破2亿、服务客户数达到8.5万、利用千帆平台开发的AI原生应用数超过了19万。同时,与2023年相比,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。客户原来一天调用1万次,同样成本现在一天可以调用100万次。 图表9:Create 2024百度AI开发者大会 百度在此前发布了Speed、Lite、Tiny三个轻量模型,并升级了文心智能体平台,截至2024年4月16日,已有3万多个智能体被创建、5万多名开发者和上万家企业入驻。 据C114通信网,公司表示基于大模型开发AI原生应用,主要有三大要点: 1.MoE:未来大型的AI原生应用基本都是MoE的,即大小模型的混用,不依赖一个模型来解决所有问题; 2.小模型:推理成本低,响应速度快,在一些特定场景中,经过精调后的小模型,使用效果可以媲美大模型;三是智能体。 3.智能体机制:包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。随着智能体能力的提升,会不断催生出大量新应用。 百度表示所有大模型用户都可以成为大模型的开发者,自然语言将成为新的通用编程语言。从我国AI开发平台产业链来看,据《2023年中国AI开发平台市场报告》,上游为支撑AI开发平台运行的基础设施组成,中游为提供AI开发平台服务的云计算厂商和人工智能企业,下游为使用AI开发平台的企业级和消费级用户。 图表10:我国AI开发平台行业产业链图谱 此外,为帮助创业公司和个人成为开发者,百度推出了三款AI开发工具: 智能体开发工具AgentBuilder:商家无需编程,通过类似提示词的信息输入,和简单的几步操作调优,就能迅速生成一个专属的智能体,成为7X24小时在线的“金牌业务员”。 AI原生应用开发工具AppBuilder:提前封装和预置了开发AI原生应用所需的各种组件和框架,大幅降低开发门槛。 各种尺寸的模型定制工具ModelBuilder:可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT。 图表11:百度发布AppBuilder工具 我们认为,随着Meta、xAI等海外厂商持续对开源大模型的升级,百度、华为等我国头部互联网厂商对AI的持续布局,为AI应用开辟了更广阔的发展空间,有望加速拓宽AI开发平台的应用场景,新产品新应用有望加速落地,我们持续看好相关产业链投资机会。 2.2联想举办2024创新科技大会,AI向PC等端侧应用演进 4月18日,据C114通信网,联想举办2024创新科技大会。大会全面展现了公司基于混合式人工智能判断的核心主张、战略图景和最新技术成果,重磅发布了内置个人智能体“联想小天”的AI PC系列产品,同时还发布了企业智能体以及联想万全异构智算平台等创新应用与解决方案。 1.AIPC:内置个人大模型与用户自然交互的智能体、本地异构算力(CPU/GPU/NPU)、个人知识库、开放人工智能应用生态、个人数据和隐私安全保护。可提供个性化服务和设备控制,保障用户隐私和数据安全。 2.联想小天智能体:内置本地的天禧大模型驱动,通过自然交互,在工作、学习和生活等诸多场景中带来全新AI体验。 3.混合式AI框架:包含大模型与AI智能体,联想将一方面从端侧优化、场景优化、类脑智能等维度增强大模型的基础能力,另一方面开发基于大模型的智能体技术,聚焦开发关键技术和个人及企业智能体应用,真正解决应用场景的问题。 图表12:联想混合式AI框架 终端侧AI能力是赋能混合AI并让生成式AI实现全球规模化扩展的关键。在生成式AI出现之前,AI处理便持续向边缘转移,越来越多的AI推理工作负载在PC、手机、可穿戴设备、学习机、办公本、音箱及各种智能配件等其他边缘终端上