您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [国联证券]:电子3月周报(3.25—3.29)大模型不断更新,算力条线仍为重点 - 发现报告

电子3月周报(3.25—3.29)大模型不断更新,算力条线仍为重点

电子设备 2024-03-31 熊军 国联证券 ζޓއއKun
报告封面

腾讯发布BrushNet图像修复模型: 3月11日,腾讯人工智能团队联合香港中文大学研发出了一种名为BrushNet的创新图像修复模型。BrushNet是一个基于扩散模型的即插即用双分支模型,该模型的一个分支专注于提取遮罩图像的像素级特征,另一个分支负责图像生成,这种设计能够将像素级掩码图像特征嵌入任何预训练的扩散模型中,从而实现语义一致且质量增强的图像修复效果,可以实现高质量且自然连贯的重绘。 月之暗面升级Kimi智能助手 3月18日,月之暗面宣布,Kimi智能助手已支持200万字超长无损上下文,并开启产品内测。Kimi智能助手的智能搜索功能,可根据用户的问题,主动去互联网上搜索、分析和总结最相关的多个页面,生成更直接、更准确的答案。Kimi诞生于2023年10月,是国内人工智能创业公司北京月之暗面科技有限公司推出的一款大模型应用。作为全球首个支持200万字上下文的中文大模型,Kimi不仅提升了内容创作和整理的效率,还为小说、剧本创作等领域带来了深化和创新,同时在游戏互动、AI陪伴和专业领域任务执行等方面开辟了新的应用场景。 AI21发布Jamba突破性AI模型 AI21公司推出了名为Jamba的突破性AI模型,这是世界上第一个采用了Mamba结构状态空间模型(SSM)和Transformer混合架构的大规模生产级模型。Jamba能够同时优化内存、吞吐量和性能表现。Mamba结构由卡内基梅隆大学和普林斯顿大学的研究人员提出,主要解决Transformer内存占用大,随着上下文的增长推理速度变慢等问题,在Jamba推出之前,Mamba用例更多停留在学术圈。 投资建议 1)英伟达是全球AI龙头,其GPU技术有望持续引领市场,建议关注英伟达产业链快速发展带来的新机遇以及国内算力芯片在国产替代和自主可控逻辑下的渗透率提升。2)AI需求兴起有望加速服务器平台向更大性能方向的产品替换。PCB行业在这一发展过程中有望呈现产品价值量普遍提升的趋势。3)带宽由存储器决定,存力是限制AI芯片性能的瓶颈之一,建议关注存储产业链。4)高算力AI芯片导入有望加速服务器高功率密度演进趋势,而这对于散热效率提出了更高的要求。5)受益于全球数据量快速增长,光通信产业链建议重点关注。 风险提示:宏观经济增速不及预期,消费电子复苏和IOT产品出货量低于预期风险,AIGC行业发展进程不及预期。 1.大模型不断更新 1.1腾讯发布BrushNet图像修复模型 3月11日,腾讯人工智能团队联合香港中文大学研发出了一种名为BrushNet的创新图像修复模型。BrushNet是一个基于扩散模型的即插即用双分支模型,该模型的一个分支专注于提取遮罩图像的像素级特征,另一个分支负责图像生成,这种设计能够将像素级掩码图像特征嵌入任何预训练的扩散模型中,从而实现语义一致且质量增强的图像修复效果,可以实现高质量且自然连贯的重绘。 图表1:BrushNet创新图像修复模型 BrushNet的核心创新点在于将掩码图像特征和噪声潜在向量分为两个独立分支进行处理。这种分支分离极大地减轻了模型的学习负担,使得模型能够以层级方式精细地融入掩码图像的关键信息。 在模型架构方面,BrushNet首先对掩码进行下采样以匹配潜在向量大小,然后将掩码图像输入VAE编码器对潜在空间的分布进行校准。之后,噪声潜在向量、掩码图像潜在向量和下采样掩码被级联作为BrushNet的输入。从BrushNet提取的特征通过零卷积块层层叠加到预训练的UNet中。在去噪后,生成图像与掩码图像使用模糊掩码进行混合。 图表2:BrushNet的工作原理 研究人员在多个基准测试上评估了BrushNet,结果表明它在图像质量、掩码区域保留和文本一致性等7个关键指标上都显著优于现有模型。 图表3:BrushNet性能表现优异 与以前的图像修复方法相比(如Blended Latent Diffusion、Stable Diffusion Inpainting、HD-Painter、PowerPaint等),BrushNet的图像还原修复能力无论是在风格、内容,还是颜色和提示对齐等方面都表现出了优越的连贯性。 图表4:BrushNet修复能力优异 1.2月之暗面Kimi智能助手 2024年3月18日,月之暗面宣布,Kimi智能助手已支持200万字超长无损上下文,并开启产品内测。Kimi智能助手的智能搜索功能,可根据用户的问题,主动去互联网上搜索、分析和总结最相关的多个页面,生成更直接、更准确的答案。Kimi诞生于2023年10月,是国内人工智能创业公司北京月之暗面科技有限公司推出的一款大模型应用。作为全球首个支持200万字上下文的中文大模型,Kimi不仅提升了内容创作和整理的效率,还为小说、剧本创作等领域带来了深化和创新,同时在游戏互动、AI陪伴和专业领域任务执行等方面开辟了新的应用场景。 图表5:支持200万字上下文的中文大模型Kimi已启动内测 过去要10000小时才能成为专家的领域,现在只需要10分钟,Kimi就能接近任何一个新领域的初级专家水平。用户可以跟Kimi探讨这个领域的问题,让Kimi帮助自己练习专业技能,或者启发新的想法。有了支持200万字无损上下文的Kimi,快速学习任何一个新领域都会变得更加轻松。例如上传一份完整的近百万字中医诊疗手册,Kimi可以针对用户的问题给出诊疗建议;上传几十万字的经典德州扑克长篇教程后,Kimi可以扮演德扑专家为自己提供出牌策略的指导;上传英伟达过去几年的完整财报,Kimi可以成为英伟达财务研究专家,帮用户分析总结英伟达历史上的重要发展节点;上传一个代码仓库里的源代码,可以询问Kimi关于代码库的所有细节,即便是毫无注释的陈年老代码也能快速梳理清晰。 图表6:Kimi可以针对用户的问题给出诊疗建议 1.3AI21之Jamba突破性AI模型 AI21公司推出了名为Jamba的突破性AI模型,这是世界上第一个采用了Mamba结构状态空间模型(SSM)和Transformer混合架构的大规模生产级模型。Jamba能够同时优化内存、吞吐量和性能表现。Mamba结构由卡内基梅隆大学和普林斯顿大学的研究人员提出,主要解决Transformer内存占用大,随着上下文的增长推理速度变慢等问题,在Jamba推出之前,Mamba用例更多停留在学术圈。 图表7:Jamba能够同时优化内存、吞吐量和性能表现 Jamba的发布标志着LLM创新的两个重大里程碑:成功地将Mamba与Transformer架构结合在一起,并将混合SSM-Transformer模型提升到生产级规模和质量。生成式人工智能的起爆点是号称大模型“CPU”的Transformer,但是CPU会一直升级换代,CPU也不会只有一种,Jamba是对Transformer这颗目前最热的大模型CPU的一个重大升级。Jamba在各种基准测试中均优于或与同尺寸级别的其他最先进型号相媲美。 图表8:Jamba在各种基准测试中表现优异 1.4AIGC需要大算力 OpenAI在2018年推出第一代GPT时,所采用的参数量为1.17亿个,此后GPT模型快速迭代,与之相对应的参数量也呈现指数增长,到GPT3,参数量达1750亿,相比于初代GPT增长了近1500倍,预训练数据量更是从5GB提升到了45TB。伴随着参数量和预训练数据量的提升,模型的性能实现了飞跃式提升。 图表9:Chat-GPT模型与参数 图表10:各语言模型训练算力需求对比 算力需求上升且增速变快。据中国信息通信研究院,2021年全球计算设备算力总规模为615EFlops,增速为44%;预计到2030年,全球算力总规模将实现56ZFlops,平均年增速将达到65%。 图表11:算力需求上升且增速变快 图表12:全球计算设备算力总规模(Eflops) 2.投资建议:算力条线仍为重点 2.1算力芯片 英伟达是全球AI龙头,其GPU技术有望持续引领市场,建议关注英伟达产业链快速发展带来的新机遇以及国内算力芯片在国产替代和自主可控逻辑下的渗透率提升。 2.2PCB AI需求兴起有望加速服务器平台向更大性能方向的产品替换。PCB行业在这一发展过程中将呈现产品价值量普遍提升的趋势。 2.3存储芯片 AI芯片需要处理大量并行数据,要求高算力和大带宽,算力越强、每秒处理数据的速度越快,而带宽越大、每秒可访问的数据越多,算力强弱主要由AI芯片决定,带宽由存储器决定,存力是限制AI芯片性能的瓶颈之一。AI芯片需要高带宽、低能耗,同时在不占用面积的情况下可以扩展容量的存储器。 2.4散热 高算力AI芯片导入有望加速服务器高功率密度演进趋势。大数据生成、业务模式变迁强调实时业务的重要性,导致高性能计算集群对于散热的要求提升。随着ChatGPT引爆新一轮人工智能应用的热情,海内外数据中心、云业务厂商纷纷开始推动AI基础设施建设,AI服务器出货量在全部服务器中的占比逐渐提高,而这对于散热效率提出了更高的要求。 2.5光芯片/光模块 受益于全球数据量快速增长,光通信逐渐崛起。在全球信息和数据互联快速成长的背景下,终端产生的数据量每隔几年就实现翻倍增长,当前的基础电子通讯架构渐渐无法满足海量数据的传输需求,光电信息技术逐步崛起。 3.风险提示 宏观经济增速不及预期。伴随全球半导体产业从产能不足、产能扩充到产能过剩的发展循环,半导体行业存在周期性波动。如果未来宏观经济形势发生剧烈波动,导致下游市场对各类芯片需求减少,半导体行业增长势头将逐渐放缓,行业内企业面临行业波动风险。 消费电子复苏和IOT产品出货量低于预期。行业竞争加剧导致产品价格快速下滑的风险。全球通胀处于高位,如果售价过高或性能不达预期,可能抑制总体销量,从而导致供应链市场价格下降、行业利润缩减等状况。 AIGC行业发展进程不及预期。目前AIGC行业还处于起步阶段,未来发展空间以及发展速度还存在不确定性。国内公司由于起步较晚而无法与国际巨头竞争。国外领先公司如OpenAI已有领先行业的产品,并且形成成熟盈利模式,国内企业还处于探索阶段。