您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[太平洋证券]:计算机行业周报:多模态大模型持续迭代,宝马搭载国产AI模型 - 发现报告

计算机行业周报:多模态大模型持续迭代,宝马搭载国产AI模型

信息技术2025-03-30曹佩、王景宜太平洋证券J***
AI智能总结
查看更多
计算机行业周报:多模态大模型持续迭代,宝马搭载国产AI模型

多模态大模型持续迭代,宝马搭载国产AI模型 报告摘要 GPT-4o上线多模态生图功能,实用性大幅提升。OpenAI发布GPT-4o原生多模态图像生成功能,支持一分钟内生成逼真图像,取代DALL-E 3成为ChatGPT默认图像引擎。新功能优势包括精准渲染文字、执行复杂指令、保持视觉一致性和支持多种艺术风格,已向大部分用户开放。GPT-4o生图在多个领域展现出强大的应用潜力,在海报制作、插画绘制、UI设计、电商宣传图绘制等场景中表现出较高水平。由于使用GPT-4o生图的需求过高,OpenAI创始人Sam Altman表示,目前GPU负荷过大,在努力提高效率的同时,将暂时对ChatGPT生成图片的功能引入一些速率限制,并将推迟向免费用户开放新功能的时间。 ◼子行业评级 阿里发布多模态大模型Qwen2.5-Omni,支持语音、视频交互。阿里发布多模态大模型Qwen2.5-Omni,采用Apache 2.0许可证开源7B参数版本,支持文本、图像、音频和视频多模态输入输出。该模型创新设计Thinker-Talker架构实现实时语音视频聊天,并提出TMRoPE技术同步视频与音频时间戳,适合手机等终端设备部署。模型性能超越同等大小的单模态模型,在OmniBench等多模态任务中达到领先水平,语音生成展现较好稳健性和自然性。 计算机设备无评级计算机软件中性IT服务无评级云服务无评级产业互联网无评级 ◼推荐公司及评级 宝马接入通义系列模型赋能智能座舱和智能出行交互。3月26日,宝马集团宣布与阿里巴巴集团深化战略合作,将基于通义系列模型联合开发AI引擎,应用于中国市场的宝马新世代系列车型。此次合作主要聚焦在AI大模型、智能语音交互等前沿技术领域。基于通义系列模型和斑马元神AI,全新BMW智能个人助理采用宝马与阿里共同开发的AI引擎,计划搭载于中国生产的BMW新世代系列车型上,预计2026年在中国市场交付。双方合作升级的智能座舱及智能出行交互场景,将于今年4月首次亮相上海车展。 相关研究报告 <<收入高速增长,拓展低空产品>>--2025-03-25<<算力产品更新,为AI应用发展提供有力保障>>--2025-03-24<<WPS 365高速增长,AI赋能打开成长空间>>--2025-03-23 投资建议:继续看好AI应用的表现,以及国产AI的发展。重点推荐金山办公(办公)、用友网络(企业软件)、赛意信息(工业)、熵基科技(零售)等,国产AI重点推荐海光信息、神州数码、智微智能、联想集团等。 证券分析师:曹佩电话:E-MAIL:caopeisz@tpyzq.com分析师登记编号:S1190520080001 风险提示:AI技术发展不及预期,应用落地不及预期,算力需求不及预期,市场竞争加剧。 证券分析师:王景宜电话:E-MAIL:wangjy@tpyzq.com分析师登记编号:S1190523090002吧 目录 一、行业热点事件回顾..............................................................4(一) GPT-4o上线多模态生图功能,实用性大幅提升.......................................4(二)阿里发布多模态大模型Qwen2.5-Omni,支持语音、视频交互............................5(三) DeepSeek V3小版本更新,数学、代码类能力超过GPT-4.5.............................6(四)宝马接入通义大模型.............................................................7二、行情回顾......................................................................7三、重要公司公告..................................................................8四、投资建议......................................................................9五、风险提示......................................................................9 图表目录 图表1:GPT-4o能够将准确的将文字嵌入图片中...........................................4图表2:GPT-4o参考输入的图片元素设计图片并能够随意替换背景...........................5图表3:Qwen2.5-Omni支持文本、语音、图像、视频多模态交互.............................6图表4:新版V3模型的百科知识、数学和代码任务表现均有提升...........................7图表5:申万一级行业周涨幅(3.24-3.28)..............................................8图表6:申万计算机指数和沪深300指数年初至今涨跌幅(截至3.28).......................8图表7:本周计算机行业涨跌幅前五.....................................................8 一、行业热点事件回顾 (一)GPT-4o上线多模态生图功能,实用性大幅提升 3月26日,OpenAI官网上线GPT-4o原生多模态图像生成功能,支持一分钟内生成逼真图像,取代DALL-E 3成为ChatGPT默认图像引擎。 据OpenAI官方说明,GPT-4o在多个方面相较于过去的模型进行了改进: ⚫更好的文本集成:与过去那些难以生成清晰、恰当位置文字的AI模型不同,GPT-4o现在可以准确地将文字嵌入图像中;⚫增强的上下文理解:GPT-4o通过利用聊天历史,允许用户在互动中不断细化图像,并保持多次生成之间的一致性;⚫改进的多对象绑定:相比传统模型仅能处理5-8个对象,GPT-4o可同时绑定10-20个对象特征,严格遵循复杂指令(如生成含16种网格物体的图像);⚫多样化风格适应:该模型可以生成或将图像转化为多种风格,支持从手绘草图到高清写实风格的转换。 GPT-4o生图在多个领域展现出强大的应用潜力。在设计领域,能快速生成各种风格的图像,包括模仿吉卜力风格等,可用于产品设计、海报制作、插画绘制等,还能帮助设计师快速创建概念草图和进行创意探索,节省时间和精力。在电商领域,能方便地制作商品图,替换模特手中的产品、添加logo等,有助于降低电商企业的设计成本。在游戏开发和影视特效制作中,支持3D模型重建与渲染,可生成游戏角色、场景和影视特效镜头等。此外,在室内设计、UI设计、信息图表制作等方面也有出色表现。 生图功能使用量巨大,带来算力需求激增。OpenAI创始人Sam Altman表示,ChatGPT的文生图应用需求过高,我们的GPU“冒烟了”(melting,也有融化之意),在努力提高效率的同时,将暂时对ChatGPT生成图片的功能引入一些速率限制,并将推迟向免费用户开放新功能的时间。 (二)阿里发布多模态大模型Qwen2.5-Omni,支持语音、视频交互 3月27日,阿里发布多模态大模型Qwen2.5-Omni,采用Apache 2.0许可证开源7B参数版本,专为全面的多模式感知设计,支持文本、图像、音频和视频多模态输入输出。用户可以通过语音聊天或视频聊天的方式与Qwen进行交互,手机等终端智能硬件可部署运行。 Qwen2.5-Omni具有以下特点:1)Omni创新架构:团队提出了Thinker-Talker架构,这是一个端到端的多模态模型,旨在感知包括文本、图像、音频和视频在内的多种模态,同时以流式方式生成文本和自然语音响应。此外,团队还提出了一种名为TMRoPE(Time-aligned MultimodalRoPE)的新型位置嵌入,用于同步视频输入与音频的时间戳;2)实时语音和视频聊天:该架构专为完全实时交互而设计,支持分块输入和即时输出;3)自然且稳健的语音生成:在语音生成方面, Qwen2.5-Omni超越了许多现有的流式和非流式替代方案,展现出卓越的稳健性和自然性;4)多模态性能强劲:在与同样大小的单模态模型进行基准测试时,Qwen2.5-Omni在所有模态上均展现出卓越的性能。Qwen2.5-Omni在音频能力上超越了同样大小的Qwen2-Audio,并且达到了与Qwen2.5-VL-7B相当的性能;5)出色的端到端语音指令遵循能力:Qwen2.5-Omni在端到端语音指令遵循方面的表现可与文本输入的有效性相媲美,这一点在MMLU和GSM8K等基准测试中得到了证明。 (三)DeepSeek V3小版本更新,数学、代码类能力超过GPT-4.5 3月25日,深度求索宣布DeepSeek V3模型已完成小版本升级,目前版本号DeepSeek-V3-0324。新版DeepSeekV3主要有以下能力提升:1)推理任务表现提高:V3模型借鉴DeepSeek-R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。2)前端开发能力增强:在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。3)中文写作升级:在中文写作任务方面,新版V3模型基于R1的写作水平进行了进一步优化,同时特别提升了中长篇文本创作的内容质量。4)中文搜索能力优化:新版V3模型可以在联网搜索场景下,对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。此外,新版V3模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。 (四)宝马接入通义大模型 宝马接入通义系列模型赋能智能座舱和智能出行交互。3月26日,宝马集团宣布与阿里巴巴集团深化战略合作,将基于通义系列模型联合开发AI引擎,应用于中国市场的宝马新世代系列车型。此次合作主要聚焦在AI大模型、智能语音交互等前沿技术领域。基于通义系列模型和斑马元神AI,全新BMW智能个人助理采用宝马与阿里共同开发的AI引擎,计划搭载于中国生产的BMW新世代系列车型上,预计2026年在中国市场交付。双方合作升级的智能座舱及智能出行交互场景,将于今年4月首次亮相上海车展。 二、行情回顾 本周申万计算机行业指数下跌4.89%,在31个申万一级行业中排名第31位。年初至本周五(3月28日),计算机行业累计上涨7.89%,跑赢沪深300指数8.39pct。 资料来源:iFinD,太平洋证券整理 本周计算机行业涨幅前五的公司分别为安硕信息(+12.17%)、*ST迪威(+10.86%)、博通股份(+9.52%)、锐明技术(+5.49%)、新大陆(+5.22%);跌幅前五的公司分别为首都在线(-26.11%)、浙大网新(-24.95%)、神州信息(-24.44%)、依米康(-20.78%)、大位科技(-20.07%)。 三、重要公司公告 浪潮信息:2024年营业收入为1147.67亿元,同比增长74.24%;净利润为22.92亿元,同比增长28.55%。公司拟向全体股东每10股派发现金红利1.15元(含税),送红股0股(含税),不以公积金转增股本。 道通科技:2024年营业收入39.32亿元,同比增长20.95%;归母净利润6.41亿元,同比增长257.59%;基本每股收益盈利1.45元,去年同期为0.40元。公司拟向全体股东每10股派发现金红利人民币5.00元,每10股转增4.90股,不送红股。 神州数码:2024年营业收入1281.66亿