您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[国盛证券]:通义千问主力模型降价,助力AI应用快速推开 - 发现报告

通义千问主力模型降价,助力AI应用快速推开

信息技术2024-05-23宋嘉吉、孙爽国盛证券H***
通义千问主力模型降价,助力AI应用快速推开

事件:5月21日,阿里云宣布下调通义千问商业化模型和开源模型面向开发者的API调用价格,其中,通义千问GPT-4级主力模型Qwen-Long输入价格从0.02元/千tokens降至0.5元/百万tokens,直降97%。 此前,5月9日,阿里通义发布1100亿参数开源模型Qwen1.5-110B,根据阿里云,该模型在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首。 “降价+开源”,通义千问组合拳“拳拳到肉”。“降价+开源”已经逐渐成为全球大模型厂商的共识,这有助于解决AI应用开发者“大模型API价格太贵,开源模型质量不够高”两大痛点,驱动AI应用全面开花。 大模型开启推理端降价潮。通义千问并非首个对开发者降价的大模型,5月以来,多个大模型推出低价产品或降价:1)5月6日,幻方量化宣布旗下深度求索(DeepSeek)正式开源第二代MoE模型DeepSeek-V2,API定价为:输入1元/百万tokens、输出2元/百万tokens,价格为GPT-4-Turbo的近百分之一;2)5月11日,智谱宣布其个人版GLM-3Turbo模型产品调用价格从5元/百万tokens降低至1元/百万tokens;3)5月13日,OpenAI推出GPT4o,它在英语文本和代码上的GPT-4Turbo性能相当,向全部用户免费,API调用速度比GPT-4快两倍,但价格减半;4)5月15日,豆包主力模型的推理输入定价只有0.0008元/千Tokens;5)5月21日,百度智能云宣布其文心大模型的两大主力模型ERNIE Speed和ERNIE Lite全面免费;6)5月22日,科大讯飞宣布讯飞星火Lite API永久免费开放。我们认为,大模型API纷纷降价,可能源于大模型推理技术的进步、推理成本的下降,客观上给了开发者更多选择,有助于开发者增加对AI大模型的开发。 推出多尺寸与多模态模型,阿里通义助力多场景应用开发。5月9日,阿里通义推出参数规模横跨5亿到1100亿的八款大语言模型,小尺寸模型如0.5B、1.8B、4B、7B、14B,可在手机、PC等端侧设备部署;大尺寸模型如72B、110B能支持企业级和科研级的应用;中等尺寸如32B试图在性能、效率和内存占用之间找到最具性价比的平衡点。此外,通义还开源了视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。我们认为,大模型在端侧的应用也不容忽视。 建议关注:算力板块:1)光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技;2)算力调优/调度/租赁:恒为科技、中科曙光、中国移动、中国联通、中国电信;3)算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪;4)液冷:英维克;5)边缘算力承载平台:美格智能、广和通、移远通信。 数据要素:1)运营商:中国电信、中国移动、中国联通;2)数据可视化:浩瀚深度、恒为科技、中新赛克。 风险提示:大模型商业化进度不及预期,大模型技术发展不及预期。