您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。[华创证券]:计算机行业重大事项点评:Sota,+Kimi+K2+Thinking开源思考模型发布 - 发现报告

计算机行业重大事项点评:Sota,+Kimi+K2+Thinking开源思考模型发布

AI智能总结
查看更多
计算机行业重大事项点评:Sota,+Kimi+K2+Thinking开源思考模型发布

计算机2025年11月12日 计算机行业重大事项点评 推荐 (维持) Sota:Kimi K2 Thinking开源思考模型发布 事项: 华创证券研究所 11月6日,月之暗面发布Kimi K2 Thinking模型并开源。 证券分析师:吴鸣远邮箱:wumingyuan@hcyjs.com执业编号:S0360523040001 评论: Kimi K2 Thinking在模型架构上实现了多项技术创新,显著提升了推理和工具使用能力。Kimi K2Thinking模型采用混合专家架构,总参数量高达1万亿,每次推理激活320亿参数,模型支持256K的上下文窗口,并采用原生INT4量化技术,使推理速度提升约2倍的同时保持了性能领先。特别值得关注的是,该模型实现了“模型即Agent”的设计理念,能够无需人工干预执行200-300次连续工具调用,在解决复杂问题时能通过多轮“思考→搜索→浏览→思考→编程”的动态循环,将模糊的开放式问题分解为可执行的子任务。这些技术进步源于月之暗面在测试时扩展领域的最新探索,通过同时扩展思考Token和工具调用轮次,使模型在Agent和推理性能上实现了质的飞跃。 联系人:周志浩邮箱:zhouzhihao1@hcyjs.com 行业基本数据 Kimi K2 Thinking在多项权威基准测试中表现出色,甚至超越了主流闭源模型。根据官方发布的评测结果,该模型在人类最后的考试中取得了44.9%的成绩,在测试自主网络浏览能力的BrowseComp上达到60.2%,这些成绩均刷新了纪录,超越了GPT-5和Claude Sonnet 4.5等闭源模型。在专业领域能力方面,该模型在SWE-Multilingual和LiveCodeBench等编程基准测试中表现优异,能够处理HTML、React等前端任务,将创意转化为功能齐全的产品。此外,Artificial Analysis在τ²-Bench Telecom智能体工具使用基准测试中给予Kimi K2 Thinking 93%的评分,相比之前广受好评的K2 Instruct有了大幅提升,显示出其在智能体场景下的卓越能力。 %1M6M12M绝对表现-3.6%20.9%14.7%相对表现-4.4%1.3%0.8% Kimi K2 Thinking以极低的训练成本实现了顶尖性能,展现出卓越的成本效益。据CNBC转引自机器之心,该模型的训练成本仅为460万美元,与OpenAI投入形成鲜明对比。在定价策略上,Kimi K2 Thinking的API价格具有明显竞争力:缓存命中每百万tokens仅0.15美元,缓存未命中为0.6美元,输出为2.5美元,这一价格远低于GPT-5的1.25美元输入和10美元输出的定价。这种低成本高性能的特点部分源于其采用的量化感知训练和INT4纯权重量化技术,不仅提升了生成速度,还降低了对硬件的要求,使模型对国产加速计算芯片更加友好。该模型采用最宽松的MIT协议开源,允许免费商业使用,但对超大规模部署有署名要求,这大大降低了企业和开发者使用前沿AI技术的门槛。 相关研究报告 《计算机行业重大事项点评:太空AI发展提速,天基智能有望迎来新业态》2025-11-10《计算机行业2025年三季报综述:龙头复苏,计 算机或迎周期拐点》2025-11-03《计算机行业重大事项点评:DeepSeek-OCR发布,重塑大语言模式范式》2025-10-23 Kimi领衔开启国产大模型商业化新阶段。Kimi的会员体系通过差异化的定价与服务设计,旨在探索大模型在C端市场的可持续商业化路径。该体系的核心是对高成本功能如“深度研究”和“OK Computer”进行使用次数限制,这直接源于其高昂的单次运行成本。这一分层策略显示了Kimi在平衡用户体验与高昂算力成本方面的努力,或是其实现商业化目标的关键一步。 投资建议:建议关注AI细分景气方向: 国产算力:寒武纪、海光信息、阿里巴巴、中科曙光、景嘉微、龙芯中科等。 企业服务:1)办公:金山办公、合合信息、福昕软件;2)多模态:海康威视、快手、三六零、虹软科技;3)ERP:金蝶国际、用友网络、聚水潭;4)OA:泛微网络、致远互联;5)编程:卓易信息;6)营销:迈富时、明源云。 应用场景:1)金融:大智慧、同花顺、恒生电子、第四范式、宇信科技、京北方、中科金财;2)教育:科大讯飞、视源股份、新开普、佳发教育;3)法律:华宇软件、金桥信息;4)医疗:阿里健康、卫宁健康、讯飞医疗科技、晶泰控股;5)电商:焦点科技;6)安全:深信服;7)工业:华大九天、中控技术、中望软件、索辰科技;8)军用:中科星图、太极股份、能科科技等。 风险提示:技术进展不及预期;模型落地不及预期;商业落地不及预期。 目录 一、Kimi K2 Thinking:技术架构实现突破..................................................................4二、Kimi K2 Thinking:多项权威测试成绩表现卓越..................................................4三、Kimi K2 Thinking:成本优势显著..........................................................................5四、Kimi K2 Thinking:加速Agent商业化落地.........................................................6五、Kimi:领衔开启国产大模型商业化新阶段............................................................7六、投资建议.....................................................................................................................7七、风险提示.....................................................................................................................8 图表目录 图表1 DeepSeek R1与Kimi K2 Thinking对比...................................................................4图表2 Kimi K2 Thinking多项权威基准测试成绩..............................................................5图表3 Kimi K2 Thinkingτ²-Bench Telecom成绩.............................................................5图表4 Kimi K2 Thinking与GPT-5价格对比......................................................................6图表5 Kimi K2 Thinking通过23次推理和工具调用成功解决博士级数学问题.............6图表6 Kimi付费会员方案...................................................................................................7 一、Kimi K2 Thinking:技术架构实现突破 Kimi K2 Thinking在模型架构上实现了多项技术创新,显著提升了推理和工具使用能力。Kimi K2 Thinking模型采用混合专家架构,总参数量高达1万亿,每次推理激活320亿参数,模型支持256K的上下文窗口,并采用原生INT4量化技术,使推理速度提升约2倍的同时保持了性能领先。特别值得关注的是,该模型实现了“模型即Agent”的设计理念,能够无需人工干预执行200-300次连续工具调用,在解决复杂问题时能通过多轮“思考→搜索→浏览→思考→编程”的动态循环,将模糊的开放式问题分解为可执行的子任务。这些技术进步源于月之暗面在测试时扩展领域的最新探索,通过同时扩展思考Token和工具调用轮次,使模型在Agent和推理性能上实现了质的飞跃。 资料来源:量子位微信公众号 二、Kimi K2 Thinking:多项权威测试成绩表现卓越 Kimi K2 Thinking在多项权威基准测试中表现出色,甚至超越了主流闭源模型。根据官方发布的评测结果,该模型在人类最后的考试中取得了44.9%的成绩,在测试自主网络浏览能力的BrowseComp上达到60.2%,这些成绩均刷新了纪录,超越了GPT-5和ClaudeSonnet 4.5等闭源模型。 资料来源:月之暗面Kimi微信公众号 Kimi K2 Thinking在专项领域测试中表现优异。在专业领域能力方面,该模型在SWE-Multilingual和LiveCodeBench等编程基准测试中表现优异,能够处理HTML、React等前端任务,将创意转化为功能齐全的产品。此外,Artificial Analysis在τ²-Bench Telecom智能体工具使用基准测试中给予Kimi K2 Thinking 93%的评分,相比之前广受好评的K2Instruct有了大幅提升,显示出其在智能体场景下的卓越能力。 资料来源:量子位微信公众号、华创证券 三、Kimi K2 Thinking:成本优势显著 Kimi K2 Thinking以极低的训练成本实现了顶尖性能,展现出卓越的成本效益。据CNBC转引自机器之心,该模型的训练成本仅为460万美元,与OpenAI投入形成鲜明对比。在定价策略上,Kimi K2 Thinking的API价格具有明显竞争力:缓存命中每百万tokens仅0.15美元,缓存未命中为0.6美元,输出为2.5美元,这一价格远低于GPT-5的1.25美元输入和10美元输出的定价。这种低成本高性能的特点部分源于其采用的量化感知训练 和INT4纯权重量化技术,不仅提升了生成速度,还降低了对硬件的要求,使模型对国产加速计算芯片更加友好。这种“高性价比”技术路径正吸引越来越多海外企业关注,为中国AI公司在全球市场竞争中创造了独特优势。 四、Kimi K2 Thinking:加速Agent商业化落地 Kimi K2 Thinking采用最宽松的MIT协议开源。Kimi K2 Thinking允许免费商业使用,但对超大规模部署有署名要求,这大大降低了企业和开发者使用前沿AI技术的门槛。Kimi K2 Thinking的成功展示了测试时扩展技术的潜力,通过长链条的思考和工具调用,使AI系统能够解决更加复杂的实际问题,为实现真正的L3级Agent提供了可行的技术路径。这一发展可能加速AI技术在各行业的普及应用,或推动全球AI竞争从单纯的模型规模竞赛转向效率与实用性并重的新阶段。 资料来源:量子位微信公众号 五、Kimi:领衔开启国产大模型商业化新阶段 Kimi的会员体系通过差异化的定价与服务设计,旨在探索大模型在C端市场的可持续商业化路径。Kimi的会员体系通过差异化的定价与服务设计,旨在探索大模型在C端市场的可持续商业化路径。其付费会员主要分为三档:免费版提供有限的功能使用次数;49元/月的Andante版提供4倍提速的K2 Turbo并扩展K2系列模型的使用额度以及深度研究与OK Computer使用次数,并有4倍速生成且高峰期优先使用的PPT助手