行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

KIMIK2-最前瞻的研究！OnlineRL新范式，大模型的又一DeekSeek时刻

2025-07-17 未知机构张彦男 Tim

量的合同数据方面表现出色。K1K2模型在技术上实现了两个重大创新。首先，它的优化器设计能够有效处理大规模MOE模型中的梯度溢出问题。其次，它采用了半在线强化学习的方式，利用融合了多种工具和场景数据的模型，在奖励模型基础上通过疑似推理定型并选择最优结果，多次推理后生成高质量的合同数据。基于这些数据，模型能够进行post确定和参数调整，逐步迭代并实现类似O3模型的能力提升。问：K1K2模型对于后续AI发展的意义是什么？答：K1K2模型不仅展示了范式的创新，为后续模型的迭代打开了新的空间，而且其作为一个基础模型，仅在其免费训练版本中就已展现出超越预期的能力。随着强化学习的进一步发展，预计K1K2后续的转化学习将带来更强的综合能力，可能对标甚至超越国内外下一代模型。从投资角度来看，K1K2将带动云计算、推展基础软硬件配套设施以及实施咨询类服务等行业快速发展，形成从短链到长链的应用链条，其中涉及的公司如深信服、阿里云、亚信科技等都将从中受益。

点击免费查看完整报告

KIMIK2-最前瞻的研究！OnlineRL新范式，大模型的又一DeekSeek时刻

你可能感兴趣

【民生计算机】科大讯飞涨停！市场最悲观时刻明确提示【科大讯飞】基于全国产化算力底座“飞星一号”平台的星火大模型V3.5预期差星火大模型3.5即将重磅发布

大模型赋能行业研究新范式20240912

OpenAI o1大模型开启新范式|国君热点研究

非银金融行业研究深度报告：投研范式的革新-当大模型遇到大资管

大模型驱动的研发新范式

基于知识增强DeepSeek大模型的医药数字化营销新范式

面向大模型的新编程范式

扩散大语言模型（dLLM）开启并行新范式，大模型领域的重要技术路线试水

通信：“合成数据+强化学习”：大模型进化的新范式

大模型技术深度赋能保险行业白皮书（2025）——智能体驱动的保险新范式