登录
注册
个人信息
我的订单
我的报告豆
我的优惠券
我的笔记
我的阅读
我的收藏
我的下载
我的上传
我的订阅
在线客服
退出登录
回到首页
AI
搜索
发现报告
发现数据
发现专题
专题报告
专题百科
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
seedance2.0
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
会议纪要
/
报告详情
KimiK2有潜力的开源基模重视AI应用机遇中信证券计算机
2025-07-18
未知机构
EMJENNNY
核心观点
:月之暗面开源的新一代基座模型Kimi K2具有显著潜力,在编程和逻辑方向的多项基准测试中达到SOTA能力,接近Claude 4 Opus水平,同时具备优秀的推理成本控制,适合用于Agent开发。
关键数据
:
参数规模:1万亿参数,单次激活参数320亿,上下文长度128k。
基准测试表现:SWE-bench Verified/LiveCodeBench/AIME 2025/GPQA-diamond等测试集成绩达到Claude 4 Opus相同水平。
成本优势:API输入(命中)/输入(未命中)/输出定价分别为1/4/16元每百万Tokens,较Claude 4 sonnet有约80%的成本优势。
技术创新
:
数据合成:通过智能体数据合成提升工具使用能力和Agent能力,构建工具模拟器环境进行“练习”。
优化器:MuonClip优化器提升训练稳定性,降低计算资源消耗。
模型架构与优化
:
基础架构:继承DeepSeek-V3模型架构,将专家数从256提升至384,降低MLA头数以优化成本控制。
未来展望:若开源智能体数据合成的工程方案,将进一步提升基座模型逻辑能力;加入思维链能力后训练的模型值得期待。
亿,亿,思路相似,在预训练和后训个,同时降低了另一创新
你可能感兴趣
计算机行业周报:AI应用潜力持续释放,重视B端AI+企业服务投资机会
商贸零售
安信证券
2023-06-26
3月思路AIAgent时代软件机遇再讨论丨中信证券计算机大模
商贸零售
未知机构
2026-03-05
计算机应用行业:免费且开源的鸿蒙,未来空间有多大?
商贸零售
东吴证券
2021-05-30
计算机行业周报:月之暗面开源KimiK2大模型,OpenAI发布ChatGPT Agent
商贸零售
国金证券
2025-07-20
关注生成式AI应用带来的安全需求—信息安全专题7丨中信证券计算机
商贸零售
未知机构
2023-04-07