登录
注册
回到首页
AI
搜索
发现报告
发现数据
发现专题
研选报告
定制报告
VIP
权益
发现大使
发现一下
行业研究
公司研究
宏观策略
财报
招股书
会议纪要
中央经济工作会议
低空经济
DeepSeek
AIGC
大模型
当前位置:首页
/
会议纪要
/
报告详情
KimiK2有潜力的开源基模重视AI应用机遇中信证券计算机
2025-07-18
未知机构
E***
AI智能总结
查看更多
核心观点
:月之暗面开源的新一代基座模型Kimi K2具有显著潜力,在编程和逻辑方向的多项基准测试中达到SOTA能力,接近Claude 4 Opus水平,同时具备优秀的推理成本控制,适合用于Agent开发。
关键数据
:
参数规模:1万亿参数,单次激活参数320亿,上下文长度128k。
基准测试表现:SWE-bench Verified/LiveCodeBench/AIME 2025/GPQA-diamond等测试集成绩达到Claude 4 Opus相同水平。
成本优势:API输入(命中)/输入(未命中)/输出定价分别为1/4/16元每百万Tokens,较Claude 4 sonnet有约80%的成本优势。
技术创新
:
数据合成:通过智能体数据合成提升工具使用能力和Agent能力,构建工具模拟器环境进行“练习”。
优化器:MuonClip优化器提升训练稳定性,降低计算资源消耗。
模型架构与优化
:
基础架构:继承DeepSeek-V3模型架构,将专家数从256提升至384,降低MLA头数以优化成本控制。
未来展望:若开源智能体数据合成的工程方案,将进一步提升基座模型逻辑能力;加入思维链能力后训练的模型值得期待。
亿,亿,思路相似,在预训练和后训个,同时降低了另一创新
你可能感兴趣
计算机行业周报:AI应用潜力持续释放,重视B端AI+企业服务投资机会
信息技术
安信证券
2023-06-26
计算机应用行业:免费且开源的鸿蒙,未来空间有多大?
信息技术
东吴证券
2021-05-30
关注生成式AI应用带来的安全需求—信息安全专题7丨中信证券计算机
未知机构
2023-04-07
计算机行业周报:月之暗面开源KimiK2大模型,OpenAI发布ChatGPT Agent
信息技术
国金证券
2025-07-20
【民生计算机|人工智能第一团队】金桥信息:继续强推阿里系AI应用龙头,阿里大模
未知机构
2023-04-09