核心观点
全球大模型正从“快思考”走向“慢思考”,从算力堆砌转向算法与训练范式优化。头部厂商竞争从追求对话速度和表层“生成质量”的System 1快速反应,转向构建具备长链条推理、自我反思与工具调用能力的System 2慢思考体系。
关键数据
- Gemini 3在LM Arena基准测试中以1501分登顶,并在多项高难度推理评估中展现出代际优势。
- DeepSeek-V3.2的百万Token输出成本仅为GPT-5的1/24、Gemini 3 Pro的1/29。
- 2023年企业级LLM使用份额,Anthropic升至约32%,领先OpenAI与Google。
- Claude在代码生成用例的份额约42%。
研究结论
- 真正具备持续竞争力的,不再是单纯“更大的模型”,而是单位算力下更高的有效智能密度、更稳定的思考链以及更优的成本效率。
- 竞争重心从“跑分领先”转向“直达用户、驱动行动”,AI从生成走向行动。
- AI正在系统性重塑生产方式与人才结构,从“手工生产者”到“任务设计者”。
- 国内厂商展示出高度差异化的应对路径:一端是以DeepSeek为代表,在底层算法和算力密度上“弯道超车”;另一端是以字节豆包、阿里千问、快手可灵为代表,通过OS级权限、API生态和多模态生产工具,直接改造用户触点和生产方式,形成“模型—入口—算力”三线合围的中国样本。