大模型厂商在近期各领风骚,OpenAI的Images 2.0发布将“思考”能力引入图像生成,显著提升性能。
- 核心观点:OpenAI Images 2.0在图像生成中引入“思考”能力,通过实时信息搜索、多图生成和输出复核,生成更准确和及时的图像内容。
- 关键数据:ELO得分1512 vs 1271,完爆Nano Banana 2;Codex用户达400万。
- 技术突破:支持实时信息搜索、多图生成、输出复核,知识截止日期为2025年12月,提升说明图、教育图表和视觉摘要能力。
- 算力与用户:OpenAI利用算力优势,一边Anthropic限制用户,一边狂揽用户,印证“算力=token=收入=用户”逻辑。
- 研究结论:OpenAI将文本模型的“思考”能力复用至多模态生成,印证“LLM和多模态模型底层Know-How可复用”,全模态能力或将受益。