产业观察 2025.06.16 【AI产业跟踪-海外】OpenAI发布o3-pro,Tolan获500万下载量 摘要:产业最新趋势跟踪,点评产业最新风向 AI行业动态 a16z:从搜索引擎优化(SEO)到生成式引擎优化(GEO)240款AI软件定价分析:AI定价的�种趋势 Meta与ScaleAI洽谈一项超过100亿美元的投资 Meta宣布与ConstellationEnergy签署20年核电协议 AI应用资讯 OpenAI升级高级语音功能 全球30名顶尖数学家集会“围剿”AI 谷歌Veo3Fast版价格暴降5倍独角兽ElevenLabs发布Elevenv3OpenAudioS1上线 Figma正式推出官方MCP DreamTech联手多高校发布影视级精细度Direct3D-S2FigureAI人形机器人物流工作实现重大飞跃 KreaAI正式发布其首款原生模型Krea1Tolan获500万下载量 苹果推出Xcode26开发者工具 AI大模型资讯 OpenAI发布推理新�o3-pro ChatGPT4o引入“先思考再搜索”机制 Meta开源发布V-JEPA2世界模型:开启物理推理新时代 Mistral发布首个开源推理模型Magistral AI科技前沿 Figure:人形机器人是"赢者通吃"行业黄仁勋发布量子计算专用CUDA 苹果发布六大系统统一设计风险提示 AI软件销售不及预期,capex投资计划变动,AI产品及大模型研发不及预期等。 产业研究中心 李嘉琪(分析师) 登记编号S0880524040001 021-38676666 刘峰(研究助理) 登记编号S0880124060013 021-38676666 目录 1.AI行业动态3 2.AI应用资讯3 3.AI大模型资讯5 4.科技前沿5 5.风险提示6 1.AI行业动态 a16z:从搜索引擎优化(SEO)到生成式引擎优化(GEO) 据ZPotentials公众号6月12日消息,搜索正从传统浏览器转向语言模型平台, 曝光定义变为"出现在模型生成答案中",800亿美元SEO市场被"生成式引擎优化(GEO)"新范式取代。竞争焦点从点击率转向"模型引用率",品牌需"编码至AI层","无提示认知度"成为关键指标,新平台已能监控品牌在AI回答中的呈现方式。GEO胜出者将构建行动基础设施,成为核心渠道并掌控预算分配权,品牌最终命题是"模型会记住你吗"。 240款AI软件定价分析:AI定价的�种趋势 据乌鸦智能说公众号6月12日消息,国外科技作者KylePoyar收集了超过240 家软件公司的数据,这些公司的年经常性收入(ARR)在100万至2000万美元之间,销售的是SaaS和AI混合产品。研究发现,传统席位和固定价格模式正被混合定价取代(41%企业采用),结合订阅与使用量计费,平衡收入可预测性与实际价值。AI定价策略多样化,包括现收现付、套餐制、平台费加使用量等七种模式,企业需依据自身情况选择最佳方案。结果导向定价成为趋势但需满足一致性、归因性、可衡量性和可预测性四要素,AI定价正向围绕客户成果收费演进。 Meta与ScaleAI洽谈一项超过100亿美元的投资 据AIGC开放社区公众号6月9日消息,Meta正与ScaleAI洽谈超过100亿美元 投资,将成为Meta最大外部AI投资和私企最大融资之一。ScaleAI成立于2016年,由华裔AlexWang和LucyGuo创立,2024年5月获10亿美元F轮融资。公司主要提供数据标注服务,包括图像视频标注、3D点云标注和NLP处理,客户包括OpenAI、微软、谷歌等科技巨头。 Meta宣布与ConstellationEnergy签署20年核电协议 据AIGC开放社区公众号6月10日消息,Meta与ConstellationEnergy签署20年 核能购买协议,规模达1121兆瓦,将从伊利诺伊州克林顿清洁能源中心获取电力。该协议超过此前微软与Constellation的835兆瓦合作,旨在支持Meta不断增长的数据中心能源需求和AI发展计划。合作将保留1100多个工作岗位,提升发电量30兆瓦,预计2027年启动供电,以支持Meta计划中的130万GPU规模。 2.AI应用资讯 OpenAI升级高级语音功能 据AI寒武纪公众号6月8日消息,ChatGPT高级语音功能升级,声音更自然,能 表达情感和语调变化,使交流更具人性化。新增实时翻译功能,支持跨语言对话,可在国际环境中充当同声传译,无缝衔接对话。该功能已向所有付费用户开放,用户只需点击输入框中的语音图标即可使用。 全球30名顶尖数学家集会“围剿”AI 据新智元公众号6月7日消息,30位顶尖数学家在UC伯克利对OpenAI的o4- mini进行秘密测试,发现AI能解决约20%的教授级数学难题,表现超越多数参赛团队。数学家KenOno承认AI展现出接近数学天才的水平,能在几分钟内解决人类专家需要数周甚至数月才能完成的复杂问题。陶哲轩已在社交平台分享AI在数学研究中的惊人进展,如与AlphaEvolve合作突破18年未解的和差集指数问题,预示AI将成为数学研究中值得信赖的合作者。 谷歌Veo3Fast版价格暴降5倍 据量子位公众号6月9日消息,谷歌Veo3模型新增"360°"关键词功能,能生成 3D环绕效果视频,但在物理真实性上仍有缺陷。推出Veo3-Fast版本,支持文生视频和自动生成配音,速度更快且价格降低80%。Fast版本生成8秒720P视频仅 需20credits(比标准版便宜5倍),但面部细节和光照效果略有下降。 独角兽ElevenLabs发布Elevenv3 据量子位6月6日消息,ElevenLabs发布新版TTS模型Elevenv3,支持70多种 语言,声称是"迄今为止最具表现力的文本转语音模型"。引入音频标签系统,可精确控制情感表达,包括情感标签、音效标签和特殊标签,标点符号也影响情绪传递。支持多人对话功能,可为不同角色分配不同语音,英语效果优于中文,目前处于内测阶段。 OpenAudioS1上线 私域X星球公众号6月6日消息,FishAudio推出OpenAudioS1声音克隆模型, 支持通过指令精确控制语音情感、语气和节奏,表现力媲美专业配音。采用双自回归架构和RLHF技术,支持13种语言,包括中英日等,在TTS-Arena排名第一。定价每百万字节15美元(约0.8美元/小时),适用于内容创作和配音领域,未来计划推出版权音色注册与分成机制。 Figma正式推出官方MCP 据阿辍Trent公众号6月11日消息,Figma推出官方MCP服务,直接将设计文件 中的变量、组件、布局等信息导入IDE,实现真正的所见即所得,比第三方MCP还原度更高。部署简单,只需更新Figma客户端,启用DevModeMCPServer,并在支持MCP的编辑器中配置本地服务URL。使用时只需在Figma中复制设计链接到对话框,一轮交互即可生成高保真页面,无需复杂配置或API申请。 DreamTech联手多高校发布影视级精细度Direct3D-S2 据新智元公众号6月9日消息,Direct3D-S23D大模型刷新HuggingFace3D建模 趋势榜,被全球开发者广泛关注。模型仅用8块GPU训练,效果超越闭源商用模型,训练效率提升近20倍,token吞吐量提高64倍。核心创新为空间稀疏注意力机制(SSA),支持超大规模体素生成,已全面开源且采用MIT协议允许商业使用。 FigureAI人形机器人物流工作实现重大飞跃 据AI寒武纪公众号6月8日消息,FigureAI人形机器人Helix在物流仓库工作三 个月后实现重大突破,能处理硬质纸箱、塑料袋和扁平信封等多种包裹类型。机器人性能显著提升:包裹处理速度从5.0秒/件提高到4.05秒/件,条形码扫描成功率从70%升至95%,并展现出自适应行为如拍平褶皱包裹。突破归功于三大技术增强(视觉记忆、状态历史、力反馈)和训练数据规模扩展(从10小时增至60小时),机器人还能通过"视觉条件化"实现与人类协作递物。 KreaAI正式发布其首款原生模型Krea1 AI星球视界公众号6月11日消息,KreaAI推出首款原生模型Krea1,专注解决 AI图像"同质化"和"塑料感"问题,提供高美学控制力与专业级画质输出。该模型支持风格参考和自定义训练,原生支持1.5K分辨率且可扩展至4K,提供实时编辑功能,适用于电商、插画、影视分镜等多种场景。Krea1目前提供免费测试版,无需注册或付费即可使用,旨在加速数字艺术创作流程,降低制作成本,有望成为AI图像生成领域的重要参与者。 Tolan获500万下载量 据极客公园公众号6月11日消息,Tolan作为外星AI陪伴应用获500万下载量 及400万美元ARR,独特之处在于选择"外星人"形象而非模拟人类,强调"非浪漫型、非工具性"陪伴。产品设计融合陪伴与游戏化元素,用户可定制外星人伴侣外观,并通过互动发展独特星球环境,形成情感连接,团队特意避免让AI回应过于像人类。与国内猫箱等AI陪伴应用相比,Tolan专注普遍"孤独感"而非"恋爱幻想",通过限制聊天时间等机制追求健康使用节奏,因此在用户留存方面表现更好。 苹果推出Xcode26开发者工具 据MGCloud蘑菇云公众号6月10日消息,苹果宣布Xcode26将集成ChatGPT,使开发者能通过AI辅助代码编写、文档生成和错误修复。开发者可通过API密钥将其他供应商的AI模型引入Xcode,构建多元智能编程生态。苹果发布FoundationModels框架,让开发者仅需三行代码即可调用设备上运行的本地AI模型。 3.AI大模型资讯 OpenAI发布推理新�o3-pro 据夕小瑶科技说公众号6月11日消息,OpenAI发布推理新模型o3-pro,以推理 能力最强、速度最慢为卖点,输入价格20美元/百万tokens,输出80美元/百万tokens。在科学分析、写作、编程和数据分析领域,o3-pro比o3领先约14%,但在ARC-AGI-2测试中几乎无提升,成本却大幅增加。用户测试显示o3-pro擅长复杂推理任务且环境感知能力强,但推理速度极慢,不适合简单问题,主要面向专业用户。 ChatGPT4o引入“先思考再搜索”机制 据AI信息GAP公众号6月9日消息,ChatGPT4o现在在回答复杂问题前会先停 顿几秒"思考",页面显示"Thoughtforafewsecond",然后再决定搜索或直接回答。这种"先理解后搜索"的能力提高了回答准确性,但用户需要等待更长时间,移动端触发率更高。OpenAI未官宣此功能,但已将这种思考能力扩展到GPT-4.1和GPT-4.5等非推理模型中。 Meta开源发布V-JEPA2世界模型:开启物理推理新时代 据量子位公众号6月12日消息,Meta开源V-JEPA2世界模型,能理解物理世界, 用100万小时视频数据训练,可实现零样本规划和机器人控制。模型仅需62小时训练即可生成规划控制模型,在行为分类和预测方面达到顶级表现,成功率达65%-80%。Meta发布三个物理理解基准测试,揭示AI与人类在物理推理能力上仍存在差距,未来将发展分层次和多模态JEPA模型。 Mistral发布首个开源推理模型Magistral 据机器之心公众号6月11日消息,MistralAI发布推理模型Magistral,包括企业 版Medium和开源版Small(24B参数),在AIME2024等多项测试中表现优异。Magistral通过自主研发的可扩展强化学习流水线实现多语言保真推理,适用于英法西德意阿俄中等语言。利用FlashAnswers技术,MagistralMedium实现比竞品快10倍的token吞吐量,定价策略更具竞争力(输入2美元/百万token,输出5美元/百万token)。 4.科技前沿 Figure:人形机器人是"赢者通吃"行业 据有新Newin公众号6月11日消息,F