AI智能总结
产业研究中心[Table_Authors]登记编号登记编号 目录1. AI行业动态..........................................................................................................32. AI应用资讯..........................................................................................................33. AI大模型资讯......................................................................................................54.科技前沿..............................................................................................................55.风险提示..............................................................................................................6 请务必阅读正文之后的免责条款部分2of7 1.AI行业动态a16z:从搜索引擎优化(SEO)到生成式引擎优化(GEO)据Z Potentials公众号6月12日消息,搜索正从传统浏览器转向语言模型平台,曝光定义变为"出现在模型生成答案中",800亿美元SEO市场被"生成式引擎优化(GEO)"新范式取代。竞争焦点从点击率转向"模型引用率",品牌需"编码至AI层","无提示认知度"成为关键指标,新平台已能监控品牌在AI回答中的呈现方式。GEO胜出者将构建行动基础设施,成为核心渠道并掌控预算分配权,品牌最终命题是"模型会记住你吗"。240款AI软件定价分析:AI定价的五种趋势据乌鸦智能说公众号6月12日消息,国外科技作者Kyle Poyar收集了超过240家软件公司的数据,这些公司的年经常性收入(ARR)在100万至2000万美元之间,销售的是SaaS和AI混合产品。研究发现,传统席位和固定价格模式正被混合定价取代(41%企业采用),结合订阅与使用量计费,平衡收入可预测性与实际价值。AI定价策略多样化,包括现收现付、套餐制、平台费加使用量等七种模式,企业需依据自身情况选择最佳方案。结果导向定价成为趋势但需满足一致性、归因性、可衡量性和可预测性四要素,AI定价正向围绕客户成果收费演进。Meta与Scale AI洽谈一项超过100亿美元的投资据AIGC开放社区公众号6月9日消息,Meta正与Scale AI洽谈超过100亿美元投资,将成为Meta最大外部AI投资和私企最大融资之一。Scale AI成立于2016年,由华裔Alex Wang和LucyGuo创立,2024年5月获10亿美元F轮融资。公司主要提供数据标注服务,包括图像视频标注、3D点云标注和NLP处理,客户包括OpenAI、微软、谷歌等科技巨头。Meta宣布与Constellation Energy签署20年核电协议据AIGC开放社区公众号6月10日消息,Meta与Constellation Energy签署20年核能购买协议,规模达1121兆瓦,将从伊利诺伊州克林顿清洁能源中心获取电力。该协议超过此前微软与Constellation的835兆瓦合作,旨在支持Meta不断增长的数据中心能源需求和AI发展计划。合作将保留1100多个工作岗位,提升发电量30兆瓦,预计2027年启动供电,以支持Meta计划中的130万GPU规模。2.AI应用资讯OpenAI升级高级语音功能据AI寒武纪公众号6月8日消息,ChatGPT高级语音功能升级,声音更自然,能表达情感和语调变化,使交流更具人性化。新增实时翻译功能,支持跨语言对话,可在国际环境中充当同声传译,无缝衔接对话。该功能已向所有付费用户开放,用户只需点击输入框中的语音图标即可使用。全球30名顶尖数学家集会“围剿”AI据新智元公众号6月7日消息,30位顶尖数学家在UC伯克利对OpenAI的o4-mini进行秘密测试,发现AI能解决约20%的教授级数学难题,表现超越多数参赛团队。数学家Ken Ono承认AI展现出接近数学天才的水平,能在几分钟内解决人类专家需要数周甚至数月才能完成的复杂问题。陶哲轩已在社交平台分享AI在数学研究中的惊人进展,如与AlphaEvolve合作突破18年未解的和差集指数问题,预示AI将成为数学研究中值得信赖的合作者。谷歌Veo 3 Fast版价格暴降5倍据量子位公众号6月9日消息,谷歌Veo3模型新增"360°"关键词功能,能生成3D环绕效果视频,但在物理真实性上仍有缺陷。推出Veo 3-Fast版本,支持文生视频和自动生成配音,速度更快且价格降低80%。Fast版本生成8秒720P视频仅 需20 credits(比标准版便宜5倍),但面部细节和光照效果略有下降。独角兽ElevenLabs发布Eleven v3据量子位6月6日消息,ElevenLabs发布新版TTS模型Eleven v3,支持70多种语言,声称是"迄今为止最具表现力的文本转语音模型"。引入音频标签系统,可精确控制情感表达,包括情感标签、音效标签和特殊标签,标点符号也影响情绪传递。支持多人对话功能,可为不同角色分配不同语音,英语效果优于中文,目前处于内测阶段。OpenAudio S1上线私域X星球公众号6月6日消息,Fish Audio推出OpenAudio S1声音克隆模型,支持通过指令精确控制语音情感、语气和节奏,表现力媲美专业配音。采用双自回归架构和RLHF技术,支持13种语言,包括中英日等,在TTS-Arena排名第一。定价每百万字节15美元(约0.8美元/小时),适用于内容创作和配音领域,未来计划推出版权音色注册与分成机制。Figma正式推出官方MCP据阿辍Trent公众号6月11日消息,Figma推出官方MCP服务,直接将设计文件中的变量、组件、布局等信息导入IDE,实现真正的所见即所得,比第三方MCP还原度更高。部署简单,只需更新Figma客户端,启用Dev Mode MCP Server,并在支持MCP的编辑器中配置本地服务URL。使用时只需在Figma中复制设计链接到对话框,一轮交互即可生成高保真页面,无需复杂配置或API申请。DreamTech联手多高校发布影视级精细度Direct 3D-S2据新智元公众号6月9日消息,Direct3D-S2 3D大模型刷新HuggingFace 3D建模趋势榜,被全球开发者广泛关注。模型仅用8块GPU训练,效果超越闭源商用模型,训练效率提升近20倍,token吞吐量提高64倍。核心创新为空间稀疏注意力机制(SSA),支持超大规模体素生成,已全面开源且采用MIT协议允许商业使用。Figure AI人形机器人物流工作实现重大飞跃据AI寒武纪公众号6月8日消息,Figure AI人形机器人Helix在物流仓库工作三个月后实现重大突破,能处理硬质纸箱、塑料袋和扁平信封等多种包裹类型。机器人性能显著提升:包裹处理速度从5.0秒/件提高到4.05秒/件,条形码扫描成功率从70%升至95%,并展现出自适应行为如拍平褶皱包裹。突破归功于三大技术增强(视觉记忆、状态历史、力反馈)和训练数据规模扩展(从10小时增至60小时),机器人还能通过"视觉条件化"实现与人类协作递物。Krea AI正式发布其首款原生模型Krea 1AI星球视界公众号6月11日消息,Krea AI推出首款原生模型Krea 1,专注解决AI图像"同质化"和"塑料感"问题,提供高美学控制力与专业级画质输出。该模型支持风格参考和自定义训练,原生支持1.5K分辨率且可扩展至4K,提供实时编辑功能,适用于电商、插画、影视分镜等多种场景。Krea 1目前提供免费测试版,无需注册或付费即可使用,旨在加速数字艺术创作流程,降低制作成本,有望成为AI图像生成领域的重要参与者。Tolan获500万下载量据极客公园公众号6月11日消息,Tolan作为外星AI陪伴应用获500万下载量及400万美元ARR,独特之处在于选择"外星人"形象而非模拟人类,强调"非浪漫型、非工具性"陪伴。产品设计融合陪伴与游戏化元素,用户可定制外星人伴侣外观,并通过互动发展独特星球环境,形成情感连接,团队特意避免让AI回应过于像人类。与国内猫箱等AI陪伴应用相比,Tolan专注普遍"孤独感"而非"恋爱幻想",通过限制聊天时间等机制追求健康使用节奏,因此在用户留存方面表现更好。苹果推出Xcode 26开发者工具 据MGCloud蘑菇云公众号6月10日消息,苹果宣布Xcode 26将集成ChatGPT,使开发者能通过AI辅助代码编写、文档生成和错误修复。开发者可通过API密钥将其他供应商的AI模型引入Xcode,构建多元智能编程生态。苹果发布Foundation Models框架,让开发者仅需三行代码即可调用设备上运行的本地AI模型。3.AI大模型资讯OpenAI发布推理新王o3-pro据夕小瑶科技说公众号6月11日消息,OpenAI发布推理新模型o3-pro,以推理能力最强、速度最慢为卖点,输入价格20美元/百万tokens,输出80美元/百万tokens。在科学分析、写作、编程和数据分析领域,o3-pro比o3领先约14%,但在ARC-AGI-2测试中几乎无提升,成本却大幅增加。用户测试显示o3-pro擅长复杂推理任务且环境感知能力强,但推理速度极慢,不适合简单问题,主要面向专业用户。ChatGPT 4o引入“先思考再搜索”机制据AI信息GAP公众号6月9日消息,ChatGPT 4o现在在回答复杂问题前会先停顿几秒"思考",页面显示"Thought for a few second",然后再决定搜索或直接回答。这种"先理解后搜索"的能力提高了回答准确性,但用户需要等待更长时间,移动端触发率更高。OpenAI未官宣此功能,但已将这种思考能力扩展到GPT-4.1和GPT-4.5等非推理模型中。Meta开源发布V-JEPA 2世界模型:开启物理推理新时代据量子位公众号6月12日消息,Meta开源V-JEPA 2世界模型,能理解物理世界,用100万小时视频数据训练,可实现零样本规划和机器人控制。模型仅需62小时训练即可生成规划控制模型,在行为分类和预测方面达到顶级表现,成功率达65%-80%。Meta发布三个物理理解基准测试,揭示AI与人类在物理推理能力上仍存在差距,未来将发展分层次和多模态JEPA模型。Mistral发布首个开源推理模型Magistral据机器之心公众号6月11日消息,Mistral AI发布推理模型Magistral,包括企业版Medium和开源版Small(24B参数),在AIME2024等多项测试中表现优异。Magistral通过自主研发的可扩展强化学习流水线实现多语言保真推理,适用于英法西德意阿俄中等语言。利用Flash Answers技术,Magistral Medium实现比竞品快10倍的token吞吐量,定价策略更具竞争力(输入2美元/百万token,输出5美元/百万token)。4.科技前沿Figure:人形机器人是"赢者通吃"行业据有新Newin公众号6月11日消息,Figure CEO认为人形机器人是"赢者通吃"行业,目标不是销售硬件而是提供完整"劳动力"系统,强调完全自主运行。公司已建立年产1.2万台产线,产品成本较初代降93%,未来四年计划交付10万台,同时面向商业和家庭市场。Figure采用"共享神经网络"让所有机器人共享学习成果,资金充足,相信最终胜出者将是"最聪明、最便宜"的参与者。黄仁勋发布量子计算专用CUDA据量子位公众




