AI智能总结
刘峰(研究助理)0755-23976068liufeng6@gtht.com登记编号S0880124060013[Table_Report]往期回顾【数字经济周报】Broadcom推出Tomahawk Ultra交换机2025.07.20【数字经济资本市场周概览】Mega Fortune纳斯达克挂牌上市,挚达科技向港交所递交招股书2025.07.20【智能车产业跟踪】国科础石完成近亿元天使加轮融资,加速智能汽车操作系统布局2025.07.20宽松政策预期强化,驱动行情延续上行——东南亚指数双周报第3期2025.07.19【新材料产业周报】阿科玛PA11再扩产提升产能至原来的三倍,清协华和完成数千万Pre-A轮融资2025.07.16 目录1. AI行业动态..........................................................................................................32. AI应用资讯..........................................................................................................33. AI大模型资讯......................................................................................................44.科技前沿..............................................................................................................55.风险提示..............................................................................................................6 请务必阅读正文之后的免责条款部分2of7 1.AI行业动态OpenAI收购Wind-surf失败据AIGC公众号7月15日消息,OpenAI以30亿美元收购AI编码初创公司Wind-surf的交易宣告失败。因OpenAI与微软现有协议规定,微软拥有OpenAI技术访问权,Wind-surf团队对此存忧,致交易受阻。而谷歌趁势“截胡”,将聘用Wind-surf首席执行官Varun Mohan、联合创始人Douglas Chen及部分顶尖研究人员,并获其技术非独家许可。美国解除英伟达H20芯片对华销售限制据AIGC公众号7月15日消息,美国政府已同意英伟达恢复对中国销售H20 AI芯片,此前该芯片于2025年4月被纳入出口管制需特殊许可。此次解禁发生在英伟达CEO黄仁勋与特朗普会面之后,黄仁勋曾多次游说称限制影响美国技术领先地位,且芯片限制已使英伟达在华市场份额减半。黄仁勋正与中国相关方会面,还宣布符合管制规定的新款RTX PRO GPU,适用于智能工厂等领域。英伟达最新财报显示,2025财年一季度收入创纪录,数据中心业务成增长核心,生成式AI推动客户群体扩大至多个行业。前OpenAI CTO创办公司获143亿种子轮融资据智东西公众号7月16日消息,前OpenAI首席技术官Mira Murati创办的Thinking Machines Lab(TML)完成20亿美元种子轮融资,为史上最大规模种子轮,由a16z领投,英伟达、AMD等参投。该公司成立仅5个月,三分之二团队来自OpenAI,北大学霸翁荔任联合创始人。其聚焦企业定制AI与消费级产品,采用“模型层融合”提升效率,计划推出含开源组件的产品,已引发科技巨头关注,被视为AI领域有力竞争者。2.AI应用资讯谷歌Gemini嵌入模型登顶MTEB据AIGC公众号7月15日消息,谷歌发布首个Gemini嵌入模型,现位居MTEB排行榜第一,已开放API,每100万token仅0.15美元。该模型基于Gemini双向Transformer编码器,采用多维度训练等策略,在多任务中表现出色,尤其多语言能力受认可。网友认为其降低了技术使用门槛,将助力搜索、推荐等多领域应用。AI已能模拟人类思考据DeepTech公众号7月16日消息,40余名科学家联合撰文指出,AI已能用人类语言模拟思考,监控其推理的窗口期正缩小。思维链监控可助于检测AI异常行为、发现偏差信号等,但当前可监控性依赖模型训练方式,可能因强化学习规模扩大、架构改进等被削弱。文中倡议开发评估方法、将监控纳入安全措施,同时强调其为补充方案,需结合其他安全手段,且需抓紧研究以维持可监控性。马斯克推出互动型AI角色功能据量子位公众号7月16日消息,马斯克旗下Grok推出AI Companions新功能,用户可通过语音与3D动漫角色互动,现有金发女孩Ani和暴躁狐狸Bad Rudy等角色,还将推出新角色。该功能需购买Super Grok超级会员,目前仅iOS用户可用。网友反馈多样,有调侃也有期待。行业中,AI陪伴赛道遇冷,用户付费率低、活跃度下滑且争议多,但此3D交互形象较领先。马斯克还提及xAI将创建多智能体公司。 OpenAI发布ChatGPT Agent据DeepTech公众号7月18日消息,OpenAI推出综合代理工具ChatGPT Agent,整合网页交互、信息整合等能力,可自动写代码、做PPT、订酒店等。其运行于虚拟机,依托新模型和强化学习处理复杂任务,支持调用终端、访问谷歌网盘等。该功能向Pro、Plus等订阅者开。测试中,其在多领域表现优于同类模型,虽运行速度较慢,但能在后台处理任务,且有安全机制保障,未来将优化输出质量与功能。全球首个直播生成模型MirageLSD发布据智东西公众号7月19日消息,以色列AI创企Decart推出全球首个直播扩散AI视频模型MirageLSD,获AI大神卡帕西投资。该模型可实时转换无限长视频流,响应时间小于40毫秒,突破传统视频生成的时长和延迟限制。其基于实时流扩散技术,通过因果生成和优化技术解决误差累积问题,支持文本提示操控,应用场景涵盖游戏、直播、影视等。目前平台已上线,移动版本即将推出,虽在精确控制等方面有提升空间,但为实时视频生成领域带来突破。3.AI大模型资讯全球首个医疗代码生成大模型训练平台问世据量子位公众号7月13日消息,多国研究团队发布全球首个医疗代码生成大模型训练平台MedAgentGym。该平台整合多领域医疗编程任务,提供容器化环境、交互式反馈等基础设施及全面评估体系。经其训练的Med-Copilot-7B模型,采用两阶段训练策略,性能接近GPT-4o。平台还通过AI验证器提升成功率,为医疗AI发展提供可持续进化路径,助力解决医疗AI编程瓶颈。谷歌发布T5Gemma与MedGemma据新智元公众号7月14日消息,谷歌推出T5Gemma和MedGemma两款模型。T5Gemma基于Gemma 2框架,采用编码器-解码器架构,在多项任务中性能优于原版,且支持灵活配置,已开源。MedGemma聚焦医疗多模态,含4B和27B版本,可在单卡或移动设备运行,能处理医学图文任务,另有轻量编码器Med-SigLIP。这些模型降低使用门槛,推动开源AI发展,获业内关注。华人团队开源全AI操作系统NeuralOS据量子位公众号7月15日消息,滑铁卢大学与加拿大国家研究委员会的华人团队开源全AI操作系统NeuralOS,受卡帕西“下一代GUI系统”预言启发,可通过神经网络模拟Windows,实时预测下一帧屏幕图像。其核心为循环神经网络(跟踪状态)和扩散神经渲染器(生成画面),经Ubuntu操作录像训练而成,能逼真模拟界面变化、响应鼠标操作,但对快速键盘输入处理欠佳。目前提供在线体验,为自适应生成式神经接口及下一代人机交互系统提供新方向。微软开源CoLLabLLM框架据AIGC公众号7月17日消息,微软开源2025年ICML获奖框架CoLLabLLM,旨在解决大模型多轮对话缺陷。该框架含四大核心模块,通过上下文理解、模拟未来交互、评估长期影响及强化微调,让模型能预判响应对后续交互的作用,优化沟通方式与时机,提升用户体验和任务效率。在文档创作、编程等任务中,其通过引导性提问明确需求,经测试表现优于基线模型,推动AI向用户中心系统发展。 Mistral发布开源语音模型Voxtral据智东西公众号7月16日消息,AI初创公司Mistral AI发布首个开源语音模型Voxtral系列,含24B和3B参数版本,基于Apache 2.0许可证开源,提供API服务。该模型支持32k token上下文窗口,可处理30分钟音频转录或40分钟语义理解任务,转录能力全面超越Whisper large-v3,多项测试超越GPT-4o mini,语音翻译成绩居首,成本较低,支持本地部署和私有化部署,未来将增强功能。全球最强开源定理证明器Goedel-Prover-V2问世据新智元公众号7月17日消息,普林斯顿、清华等八大机构的十位华人核心成员联合推出Goedel-Prover-V2,为目前全球最强开源定理证明器。该模型有32B和8B两个版本,在PutnamBench、MathOlympiadBench等基准测试中表现卓越,8B参数模型性能堪比671B的DeepSeek-Prover,32B模型更以90.4%的Pass@32成绩刷新MiniF2F纪录。其采用分层数据合成、验证器引导自我修正等技术,依托有限算力实现突破,推动AI形式化证明领域发展。OpenAI新模型斩获IMO 2025金牌据新智元公众号7月19日消息,OpenAI一款全新实验性通用推理模型在2025年国际数学奥林匹克竞赛(IMO)中斩获金牌,解出6道题中的5道,获35分,远超此前表现最佳的Gemini2.5 Pro(13分)。该模型在与人类相同的规则下参赛,不使用工具,以自然语言输出证明过程,展现出长期创造性思维能力,其推理时间可达数小时,突破了传统思维链模式,被认为是AI推理技术的重大里程碑,相关解题过程已开源。斯坦福开源OctoTools框架据AIGC公众号7月19日消息,斯坦福大学开源了OctoTools框架,这是一款融合11种工具的AI Agent,专为复杂推理设计。其核心是工具卡片,标准化封装工具功能与元数据,支持动态调整;规划器负责分析任务并制定步骤;执行器将计划转化为命令;上下文验证器检查结果完整性。该框架在16项基准测试中表现优异,可应对数学、科学、医学诊断等复杂场景,为处理多步推理和跨领域任务提供新方案,代码已开源。4.科技前沿AI模型Centaur精准模拟人类认知据量子位公众号7月14日消息,德国团队开发的人类认知基础模型Centaur登上《Nature》。该模型基于Llama 3.1 70B构建,仅用0.15%参数,经5天训练,可精准模拟160项心理学实验中的人类行为,预测能力超传统模型。其神经表征与人类fMRI扫描结果高度吻合,在奖励相关脑区等表现突出,还能复现人类行为特征,为统一认知理论研究提供新路径,展现出强大的跨领域泛化能力。OpenAI发布CoT监控技术据AIGC公众号7月16日消息,OpenAI发布思维链(CoT)监控技术,旨在增强AIAgent等系统的自主性与可解释性。该技术可监控AI推理过程,助力调试故障、合规审计及建立信任,对金融、医疗等领域尤为重要。其有效方法包括利用大模型评估CoT清晰度、测量因果相关性等,但需平衡模型对齐性与监控有效性。当前训练侧重输出正确性可能模糊CoT与输出关系,未来需开发更先进技术深入模型内部推理,通过对抗性训练提升监控鲁棒性。 谷歌DeepMind推出MoR架构据新智元公众号7月17日消息,KAIST、谷歌DeepMind等机构联合发布全新MoR(Mixture-of-Recursions)架构,