行业研究公司研究宏观策略财报招股书会议纪要 Token 低空经济十五五 AIGC 大模型

AI产业跟踪海外：海外特斯拉Robotaxi上线，MetaAI眼镜能拍3K视频

电子设备 2025-07-02 国泰海通证券高杨

AI行业动态
- Meta从OpenAI挖走四位华人学者，专长于模型微调和多模态对齐，以弥补Llama 4性能未达预期的短板。
- Delphi获红杉领投1600万美元A轮融资，创建数字化身让用户在赛博世界"永生"，提供多级订阅服务。
- OpenAI前CTO Mira Murati创立的Thinking Machines Lab完成20亿美元种子轮融资，估值达100亿美元，具体业务方向尚未公开。
AI应用资讯
- Anthropic的Claude聊天机器人新增功能，允许用户通过对话直接构建AI应用，无需编程知识。
- 谷歌推出开源的Gemini CLI，支持终端访问Gemini，提供百万上下文窗口和每天1000次的高额免费使用限额。
- 谷歌DeepMind发布AI工具AlphaGenome，能一次读取100万DNA碱基，精准预测基因突变影响。
- 谷歌Gemini Robotics On-Device是首个能在机器人本地运行的视觉-语言-动作模型，无需网络连接。
- 谷歌将最新的Imagen 4和Imagen 4 Ultra文生图模型上线AI Studio和API，生成速度接近实时。
- ODDY工作室创作的《名作艺术秀》将梵高、达利等艺术巨匠的作品以时装秀形式呈现，引发观众共鸣。 -斯坦福、基因泰克等机构联合开发通用生物医学AI智能体Biomni，能自主执行跨领域研究任务。
- 谷歌推出七段纸艺ASMR解压视频，采用纸质艺术形式，呈现梦幻效果。
- ElevenLabs发布11ai语音助手，支持安排日程、任务管理和信息查询，集成Perplexity搜索和Notion、Linear等工具对接。
- 谷歌真AR眼镜开发者版本曝光，代号"Martha"，基于Android XR平台设计，配备内置相机、麦克风和右镜片上的小型棱镜显示屏。
- 特斯拉Robotaxi服务在德州奥斯汀启动，首批乘客固定价格4.2美元，仅向受邀用户开放，投入10-20辆Model Y车辆。
- Deezer将对AI生成曲目专辑进行标注，每日拦截超2万首AI生成音乐，约占上传量18%，其中70%播放量为虚假的。
- 多所大学研究者开发出"虚拟社区"，模拟全球35个城市的3D环境，智能体拥有详细背景和社会关系，可自主执行日常活动及特定任务。
- Meta与运动眼镜品牌欧克利合作推出OakleyMeta HSTN智能眼镜，主打运动场景，售价399美元起，采用1200万像素摄像头，可录制3K视频。
AI大模型资讯
- 微软发布Mu模型，仅3.3亿参数，性能可比肩参数量大10倍的Phi-3.5-mini，在NPU设备上每秒响应超100 tokens。
- Sakana AI提出"强化学习教师"(RLT)新范式，让模型学习如何教学而非直接解决问题，仅7B大小的教师模型表现超过671B的DeepSeek-R1。
科技前沿
- CMU等团队开发Mirage Persistent Kernel (MPK)编译器，可将LLM自动编译为优化巨型内核，无需CUDA编程，将LLM推理延迟降低1.2至6.7倍。
- Netflix宣布在即将开业的Netflix House超大型体验空间中推出沉浸式VR体验，由Sandbox VR提供技术支持。
- 微软发布量子计算重大技术突破——4D拓扑量子纠错码，可将量子比特错误率降低1000倍，从10⁻³降至约10⁻⁶。
风险提示
- AI软件销售不及预期，capex投资计划变动，AI产品及大模型研发不及预期等。受AI产业链新建产能变化影响，及全球AI软件销售不及预期，或因上下游芯片产出及量产能力限制，影响产业产品研发情况。

摘要：产业最新趋势跟踪，点评产业最新风向 Meta从OpenAI挖走四位华人学者Delphi拿下红杉领投的1600万美元A轮OpenAI前CTO的Thinking Machines Lab成史上最大种子轮 AI应用资讯 Anthropic重磅更新谷歌推出开源的Gemini CLI谷歌AlphaGenome横空出世谷歌Gemini家族新成员谷歌Imagen 4 / Ultra上线AI StudioODDY工作室创作的《名作艺术秀》Biomni通用生物医学Agent，可由「任务」自主生成工作流谷歌推出新ASMR解压视频新类型：纸艺动画ElevenLabs推出名叫11ai的AI个人助理谷歌真AR眼镜原型曝光特斯拉Robotaxi终于上线Deezer给AI音乐贴“身份证”世界模型版《模拟人生》虚拟社区：AI小人在街头演讲拉票Meta发布性能最强AI眼镜：一个运动「外挂」能拍3K视频 AI大模型资讯微软发布Mu模型：支持Win智能体，小参数跑出10倍性能SakanaAI提出"强化学习教师"(RLT)新范式 AI科技前沿 CMU几十行代码将LLM编译成巨型内核网飞NetflixVR大空间：Netflix House，占地1.3个足球场微软量子计算重大技术突破可商用风险提示 AI软件销售不及预期，capex投资计划变动，AI产品及大模型研发不及预期等。目录 1. AI行业动态..........................................................................................................32. AI应用资讯..........................................................................................................33. AI大模型资讯......................................................................................................54.科技前沿..............................................................................................................55.风险提示..............................................................................................................6 1.AI行业动态 Meta从OpenAI挖走四位华人学者据机器之心公众号6月30日消息，Meta再次从OpenAI挖走四位华人学者，他们都是OpenAI重要模型(GPT-4、GPT-4o和o系列)的核心贡献者。此举发生在Meta发布Llama 4后，由于性能未达预期，Meta启动大规模招聘，两公司之间爆发"亿元签约奖金"口水战。被挖人才包括余家辉、任泓宇、毕树超和赵晟佳，他们专长于模型微调和多模态对齐，可能帮助Meta弥补技术短板。 Delphi拿下红杉领投的1600万美元A轮据新智元公众号6月25日消息，AI创业公司Delphi获红杉领投1600万美元A轮融资，创建数字化身让用户在赛博世界"永生"，已有情感导师靠此年入百万。创始人Ladjevardian的初衷是为中风无法说话的爷爷创建"数字大脑"，将其回忆录中的智慧数字化，实现数字疗愈。Delphi提供多级订阅服务，可复制用户语言风格、知识体系和表达方式，用户可对每次对话收费并获85%以上收入，吸引作家、教练、投资人等创建数字思维扩展影响力。 OpenAI前CTO的Thinking Machines Lab成史上最大种子轮据Z Potentials公众号6月21日消息，OpenAI前CTO Mira Murati创立的AI初创公司Thinking Machines Lab完成20亿美元种子轮融资，估值达100亿美元。这笔由Andreessen Horowitz领投的融资可能创下史上最大规模种子轮融资纪录，成立仅6个月的公司具体业务方向尚未公开。Murati曾主导开发ChatGPT、DALL-E等产品，2023年曾短暂担任OpenAI临时CEO，多位前同事已加入她的新公司。 2.AI应用资讯 Anthropic重磅更新据AI范儿公众号6月26日消息，Anthropic的Claude聊天机器人新增功能，允许用户通过对话直接构建AI应用，无需编程知识。用户已创建多种应用，包括AI游戏、学习工具、数据分析应用、写作助手和智能体工作流。该功能在所有订阅层级开放，并设计巧妙分享机制，API调用计入使用者而非创建者额度。谷歌推出开源的Gemini CLI 据量子位公众号6月26日消息，谷歌推出开源免费的Gemini CLI，支持在终端访问Gemini，提供百万上下文窗口和每天1000次的高额免费使用限额。功能全面，支持代码理解、GitHub集成、多模态操作、MCP调用(Imagen、Veo等)以及谷歌搜索。采用Apache 2.0开源协议，安装简便，只需Node.js环境，已引发开发者社区热议，GitHub仓库标星迅速增至10.8k。谷歌AlphaGenome横空出世据新智元公众号6月26日消息，谷歌DeepMind发布AI工具AlphaGenome，能一次读取100万DNA碱基，精准预测基因突变影响，填补解读DNA非编码区域空白。模型采用层次化架构，兼具长序列与高分辨率优势，24项评估中22项超越现有模型，能同时预测多种分子特性，实现RNA剪接点直接预测。AlphaGenome将加速疾病机理研究、合成生物学和基因组功能解析，为理解罕见遗传病和癌症提供关键工具，推动生物学进入可编程时代。谷歌Gemini家族新成员据机器之心6月25日消息，Gemini Robotics On-Device是首个能在机器人本地运行的视觉-语言-动作模型，无需网络连接，适用于延迟敏感型应用。该模型可执行高度灵巧任务如拉开拉链、折叠衣物，展现出优于其他本地模型的泛化性能和多步骤指令处理能力。仅需50-100个演示即可适应新任务，能跨平台泛化到不同机器人如Franka FR3和Apollo人形机器人。谷歌Imagen 4 / Ultra上线AI Studio 据AI进修生公众号6月25日消息，谷歌将最新的Imagen 4和Imagen 4 Ultra文生图模型上线AI Studio和API，普通版每张约4美分，Ultra版约6美分，生成速度接近实时。Imagen 4 Ultra对prompt理解更精准，能生成高质量图像，支持每次生成最多四张1024×1024的图片，测试显示能生成逼真的超现实场景。谷歌AIStudio未来将整合MCP服务器功能和Jules SWE Agent，界面也将更新，提供更统一的工作流和复杂操作能力。 ODDY工作室创作的《名作艺术秀》据新智元公众号6月25日消息，AI技术复活世界名画与艺术家走秀视频爆红，ODDY工作室创作的《名作艺术秀》将梵高、达利、蒙娜丽莎等经典艺术元素以时装秀形式呈现。视频重现多位艺术巨匠及其作品：梵高的《星夜》、波提切利的《维纳斯诞生》、克里姆特的《吻》、达利的超现实主义等，让艺术跨越时空界限。最后场景中梵高、达利、莫奈、达芬奇等艺术大师同台相拥谢幕，这场AI视觉盛宴不仅完美还原艺术作品细节，更引发观众情感共鸣与泪目。 Biomni通用生物医学Agent，可由「任务」自主生成工作流据ScienceAI公众号6月25日消息，斯坦福、基因泰克等机构联合开发通用生物医学AI智能体Biomni，能自主执行跨领域研究任务，无需预定义工作流程。Biomni由两部分组成：Biomni-E1(统一生物医学环境，包含150个专用工具、105个软件和59个数据库)和Biomni-A1(智能体架构，结合大语言模型推理与代码执行)。系统在遗传学、基因组学等领域表现出色，能分析可穿戴设备数据、处理复杂RNA数据并自主设计实验方案，已上线免费使用，有望加速生物医学研究创新。谷歌推出新ASMR解压视频新类型：纸艺动画据新智元公众号6月24日消息，谷歌Gemini推出七段纸艺ASMR解压视频，内容包括火烈鸟水中起舞、圣托里尼落日等场景。这些视频采用纸质艺术形式，通过高精准提示词生成、定格动画质感和恰当背景音，呈现梦幻效果。研究称这类ASMR内容之所以能够广泛传播，因其有助放松情绪，是从生产力工具转变为通往美学与治愈的另类方式。 ElevenLabs推出名叫11ai的AI个人助理据AI星球视界公众号6月24日消息，ElevenLabs发布11ai语音助手，主打语音优先设计和多通道处理，支持安排日程、任务管理和信息查询。11ai集成Perplexity搜索和Notion、Linear等工具对接，探索对话式AI如何嵌入实际工作流程。ElevenLabs专注AI音频技术，覆盖32种语言，已应用于有声书、游戏角色配音及医疗训练等领域，中文能力待提升。谷歌真AR眼镜原型曝光据三次方AIRX公众号6月24日消息，谷歌真AR眼镜开发者版本曝光，代号"Martha"，基于Android XR平台设计。配套应用界面类似Pixel Watch，包含通知、设置、视图记录和反馈等功能，明显针对测试人员。硬件配备内置相机、麦克风和右镜片上的小型棱镜显示屏，可显示时间和温度，支持视频录制和通知查看。特斯拉Robotaxi终于上线据机器之心公众号6月23日消息，特斯拉Robotaxi服务在德州奥斯汀启动，首批乘客固定价格4.2美元，仅向受邀用户开放，投入10-20辆Model Y车辆。服务有严格地理围栏限制，运营时间为早6点至午夜，车内配有安全监控员可紧急接管，部分情况下还有跟车和远程驾驶员。用户体验总体平稳，能应对基本城市驾驶场景，但存在需远程操作介入等问题，马斯克计划数月内扩大至上千辆，但竞争对手Waymo已运营1500辆无人车。 Deezer给AI音乐贴“身份证”据Z Potentials公众号6月23日消息，Deezer将对AI生成曲目专辑进行标注，每日拦截超2万首AI生成音乐，约占上传量18%，其中70%播放量为虚假的。AI生成歌曲目前仅占平台总流量0.5%但增长迅速，被标记的AI内容将不会出现在编辑精选歌单或算法推荐中。Deezer已为AI检测技术申请两项专利，能识别合成与真实内容的"独特特征"，此举正值三大唱片公司与AI音乐初创公司洽谈授权合作之际。世界模型版《模拟人生》虚拟社区：AI小人在街头演讲拉票据机器之心公众号6月21日消息，多所大学研究者开发出"虚拟社区"，将地理空间数据与生成模型结合，创建了智能体可交互的开放世界场景。该系统能模拟全球35个城市的3D环境，智能体拥有详细背景和社会关系，可自主执行日常活动及特定任务。实验中使用GPT-4o主干的智能体在"竞选"任务中表现优于GPT-3.5-turbo，展示了更强的社交说服能力。 Meta发布性能最强AI眼镜：一个运动「外挂」能拍3K视频据APPSO公众号6月21日消息，Meta与运动眼镜品牌欧克利合作推出OakleyMeta HSTN智能眼镜，主打运动场景，售价399美元起。新品采用1200万像素摄像头，可录制3K视频，具备IPX4防水性能，续航达8小时，充电盒可再提供48小时电量。智能眼镜市场已形成三条技术路线：纯语音交互、单色显示辅助、投影XR显示，Meta眼镜销量已超200万副。 3.AI大模型资讯微软发布Mu模型：支持Win智能体，小参数跑出10倍性能据AIGC开放社区公众号6月24日消息，微软发布M

点击免费查看完整报告

AI产业跟踪海外：海外特斯拉Robotaxi上线，MetaAI眼镜能拍3K视频

你可能感兴趣

电子行业点评报告：AI+端侧：豆包上线视频通话，见你所见+情感陪伴，期待AI眼镜、AI伴侣等新终端的“iPhone时刻”

智能车产业事件点评：特斯拉Robotaxi正式上线，无人驾驶商业化进展提速

产业观察：特斯拉Robotaxi正式上线，无人驾驶商业化进展提速

海外科技行业跟踪点评：Pika引爆文生视频，AI视频工具赋能社区升级

跟踪点评：25H1 亮点多：海外出圈、牵手阿里、AI Agent上线在即；看好 AI 赋能带动收入和利润稳升

AI 产业跟踪：海外：全球首个 AI Agent 交易市场：MuleRun 上线，Meta 发布 MobileLLM-R1 系列小模型

耐用消费产业行业研究：MetaAI眼镜新品加速利好产业链，沪七条落地利好内需消费

海外科技行业2024年第62期：特斯拉Robotaxi如约亮相，AMD全线布局AI推新品

产业观察35期：【新能源车产业跟踪】华为首次曝光无人代客泊车视频，小马智行Robotaxi获广州测试许可

AI产业跟踪海外：智谱开源GLM-4.5，特斯拉人形机器人再度亮相