AI智能总结
摘要:产业最新趋势跟踪,点评产业最新风向 Meta从OpenAI挖走四位华人学者Delphi拿下红杉领投的1600万美元A轮OpenAI前CTO的Thinking Machines Lab成史上最大种子轮 AI应用资讯 Anthropic重磅更新谷歌推出开源的Gemini CLI谷歌AlphaGenome横空出世谷歌Gemini家族新成员谷歌Imagen 4 / Ultra上线AI StudioODDY工作室创作的《名作艺术秀》Biomni通用生物医学Agent,可由「任务」自主生成工作流谷歌推出新ASMR解压视频新类型:纸艺动画ElevenLabs推出名叫11ai的AI个人助理谷歌真AR眼镜原型曝光特斯拉Robotaxi终于上线Deezer给AI音乐贴“身份证”世界模型版《模拟人生》虚拟社区:AI小人在街头演讲拉票Meta发布性能最强AI眼镜:一个运动「外挂」能拍3K视频 AI大模型资讯 微软发布Mu模型:支持Win智能体,小参数跑出10倍性能SakanaAI提出"强化学习教师"(RLT)新范式 AI科技前沿 CMU几十行代码将LLM编译成巨型内核网飞NetflixVR大空间:Netflix House,占地1.3个足球场微软量子计算重大技术突破可商用 风险提示 AI软件销售不及预期,capex投资计划变动,AI产品及大模型研发不及预期等。 目录 1. AI行业动态..........................................................................................................32. AI应用资讯..........................................................................................................33. AI大模型资讯......................................................................................................54.科技前沿..............................................................................................................55.风险提示..............................................................................................................6 1.AI行业动态 Meta从OpenAI挖走四位华人学者 据机器之心公众号6月30日消息,Meta再次从OpenAI挖走四位华人学者,他们都是OpenAI重要模型(GPT-4、GPT-4o和o系列)的核心贡献者。此举发生在Meta发布Llama 4后,由于性能未达预期,Meta启动大规模招聘,两公司之间爆发"亿元签约奖金"口水战。被挖人才包括余家辉、任泓宇、毕树超和赵晟佳,他们专长于模型微调和多模态对齐,可能帮助Meta弥补技术短板。 Delphi拿下红杉领投的1600万美元A轮 据新智元公众号6月25日消息,AI创业公司Delphi获红杉领投1600万美元A轮融资,创建数字化身让用户在赛博世界"永生",已有情感导师靠此年入百万。创始人Ladjevardian的初衷是为中风无法说话的爷爷创建"数字大脑",将其回忆录中的智慧数字化,实现数字疗愈。Delphi提供多级订阅服务,可复制用户语言风格、知识体系和表达方式,用户可对每次对话收费并获85%以上收入,吸引作家、教练、投资人等创建数字思维扩展影响力。 OpenAI前CTO的Thinking Machines Lab成史上最大种子轮据Z Potentials公众号6月21日消息,OpenAI前CTO Mira Murati创立的AI初 创公司Thinking Machines Lab完成20亿美元种子轮融资,估值达100亿美元。这笔由Andreessen Horowitz领投的融资可能创下史上最大规模种子轮融资纪录,成立仅6个月的公司具体业务方向尚未公开。Murati曾主导开发ChatGPT、DALL-E等产品,2023年曾短暂担任OpenAI临时CEO,多位前同事已加入她的新公司。 2.AI应用资讯 Anthropic重磅更新 据AI范儿公众号6月26日消息,Anthropic的Claude聊天机器人新增功能,允许用户通过对话直接构建AI应用,无需编程知识。用户已创建多种应用,包括AI游戏、学习工具、数据分析应用、写作助手和智能体工作流。该功能在所有订阅层级开放,并设计巧妙分享机制,API调用计入使用者而非创建者额度。 谷歌推出开源的Gemini CLI 据量子位公众号6月26日消息,谷歌推出开源免费的Gemini CLI,支持在终端访问Gemini,提供百万上下文窗口和每天1000次的高额免费使用限额。功能全面,支持代码理解、GitHub集成、多模态操作、MCP调用(Imagen、Veo等)以及谷歌搜索。采用Apache 2.0开源协议,安装简便,只需Node.js环境,已引发开发者社区热议,GitHub仓库标星迅速增至10.8k。 谷歌AlphaGenome横空出世据新智元公众号6月26日消息,谷歌DeepMind发布AI工具AlphaGenome,能 一次读取100万DNA碱基,精准预测基因突变影响,填补解读DNA非编码区域空白。模型采用层次化架构,兼具长序列与高分辨率优势,24项评估中22项超越现有模型,能同时预测多种分子特性,实现RNA剪接点直接预测。AlphaGenome将加速疾病机理研究、合成生物学和基因组功能解析,为理解罕见遗传病和癌症提供关键工具,推动生物学进入可编程时代。 谷歌Gemini家族新成员据机器之心6月25日消息,Gemini Robotics On-Device是首个能在机器人本地运 行的视觉-语言-动作模型,无需网络连接,适用于延迟敏感型应用。该模型可执行高度灵巧任务如拉开拉链、折叠衣物,展现出优于其他本地模型的泛化性能和多步骤指令处理能力。仅需50-100个演示即可适应新任务,能跨平台泛化到不同机器人如Franka FR3和Apollo人形机器人。 谷歌Imagen 4 / Ultra上线AI Studio 据AI进修生公众号6月25日消息,谷歌将最新的Imagen 4和Imagen 4 Ultra文生图模型上线AI Studio和API,普通版每张约4美分,Ultra版约6美分,生成速度接近实时。Imagen 4 Ultra对prompt理解更精准,能生成高质量图像,支持每次生成最多四张1024×1024的图片,测试显示能生成逼真的超现实场景。谷歌AIStudio未来将整合MCP服务器功能和Jules SWE Agent,界面也将更新,提供更统一的工作流和复杂操作能力。 ODDY工作室创作的《名作艺术秀》 据新智元公众号6月25日消息,AI技术复活世界名画与艺术家走秀视频爆红,ODDY工作室创作的《名作艺术秀》将梵高、达利、蒙娜丽莎等经典艺术元素以时装秀形式呈现。视频重现多位艺术巨匠及其作品:梵高的《星夜》、波提切利的《维纳斯诞生》、克里姆特的《吻》、达利的超现实主义等,让艺术跨越时空界限。最后场景中梵高、达利、莫奈、达芬奇等艺术大师同台相拥谢幕,这场AI视觉盛宴不仅完美还原艺术作品细节,更引发观众情感共鸣与泪目。 Biomni通用生物医学Agent,可由「任务」自主生成工作流 据ScienceAI公众号6月25日消息,斯坦福、基因泰克等机构联合开发通用生物医学AI智能体Biomni,能自主执行跨领域研究任务,无需预定义工作流程。Biomni由两部分组成:Biomni-E1(统一生物医学环境,包含150个专用工具、105个软件和59个数据库)和Biomni-A1(智能体架构,结合大语言模型推理与代码执行)。系统在遗传学、基因组学等领域表现出色,能分析可穿戴设备数据、处理复杂RNA数据并自主设计实验方案,已上线免费使用,有望加速生物医学研究创新。 谷歌推出新ASMR解压视频新类型:纸艺动画 据新智元公众号6月24日消息,谷歌Gemini推出七段纸艺ASMR解压视频,内容包括火烈鸟水中起舞、圣托里尼落日等场景。这些视频采用纸质艺术形式,通过高精准提示词生成、定格动画质感和恰当背景音,呈现梦幻效果。研究称这类ASMR内容之所以能够广泛传播,因其有助放松情绪,是从生产力工具转变为通往美学与治愈的另类方式。 ElevenLabs推出名叫11ai的AI个人助理 据AI星球视界公众号6月24日消息,ElevenLabs发布11ai语音助手,主打语音优先设计和多通道处理,支持安排日程、任务管理和信息查询。11ai集成Perplexity搜索和Notion、Linear等工具对接,探索对话式AI如何嵌入实际工作流程。ElevenLabs专注AI音频技术,覆盖32种语言,已应用于有声书、游戏角色配音及医疗训练等领域,中文能力待提升。 谷歌真AR眼镜原型曝光 据三次方AIRX公众号6月24日消息,谷歌真AR眼镜开发者版本曝光,代号"Martha",基于Android XR平台设计。配套应用界面类似Pixel Watch,包含通知、设置、视图记录和反馈等功能,明显针对测试人员。硬件配备内置相机、麦克风和右镜片上的小型棱镜显示屏,可显示时间和温度,支持视频录制和通知查看。 特斯拉Robotaxi终于上线据机器之心公众号6月23日消息,特斯拉Robotaxi服务在德州奥斯汀启动,首 批乘客固定价格4.2美元,仅向受邀用户开放,投入10-20辆Model Y车辆。服务有严格地理围栏限制,运营时间为早6点至午夜,车内配有安全监控员可紧急接管,部分情况下还有跟车和远程驾驶员。用户体验总体平稳,能应对基本城市驾驶场景,但存在需远程操作介入等问题,马斯克计划数月内扩大至上千辆,但竞争对手Waymo已运营1500辆无人车。 Deezer给AI音乐贴“身份证”据Z Potentials公众号6月23日消息,Deezer将对AI生成曲目专辑进行标注, 每日拦截超2万首AI生成音乐,约占上传量18%,其中70%播放量为虚假的。AI生成歌曲目前仅占平台总流量0.5%但增长迅速,被标记的AI内容将不会出现在编辑精选歌单或算法推荐中。Deezer已为AI检测技术申请两项专利,能识别合成与真实内容的"独特特征",此举正值三大唱片公司与AI音乐初创公司洽谈授权合作之际。 世界模型版《模拟人生》虚拟社区:AI小人在街头演讲拉票 据机器之心公众号6月21日消息,多所大学研究者开发出"虚拟社区",将地理空间数据与生成模型结合,创建了智能体可交互的开放世界场景。该系统能模拟全球35个城市的3D环境,智能体拥有详细背景和社会关系,可自主执行日常活动及特定任务。实验中使用GPT-4o主干的智能体在"竞选"任务中表现优于GPT-3.5-turbo,展示了更强的社交说服能力。 Meta发布性能最强AI眼镜:一个运动「外挂」能拍3K视频 据APPSO公众号6月21日消息,Meta与运动眼镜品牌欧克利合作推出OakleyMeta HSTN智能眼镜,主打运动场景,售价399美元起。新品采用1200万像素摄像头,可录制3K视频,具备IPX4防水性能,续航达8小时,充电盒可再提供48小时电量。智能眼镜市场已形成三条技术路线:纯语音交互、单色显示辅助、投影XR显示,Meta眼镜销量已超200万副。 3.AI大模型资讯 微软发布Mu模型:支持Win智能体,小参数跑出10倍性能 据AIGC开放社区公众号6月24日消息,微软发布M