AI智能总结
摘要:产业最新趋势跟踪,点评产业最新风向 刘峰(研究助理)0755-23976068liufeng6@gtht.com登记编号S0880124060013 【具身智能产业动态】星尘智能与仙工智能达成千台级合作,推进工业及物流场景规模应用2025.09.08【新材料产业周报】我国丙烷脱氢催化剂领域实现重大突破,富加镓业等多家新材料企业完成融资2025.09.07【数字经济资本市场周概览】华新精科上交所主板挂牌上市,健康160向港交所递交招股书2025.09.07【数字经济周报】全球首款全频6G芯片发布2025.09.07【AI产业跟踪】美的打造全球首个智能体工厂,首个高刷视频理解开源端侧模型MiniCPM-V 4.5问世2025.09.03 目录 1. AI行业动态..........................................................................................................32. AI应用资讯..........................................................................................................33. AI大模型资讯......................................................................................................34.科技前沿..............................................................................................................45.风险提示..............................................................................................................4 1.AI行业动态 OpenAI计划在印度建设GW级大型数据中心 据新智元公众号9月2日消息,外媒曝出OpenAI计划在印度建设容量至少1GW的数据中心,这是“星际之门”首次大规模落地亚洲。该项目或将在奥特曼本月访问印度时宣布。星际之门计划由OpenAI、软银、甲骨文和阿布扎比基金联合推动,总投资高达5000亿美元,目标是在全球部署10GW级别算力集群,目前已在美国德州、阿联酋和挪威落地。印度成为亚洲首站,既因其庞大的AI用户增长潜力,也因多语言环境对本地化AI的需求。ChatGPT Go等专供产品已让印度成为OpenAI第二大市场。 2.AI应用资讯 亚马逊推出AI实时购物功能Lens Live 据IT之家9月3日消息,亚马逊于近期上线了AI驱动的实时购物工具Lens Live,这是对现有Amazon Lens功能的升级。用户只需将手机镜头对准实物,屏幕底部即可显示匹配商品,同时可将心仪商品加入购物车或收藏至愿望清单。LensLive还与亚马逊AI购物助手鲁弗斯联动,提供产品摘要及对话式问题,帮助消费者快速获取产品信息。该功能由SageMaker和Amazon OpenSearch提供技术支持,首批上线iOS亚马逊购物App,面向数千万美国用户,未来有望覆盖更多用户。 3.AI大模型资讯 智谱开源GLM-4.5 据量子位公众号9月2日消息,智谱最新开源大模型GLM-4.5在伯克利工具使用榜单上超越Claude Opus 4.1,并以仅1.4%的运行成本完成相同任务,展现出极高的性价比。GLM-4.5采用MoE架构,并通过自建CC-Bench评测体系,在六大开发领域、52个实际编程任务中表现强劲,编程能力已接近Claude 4。研究人员反馈称,其推理速度比Opus 4.1快3倍,比GPT-5快5倍。值得一提的是,智谱还推出价格仅为Claude七分之一的Claude Code套餐,适配GLM-4.5和GLM-4.5-Air,进一步降低使用门槛。目前,GLM-4.5已接入包括Claude Code、Cline、GeminiCLI、CodeGeeX等多款主流编程工具,几乎覆盖完整开发流程,为开发者提供了性能与成本兼具的全新选择。 苹果开源7B视频理解模型FastVLM 据Kevin改变世界的点滴公众号9月4日消息,苹果最新开源的FastVLM模型仅7B参数,显存占用不到10多GB,依托阿里Qwen2-7B进行深度训练,主要突破在视频流识别能力。该模型通过逐帧提取图像特征,再汇总生成最终结果,并结合文本向量数据库进行匹配,实现高精度的视频理解。FastVLM不仅可在原生手机客户端运行,也支持Web浏览器,能够识别现实物理世界的物品、字体及内容含义,提供视觉一体化解决方案。其低延迟和端到端离线能力保障数据隐私与安全,同时支持高分辨率图像理解及图文关联,非常适合在MR/AR眼镜和机器人视觉场景中应用。用户测试显示,在16GB的M2设备即可运行,并可将2小时视频快速生成字幕,显著提升开发和应用效率。 谷歌开源端侧嵌入模型EmbeddingGemma 据智东西公众号9月5日消息,谷歌推出了面向端侧AI的开放式嵌入模型EmbeddingGemma,仅有3.08亿参数,却在检索增强生成(RAG)和语义搜索等任务中性能直追参数翻倍的Qwen-Embedding-0.6B。该模型支持离线运行,可在笔记本、手机等设备上部署,仅占用不到200MB内存,同时兼顾隐私保护。 EmbeddingGemma基于Gemma 3架构,经过100多种语言训练,提供灵活嵌入尺寸和2K上下文窗口,可生成高质量文本向量以优化RAG流程,保证检索和生成答案的准确性。它可与多种主流工具集成,并在EdgeTPU上实现实时推理。 苹果发布端侧多模态模型MobileCLIP2据智东西公众号9月1日消息,苹果公布了新一代多模态基础模型MobileCLIP2 及其多模态强化训练机制,并在GitHub和Hugging Face开源了预训练权重与数据生成代码。该模型专为零样本分类和检索设计,参数规模50~1.5亿,推理延迟仅3-15毫秒,可在iPhone等移动设备端高效部署。通过改进的教师监督和字幕数据训练机制,MobileCLIP2在ImageNet-1k零样本分类准确率提升2.2%,同时保持比大型模型更小的参数量和更低延迟。所有模型变体均已开源,支持开发者直接部署和进行基准测试,并可扩展到新的模态和任务,实现低延迟、多模态的移动端应用。 OpenAI发布语音转语音模型GPT-RealTime 据智东西公众号8月29日消息,OpenAI推出面向开发者的GPT-RealTime语音转语音模型,并更新Realtime API,新增远程MCP服务器支持、图像输入和SIP电话呼叫功能。该模型能够生成自然、富有表现力的语音,可捕捉笑声、无缝切换语言并遵循复杂指令。在Big Bench Audio和MultiChallenge音频基准测试中,GPT-RealTime的准确率和指令遵循能力较旧模型显著提升。与传统多模型链式流程不同,Realtime API通过单模型直接处理音频,降低延迟并保留语音细节。新功能包括图像输入、SIP支持和可重用提示。 4.科技前沿 特斯拉人形机器人再度亮相 据新智元公众号9月4日消息,近日,Salesforce创始人Marc Benioff参观特斯拉办公室时发布了全新Optimus视频。马斯克表示,Optimus旨在承担重复、危险工作,让人类从枯燥劳动中解放,计划2025年生产约5000台,2026年达5万台,目标价格约2万美元。与此同时,Figure发布Helix机器人新视频,展示其自主将碗放入洗碗机的能力,仅通过新数据训练,无需新算法,实现高精度、多任务操作,表明通用人形机器人在实际生活中的适应性和学习能力正快速提升。 5.风险提示 AI软件销售不及预期,capex投资计划变动,AI产品及大模型研发不及预期等。受AI产业链新建产能变化影响,及全球AI软件销售不及预期,或因上下游芯片产出及量产能力限制,影响产业产品研发情况。 本公司具有中国证监会核准的证券投资咨询业务资格 分析师声明 作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,本报告清晰准确地反映了作者的研究观点,力求独立、客观和公正,结论不受任何第三方的授意或影响,特此声明。 免责声明 本报告仅供国泰海通证券股份有限公司(以下简称“本公司”)的客户使用。本公司不会因接收人收到本报告而视其为本公司的当然客户。本报告仅在相关法律许可的情况下发放,并仅为提供信息而发放,概不构成任何广告。 本报告的信息来源于已公开的资料,本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载的资料、意见及推测仅反映本公司于发布本报告当日的判断,本报告所指的证券或投资标的的价格、价值及投资收入可升可跌。过往表现不应作为日后的表现依据。在不同时期,本公司可发出与本报告所载资料、意见及推测不一致的报告。本公司不保证本报告所含信息保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者应当自行关注相应的更新或修改。 本报告中所指的投资及服务可能不适合个别客户,不构成客户私人咨询建议。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在任何情况下,本公司、本公司员工或者关联机构不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。投资者务必注意,其据此做出的任何投资决策与本公司、本公司员工或者关联机构无关。 本公司利用信息隔离墙控制内部一个或多个领域、部门或关联机构之间的信息流动。因此,投资者应注意,在法律许可的情况下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的情况下,本公司的员工可能担任本报告所提到的公司的董事。 市场有风险,投资需谨慎。投资者不应将本报告作为作出投资决策的唯一参考因素,亦不应认为本报告可以取代自己的判断。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。 本报告版权仅为本公司所有,未经书面许可,任何机构和个人不得以任何形式翻版、复制、发表或引用。如征得本公司同意进行引用、刊发的,需在允许的范围内使用,并注明出处为“国泰海通证券研究”,且不得对本报告进行任何有悖原意的引用、删节和修改。 若本公司以外的其他机构(以下简称“该机构”)发送本报告,则由该机构独自为此发送行为负责。通过此途径获得本报告的投资者应自行联系该机构以要求获悉更详细信息或进而交易本报告中提及的证券。本报告不构成本公司向该机构之客户提供的投资建议,本公司、本公司员工或者关联机构亦不为该机构之客户因使用本报告或报告所载内容引起的任何损失承担任何责任。 国泰海通证券研究所 电话(021)38676666 地址上海市黄浦区中山南路888号