AI智能总结
目录1.AI重要事件:华为云发布盘古大模型5.5,腾讯混元正式发布首个开源混合推理MoE模型............................................................................................32.金融科技进展:拉卡拉推出即易付3.0+AI智能助手,同花顺推出大模型金融评估基准BizFinBench............................................................................53.投资建议......................................................................................................64.风险提示......................................................................................................7 1.AI重要事件:华为云发布盘古大模型5.5,腾讯混元正式发布首个开源混合推理MoE模型6月17日,谷歌Gemini 2.5 Flash和Pro全面上市,同时推出2.5 Flash-Lite预览版。谷歌于6月5日在正式发布前推出了Gemini 2.5 Pro预览版,在LMArena上的Elo评分提高了24分并在排行榜上保持领先,在WebDevArena上提高了35分并以1443分领先;在编码方面表现出色,在Aider Polyglot等困难编码基准测试中处于领先地位,在GPQA和humanity's Last Exam (HLE)等具有高度挑战性的基准测试中表现出顶级性能。Flash-Lite是谷歌迄今为止最经济实惠和最快的2.5模型,在编码、数学、科学、推理和多模态基准测试中整体优于2.0 Flash-Lite,并在翻译和分类等高吞吐量、对延迟敏感的任务中表现出色,具有相比2.0 Flash-Lite更低的延迟。(来源:https://blog.google/products/gemini/gemini-2-5-model-family-expands/https://blog.google/products/gemini/gemini-2-5-pro-latest-preview/)6月16日,OpenAI表示公司将于2025年7月14日从官方OpenAI应用程序编程接口(API)中移除GPT-4.5预览版。自4月起,OpenAI就已宣布逐步取消GPT-4.5预览版这一计划,这一模型定位为一个实验性产品,为未来产品提供发展意见与经验教训。(来源:https://venturebeat.com/ai/openai-moves-forward-with-gpt-4-5-deprecation-in-api-triggering-developer-anguish-and-confusion/)6月19日,Anthropic宣布在Claude Code中支持远程MCP服务器,提供更加个性化的编程服务。Anthropic于5月发布Claude4系列,在编码和解决复杂问题等方面表现卓越,与Sonnet 3.7相比,对工具使用、并行工具执行和内存改进进行扩展,并显著减少了模型使用快捷方式或漏洞完成任务的行为。Claude Code可以访问MCP服务器公开的工具和资源,并从中提取上下文,使用其进行调试,而无需离开终端(来源:https://www.anthropic.com/news/claude-4https://www.anthropic.com/news/claude-code-remote-mcp)6月20日,华为开发者大会上,华为云发布盘古大模型5.5,新一代AI云服务上线。该模型基于CloudMatrix 384超节点,首创将384颗NPU和192颗鲲鹏CPU通过全新高速网络MatrixLink全对等互联,单卡推理吞吐量跃升到2300 Tokens/s,与非超节点相比提升近4倍,更好地支持混合多专家MoE大模型的推理,实现“一卡一专家”,并支持“一卡一算子任务”,提升任务并行处理,减少等待,将算力有效使用率(MFU)提升50%以上。同时,会上还发布了盘古医学、金融、政务、工业、汽车五个具备深度思考能力的行业自然语言大模型,并将在6月底正式上线。(来源:https://www.huaweicloud.com/intl/zh-cn/news/20250620101057482.html)6月27日,腾讯正式发布腾讯混元首个开源混合推理MoE模型Hunyuan-A13B,总参数80B,激活参数仅13B。其效果可比肩同等架构领先开源模型,但拥有更快的推理速度,因此具有更高的性价比。该模型是业界首个13B级别的MoE开源混合推理模型,基于先进的模型架构,Hunyuan-A13B表现出强大的通用能力,在多个业内权威数据测试集上取得优异成 绩,并在Agent工具调用和长文能力上有突出表现。在Agent能力方面,腾讯混元建设了一套多Agent数据合成框架,接入了MCP、沙箱、大语言模型模拟等多样环境,并通过强化学习让Agent在多种环境里进行自主探索与学习,进一步提升Hunyuan-A13B的效果。数据分析场景下,该模型通过调用编码工具,完成数据分析的工作,并支持生成新的excel表格文件;在长文方面,Hunyuan-A13B支持256K原生上下文窗口,在多个长文数据集中取得了优异成绩。同时,腾讯混元开源了两个新的数据集:ArtifactsBench用于弥合大语言模型代码生成评估中的视觉与交互鸿沟,构建了一个包含1825个任务的新基准,涵盖了从网页开发、数据可视化到交互式游戏等九大领域,并按难度分级以全面评估模型的能力;C3-Bench针对Agent场景模型面临的三个关键挑战:规划复杂的工具关系、处理关键的隐藏信息以及动态路径决策,设计了1024条测试数据,以发现模型能力的不足。(来源:https://mp.weixin.qq.com/s/BlmQfsT5WVUzqY_I7uBiNQ)6月10日,中国科学院推出全球首个基于人工智能技术的处理器芯片软硬件全自动设计系统——“启蒙”。该系统依托大模型等先进人工智能技术,可实现自动设计CPU,并能为芯片自动配置相应的操作系统、转译程序、高性能算子库等基础软件,性能可比肩人类专家手工设计水平。在CPU自动设计方面,“启蒙1号”可实现5小时内完成32位RISC-V CPU的全部前端设计,达到Intel 486性能,规模超过400万个逻辑门,已完成流片;升级版“启蒙2号”,达到ARM Cortex A53性能,规模扩大至1700万个逻辑门。在基础软件方面,可自动生成定制优化后的操作系统内核配置,性能相比专家手工优化提升25.6%;可实现不同芯片和不同编程模型之间的自动程序转译,性能最高达到厂商手工优化算子库的2倍;可自动生成矩阵乘等高性能算子,在RISC-V CPU和NVIDIA GPU上的性能分别提高110%和15%以上。(来源:https://www.peopleapp.com/column/30049316478-500006309824)6月24日,OceanBase宣布,其云数据库OB Cloud已实现AI能力的开发部署及生态集成。自4月底宣布AI战略后,OceanBase全力推进Data×AI的战略落地,并已服务零售、金融、物流等行业的数十家头部企业,推动AI应用从概念走向实际落地。会上,OceanBase将OB Cloud的AI能力优势总结为四点:具备天然的一体化架构,面向AI无需引入额外技术栈,在一个数据底座中可同时支持事务处理、实时分析与AI工作负载,减少AI技术架构复杂性;OB Cloud支持多模向量一体化,OceanBase向量能力在VectorDBBench基准测试中,在同等环境下性能表现达到业界主流开源向量数据库的最优水平;OceanBase PowerRAG提供包括文档解析、知识切片、上下文召回、精排与大模型集成在内的全流程产品能力,将原本需要大量工程投入的RAG技术,转化为一站式平台服务;原生的一体化架构,令AI分析不再依赖ETL、数据流转或副本同步,能够直接实时获取最新的业务数据。(来源:https://mp.weixin.qq.com/s/yFrJ3Dhm4YKAg7RqQrS0eg)6月23日,百度文心快码正式发布其独立AI原生开发环境工具Comate 请务必阅读正文之后的免责条款部分4of8 AI IDE,是业界首个深度融合多模态与多智能体协同能力的AI IDE。其围绕“智能”、“拓展”、“协同”、“灵感”四大维度实现全方位突破,具备多项核心能力:多智能体协同,集成编程智能体“Zulu”,赋予其自主思考和决策能力;多模态能力增强(前端场景突出),特别强化了前端开发的多模态能力,设计稿一键转代码(F2C)、图片/自然语言转代码、实时预览与自然语言调整;AI辅助编码全流程,覆盖从需求分析、代码编写、运行测试到代码提交的完整开发闭环;强大工具链与开放生态(支持MCP)。(来源:https://mp.weixin.qq.com/s/nJBv0DdnI3BHDuX_G_NPOg)6月23日,网易有道开源“子曰3”系列大模型(Confucius3-Math),是国内首个专注于数学教育,可在单块消费级GPU上高效运行的开源推理模型。测试数据显示,在CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等数据集上,14B轻量级的“子曰3数学模型”各项得分均高于DeepSeek-R1等通用大模型。尤其在GAOKAO-Bench(Math)这一基于高考数学题的大模型评测框架中,“子曰3数学模型”的得分高达98.5分。该模型通过大规模增强学习以及系列创新算法,推理性能约为DeepSeek R1的15倍,在消费级GPU即可运行,服务成本每百万token低至0.15美元,远低于目前大多数通用大模型,实现了更优的成本效益。同时,自2023年7月推出国内首个教育大模型“子曰”以来,已快速推出10余个垂直应用,并于2025年初发布国内首个输出分步式讲解的推理模型“子曰-o1”,持续释放大模型在教育行业的应用价值。(来源:https://mp.weixin.qq.com/s/GLsDlOFZNK1Mjj14PJrQzA)2.金融科技进展:拉卡拉推出即易付3.0+AI智能助手,同花顺推出大模型金融评估基准:BizFinBench6月25日,拉卡拉推出即易付3.0+AI智能助手。即易付3.0针对传统收款开通流程复杂、收款场景割裂、信息管理低效、人工沟通不易四大痛点,通过AI智能助手的智能开通、操作、通知、解答,提供了解决方案。可实现自动配置“千店千面”店铺模板、一键转发客户/社群、复购客户自助下单、同步推送交易成功通知等功能。除了强大的全场景收款功能外,还具备0开发成本、简易版CRM、高级版强大功能(高级数据分析、会员卡/优惠券配置、批量订单管理、商户级模板统管等功能)等多项产品优势。同时6月27日,拉卡拉开放平台AI售前服务,通过人工智能技术赋能商户接入服务,全链路低成本提升客户体验。(来源:https://mp.weixin.qq.com/s/Eah-YIgQXsl5M2yRTxluIAhttps://mp.weixin.qq.com/s/o0ZR7i38xtE49KDykrAUlQ)6月18日,奇富科技在2025中国国际金融展上重点展示了奇富信贷超级智能体的重要智能模块。奇富信贷超级智能体由端到端授信决策智能体、小微企业信用评估、AI合规助手、AI决策助手、AI审批官等众多模块构成,为银行匹配专家级信贷能力,助力银行提升技术与业务双实力,为传统银行