人工智能动态:1)产品应用:DeepSeek的多模态AI模型在处理文本和图像方面表现出色,其Janus-Pro-7B模型在GenEval基准测试中超越了DALL-E3; 阿里云宣布接入DeepSeek-R1等热门模型,并推出Qwen2.5-Max,该模型在多项公开主流模型评测基准上超越了全球领先的开源MoE模型DeepSeekV3以及最大的开源稠密模型Llama-3.1-405B;月之暗面发布了新一代多模态思考模型K1.5,该模型在数学、代码、多模态推理能力等方面都接近OpenAI满血版o1;Meta发布《前沿人工智能框架》政策文件,明确对两类高风险AI系统采取限制措施;谷歌宣布全面推出Gemini2.0系列模型,涵盖Gemini 2.0Flash和Gemini2.0Pro等;OpenAI的o3-mini模型在数学代码、物理模拟等基准测试中成绩优异,远超DeepSeekR1。 2)底层技术:Deepseek通过创新的训练框架及算法优化,显著降低其开发成本,其开发成本仅为600万美元,相比OpenAI的o1模型节省超过98%的成本。 3)行业政策:2025全球开发者先锋大会将于2月21日至23日在上海徐汇举办。大会以“模塑全球无限可能”为主题,将紧密链接国内外人工智能相关产业链全环节,形成端到端的产业链条有机协同。 投资建议:伴随着Deepseek开源模型推广应用,我们观察到国内互联网与模型厂商也纷纷推出对标全球领先水平的大模型。模型层的能力拉平利好云厂商下游需求增长,降低AI应用研发与落地的成本,加速AI应用发展。同时将显著缩小了云厂AI前期投入与应用兑现之间的时间与资源成本,有望进一步提升国产云厂商盈利能力。因此,我们建议增加港股互联网板块的仓位配置,核心推荐云消费趋势变化弹性明显的阿里巴巴,以及具备最佳社交场景和生态有望受益于人工智能产业趋势的腾讯控股。 风险提示:政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行风险,游戏公司新产品不能如期上线或表现不及预期风险等。 AI相关网站流量数据 图1:AI相关网站周访问量(百万) 图2:第一梯队AI相关网站周访问量变动(百万) 图3:第二梯队AI相关网站周访问量变动(百万) 图4:第三梯队AI相关网站周访问量变动(百万) 图5:新增聊天、教育类AI相关网站周访问量变动(百万) (一)公司动态 DeepSeek的多模态AI模型在处理文本和图像方面表现出色,其Janus-Pro-7B模型在GenEval基准测试中超越了DALL-E3,能够生成4K分辨率的图像,并在医学成像和工业检查等领城具有优化性能。在GenEval基准测试中,Janus-Pro-7B的得分为0.80,领先于OpenAI的DALL-E3(0.67)和StableDiffusion3(0.74)等强劲对手,表明其在文本到图像生成任务中的能力已达到行业领先水平。 Janus-Pro-7B的应用价值在于其在医学成像领域具有优化性能,能够实现实时对象识别和高精度的医学图像处理,为医疗领域的AI应用提供了新的可能性。例如,它可以快速准确地识别医学影像中的病变部位,辅助医生进行诊断,提高诊断效率和准确性;在工业检查领域,Janus-Pro-7B则能够生成高分辨率的图像,帮助检测产品缺陷和质量问题。其高精度的图像生成和理解能力,可以快速识别生产过程中的异常情况,提高工业生产的质量和效率。 阿里云在2月1日至2月3日期间宣布接入DeepSeek-R1、DeepSeek-V3、Janus-Pro等热门模型,并推出“一键部署”等能力,为开发者提供更加便捷的部署与试用服务。阿里云的PAIModel Gallery平台目前支持云上一键部署DeepSeek-V3和DeepSeek-R1模型,这一功能极大地简化了模型开发流程,用户无需编写繁琐的代码,即可实现从训练到部署再到推理的全过程,为开发者和企业用户带来了更快、更高效、更便捷的AI开发和应用体验。 月之暗面发布了新一代多模态思考模型K1.5,利用长短转化技术,以长链式思考技术改进短链式思考模型,在短链式推理能力上有所提升,该模型在数学、代码、多模态推理能力等方面都接近OpenAI满血版o1。该模型利用长短转化技术,以长链式思考技术改进短链式思考模型,在短链式推理性能测试中,k1.5模型在数学、代码等方面大幅超越GPT-4o、Claude3.5 Sonnet等全球领先模型。同时,月之暗面首次公布了多模态模型技术训练报告《Kimik1.5:借助大语言模型实现强化学习的Scaling》,涵盖强化学习训练、多模态数据配方及基础设施优化等技术细节。该报告的发布,将助力人工智能企业提升多模态大模型训练效率,进一步降低训练成本,为人工智能技术的应用实践提供重要参考。 Meta发布《前沿人工智能框架》政策文件,明确对两类高风险AI系统(“高风险”和“关键风险”)采取限制措施。这些系统可能被用于网络攻击、生物武器扩散等场景。对于“关键风险”系统,Meta将暂停开发并实施未公开的安全防护措施,直至风险可控;“高风险”系统则限制内部访问权限,需通过缓解措施降低风险后才会发布。该框架被视为Meta对开源策略争议的回应,强调平衡技术益处与社会风险。 Meta宣布下周在全公司范围内进行预期内的裁员,同时加快招聘机器学习工程师。此次裁员预计将裁减约5%的员工,以该公司截至去年9月约72404名员工计算,约3600人可能会受影响,Meta此举旨在优化资源配置并集中资源投入AI领域。扎克伯格此前表示,2025年公司将聚焦AI、智能眼镜等下一代技术,需确保团队由“最优秀人才”组成。 谷歌宣布全面推出Gemini 2.0系列模型,涵盖Gemini 2.0 Flash、Gemini 2.0 Flash-Lite和Gemini2.0Pro等。其中,Gemini2.0Flash-Lite主打性价比,在多数基准测试中优于Gemini1.5Flash,且输入价格较低,与竞品相比有一定优势。Gemini2.0 Pro则强调具备更好的世界知识理解和推理能力,上下文窗口大,可调用谷歌搜索工具和执行代码。然而,发布当日谷歌股价下跌7%,主要因公司预期本财年资本支出高,用于扩展人工智能产品和数据中心建设。 谷歌宣布解除AI军事禁令,科技巨头全面拥抱国防市场。谷歌取消对人工智能技术用于武器和监控的限制,修改AI原则,删除相关限制条款并采用更灵活表述。谷歌员工曾协助以色列国防部获取AI技术,这一转变在公司内部引发抗议,此前谷歌就因军事项目遭员工反对。同时,Meta、Anthropic等多家AI公司也在调整军事合作政策。背后原因包括地缘政治使国防预算增加、AI公司研发投入压力大以及军事AI市场规模扩大等。 OpenAI的o3-mini模型在数学代码、物理模拟等基准测试中成绩优异,远超DeepSeekR1。o3-mini模型能生成符合物理定律的代码,在纯文本测试集里准确率也较高。其编码能力突出,在代码补全排名上优于o1系列模型,且价格更便宜。在实际应用中,o3-mini表现惊艳,可快速构建“我的世界”、生成动态海洋风暴Shader、克隆应用、制作游戏等,还能很好地理解和解析arXiv论文,辅助科研。 FigureAI宣布终止与OpenAI的合作,因其在人形机器人AI技术上取得重大突破,决定开发内部AI技术,并计划在未来30天展示新技术。此前两家公司曾合作开发人形机器人,成果为Figure02。FigureAI认为垂直整合是让机器人规模化应用的唯一出路。OpenAI也在布局机器人领域,提交相关商标申请,组建研发团队。人形机器人领域竞争激烈,各企业在合作与自主创新中探索发展。 (二)底层技术 Deepseek通过创新的训练框架及算法优化,显著降低其开发成本,其开发成本仅为600万美元,相比OpenAI的o1模型节省超过98%的成本。Deepseek在训练框架的创新包括: DeepSeek-V3采用了创新的DualPipe算法,通过重叠计算和通信,减少了管道气泡,显著提升了训练效率。该算法通过确保在一个微批量被计算的同时,另一个微批量可以进行通信,精细地编排计算和通信,从而最大限度地减少GPU的空闲期,提高GPU的利用率。 通过定制高效的跨节点全对全通信内核 ,DeepSeek-V3充分利用了InfiniBand和NVLink的带宽,确保了通信的高效性。 Deepseek在算法优化的创新包括: DeepSeek-R1采用组相对策略优化(GRPO)替代传统的近端策略优化(PPO),无需单独的价值模型,采用基于组的相对优势估计,显著降低内存和计算开销,增强了模型的数学推理能力。 DeepSeek-R1-Zero实施了一个精心设计的基于规则的奖励系统,包含准确性奖励和格式奖励,引导模型生成高质量的输出。 (三)行业政策 2025全球开发者先锋大会将于2月21日至23日在上海徐汇举办。大会以“模塑全球无限可能”为主题,将紧密链接国内外人工智能相关产业链全环节,形成端到端的产业链条有机协同。本次大会是全球第一个定位服务于全员开发者的大会,集聚国内外100家开发者社区参与,其中20家核心开发者社区承办相关活动,包括HuggingFace、微软开发者社区、CSDN、阿里魔搭社区、Linux基金会、阿帕奇基金会、华为社区等。本次大会将主要针对“5+6”领域和行业,探索大模型产业化解决方案,推进场景落地应用,实现商业模式的正向闭环,包括智能终端、自动驾驶、科学智能、具身智能、医疗、金融、教育等领域行业,推动生态链接合作。 (四)重点事件预告 2月11-14日:Shopify、Applovin、Twilio、Coinbase财报 投资建议 受益于美联储9月开启降息周期,和我国政治局会议后推出的系列积极政策,恒生科技指数向上迅猛突破。我们认为互联网巨头将持续走出三年股价底部,并且进入到明确的股本数量下降期。今年初以来,我们判断港股互联网企业经营层面迎来明显筑底,新阶段巨头的经营特点整体呈现:更加聚焦主业、发展高毛利业务;通过组织架构整合提升经营效率;同时增加回购和分红力度,股东回报强于多数板块。回顾九月,再次出现几个重要事件,标志着行业进入全新的高质量发展阶段:1)阿里巴巴正式完成三年反垄断整改,行业从强监管阶段逐步走向规范化发展;2)近期腾讯、阿里、京东等平台宣布开展生态互联互通,意味着互联网行业逐步从跑马圈地的快速增长期进入稳定增长阶段,将满足更广泛消费者的需求,对各家平台的收入利润增长都将有正向促进作用。因此,后续如果板块出现阶段性因情绪过热带来的回调,我们建议增加港股互联网板块的仓位配置。持续推荐竞争格局清晰的港股互联网龙头腾讯、美团和边际竞争格局改善的阿里。 风险提示 政策风险,疫情反复的风险,短视频行业竞争格局恶化的风险,宏观经济下行导致广告大盘增速不及预期的风险,游戏公司新产品不能如期上线或者表现不及预期的风险等。