AI智能总结
SCBX AI Outlook 2025:指引人工智能的未来。智能在2022年底,OpenAI发布ChatGPT标志着一个决定性的时刻—世界被引入了生成式人工智能(Gen AI),一切都发生了变化。该报告分为四个部分,每部分都突出一个重塑人工智能格局的主要力量:第一幕:两种哲学,一个未来。开源与闭源人工智能之间的较量加剧。第三幕:AI触手可及。自主人工智能:代理的崛起ACT IV:并非完全人类,但已接近。通用人工智能(AGI)与通往人类水平人工智能的未解决路径ACT II: 微型巨头 - 小,但强大。更具通用性、更小巧、更智能:下一代人工智能发展的三大趋势报告以尾声《AI风暴——无限影响》结束:来自台风眼内部的案例研究——展示SCBX在其AI引擎“台风”在多个业务部门中的实际应用案例。SCBX AI Outlook 2025:为人工智能的未来引航,旨在成为这股加速浪潮中的一座灯塔——为领导者们在技术颠覆的浪潮中提供清晰指引。本报告探讨塑造未来一年的定义性人工智能趋势,并提供战略视角将不确定性转化为机遇。随着人工智能浪潮向前推进,本报告旨在不仅提供预测——而且成为那些准备好驾驭浪潮并引领的群体的战略灯塔。曾经被视为遥远前沿的领域突然成为当下的现实。人工智能迅速融入个人日常与企业战略之中,成为强大的变革力量——简化生活、解锁新效率,并重塑组织运营方式。为追求竞争优势,各行业企业正竞相理解、采纳和创新人工智能。 目录页面4-9第一幕:两种哲学,一个未来。开源与闭源人工智能之间的较量加剧。 更具通用性、更小巧、更智能:下一代人工智能发展的三大趋势页面10-16 ACT IV:并非完全人类,但已接近。通用人工智能(AGI)与通往人类水平人工智能的未解决路径页面22-26 第三幕:AI触手可及。自主人工智能:代理的崛起页面17-21 页面27人工智能风暴——无限影响。台风眼内部的案例研究,来自SCBX A CT I:两种哲学一个未来。 开源与闭源人工智能之间的斗争加剧。 44.4%65.7%33.3%[5]从一个增加AND JUSTWERE OPEN-SOURCEIN 20222021年这些数据表明产业正迅速向开放转型,摆脱少数科技巨头的统治。如今,越来越多的组织和研究机构以开源格式发布模型。这促进了知识和技术的广泛传播,使更多实验与创新得以在大型企业的封闭体系之外进行。然而,这些封闭系统作为“黑箱”的性质引发了透明度和数据安全的担忧。许多组织不愿将敏感数据提交到他们无法完全控制的系统中,这凸显了依赖可能缺乏完善内部保障的封闭模型所伴随的风险。相反,开源模型通过赋予公众访问权限并鼓励社区开发,显著改变了人工智能的格局。这种协作能力导致了创新性人工智能模型的快速涌现。[3] [4]这一趋势在斯坦福大学以人为本的人工智能研究所(HAI)的研究成果中日益明显,该研究所报告称,仅在2023年就推出了149个创纪录的基础模型。其中,超过开源模型与闭源模型之间的竞争日益激烈,已成为焦点,许多企业现在选择开源模型来驱动他们的聊天机器人和人工智能应用——直接挑战基于专有模型的付费服务。此外,开源模型通过允许开发者和普通用户为独特需求或细分问题定制工具,从而无需从头构建模型的负担来推动创新。 由OpenAI、Google和Anthropic等主要企业开发的闭源模型最初推动了人工智能的进步——大约从2018年GPT-1发布开始——并引发了广泛的公众兴趣。由GPT-3.5和GPT-4等专有模型驱动的OpenAI的ChatGPT展现了人工智能在对话和内容生成方面的显著潜力,促使许多组织认真采用人工智能技术。2]开源AI模型在设计中具有透明性。其底层代码和架构洞察被公开提供给公众,使全球开发者能够在不受限制的情况下使用、修改和基于它们进行开发。相比之下,闭源模型由特定组织开发并严格控制。其内部机制、数据和决策逻辑保持专有——对外部审查进行屏蔽。关于“开源与闭源AI模型”的争论已成为决定人工智能行业发展方向的关键议题。每种方法都提供了独特的优势和劣势。随着开源模型的能力日益与闭源模型相媲美,它们对产业和经济的冲击不断增大——这使得企业适时地适应并恰当整合AI解决方案同样变得至关重要。[1]知名的闭源模型如OpenAI的ChatGPT和Anthropic的Claude通常表现出高性能,但往往被视为“黑箱”,其内部机制对用户而言仍保持神秘。另一方面,像DeepSeek的DeepSeek R1和Meta的Llama这样的知名开源模型允许开发者社区参与,从而推动了快速和协作性的创新。先进人工智能(AI)模型的发展目前由两种主导哲学主导:开源和闭源。开源模型与闭源模型的影响与转型 [ DeepSeek的影响自2025年1月27日发布以来已波及科技股票市场。数据中心能源领域的企业——如Vertiv和通用电气可再生能源公司(GEV)的股价下跌了高达30%。半导体股,包括与人工智能相关的成长股如英伟达和台积电,跌幅超过20%。相比之下,谷歌、微软、亚马逊和Meta等云服务提供商受影响不大。最终,股价上涨的是与应用层相关联的公司——如Adobe、Salesforce和SAP。深Seek是快速增长的开放源模型的一个典型案例。仅用两年时间,它就发布了多个版本,包括DeepSeek-Coder、DeepSeek-V2,以及最新的DeepSeek R1——展现出持续的创新轨迹。DeepSeek R1的一个关键亮点在于其能够比预期更快地缩小与封闭式模型(这类模型通常需要显著更高的资源和开发成本)的性能差距。这一点在MMLU(大规模多任务语言理解)基准测试中的表现尤为明显。一个被广泛认可的用于评估人工智能模型在语言理解、一般知识和高级问题解决能力方面的标准。DeepSeek R1 的表现与 OpenAI 的“o1”这一领先的闭源模型相当,表明开源模型正以加速的速度赶超。值得注意的是,据报道 DeepSeek 的研发预算仅为 560 万美元(约 1.9 亿泰铢)。然而,许多分析师认为这一数字可能低估了真实成本,因为它很可能不包括多次训练周期、数据收集、基础设施以及运营等各项额外开支。将这些都考虑在内,总投资额可能远高于报告中的数字。[8]尽管领先的闭源模型在历史上一直具有性能优势,但闭源与开源模型之间的差距正在迅速缩小。[6]DeepSeek 与开放模型与封闭模型之间日益缩小的差距 [7], DeepSeek能够在短短两年内开发出与闭源模型性能相当的模型,这一事实反映了一种日益增长的趋势——开源模型可能很快就会拥有与其闭源对应物的同等能力。这一发展可能导致人工智能加速进步、成本降低以及人工智能技术在各行业中的更广泛普及。这两种模型类型之间的持续竞争可能会迅速重塑人工智能格局——尤其是在成本、采用和持续发展方面。例如,如图所示,OpenAI 的 GPT-4.5 在幻觉问题(生成不准确信息)方面表现出强控制力。然而,其每处理 100 万个 token 的成本约为 112.5 美元,性能评分为 51 分(性能基于推理、常识、数学和编程能力进行评估)。相比之下,DeepSeek R1 处理 100 万个 token 的成本仅为 1.37 美元,同时实现了 60 分的性能评分。[9]2025年1月28日至30日间,部分此前急剧下跌的股票开始反弹;然而,它们尚未恢复至DeepSeek发布前的水平。云服务提供商保持相对稳定,其中某些公司如谷歌和Meta甚至出现了轻微上涨。 2. 速度经济:1. 规模经济:开源模型通过在全球开发者社区中分配工作负载,显著降低了 AI 开发的成本。与需要单个实体进行大量投资的封闭源模型不同,开源模型允许企业采用和优化现有模型,而无需从零开始——这降低了成本并加速了 AI 的商业部署。开源AI与闭源AI之间的竞争不仅重塑着技术格局,而且通过规模经济和速度经济的原则重新定义着AI的经济模式。通过公开源代码,AI的开发周期得到显著加速。广泛的开发者群体能够集体优化模型,与封闭式开发的有限内部流程相比,这导致问题解决和创新速度更快。这种全球适应性和共享学习使开源模型能够在更短的时间框架内达到与封闭式模型相媲美的性能。结论:开源AI模型正在改变AI的经济格局。一个引人注目的例子是SCB10X开源的Typhoon2 R1 70B模型,该模型仅用120美元(约合4000泰铢)的预算,在极短的15小时时间内完成开发。这一成就通过融合两个模型实现——Typhoon2 70B以其泰语能力著称,而DeepSeek R1 70B Distill则以其强大的推理能力闻名。由此产生的模型在推理和泰语理解方面均有显著提升,在关键领域超越了DeepSeek R1的性能。[10] [11] 尽管如此,领先的闭源模型在特定任务上仍保持着明显的优势,例如高级语言理解或管理扩展的上下文——在这些领域,GPT-4等模型表现出色。这些优势源于用于训练此类模型的庞大资源和专有的大规模数据集,这些资源仅限于拥有它们的组织。此外,开源模型在灵活性和定制化方面具有显著优势,在某些情况下,它们比通用型闭源模型更适合专业应用。例如,一家寻求用于分析特定领域文档的AI助手的公司,可以选择在其专有数据上微调开源模型,从而得到一个深刻理解其特定环境的AI系统——而通用型闭源模型可能无法以同样精确的水平实现这一点。超越性能和成本,双方正在积极追求的另一个新兴趋势是推动速度——特别是基于推理响应的加速。在早期的模型代中,生成有推理的答案需要在推理过程中消耗大量计算资源。因此,逻辑连贯响应的速度正成为未来AI模型评估的另一个关键指标。然而,鉴于开源模型目前正以指数级的速度发展——每年在公开发布中翻倍——并且它们正持续被全球开发者“改进”,性能差距正逐步缩小。要说“开源AI模型正快速逼近”——在特定领域有潜力与闭源模型匹敌甚至超越——这并不算夸张。 81.476.074.488.785.185.7806040200100指令遵循/代码转换基准Typhoon2 70B InstructTyphoon2 R1 70BDeepSeek R1 70B DistillIF Eval-THIF Eval-TH另一方面,开源模型承诺合作与公平访问,并且它们越来越多地展示出在与闭源模型在许多领域相媲美的能力。在这些两种方法之间达成平衡整合,对于人工智能行业的持续发展和最最终,无论是有源码还是闭源码的AI模型,共同的目标都是利用人工智能为人类带来最大的利益。两种方法的共存将使这一目标得以更快速、更全面地实现——同时在未来保持创新、透明度和问责制之间的健康平衡。闭源模型提供顶尖性能和可靠支持,但这以有限的透明度和权力集中在少数开发者手中为代 大化其对经济和社会的整体利益将至关重要。价。 ACT II:Tiny Titans - Small,但Mighty. 更具多功能性、更小巧、更智能:下一代人工智能演进的3大趋势 2. 更高效、更灵活的小型、任务特定模型。多模态AI模型能够同时处理多种类型的数据,例如文本、图像、音频和视频。这使得系统能够更深入地理解上下文并执行更广泛范围内的复杂任务。多模态大语言模型(Multimodal LLMs)正获得强劲的发展势头,因为它们为各种现实世界的应用提供了更丰富的上下文理解和更大的灵活性。这一趋势促成了能够解释多种数据格式的全新模型的发展,并为它们与AI智能体系统的整合铺平了道路,使其能够自主且智能地运行。谷歌DeepMind首席执行官Demis Hassabis表示,“多模态能力与AI智能体的结合是实现通用人工智能(AGI)的关键步骤之一。”[1]这些趋势中的每一种都具有独特的意义——重塑企业运营方式、行业创新模式以及人工智能融入日常生活的途径。总体而言,它们标志着向更实用、可扩展且与人类需求相契合的人工智能转变——拓展智能系统在现实世界中所能实现的成就边界。人工智能(AI)正以显著的速度持续发展,有三个新兴趋势正在重新定义技术前沿:1. 具备解释和响应多种类型数据能力的多功