AI智能总结
降低成本 目录 简介03 公共部门正处于转折点 第1章04 为何自动化必须成为每项AI战略的核心策略、流程和透明度要求从重复性任务到预测性洞察:自动化的最大价值 第2章07 自动化之路上的障碍弥合AI技能差距 第3章10 开源作为一种成本控制和信任机制保护隐私和数据主权 第4章14 助力实现经济高效自动化的可信平台面向联邦机构的生成式AI服务生态系统优势:不止英特尔 了解更多18 推进自动化,降本增效,优化服务体验 简介 公共部门正处于转折点 这些公共部门机构发现了一个令人不安的悖论:本承诺大幅减少手动操作的AI模型,反而可能带来令人震惊的计算和云服务订阅费用。Flexera发布的《2025年云现状报告》速览显示,目前有33%的企业组织每年在公共云资源方面的支出超过1,200万美元,其中72%的企业组织将生成式AI服务作为主要关注点。²对于运维预算紧张的州政府和地方政府,这些成本会产生重大影响;每增加一小时的图形处理单元(GPU)使用时间,就意味着必须削减相应的一线项目经费。 面对这些挑战,开源AI解决方案可以为公共部门机构提供更大的灵活性、透明度和控制力。这使得团队能够构建、审核和调整模型,以满足他们的特定需求。开源的核心是社区驱动的创新,这使机构能够避免供应商锁定、降低成本并加快开发速度,同时在注重安全的可扩展环境中保持合规。 在AI的影响下,公民对私营部门服务提供商有了新的期望⸺即时响应、预测性推荐以及全天候服务渠道已成为基本要求。公共机构现在面临着同样的压力,但从未获得足够的资金或人员配置来与数字原生私营企业竞争;因此,他们现在正在奋力追赶。事实上,预计2022至2027年间,政府对AI领域的投资将以19%的复合平均增长率(CAGR)持续增长。¹ 本电子书探讨了公共部门如何化解这一矛盾,利用AI作为自动化引擎来降低成本,同时借助开源创新来控制基础架构支出。以下各章节将: 展示开源社区(如红帽全新的llm-d项目)如何重塑推理的经济模式。 量化自动化重复流程所带来的财政收益。 明确政府机构特有的策略、隐私和采购注意事项。 分析随着试点项目规模扩大而不断增加的隐性成本。 重点介绍有助于实施AI的红帽®技术和合作伙伴解决方案,从安全至上的供应链,到借助红帽Ansible®Lightspeed实现的AI增强型IT自动化,再到与英特尔等合作伙伴共同推进的联邦学习。 将大型通用模型与任务调优型小语言模型(SLM)以及成本节约技术(如虚拟大语言模型(vLLM)提示符缓存)进行对比。 第1章 为何自动化必须成为每项AI战略的核心 公共行政领域最古老的使命就是以更少的资源实现更多的目标。自动化是确保这一使命与21世纪工作负载保持一致的关键工具。分析师预测,到2026年,20%的企业组织将利用AI减少当前超过一半的中层管理人员,从而提升团队效率。³ 每一项政府职能(包括许可、福利裁决和采购)都围绕纸质时代的控制措施发展而来,这些措施旨在维护透明度并防止腐败。每项控制措施都需要移交,而每次移交都需要配备带薪员工。自动化通过软件逻辑取代这些移交工作,能在几毫秒内创建相同的审计跟踪记录。根据德勤2024年对超过19,000项美国政府任务的分析,公共部门的大部分工作(尤其是日常的数据密集型活动)都适合通过生成式AI工具实现自动化。报告还发现,自动化可以节省在起草报告或路由文档等工作上所花费的75%到95%的时间。⁴ 自动化还会以意想不到的方式改变成本曲线。引入帮助台聊天机器人后,支持工单数量降幅可达60%,从而降低了人员成本。⁵但是,云成本可能会增加,因为聊天机器人对话中的每个步骤都需要强大的算力来理解问题并生成响应,这一过程被称为推理。一家中型国家机构最近实现了福利资格查询自动化,但发现每月的AI费用增加了两倍,耗尽了原本用于关闭服务中心的专项资金。 在过去,政府机构曾尝试过零散的修复措施,例如将单个表格数字化或部署机器人来对电子邮件进行分类,然而,当服务在机构内部转移时,这会导致流程脱节和中断。因此,下一波由AI驱动的自动化必须实现端到端运维,在同一个安全至上的工作流中编排文档理解、决策规则、员工调度和公民自助服务。要实现这一目标,需要一个平台来进行管理、维护成本并实现规模经济效益。 策略、流程和透明度要求 每一项公共服务都必须遵循严格记录的程序:强制等待期、公证表单以及多方签字审批。这些控制措施可以保护公民免受任意决策的侵害,但也催生了大量繁琐的手动核查流程。AI能够将这些相同的规则转化为可执行代码,将响应时间从数周缩短到几秒,同时保留审计人员所需的审计跟踪记录。 以建筑许可工作流为例。如今,许可申请可能需要经过规划、消防、环保和税务等多个部门审批,而每个部门都运行着自己的数据库。经过良好训练的小语言模型(SLM),即您可以使用自己的数据进行定制或微调的模型,与代理式架构相结合,可以处理完整的监管数据集、根据规则集对申请进行分类,并仅将边缘案例的例外情况转交给人类专家处理。这一过程可节省数百万员工工时,使这些资源能够重新部署到一线检查工作中。 但是,如果该模型在专有云中运行,并且每个令牌都需要计费,则累计费用可能会超过节省下来的工资金额。这意味着成本效益必须成为一项策略要求,而非之后考虑的事项。为了兑现节省成本的承诺,技术领导者必须确保将模型用途、规模调整和透明化计量作为首要考量因素。 从重复性任务到预测性洞察:自动化的最大价值 公共服务机构不断发展,通过消除手动任务来提高效率,但仍有很多改进机会。重复性的人工操作任务,如在不同屏幕之间复制数据、对支持工单进行分类以及编制月度合规报告等,仍难以通过传统脚本化方式实现自动化。自然语言界面和模式识别模型,使政府效率又得到进一步提升。 以下是自动化助力提高效率并降低成本的几种方式。 为资源分配提供信息依据 简化公民支持流程 借助AI驱动的预测模型,可以预测服务需求(如急诊科的接诊量),从而使管理人员能够主动重新分配人员并避免出现服务瓶颈。 自动提示缓存功能可实现对常见问题(如“我的退款在哪里?”)的快速、可重复响应。这有助于减轻GPU的压力,提高服务交付速度。 加快公平的资格审查流程 个性化的公民服务 推荐系统可以自动识别并联系高风险人群(如需要续开处方的退伍军人),避免小问题演变成更大的健康问题。 经过监管文本训练的小语言模型通过识别不完整的申请并起草与机构用语一致的资格审查决策,帮助自动化许可和福利裁决。 例如,一个服务于2000万次查询的全国性聊天机器人能够处理高达3万亿个令牌,如果不通过自动化进行优化,这一数字会大幅增加。为解决这个问题,政府机构可以通过llm-d提供精简的小语言模型,llm-d能够将模型分解为较小的组件,并在Kubernetes集群上运行它们,从而保持较高的利用率和较低的成本。 第2章 自动化之路上的障碍 AI在公共部门领域的应用前景十分光明,但障碍也显而易见。从过时的系统和数据孤岛到不断上升的云成本,政府在迈向自动化的进程中面临着严峻的结构性和运维挑战。再加上越来越多的合规义务和不断扩大的技能差距,不难理解为何许多机构在扩展AI战略方面举步维艰。 以下是当前阻碍自动化采用的最顽固但可解决的障碍: 过时的基础架构 过时的系统和IT基础架构占用了公共部门的大部分IT预算,拖慢了现代化进程。美国政府问责办公室指出,联邦政府每年大约有1,000亿美元的IT预算用于运维和维护过时系统,这使得在传统基础架构淘汰之前,创新空间极为有限。⁶ 数据孤岛 如果数据无法被企业所有部门访问,政府机构就难以大规模部署自动化,也无法利用完整的实时信息对AI进行训练。Salesforce发布的《2024年连接性报告》显示,81%的IT主管认为数据孤岛是阻碍数字化转型的重要因素,62%的IT主管承认他们的系统根本没有配置为使用AI。⁷ 不断增加的云支出 生成式AI对计算资源的需求不断攀升,这使得云预算远远超出公共部门团队最初的规划。事实上,企业云账单费用的平均年增长率已达30%,IT和财务主管将这一激增归因于生成式AI工作负载。⁸Flexera发布的《2025年云现状报告》进一步强调了这种压力,报告指出,目前近三分之一的企业组织每年在公共云资源上的支出超过1,200万美元,用于支持AI,这使得总体云预算超出计划17%。⁹ 合规和道德风险 美国政府机构必须遵守美国管理和预算办公室(OMB)的第M-24-10号备忘录。这要求联邦部门清点AI系统、记录训练数据和模型决策,并在可能影响权利或安全的任何部署之前,使用可审计记录实施持续偏差测试。¹⁰ 在英国,欧盟AI法案现在将大多数公共部门用例归为高风险类别,因此要求各机构维护10年的技术文档、执行系统性偏差测试,并针对每个发布周期保存防篡改的审计日志。¹¹ 技能差距 美国能源部2025年裁员计划将裁减超过3,500个岗位,并将43%的岗位标记为“非必要”。这体现出在预算紧张的情况下,联邦政府有必要加快推进日常工作的自动化。 所有挑战的根源都在于资金问题:每个障碍要么耗尽有限的资金,要么掩盖多余的支出。开源工具具备出色灵活性和适应性,再加上企业级支持,为未来发展提供了清晰的道路。 弥合AI技能差距 尽管AI有望减少所需员工数量,但各国政府计划对员工进行再培训,而非裁员。挑战在于如何在不超出公共部门薪资上限的情况下吸引顶尖人才。随着AI日益深入集成到公共服务中,AI、数据科学和机器学习(ML)领域技能型人才持续供不应求。开源工具可以通过提供以下工具和功能来降低准入门槛并支持政府团队内部的技能培养: 可访问的AI工具 跨职能协作 许多开源AI框架都可免费使用,它们简单易学并受到活跃社区的广泛支持。借助这些框架,政府团队能够进行试验、构建和部署模型,而无需承担专有许可的成本或复杂性。 鼓励IT员工、数据科学家和主题专家之间进行知识共享,培养更广泛的技能,并支持与使命目标更契合的AI项目。 获取外部专业知识 统一的AI集成 开源模型上下文协议(MCP)通过统一的REST风格架构,将AI代理调用外部工具和数据的方式标准化,消除对定制集成代码的需求,帮助普通开发人员(而非稀缺的AI专家)将模型集成到现有系统中,并促进跨机构重用。 通过与开源社区和技术合作者携手合作,政府团队可以获得有助于加速AI采用的专业知识。 通过采用开源解决方案,公共部门组织可以按照自己的方式采用AI,以一种安全至上的开放式方法进行创新,并以与其使命相符的步调推进。这种方法不仅有助于保护公民数据,还能确保以负责任和公平的方式交付AI创新成果。 第3章 开源作为一种成本控制和信任机制 开源方法非常适合公共部门优先事项,可以降低成本、提高透明度并加速创新,同时避免供应商锁定或对专有工具的依赖。以下优势展示了开放生态系统如何与政府价值和运维需求保持一致: 供应商选择自由 创新和选择 快速发展的llm-d开源社区丰富了vLLM代码库,该工具有助于更高效地为大语言模型(LLM)提供服务。ARM边缘设备、张量处理单元(TPU)和高级推理技术等新功能可以快速添加,无需等待漫长的采购过程。 Kubernetes使政府机构能够在本地系统和多个云提供商之间一致地运行工作负载,从而避免供应商锁定和不可预测的定价模式。红帽支持任何模型、硬件或云,进一步扩展了这种灵活性,因此团队可以选择最具成本效益的设置,而无需额外的编码或安全方面的权衡。 透明度 政府机构需要明确了解其AI模型中包含的具体内容。通过使用Sigstore和软件包数据交换(SPDX)软件物料清单(SBOM)等工具,可以跟踪、验证和记录每个组件,从而更轻松地实施策略并发现篡改行为,而无需依赖封闭的第三方工具。 vLLM可最大限度地提高GPU效率并减少延迟,从而实现更快速、更具成本效益的AI模型服务。这对于大规模交付实时服务至关重要。vLLM