AI智能总结
目录18结论8一种更好的 FinOps 方法14实现 FinOps 的好处5今天组织如何解决 FinOps 问题3引言 引言在一个不确定且动荡的经济中,组织现在面临持续的压力来削减或至少控制其云支出,同时支持业务增长并获得更好的运营效率。此外,许多组织现在正在寻求实施流程来支持其云支出的更有效规划,部分目的是避免在月底收到云账单时出现糟糕的意外。但是,云的敏捷性、灵活性和速度与管理和控制云成本及最大化投资回报率所需的结构和流程相冲突。随着数字服务的普及和加速,加之疫情的影响,云环境正变得越来越复杂,呈指数级增长。然而,在将这些新服务迁移或部署到云端时,许多组织忽视了围绕云基础设施投资效率、成本效益和投资回报率等关键考虑因素。他们也无法认识到云成本以及云采购与传统IT支出的差异。与在本地环境中采购和财务团队密切监控和管理基础设施采购不同,在云端,任何DevOps或ITOps团队以及他们编写的代码都可以快速启动新资源,通常没有任何正式流程或监督。结果,这些团队经常产生未预料到的云支出和浪费,以及基础设施低效和蔓延。FinOps 增强了云投资的效益,但无法孤立运行近年来,云财务运营(FinOps)学科应运而生,旨在弥合并解决这些多样化且各不相同的挑战。它致力于在最大化云投资价值的同时,理解和管理云成本,并控制预算。 白皮书I 3 云决策者正在拥抱FinOps1因此,为了真正实现FinOps的潜力,本文档解释了组织应如何通过将注重成本自动优化流程无缝嵌入云操作中来实施FinOps。这种方法将协调并赋能所有FinOps利益相关者达成他们的共同目标,而不是事后向压力过大的DevOps和运营团队强加可能具有破坏性的成本管理任务,脱离他们现有的基础设施优化流程。但要成功,FinOps需要多个利益相关者的支持和协作,尤其是DevOps和ITOps团队以及站点可靠性工程师(SREs)在云支出决策方面的支持,尽管这些团队通常不是成本管理的专家,也不是他们的首要任务。将这些成本管理任务强加给这些本已资源不足且压力过大的团队——并可能要求他们为了降低云成本而牺牲应用创新、性能和可靠性——会导致冲突和沮丧,并阻碍产品上市时间。这份白皮书详细阐述了当前主要依赖可视性和报告来实施FinOps策略的弊端。然后,它解释了如何通过一个可扩展、可重复的过程来实现成功的FinOps策略,该过程在云的动态性质以及业务功能的不断变化中,持续且一致地优化云成本,同时提供基础设施效率。FinOps和DevOps必须协作以推动成本和资源效率96%相信实施FinOps实践对其云战略至关重要•只9%报告拥有一个“成熟”的FinOps实践•92%在 FinOps 方面遇到困难,尤其是在降低云成本方面•只19%报告称他们使用折扣云购买选项的•已生效59%相信他们可以通过优惠提供进一步降低成本•如果他们有更多专业知识,云资源 云决策者们在 FinOps 上面临挑战,尤其是在降低云成本方面1原文:翻译:2023 云运营状况 今天组织如何解决 FinOps 问题传统的 FinOps 方法侧重于可见性和特定的成本管理策略许多组织将其FinOps实践和流程集中于获取对其云环境以及云资源相关成本的可见性,相信一系列报告和仪表板足以识别成本优化机会,从而实现其FinOps战略。他们依赖于这些报告来采取成本削减措施,例如调整实例大小、移除未使用的资源、调整实例运行时间、购买承诺计划,以及为计费/回款目的将费用分配到成本中心。一些组织确实尝试将这些流程中注入以任务驱动的自动化来驱动可重复性,但总体而言,这些流程仍是人驱动的、定期的和手动的过程。 白皮书I 5 如何将FinOps落地以驱动成本和云效率了解更多关于管理 RIs 的复杂性“保留实例的终极指南” 白皮书I 6现实情况是,当今多云环境的巨大规模和复杂性,更不用说成本与云基础设施之间的相互依赖性,使得通过主要依赖手动流程来真正获得全面的可见性,并准确规划、管理和优化云支出和资源变得不可能。各个云服务提供商的月度账单——每份都有数十万甚至上百万行——需要相当多的时间和精力来分析并提取最基本的洞察。经验丰富、技能高超且薪酬丰厚的分析师往往必须筛选大量分散的云数据,最终只获得云计算支出的一个局部快照。采用这种方法,可见性或任何采取的行动都难以扩展。组织也难以适应使用情况、性能或业务需求的变化,因此这种方法最多只能满足短期成本削减需求。有限的可见性和削减成本策略无法解决FinOps挑战此外,每个云服务提供商都有其自身的资源类型、定价模式、层级以及购买套餐。试图合并、管理和优化每个云中不同且不一致的混乱实体,使这一分析过程更加复杂、耗时且容易出错。因此,基于这种可见性所采取的成本管理措施,例如删除闲置资源或购买特定类型的预留实例(RIs),可能是有误导的。这些任务也非常耗时,以至于许多公司每年只进行一次或两次云成本优化审查。到那时,任何采取的行动都可能无关紧要,甚至有害——更不用说公司在此期间造成所有浪费的云资源成本。它们也未能阻止最初造成浪费和不必要支出的先前行动。 如何将FinOps落地以驱动成本和云效率idc估计所有云支出的20-30%被浪费了22来源:IDC未来企业规划指南,通过FinOps控制云成本并扩大透明度,IDC编号#US50654223,2023年5月19日 今天,大多数FinOps策略的重点完全集中在成本管理和成本削减措施上。然而,成本决策直接影响云基础设施。但今天的FinOps策略并没有将基础设施和工作负载需求作为策略的有机组成部分,尽管它们与云支出直接相关。finops决策不能不考虑到基础设施话虽如此,运维团队并不总是热衷于参与与基础设施配置相关的成本决策。运维团队主要关注的是确保其工作负载的性能和可靠性,并将它们快速部署到生产环境中。因此,他们可能会超额配置资源,以确保工作负载的性能和可靠性,而不考虑成本。反之,运维团队不希望其部署延迟,因为基础设施的后期成本分析迫使他们不得不回过头来改变所选择的计算资源。虽然将成本管理考虑因素纳入基础设施配置应该成为 DevOps 流程的一部分,强行在 DevOps 团队中实施它们常常会造成摩擦,产生浪费,甚至可能引发应用性能问题与部署延迟。 白皮书I 7 一种更好的 FinOps 方法连续可见性 &分析AI/ML驱动自动化优化连续基础设施优化FinOpsGove一个成功的FinOps战略需要持续的可见性,以及持续的成本优化和持续的云基础设施优化——所有这些都由AI/ML驱动的自动化优化所支持,并嵌入到云运营流程中。要获得成本和性能优化的基础设施对FinOps的成功至关重要。鉴于多云环境在规模、复杂性和工作负载需求方面,需要四个关键相互关联的流程来实施有效的FinOps策略:持续可见性、持续成本优化和持续云基础设施优化——所有这些都由利用人工智能(AI)和机器学习(ML)的自动化驱动,以预测性地识别和部署在正确的时间以正确的成本部署的最佳资源。需要注意的是,这些流程不需要按顺序实施。从业者可以从其中的任何一个开始他们的FinOps策略,并根据其组织的节奏和他们在FinOps旅程中的位置逐步扩展。 连续成本优化rnance 在其本质而言,这种方法促进了FinOps相关利益方之间的有效沟通,从财务人员、产品负责人到DevOps工程师、云架构师、SRE等。这反过来使得每个人都能更容易地协作,以成功实施FinOps策略,实现长期业务目标,并推动整个组织的FinOps治理。当云支出超出预算时,通过强制操作团队实施成本优化策略,其效果显然要差得多,从而产生摩擦、延误和中断,甚至可能无效或完全错误。持续可见性对于做出明智的商业决策至关重要利用 AI/ML 驱动的自动化优化将 FinOps 向左移动可见性必须为组织的多云环境及其成本提供单一事实来源;将云成本与其应用程序、业务部门或其他定义的成本中心对齐;并识别成本优化和基础设施效率的显著机会。因此,可见性需要是全面的,并综合所有云提供商的数据,云资源必须被准确识别和标记。组织需要为了将 FinOps 嵌入云操作,组织需要理解这些流程的要求以及它们如何相互连接和影响:要真正实施有效的FinOps策略,这四个流程应嵌入到云运营中,最好在早期阶段就进行。这意味着将云成本可见性和优化作为工作负载基础设施配置过程的一个有机组成部分。这些流程应该是协同的、无缝的、自动化的,利用AI/ML驱动的自动化优化技术来实现FinOps和DevOps目标。重要的是,这应该在基础设施决策的时间点进行,而不是作为事后反应性任务。这种方法有助于在整个组织中提供一致、可扩展和可重复的FinOps策略,并减轻DevOps、云运营和SRE的负担,减少与其他利益相关者的摩擦。 白皮书I 9 白皮书I 10成本优化是成功 FinOps 策略的核心流程。成本优化的目标是高效管理云支出并降低成本,同时最大化业务价值。标准技术包括终止或调整浪费支出的来源(例如,未使用、低使用率或未附加的资源)、调整实例大小,并通过优化 RIs 和节省计划为云计算采购获得最佳定价和条款,例如。其他技术可以包括将旧代资源迁移到更新、更快、更具成本效益的新资源,将存储资源迁移到更经济的选择,同时仍然满足故障转移和数据恢复要求,并在适当的情况下将资源迁移到更具成本效益的地区。成本优化和基础设施优化必须协同和持续许多组织从可见性开始他们的FinOps策略,认为如果他们能看到它,就能解决它。一些组织在完全了解其云支出和基础设施之前,会完全停止优化他们的云资源。全面的可见性至关重要,但组织仍然可以在努力实现全面可见性的同时开始制定他们的FinOps策略。可见性可以也应该随着时间的推移而发展。随着组织对他们的云资产获得更多的智能和洞察,他们可以持续改进和优先考虑他们的成本节约和效率的机会。许多这些流程可以自动化,由基于策略的警报触发。此外,鉴于成本和计算的不断变化,它们必须持续执行以提供准确、有影响力和可衡量的结果。云可见性也必须是一个主动的过程,随着更多数据的可用性增强以及通过成本管理和基础设施优化过程持续输入进行上下文化,这个过程会不断演变。这将为组织提供最新的、可操作的、有优先级的情报,这些情报可以推动有效的长期成本、基础设施和业务决策。 白皮书I 11今天,许多组织使用任务驱动自动化,根据预先计划和/或重复性事件来扩展或缩减云资源。例如,为了支持每天上午8:00的使用高峰,会设置一个任务来自动扩展一组预定义的资源以支持工作负载的需求,并在上午9:00将其缩减。这并非新技术。然而,它是一个预先确定、固定的流程,不适合当今云基础设施的复杂性和应用工作负载的动态需求。协调这些优化流程以及参与其中的不同团队需要一种技术解决方案,该方案能够减少人工工作、人为错误和摩擦,同时为所有利益相关者和不断变化的业务需求提供最佳成果。第三个流程是基础设施优化。基础设施优化确保使用最佳的云资源来提供支持应用工作负载所需的性能、可靠性和利用率。从历史上看,基础设施优化并不是FinOps的基础组成部分。然而,成本优化流程直接影响为应用工作负载配置的基础设施,反之亦然。因此,虽然改变资源类型到更便宜的类型可能具有成本效益,但这种改变可能会对关键业务应用的性能或可靠性产生负面影响。因此,确保应用工作负载在性能和成本方面都得到优化必须是成功FinOps策略的有机组成部分。在恰当的时机预测并部署正确的资源需要的是一个敏捷的解决方案,它嵌入在云操作流程中,能够主动地——并且自动地——为特定的作业负载(包括容器化和非容器化)在恰当的时间和恰当的成本下,始终如一地识别和部署最有效的资源。 为了支持这一过程,自动化优化软件将以其最佳价格获取每个工作负载任务所需的计算能力,并在不再需要时卸载这些资源。它还应该结合有关可接受实例类型、成本和其他参数的组织政策,以及防止异常使用峰值(例如由于配置错误或错误地遗留在工作负载上)的约束,这些异常使用峰值可能导致失控支出和偏离。AI/ML驱动的自动化优化预测不可预测例如,对于一个数据