• 一文读懂云成本管理FinOps

    云和安全管理服务专家新钛云服 肖力翻译

    本文讨论如下问题

    · FinOps是什么

    · FinOps的主要作用

    · FinOps阶段及循环方法论

    · FinOps的KPI

    · FinOps成熟度模型

    · FinOps用于云成本和使用优化的工具

    Gartner数据显示2021年全球云计算市场规模为908.9亿美元,绝大多数企业已经拥抱云计算。企业经营者每个月可以收到精准的云账单,但云上费用还存在诸多挑战,比如有没有优化空间,费用走势如何较为精准的预测,费用在内部多个部门之间如何分摊

    为了应对这些调整,FinOps理念应运而生。

    FinOps是什么?

    FinOps 是“Finance”和“DevOps”的综合体,强调通信和协作业务和工程团队。也被称为“云财务管理”、“云财务工程”、“云成本管理”、“云优化”或“云财务优化”等。

    FinOps有一个权威组织——FinOps 基金会,FinOps 基金会是Linux 基金会发起的项目,致力于通过最佳实践、教育和标准来推动实践云财务管理学科。

    FinOps基金会对FinOps定义如下:

    FinOps 是一种不断发展的云财务管理学科和文化实践,通过帮助工程、财务、技术和业务团队在数据驱动的支出决策上进行协作,使组织能够获得最大的业务价值。(定义更新时间:2021 年 11 月,FinOps 基金会技术咨询委员会)

    FinOps 的核心是一种文化实践,工程、财务、产品等方面的跨职能团队协同工作,以实现更快的产品交付,同时获得更多的财务控制和可预测性。

    FinOps的特点是将问责制引入云支出,FinOps 是财务责任文化变革带入云的可变支出模型的实践,使分布式工程和业务团队能够在其云架构和投资决策中的速度、成本和质量之间进行权衡。

    FinOps 消除障碍使工程团队能够更快更好的交付功能、应用程序和云迁移,并就投资地点和时间进行跨职能对话。有时企业会决定勒紧裤腰带,有时会决定投资更多,通过FinOp,团队知道为什么要做出这些决定。

    FinOps 的主要作用

    FinOps 的主要市场驱动力如下:

    · 减少浪费的云支出

    根据最新的 2022 年分析师和供应商报告,云支出总额的 32% 是浪费的支出,即在云上的每 100 美元支出中,有 32 美元是浪费的支出。

    · 跨多个云的成本管理

    跨地理区域的 90% 的组织都在使用多个云。CSP/Hyperscale 提供的传统成本管理工具(如 AWS、Azure 和 GCP)仅支持各自的云,不支持跨多个云的云成本管理。

    · 最终客户对优化云支出的强烈需求

    越来越需要及时报告云支出及对云支出的问责制以及获得的相关业务价值。组织正在寻找可用于优化所有云环境中的云支出的FinOps/云管理平台 (CMP)。

    · 云支出增加导致运营模式发生变化

    IT和财务团队需要更有效地共同运营,以支持业务的敏捷性,并主动监控支出并做出反应。这也将使团队能够利用云的可变成本模型。

    以下是组织通过遵循 FinOps 最佳实践可以获得的主要成果:

    · 通过了解云使用情况获得控制云成本的可见性

    · 推动对云支出的问责,协助跨职能团队维护他们使用的云服务的财务责任

    · 简化云预算管理

    · 识别成本优化机会并自动执行任务

    · 加快履行请求

    · 实现数据驱动的决策

    · 云支出的组织一致性

    FinOps 是一种跨职能实践,以下是与云财务管理相关的典型角色:

    · FinOps Practitioner /CCoE 团队

    · IT运营/工程团队

    · 业务/产品负责人

    · 财务

    · 采购

    FinOps阶段及循环方法论

    FinOps 基金会建议采用迭代方法来管理云服务的可变成本。最佳实践包括应持续管理的三个阶段:通知、优化和运营。

    通知

    这是FinOps之旅的第一阶段,赋予组织和团队可视性、分配、基准、预算和预测能力。云计算的随需应变和弹性特性,以及定制的定价和折扣,使其有必要为智能决策提供准确和及时的可见性。

    基于标签、帐户或业务映射的云支出精确分配可以实现准确的退款和显示。业务和财务利益相关者也希望确保他们在控制预算和准确预测支出的同时提高ROI,避免意外。作为一个队列和针对团队的基准测试为组织提供了必要的度量标准,以发展一个高效的团队。

    优化

    一旦组织和团队被授权,他们就需要优化他们的云足迹。云提供商提供了多种优化手段。

    按需容量是最昂贵的。为了鼓励提前预订计划和增加承诺,云提供商为承诺提供折扣,这通常涉及预订的复杂计算(预留实例(RI) /承诺使用折扣(CUD -谷歌cloud))。此外,团队和组织可以通过适当调整和自动化关闭任何浪费资源的使用来优化环境。

    运营

    组织开始持续地评估业务目标和他们针对这些目标所跟踪的度量,以及它们是如何走向的。它们根据速度、质量和成本来衡量业务一致性。

    任何组织的成功只有在组织建立FinOps文化的情况下才有可能,其中包括围绕业务、财务和运营涉众建立的卓越云成本中心,涉众还定义了适当的治理策略和模型。

    FinOps的 KPI

    FinOps 严重依赖关键绩效指标 (KPI)。KPI 用于获得可见性和度量视角,以简化成本控制过程。FinOps KPI 可大致分为以下几类:

    · 云可见性 KP

    包括与跨云环境的成本、消耗、性能、配置、安全性和可用性相关的指标

    · 云优化 KPI

    包括与成本节约、生产事件、平均修复时间、安全漏洞等相关的指标

    · 云治理和自动化 KPI

    包括与财务管理治理、运营治理、安全性和运营治理相关的指标

    作为各种 FinOps KPI 类别的一部分跟踪的关键指标。KPI 建立可衡量的基准和指标,以支持监控云资源及其消耗。以下是跟踪的关键指标:

    FinOps KPI 类别

    关键绩效指标/指标

    云可见性 KPI

    • 预测支出与实际支出差异
    • 相对于云资源成本的预测成本
    • 适当标记的环境百分比
    • 来自未标记资源的账单百分比
    • 总支出与每个团队的云资源成本对比
    • 在云上花费的收入百分比
    • 总成本与云中未使用资源的成本对比
    • 每小时计算的平均价格

    云优化 KPI

    • 调整节省百分比
    • 每个资源的有效成本
    • 按应用程序/团队划分的生产事件
    • 恢复的云部署
    • 平均修复时间或平均故障间隔时间
    • 一个月的安全漏洞数
    • 不符合配置标准的资产数量(错误的 VM 类型、位置、映像、操作系统、标记)

    云治理和自动化 KPI

    • 处于合规状态的策略百分比
    • 随时间优化的成本
    • 随时间推移按政策优化成本
    • 由于政策而节省的时间
    • 自动预订数量
    • 是时候纠正安全违规行为了
    • 基于资源的承诺折扣目标覆盖率
    • 服务可用性
    • 部署时间

    FinOps成熟度模型

    FinOps 基金会定义了关于FinOps 的“爬、走、跑”成熟度方法。这种方法使企业能够从小处着手,并在规模、范围和复杂性上不断扩大。

    在评估 FinOps 能力或领域的状态时,可以使用这些成熟度名称来确定企业当前的运营位置,并确定从“爬”到“走”或从“走”到“跑”成熟度的转变区域。

    FinOps 成熟度级别

    成熟度水平特征

    指示性目标/KPI

    • 很少的报告和工具
    • 测量仅提供对成熟能力的好处的洞察力
    • 为衡量成功而设置的基本 KPI
    • 围绕能力定义基本流程和策略
    • 组织内的所有主要团队都了解能力,但并未遵循
    • 解决“唾手可得”的计划
    • 预测支出与实际支出准确性差异为 20%
    • 基于资源的承诺折扣目标覆盖率约为 60%
    • 应该能够分配至少 50% 的云支出

    • 能力在组织内得到理解和遵循
    • 确定了困难的边缘情况,但决定不解决它们
    • 自动化和/或流程涵盖了大部分能力要求
    • 确定了最困难的边缘情况并估计了解决的工作量
    • 中到高目标/KPI 设定在成功的衡量标准上
    • 预测支出与实际支出准确性差异为 15%
    • 基于资源的承诺折扣目标覆盖率约为 70%
    • 应该能够分配至少 80% 的云支出

    • 组织内的所有团队都理解并遵循能力
    • 正在解决困难的边缘情况
    • 为衡量成功设定了非常高的目标/KPI
    • 自动化是首选方法
    • 预测支出与实际支出准确性差异为 12%
    • 基于资源的承诺折扣目标覆盖率约为 80%
    • 超过 90% 的云支出可以分配

    根据 FinOps 基金会最近进行的调查,以下是跨组织的 FinOps 团队面临的 5 大常见挑战:

    · 让工程师根据 FinOps 团队提出的建议采取行动

    · 准确预测云支出

    · 处理分摊成本

    · 减少浪费或未使用的资源

    · 全部费用分摊

    • FinOps用于云成本和使用优化的工具

    由 AWS、Azure 和 GCP 等云服务提供商 (CSP) 提供的成本管理工具通常被利用来自单个云提供商的服务的组织所利用。这些通常被称为原生成本管理工具,它们的支持仅限于特定的云平台。例如:AWS Cost Explorer 仅支持 AWS,不支持 Azure、GCP、Oracle Cloud、IBM Cloud 等。

    使用多云的企业利用第三方工具,通常称为云管理平台(CMP) 或 FinOps 工具,与原生成本管理工具相比,它们提供了许多高级特性和功能。例如:Apptio可用于支持使用 AWS、Azure 和 GCP 的多云环境。

    云服务提供商 (CSP)

    原生云成本和使用优化工具

    AWS

    • AWS Cost Explorer –通过灵活的成本报告深入了解历史云支出并了解趋势
    • AWS 预算–设置自定义预算,当超出预算阈值或预留实例 (RI) 覆盖率低于目标时发送警报
    • AWS 建议– 我确定了用于调整 EC2 实例大小和购买 RI 的潜在资源节省和表面优化建议
    • AWS Trusted Advisor –提供建议以降低成本并提高系统性能和可靠性。

    Azure

    • Azure 成本分析– 使用简单的仪表板可视化 Azure 云支出。
    • Azure 预算– 通过电子邮件或 Azure 操作组建立预算通知和阈值警报。
    • Azure 顾问建议:提供节省成本的建议,包括虚拟机 (VM) 调整大小和 RI 购买。

    GCP

    • 计费– 查看具有当前成本趋势和预测的图形表示的报告,可以按项目、SKU 和位置进行过滤和分组。
    • Pub/Sub – 配置 GCP 的通用消息服务以管理预算和触发警报。
    • Compute Engine – 列出 VM 实例并将推荐列附加到表面成本节约机会。

    在 Gartner 于 2021 年 7 月/8 月发布的关于敏捷和DevOps 炒作周期的最新报告中,云管理平台 (CMP) 被归为生产力高原类别。这意味着云管理平台的实际优势已被成功展示和接受。

    由于 FinOps 是一个快速增长的市场,在垂直领域和地理区域的采用率非常高,包括 Forrester、Gartner 和ISG 在内的所有领先分析师都会定期发布有关 FinOps 工具和市场的报告。以下是最近发布的分析师报告:

    ISG – 2021 年发布的多云 FinOps 云管理平台 (CMP) 报告

    Forrester – 2020 年发布的云成本管理和优化

    第 3 方 FinOps 工具相对于 CSP 的原生工具的 3 大优缺点:

    来自 CSP 的原生成本管理工具 例如:AWS Cost Explorer

    第三方方独立 FinOps 工具 例如:Apptio Cloudability、Centilytics 等。

    优点

    • 免费提供。联合 CSP 客户无需支付额外费用。
    • 根据云使用情况定期提供特定于云的成本节约建议
    • 跨地域和垂直领域的高采用率和使用率
    • 支持多云
    • 按服务、区域、资源标签等对每个帐户进行精细可见性。
    • 支持许多高级功能,包括容器管理、自动化预留容量管理服务、云供应自动化等。

    缺点

    • 仅支持原生云。不支持多云环境
    • 无法轻易获得精细的成本可见性细节
    • 对第3方 FinOps 工具支持的高级功能提供有限支持或不提供支持
    • 额外的许可费用
    • 与所有基础设施监控和 ITSM 工具的本地集成可能不可用
    • 需要专家进行初步实施

    参考资料:

    1. 1.https://www.finops.org/
    2. 2.https://www.cigniti.com/blog/everything-about-finops/
    «
    »
以专业成就每一位客户,让企业IT只为效果和安全买单

以专业成就每一位客户,让企业IT只为效果和安全买单