探索人工智能时代云成本优化的新策略,包括Stacklet公司首席技术官Kapil Thangavelu对FinOps、开源和自动化的见解。
在当今动荡的经济环境中,企业比以往任何时候都更仔细地审查他们的云账单。平台团队处于这一挑战的前沿,他们的任务是寻找创新的方法来优化使用并降低成本。为了深入了解这个不断发展的领域, Kapil Thangavelu是Stacklet公司联合创始人兼首席技术官,也是CloudCustodian的创建者和首席维护者。他阐述了对云成计算本优化最新趋势的看法。
不断变化的云成本格局
问:在您看来,与近几年相比,今天的云成本前景有什么不同?
答:近年来使云计算成本复杂化并经常增加的几个基本变化:
1.复杂性增加:随着组织在云原生时代的扩展,不同的应用程序团队利用各种云服务,使得使用变得越来越复杂。
2.混合云和多云方法:许多组织正在采用这些策略,这使得管理不同领域的资源具有挑战性,并将云服务与现有的本地系统集成在一起。
3.人工智能应用的崛起:这些应用从根本上依赖于云基础设施,并且资源密集。它们通常需要高性能gpu,这比标准CPU实例更昂贵。此外,人工智能应用程序所需的数据量推高了处理和存储成本。
4.提高效率的压力:业务领导者在提高效率、减少浪费和更好地了解云使用方面面临越来越大的压力。
5.过度供应:这仍然是成本失控的一个重要因素,但账单不透明使得将成本追溯到特定资源变得具有挑战性,特别是在部署增长和涉及人工智能的情况下。
6.焦点转移:虽然组织以前急于采用云提供商的最新功能,但现在更加强调改进的护栏和最佳实践,以消除和防止云浪费。
现代建筑中成本关联的挑战
问:为什么在当今的现代云原生系统和应用程序架构中关联云成本如此具有挑战性?团队在哪些方面需要帮助来降低云成本?
答:强调了成本相关性具有挑战性的几个因素:
1.不断增长的服务复杂性:云中可用的应用程序和服务的绝对数量在不断增加,这使得优化和控制使用变得困难,特别是在跨多个工程团队的规模下。
2.临时组件:云原生系统通常使用临时组件和动态扩展微服务,这使得很难跟踪成本并将其归因于特定的资源或服务。
3.分布式系统:当组织运行带有相互连接的微服务的分布式系统时,理解单个组件的成本含义变得异常具有挑战性。
4.使用优化:虽然许多组织都有某种形式的基于费率的优化,但他们需要使用优化方面的帮助。有效地采取行动需要对服务有更好的洞察力,并与工程团队进行更深入的接触。
5.缺乏早期实现:如果一个组织从一开始就没有实现成本管理工具和过程,那么随着系统的增长,理解支出模式将变得越来越具有挑战性。
6.实时可见性:目标是提供对公司云平台、资源和配置的实时、全面可见性,以优化支出,但实现这一目标是一个重大挑战。
开源解决方案和趋势
问:你在开源社区中看到了哪些令人鼓舞的趋势/模式/新技术方法,这些趋势/模式/新技术方法使云成本方程得到了更好的控制?
答:在开源社区看到了几个积极的发展:
1.策略标准:像CloudCustodian和FOCUS这样的项目为跨提供商管理云成本提供了统一的框架。
2.自动化:开源工具正在兴起,它们可以在整个基础设施生命周期中自动化云使用和控制,以消除浪费并实现良好的“成本卫生”。
3.社区驱动的创新:蓬勃发展的开源社区,如CloudCustodian,拥有超过450名活跃贡献者,可以比单个组织更快地提供更先进的成本管理解决方案。
4.跨提供商支持:像CloudCustodian这样的工具支持所有主要的云提供商,允许组织跨不同的环境实现一致的治理。
5.实时执行:例如,CloudCustodian允许用户定义可以跨各种云资源实时自动执行的策略。
FinOps运动和跨团队沟通
问:你对FinOps运动的总体看法是什么?“财务”和“工程师”今天的沟通是好是坏?什么坏了?需要改进的是什么?
答:注意到进展和持续的挑战:
1.传统孤岛:在使用和提供云资源的工程团队和控制预算的财务团队之间,通常仍然存在脱节。
2.缺乏理解:工程师可能需要立即掌握其决策的成本含义,而财务需要深入了解这些技术选择的原因。
3.相互冲突的动机:工程师们往往把创新和上市时间放在财务审慎之上。
4.积极的发展:像FinOps基金会这样的组织已经获得了突出的地位,并在教育和推动不同团体之间更好的合作方面做得很好。
5.改进的空间:仍然需要在规模上更好地采用治理和自动化,特别是在云使用的成本治理方面,包括上下文信息和自动修复工作流。
6.行为改变:改进的治理和自动化可以在工程团队中推动行动并加强成本意识行为。
云成本优化的Stacklet方法
问:Stacklet如何适应云成本和FinOps的趋势?Stacklet在节省成本、利用率、减少移动部件以及不将钱浪费在闲置资源上方面有什么新的和不同的地方?
答:概述了Stacklet解决云成本挑战的方法:
1.专注于使用优化:虽然许多团队从速率优化开始,但Stacklet强调使用优化,这需要与内部工程团队密切合作,以使云资源与业务需求保持一致。
2.解决共同的挑战:Stacklet旨在解决诸如碎片化的可见性、手工过程、不一致的组织目标以及对及时工程行动的需求等问题。
3.全面可见性:该平台实时提供所有云资源和配置的清单,并将其与策略执行数据相结合,以获得云基础设施管理的准确、情境化视图。
4.最佳实践策略:Stacklet提供了预定义的策略来处理常见的安全性、操作和成本优化用例。
5.以开发人员为中心的方法:该平台专注于开发人员的体验,与现有的工作流和协作工具集成,以减少变更管理的负担。
6.自动化工作流:以工程师为中心的工作流可以更快地消除浪费,使团队能够专注于创新。
7.智能通信:平台自动将相关通知分组,并将其路由给正确的涉众。
8.防止再次发生:Stacklet的自动护栏旨在防止再次发生浪费。
给企业的建议
问:对于那些认为云计算提供商在成本方面对他们的影响太大的企业,您有什么建议?企业能做些什么来使自己处于更好的位置?
答:为企业提供了以下几点建议:
1.考虑多云:采用一种策略来增强谈判能力、优化定价并减少对单个提供商的依赖。
2.比较产品:分析不同的云平台,为特定用例找到最具成本效益和最有效的服务组合。
3.工作负载优化:认识到基于技术需求、遵从性需求和性能标准的工作负载可能更适合不同的云环境。
4.实现健壮的治理:使用能够实时检测和可视化策略违反并自动触发补救工作流的工具。
5.利用自动化:实现简化和自动化复杂的使用优化和治理过程的解决方案。
结论
随着云原生架构和人工智能应用不断重塑技术格局,云成本优化仍然是平台工程师面临的关键挑战。通过采用开源解决方案,促进财务和工程团队之间的协作,以及利用自动化,组织可以更有效地驾驭这个复杂的领域。
关键在于平衡创新和财务审慎,确保云资源得到有效利用,而不会扼杀技术进步。随着企业不断扩展其云操作,提供实时可见性、自动化策略执行和优化使用的工具和策略将在推动创新的同时管理成本。