AWS推快照备份服务抵御宕机风险 靠谱吗?

云计算
亚马逊的多起宕机事件:在今年6月14日,位于美国东部的Amazon数据中心出现故障,并影响了AWS多项云服务以及基于之上的Heroku、Quora等知名网站。在今年10月22日,AWS东部地区再次出宕机问题, 这次宕机对Reddit, Airbnb, Flipboard, GetGlue, Coursera等多家知名网站造成了很大的影响,此次事件发生之后,AWS官方网站对本次宕机事件做出了解释,而且告诉用户AWS正在做的工作,以防止 未来再次发生类似的问题。时至今日,我们终于看到了亚马逊的动作。

似乎亚马逊的云服务每隔一段时间都要宕机一次。不过AWS今天发布一个新的功能——EBS Snapshot Copy,该服务能够让全世界各个地区的用户快速的恢复弹性块存储卷(EBS volumes)设备。即使发生宕机,也有利于整个系统快速恢复稳定。对于亚马逊的极客来说,这绝对是一个“重磅新闻”。其中有人就表示:“到目前为止,我们不得不自己动手编写代码,或者说使用像Ylastic(每个月需要50美元)这样的服务来实现跨区域移动EBS卷。而EBS Snapshot Copy功能将大大的简化跨区域之间的灾难恢复过程,这正是我们所需要的。”

AWS的官方网站***时间也对EBS Snapshot Copy功能进行了说明,以下是来自AWS官方博客的***手资料:

为什么要拷贝?

当然,很多人会有这样的疑问:为什么要从一个AWS分区拷贝EBS Snapshot到另一个分区呢?先说说用户常常遇到的情况:

地理区域的扩展:用户想在一个新的区域内推出自己的应用。

迁移:用户想跨区域迁移自己的应用程序。

灾难恢复:用户想跨区域进行备份自己的数据以及日志文件,通过这种定期备份就能最小化数据丢失的概率,也能缩短灾难恢复的时间。

那么针对这些问题,EBS快照备份可以帮助用户简化实现这些用例的拷贝流程。

如何进行快照备份?

用户现在不仅可以实现跨区域备份,而且只要是“完成”状态的Snapshot,用户都可以任意进行拷贝,包括用户自己创建的Snapshot,用户分享的Snapshot以及来自AWS市场,虚拟机的Import/Export还有Storage Gateway的Snapshot。不过如果用户拷贝了市场上的产品,就必须确保产品在目标区域内是可用的。

用户可以使用AWS管理面板或者通过命令行来创建备份,当然也可以使用***的[CopySnapshot]功能来实现,下面是从面板创建备份操作的过程:

 

 

当用户选择了拷贝Snapshot操作,管理面板就会询问用户备份的目标位置:

 

 

而且在拷贝的过程中,用户可以切换到目标区域查看拷贝的进程:

 

 

这里是该功能一些重要的信息:

AWS管理面板显示了Snapshot拷贝的进程,用户可以在其上查看完成的百分比情况。

用户可以同时创建多个Snapshot拷贝命令,仅仅需要选择然后就可以备份多个Snapshot到同一个区域,不过也可以拷贝同一个Snapshot到不同的区域,而且正在拷贝中的副本不会影响到相关EBS卷的性能。

如果备份是基于控制台的接口,那么用户首先需要登录到源区域,然后告知控制台Snapshot的拷贝位置。相比之下,基于API和命令行为基础的备份过程,用户就必须在目标区域内进行执行(API以及命令行)。

资费

跨区域之间是按照常规的数据迁移资费标准,一旦用户创建一个新的Snapshot,用户需要按照目标区域的常规存储资费标准。

未来的发展

正如用户看到的那样,EBS Snapshot Copy可以简化用户的区域扩展、数据中心迁移以及灾难恢复的过程。下一步,亚马逊将实施AMI(Amazon Machine Images)区域间的备份,用户可以备份公有的或者自己创建的AMIs到目标区域。

不过新功能的效果到底如何?能不能够减弱宕机的对运营的影响?还必须经过实践的检验,我们也将拭目以待!

后记:

不过虽然EBS Snapshot Copy允许用户跨区域拷贝EBS卷,但是这必须是在有公有云服务的范围内。AWS表示这有利于客户在新地区推出一项服务以及有利于确定接近终端用户的EBS卷。EBS Snapshot Copy的另一个很重要的用途就是帮助用户快速的进行灾难恢复,亚马逊鼓励用户使用云端的多可用区(Availability Zones),这样就可以保证系统的容灾能力,而且添加了多分区的支持,这对创建高可用性的系统来说也是合乎逻辑的。AWS将其公共云产品划分成九个区域,而且在每个地区内都配置了可用区(该可用区独立于区域内的其他部分)。这样不仅仅能扩展工作负载,还能为客户添加新的工具来预防宕机。

亚马逊的多起宕机事件:在今年6月14日,位于美国东部的Amazon数据中心出现故障,并影响了AWS多项云服务以及基于之上的Heroku、Quora等知名网站。在今年10月22日,AWS东部地区再次出宕机问题, 这次宕机对Reddit, Airbnb, Flipboard, GetGlue, Coursera等多家知名网站造成了很大的影响,此次事件发生之后,AWS官方网站对本次宕机事件做出了解释,而且告诉用户AWS正在做的工作,以防止 未来再次发生类似的问题。时至今日,我们终于看到了亚马逊的动作。

责任编辑:王程程 来源: AWS Blog
相关推荐

2015-07-23 14:25:04

宕机云主机云智慧

2017-05-10 10:25:58

互联网

2014-02-11 09:25:09

2019-03-21 12:10:56

腾讯管理年轻化

2014-09-12 21:48:20

海外邮件中继转发服务

2021-01-12 14:24:26

Python开发大数据

2016-11-22 17:26:11

开源PowerShellLinux

2013-12-30 16:22:40

Windows 9概念设计

2015-07-31 10:16:17

2021-12-28 22:09:59

5G核心网公有云

2013-07-22 09:39:30

微软数据中心Google

2018-12-03 16:17:56

资管行业人工智能投资者

2013-07-19 10:29:54

大数据数据挖掘

2015-06-08 10:06:53

路由器

2015-06-17 14:44:36

大数据填高考志愿

2015-12-29 10:10:04

私有云虚拟化公共云

2023-07-11 08:46:38

闭包函数Rust

2021-04-01 14:35:08

XDR微步在线

2014-03-31 09:59:03

2019-06-28 15:54:49

大数据
点赞
收藏

51CTO技术栈公众号