一、背景

1.1 问题:

同事反馈有可以鉴于目前几次大的公有云事故,腾讯云/阿里云两大公有云厂商尚且存在这样令人触目惊心的时刻,更何况其他厂商和我们的日常操作,有人的地方就有误操作,百分之一的风险但如果一旦发生就是100%的问题,虽SLA但或多或少存在影响,客户反馈如果阿里的A地域发生故障,例如地质灾害或不可控因素引发的ecs无法访问,用户数据都在云上无法操作情况下该如何,但考虑到不同地域灾备的高额度IT成本,想采用每天ecs的冷备。

1.2 思路:

在最大程度的降低IT成本,又想在不可控大规模地域性灾难面前做些什么,每天凌晨业务低峰期对ECS制作镜像,同时复制到其他的不同地域,如北京的镜像复制到上海,当北京整个region异常情况下,可利用复制在目标地域的ECS创建出来,在此抛砖引玉,后续可以将ecs在目标地域开出来并关机,归档删除之前的镜像,等等。同样可以将RDS备份也同样备份到异地OSS内,目前阿里已经有EBS非常方便的灾难情况下恢复RDS。利用此思路同意的适用于其他场景下。

二、代码

2.1 结构

image0 如果多个实例可同时写入配置文件,用,进行分割。

github地址

2.2 核心代码

> 配置文件

# 阿里云ak配置,建议采用子账户只授权ecs镜像操作
[common]
# 阿里云acccesskeyid
accessKeyId = LTAIhfXlcjyln6tW
# 阿里云accesssecret
accessSecret = GwfAMvR4K2ELmt76184oqLTVgRfAso
# log目录名称
logdir_name = logdir
# log文件名称
logfile_name = ecsoperlog.log

# ecs源地域配置信息段
#支持在华北 1、华北 2、华北 3、华北 5、华东 1、华东 2 和华南 1 地域之间复制镜像。涉及其他国家和地区地域时,可以 提交工单 申请
[source]
# 源地域实例regionid,可以参考:https://help.aliyun.com/document_detail/40654.html?spm=a2c1g.8271268.10000.5.5f98df25B98bhJ
s_RegionId = cn-shanghai

# 源实例id,可指定多个用,进行分隔
s_InstanceId =  i-uf661wb708uvqc9jyhem,i-uf661wb708uvqc9jyhel

# 源端制作镜像name
s_ImageName = api-source-image

# 源镜像描述信息
s_Description = api-source-image源镜像描述信息

# 镜像复制目的地域配置信息段
[destination]
# 目的地域实例regionid,
d_DestinationRegionId = cn-qingdao

# 复制过来的镜像名称
d_DestinationImageName = api-destination-image

# 复制过来的镜像描述信息
d_DestinationDescription = api-destination-image目的镜像描述信息

image操作(制作镜像->查看镜像制作状态->复制镜像)
   # 创建实例生成器
   def _get_Instance(self):
       for Instance in self.s_InstanceId_list.split(','):
           yield Instance

   def _create_image(self):
       """
       创建镜像
       :return:返回镜像id
       """
       s_timer = time.strftime("%Y-%m-%d-%H:%M", time.localtime(time.time()))
       request = CreateImageRequest.CreateImageRequest()
       request.set_accept_format('json')
       request.add_query_param('RegionId', self.s_RegionId)
       request.add_query_param('InstanceId', self.s_InstanceId)
       request.add_query_param('ImageName', self.s_ImageName + s_timer)
       request.add_query_param('Description', self.s_Description + s_timer)
       response = self.ecshelper.do_action_with_exception(request)
       self.logoper.info('创建镜像任务已提交,镜像id:%s' % json.loads(response)["ImageId"])
       print('创建镜像任务已提交,镜像id:%s' % json.loads(response)["ImageId"])
       return json.loads(response)["ImageId"]

def _describe_image(self,imageid):
       """
       查询image状态
       :param imageid:
       :return:
       """
       request = DescribeImagesRequest.DescribeImagesRequest()
       request.set_accept_format('json')
       request.add_query_param('RegionId', self.s_RegionId)
       request.add_query_param('ImageId', imageid)
       response = self.ecshelper.do_action_with_exception(request)
       # 进度 json.loads(response)['Images']['Image'][0]['Progress']
       self.logoper.info('镜像创建进度:%s' %json.loads(response)['Images']['Image'][0]['Progress'])
       # 镜像状态
       return json.loads(response)['Images']['Image'][0]['Status']


   #镜像复制
   def _copy_image(self,imageid):
       """
       镜像复制
       :param imageid:源镜像id
       :return: 复制成功后的镜像id
       """
       flag = True
       while flag:
           try:
               if self._describe_image(imageid) == 'Available':
                   flag = False
               else:
                   time.sleep(300)
           except Exception as e:
               pass
       print('镜像已经创建完成')
       d_timer = time.strftime("%Y-%m-%d-%H:%M", time.localtime(time.time()))
       request = CopyImageRequest.CopyImageRequest()
       request.set_accept_format('json')
       request.add_query_param('RegionId', self.s_RegionId)
       request.add_query_param('DestinationRegionId', self.d_DestinationRegionId)
       request.add_query_param('DestinationImageName', self.d_DestinationImageName + d_timer)
       request.add_query_param('DestinationDescription', self.d_DestinationDescription + d_timer)
       request.add_query_param('ImageId', imageid)
       response = self.ecshelper.do_action_with_exception(request)
       self.logoper.info('复制镜像任务已提交,镜像id:%s' % json.loads(response)['ImageId'])
       print('复制镜像任务已提交,镜像id:%s' % json.loads(response)['ImageId'])
       return json.loads(response)['ImageId']

三、测试

3.2 查看web控制台

> 源镜像

image2 > 添加了时间戳,方便查看

image3 > 目的地域镜像

image4

四、优化

  • 可以后续增加对指定天数的镜像进行归档删除