亚马逊AWS官方博客

易保云中台使用 AWS Backup 守护保险客户的云上数据

易保云中台简介

易保®云中台®(InsureMO®)是在全球范围内广受认可的保险中间件平台,致力于重塑数字保险版图及生态。平台已被各类保险生态企业采用,包括:保险公司、经代公司、车商/车企、保险科技公司、软件供应商等,是为全球保险行业现代化及简化保险运营的重要技术平台。

易保®云中台®目前为全球 40 多个国家的 300 多家保险公司、5,000 多个渠道以及保险科技创新公司提供技术赋能,每年通过该平台交易的保费超过 200 多亿美元。易保网络正在推动云中台成为全球保险业的中间件,将保险产品嵌入更多合作伙伴的业务中,并为他们创造更多价值,实现易保 “让保险变得容易” 的使命。更多详细信息请参观公司网站

数据备份和恢复的需求

保险数据的隐私和保护至关重要。保险数据包含了客户的个人信息、财务状况和健康记录等敏感内容,一旦泄露或被滥用,将给客户带来巨大的隐私和经济损失。保险公司有责任采取严格的技术和管理措施,确保数据的安全性、完整性和持久性,防止未经授权的访问、使用、披露或破坏。同时,还应当遵守相关的法律法规,尊重和保护客户的隐私权利。只有这样,才能赢得客户的信任,维护行业的良性发展。比如以下几个要求。

数据不能传输出境

保险数据作为敏感信息,其存储和使用必须严格遵守相关法律法规,确保数据安全和客户隐私保护。由于每个客户所属地区的合规要求不尽相同,易保云中台日常的数据备份工作需要覆盖 9 个区域,给数据管理带来了巨大挑战。为防止数据外泄和跨境违规,易保云中台必须采取严格的数据本地化策略,确保每个客户的数据都存储在其所属区域的本地数据中心,决不能擅自跨境传输或备份。这不仅需要建立完善的技术手段,还要制定明确的内部流程,对数据访问、使用、传输等环节进行全方位管控。AWS Backup 提供了跨多个区域统一管理的界面,并将各种资源备份到各自的本地区域。

定期的数据恢复测试

保险客户十分重视自身数据的安全性和可用性,因此会定期要求保险公司对备份数据进行恢复测试,并提供详细的测试报告,以确保数据在发生故障或灾难时能够及时恢复。这项要求不仅是对保险公司数据备份和灾备能力的检验,也是对数据合规性的有力监督。保险公司必须高度重视,制定完善的恢复测试计划和流程,模拟各种可能的故障场景,验证数据备份的完整性、一致性和可恢复性。恢复测试报告需要全面反映测试过程和结果,包括测试目的、范围、方法、环境、步骤、发现的问题及整改措施等内容。对于保险公司来说,及时通过恢复测试发现并解决数据备份和灾备中的漏洞,不仅可以提高自身的数据可靠性,也有利于树立良好的合规形象,赢得客户的信任。而对客户而言,定期审阅恢复测试报告,可以全面了解保险公司的数据安全和合规水平,从而选择最值得信赖的合作伙伴。AWS Backup 设计了定期自动化恢复测试和验证,自动产生恢复测试报告,帮助易保云中台完成这个流程。

客户和保单数据长期保存

在保险行业,数据合规性要求异常严格,尤其是对于数据保存期限的规定。即使客户已经不再使用易保云中台的服务,其历史数据也需要按照监管要求,相关数据在备份系统中需要保存 7 年之久。作为领先的保险科技公司,易保云中台高度重视数据合规,将 AWS Backup 视为确保数据长期保存的核心能力,Vault Lock 不仅能满足监管要求,其合规模式(compliance mode)也为客户提供了数据长期保存的而不会被删除的保障。客户可以在需要时随时申请恢复历史数据,方便查阅和使用。这种”暖备份”能力,为客户的业务连续性和合规经营提供了有力支撑。

以上都是一些来自客户和保险行业的合规要求,为了提升数据备份和恢复的工作效率和安全,易保云中台的 IT 运维团队也制定规范的内部要求:

  • 备份和恢复统一管理界面,在同一个界面中操作 RDS、EBS、EC2 等各种服务的备份和恢复。
  • 同时管理多个账号的备份和恢复,在一个管理员账号中管理其他 30 个账号资源的备份和恢复。
  • 系统管理和备份权限隔离,防止故意删除数据。系统管理员能够管理系统资源,但是没有权力删除备份数据。
  • 自动审计和报告功能,每天自动审计备份结果是否符合制定的合规要求,并生成审计报告。

AWS Backup 服务简介及使用

AWS Backup 是一项完全托管的免费 BaaS(Backup as a Service)服务,可以轻松地跨 AWS 服务、云端和本地自动执行数据保护。使用此服务,您可以一站式配置备份策略并监控资源备份活动。它允许您自动执行和整合以前执行的备份任务 service-by-service,并且无需创建自定义脚本和手动流程。只需在 AWS Backup 控制台中单击几下,即可自动执行数据保护策略和计划。目前 AWS Backup 已经支持各种存储、EC2、RDS 服务达到 22 种,针对上面提到的保险客户和 IT 运维团队的需求,AWS Backup 都提供了解决方法,下面我们来看看 AWS Backup 如何完美解决自动恢复测试和跨账号备份这两个问题。

自动恢复测试和验证

恢复测试是备份的一个重要步骤,主要用来验证备份数据在关键时候是不是真能够恢复成功、恢复流程是否正确、运维人员操作是否熟练、实际恢复时间(restore time actual)是符合设计要求。一般企业都有定期的恢复演练,来保证备份的有效性和运维人员操作流程的熟练程度。一般恢复演练都是手工操作,只有极少数企业能够达到自动编排测试流程,并且发送恢复测试结果。AWS Backup 作为一个托管备份服务,提供了一套完善服务和功能,能够自动化完成恢复测试和验证。主要步骤如下图 1 所示:

图 1 – 恢复测试流程

按照上面的流程图,我们解释每一个步骤的作用和需要注意的地方。

步骤 1:创建恢复测试计划

一个恢复测试包含 2 部分:计划和资源分配。计划是指恢复测试的周期和频率,比如是每周一次或者每月一次;资源分配是指对哪些备份资源进行恢复测试,例如 EC2 或者 RDS,默认情况下,恢复测试完成之后,会自动删除恢复的资源,避免资源继续运行产生额外成本。如果需要运行下面的步骤 3,则可以设置将恢复资源保留 1 小时或者更长时间(如下图 2),进行恢复验证,待验证完成之后,再删除资源。详细操作参考

图 2 – 恢复测试设置

步骤 2:恢复完成,将 COMPLETED event 发送到 event bus

设置好恢复测试之后,AWS Backup 会按照指定的频率和指定的资源进行恢复,等资源恢复完(restore)成以后,会发布一个 restore job COMPLETED event 到 AWS event bus。

步骤 3:设置 EventBridge 规则(rule),触发 Lambda 函数

在 EventBridge 的 console 界面创建一个规则,来捕捉步骤 2 产生的 event,根据这个 event 触发一个 Lambda 函数,对恢复出来的资源进行检查,例如检查一个对外提供 HTTP 服务的 EC2 实例是否能正常被访问。

图 3 – EventBridge rule 设置

步骤 4:Lambda 函数检查恢复资源是否符合要求,将验证结果更新到步骤 2 的恢复作业状态栏

EventBridge 会触发运行一个提前定义的 Lambda 函数,并将 restore job 的 event meta 传入 Lambda 函数。Lambda 函数获取恢复资源的 ARN,进行检查和验证,并最终将结果写回步骤 2 的作业。验证完成之后,恢复的资源会自动被删除。关于 Lambda 函数的功能实现,需要 IT 人员进行编程。AWS 提供了一个代码框架,可以通过使用 AWS Bedrock 服务,让 Bedrock 根据需求把代码框架扩充实现指定验证,IT 人员再进行细微调整即可使用。最终测试恢复及数据验证结果如下面图 4:

图 4 – 恢复测试验证结果

经过上面 4 个步骤设置,AWS Backup 将一个自动化恢复测试和验证流程完美实现。

跨账号备份和恢复

易保云中台科技的很多客户都有自己的独立账号,每次备份设置和变更的时候需要登陆独立账号进行操作,当独立账号多达几十个的时候,几十次的独立操作不但花费很大精力,而且非常容易出错,也不方便检查备份结果。AWS Backup 提供了跨多个账号备份的功能,可以定制一个共同的备份策略,通过 Organization 分发给指定的账户,同时在一个管理账号监控所有备份结果。主要功能和实现方法如下面图 5:

图 5 – 跨账号备份和恢复

下面是操作和配置的步骤:

  1. 创建 Organization 组织,委派 Organization 的管理员。根据不同的备份要求将账号加入 Organization Unit。参考操作
  2. 在 AWS Backup 的 Setting 里面分别启用“Cross Account Monitoring“ 和 “Backup Policies” 选项,支持跨账号备份和监控功能。
  3. 在 AWS Backup 的“Backup Policies”菜单创建一个备份 policy,并且 attach 到一个如图 5 的 OU。参考操作

按照上面 3 个步骤,我们可以实现一个账号统一配置备份策略,并分发到各个账号,这个账号也能够监控到所有账号的备份结果。

结语

保险行业是对数据保护最为严格的行业之一。易保云中台和亚马逊云科技共同合作,使用 AWS Backup 服务,确保了客户数据的不丢失、定期恢复测试验证、统一管理和备份策略和监控等需求。作为全球保险行业数字化转型的技术伙伴,易保云中台的经验可以为更多的同行提供借鉴。


*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您了解行业前沿技术和发展海外业务选择推介该服务。

本篇作者

吴盛峰

来自易保云中台的解决方案架构师,他为易保云中台的基础架构提供改进和优化建议,同时参与了平台安全策略、标准和最佳实践的制定工作,帮助客户构建他们的数据保护解决方案。工作之余,他喜欢与家人共度时光,一起旅行。

谢伟峰

亚马逊云科技存储和数据保护专家。擅长根据客户工作负载,对存储进行性能和成本优化;根据客户数据保护需求和合规要求,制定个性化的备份和恢复方案。工作之余,喜欢游泳、打羽毛球。

吴双

亚马逊云科技技术客户经理,负责企业级客户架构及成本优化、技术支持等工作,致力金融及制造等行业,在大数据、网络及容器等领域有较深入的理解。

琚小龙

亚马逊云科技解决方案架构师,负责基于亚马逊的云计算方案架构咨询和设计,对于微服务、DevOps 和容器领域有较深入的理解。曾任职于 HPE 以及互联网创业公司,拥有多年移动互联网、大型企业复杂应用的系统架构和设计经验。