1
背景概述
近期,某金融企业经历了一次系统危机。该金融在进行系统升级时遇到了一次突发的电力故障,导致其主要数据中心发生了严重的停机问题。由于该金融的核心业务涉及大量实时交易和客户数据处理,一旦系统停机,可能会导致交易无法完成,客户信息丢失,甚至对公司声誉和经济利益造成严重损害。
幸运的是,该金融企业早在系统设计阶段就引入了超融合双活技术。这一技术架构使得该金融能够在两个地理上分散的数据中心之间实现数据和应用的实时同步和自动切换。当主要数据中心发生故障时,备用数据中心立即接管了所有业务操作,不仅避免了系统长时间的停机,还确保了交易的连续性和数据的完整性。通过这种方式,该金融成功保护了客户的业务操作和数据安全,维持了公司业务的稳定运行。
该金融企业的成功案例清楚地表明了现代企业在数据保护和业务连续性方面所面临的挑战,包括数据丢失和业务中断的高风险。传统的备份和恢复方案往往无法满足当今对实时性和高可用性的需求,尤其是在金融行业这种对数据安全和业务连续性要求极高的环境下。为了防止类似危机的发生,企业亟需采用更加先进和可靠的技术解决方案。
接下来,我们将深入探讨超融合双活技术的主要优势,以及它如何有效提升企业的数据保护能力和业务连续性,帮助企业应对现代化的挑战。
2
业务需求:零数据丢失,秒级恢复
在数字化转型的驱动下,企业对于业务连续性和数据完整性的要求越来越高。尤其是在关键业务场景中,任何数据丢失或业务中断都可能导致巨大的经济损失和品牌声誉受损。为了满足这一需求,超融合双活数据中心方案应运而生,成为确保业务高可用性和数据安全性的核心方案。
1
零数据丢失
▪️ 实时数据同步:双活超融合系统通过在不同地点的两个数据中心之间实现实时数据同步,确保数据的一致性和完整性。无论是在主数据中心还是备份数据中心发生故障,系统都能在瞬间切换,无缝接管业务,确保数据不丢失。
▪️ 多副本存储:系统利用超融合架构的多副本存储特性,将数据分散存储在多个节点上,进一步提高了数据的安全性。即使单个节点出现故障,其他节点上的副本数据仍能确保业务的正常运行。
2
秒级恢复
▪️ 自动化故障切换:双活超融合系统具备智能化的故障检测和自动化切换能力。一旦检测到故障,系统能够在几秒钟内自动切换到备用节点或数据中心,确保业务不中断,实现秒级恢复。
▪️ 快速数据重建:对于意外的数据损坏或丢失,系统能够通过高效的数据重建机制,在秒级时间内恢复丢失的数据,确保业务连续性。
FT容错实现业务级双活
3
应用场景大揭秘:从金融到医疗的全面覆盖
超融合双活数据中心是一种将计算、存储、网络等资源高度集成在一起,通过软件定义技术实现资源池化、自动化管理和高可用性的数据中心架构,改架构中,两个数据中心可同时对外提供服务,实现数据的实时同步和业务的无缝切换,确保业务的连续性和高可靠性,主要应用场景有以下常见行业:
1
金融行业
【在线交易系统】
金融机构需要确保其交易系统的高可用性和数据一致性。超融合双活数据中心可以保证交易数据的实时同步和备份,避免因系统故障导致的交易中断或数据丢失。
2
医疗行业
【电子病历系统(EMR)】
医院的电子病历系统需要高可靠性和高可用性。超融合双活数据中心可以实现病历数据的实时同步,保证患者数据的安全和医疗服务的连续性。
3
政府和公共服务
【在线政务平台】
政府的在线服务平台需要为公众提供连续稳定的服务。超融合双活数据中心可以确保平台的高可用性和数据的安全性,实现无缝切换和服务不中断。
4
制造行业
【企业资源规划系统】
制造商可以利用超融合双活技术来确保其企业资源规划系统的稳定运行,该系统关乎整个企业的生产、供应链以及客户关系管理。
4
实现目标
通过构建一个高效、安全且可靠的系统运行平台,该平台将涵盖主机系统、存储系统、数据库系统、备份系统以及网络系统等关键组成部分。确保应用系统能够实现7*24小时的高可用性。充分利现有设备的投资,将其整合到新的系统平台环境中,同时确保系统能够满足未来3至5年的业务和数据增长需求。
一旦双活数据中心成功建立,即使其中一个中心发生灾难,也无需进行任何切换操作,可以实现数据丢失(RPO)为零,业务恢复时间(RTO)接近零的目标。这不仅确保了数据的安全,也保证了业务的连续性。此外,该设计可以满足《信息安全技术信息系统灾难恢复规范》的六级要求和《信息安全技术网络安全等级保护级别要求》的四级要求。
5
业务架构选型
常见容灾备份方案包括主备、双活数据中心延伸集群、灾备数据中心等,在容灾备份的场景中,主备、双活数据中心延伸集群与灾备数据中心是三种不同的数据保护策略,它们在架构设计、业务连续性和资源利用等方面存在差异。具体如下:
综合考虑成本及容灾需求,威努特超融合采用双活数据中心(延伸集群)确保平台资源最大化利用的同时实现数据中心级容灾需求。
为确保核心业务数据0丢失(RPO=0),双活数据中心设计从应用,计算,存储,网络和数据中心级五个层面构建业务双活运行需要的环境:
【硬盘级故障】业务数据RPO=0;
【内存故障】业务数据RPO=0;
【网络故障】业务数据RPO=0;
【超融合单节点故障】业务数据RPO=0;
【数据中心故障】业务数据RPO=0。
6
超融合双活数据中心方案
整体双活容灾集群设计如下图所示:
在双活集群的配置中,通常包含三个故障域:
两个数据站点故障域:在这些故障域中,虚拟磁盘的数据会固定存放两份副本。每个数据站点各自负责存储一个副本。这种配置确保了数据的高可用性和冗余性。
一个仲裁节点故障域:这个单独的故障域包含一个节点,该节点不用于存储用户数据,而是作为仲裁节点。仲裁节点的主要作用是在数据站点之间的网络连接出现问题时,帮助确定哪个数据站点仍然可用并能够继续提供服务。
如果两个数据站点之间的网络连接丢失,那么能够与仲裁节点保持连接的数据站点将被认定为可用站点,从而可以继续提供计算和存储服务。这种情况下,即使一个数据站点失效或无法访问,只要另一个站点能与仲裁节点通信,系统就能保持运行。
另一方面,如果只有仲裁节点变得不可访问,而两个数据站点之间的网络连接仍然正常,那么这两个数据站点仍然可以独立地提供服务,因为它们都拥有完整的数据副本,并且它们之间的通信没有受到影响。
这种设计旨在通过分散故障风险和提供冗余来提高系统的可靠性和连续性。
【双活数据中心互联网络设计】
在设计一个高可用性的网络架构时,涉及三个关键的站点组件:数据中心A、数据中心B和一个第三方仲裁站点。
数据中心A和数据中心B的配置:
· 位置与连接:这两个数据中心应位于不超过30公里的距离内,以确保低延迟的网络连接。通过裸光纤直接连接,保证网络时延小于2毫秒。
· 网络设施:每个数据中心都应具备高速的数据传输能力,建议至少使用10GE(10 Gigabit Ethernet)的二层以太网链路。
第三方仲裁站点的配置:
· 连接要求:仲裁站点需要同时连接到数据中心 A 和数据中心 B。虽然没有具体的距离限制,但网络带宽至少需要100Mbps,且网络时延可以较高,建议不小于50ms。
· 作用:仲裁站点的主要作用是在两个数据中心之间出现通信问题时,提供决策支持,确定哪个数据中心可以继续提供服务。
跨数据中心的业务及网络配置:
· 超融合分布式存储:使用10GE的二层以太网链路来实现数据中心间的实时数据同步,确保数据一致性和高可用性。
· 超融合业务网络:同样使用二层以太网链路,确保双活数据中心之间的业务网络能够互通,无缝地处理业务请求。
· 融合管理网络:也通过二层以太网链路实现双活数据中心的管理网络互通,以便进行有效的监控和管理。
通过这样的网络架构设计,可以确保系统在面对硬件故障或网络问题时,仍能保持高效稳定的运行,从而保障业务的连续性和数据的安全性。
管理口:
用于管理和监控数据中心的网络。它主要用于服务器、网络设备和存储设备的管理,例如配置、监视、故障排除和更新等操作。管理网通常使用专用的网络设备和协议。
业务口:
处理实际业务流量的网络。它连接着用户、应用程序和服务,用于传输数据、执行计算任务和提供服务。业务网可以包括各种类型的网络设备,例如交换机、路由器和防火墙等,以确保业务流量的安全和高效传输。
存储私网:
主要用于超融合服务器硬盘组网,通过存储私网将超融合集群中服务器的硬盘组成一个共享存储分配给虚拟机使用。存储网通常需要高带宽和低延迟,以满足存储系统的性能要求。
【超融合HA(高可用性)设计】
计算资源HA:
• 发生宿主机故障时,运行其上的虚拟机在其它宿主机上自动重启恢复。该虚拟机业务会有短暂中断,虚拟机数据不丢失。
• 一台超融合节点上能运行几台甚至几十台虚拟机,提供极高的资源利用率。
存储资源HA设计:
• 威努特超融合应用分布式存储技术提供副本冗余机制加仲裁节点的方式为双活数据中心提供数据安全保障。威努特超融合分布式存储技术最低支持两副本与三副本模式配置数据保护策略。
• 威努特超融合平台延伸集群存储双活方案,实现RPO=0,RT0分钟级的机房故障恢复,当一个机房故障时,延伸集群中运行的业务可以无缝使用另一个机房的数据副本;可以实现跨站点的业务虚拟机高可用,虚拟机可在不同站点之间热迁移或 HA 切换。
网络HA设计:
• 在链路聚合组中,负载可以平均地分布到多个物理链路上,实现数据的并行传输,从而提高带宽利用率和系统性能。
• 如果其中一个物理链路发生故障或链路失效,链路聚合组能够自动检测并将流量切换到其他正常工作的链路上,从而保证数据中心的连通性和可靠性。
• 整个集群网络(管理网络、业务网络和存储网络)全部使用链路聚合方式进行部署设计,确保网络层面高可用。
【双活容灾设计】
▪️ 硬盘故障
▪️ 内存故障
内存故障,未导致节点重启的,虚拟机继续在节点上运行;若是内存问题导致节点重启或宕机,会触发高可用,虚拟机自动在其它健康节点上重建运行。
▪️ 主机故障
主机故障,归类为主机节点因供电、硬件问题导致节点主机宕机、重启。
▪️ 网络故障
▪️ 数据中心故障
7
威努特超融合双活数据中心方案优势
▪️ 安全可靠
威努特超融合双活数据中心方案利用先进的副本机制确保数据的强一致性,从而实现数据的零丢失目标。这种设计允许数据中心在面对硬件故障或外部影响时,仍能保持数据完整和服务连续性。
▪️ 平滑弹性
超融合基础架构以标准化的x86服务器为基础,实现了数据中心IT架构的标准化和简化。这种架构通过集成超融合分布式高可用集群的特性,提供了高效且灵活的扩展能力,即所谓的scale-out扩展模式。此外,超融合平台内置的备份和容灾模块进一步增强了业务连续性和数据保护的能力。
▪️ 高性价比
威努特超融合双活数据中心方案采用通用的x86服务器硬件,IT投入成本更低,相比传统双活方案,无需购买专用的网关设备,可以最大限度降低成本。另外,超融合起步门槛低,最小规模2+2+1起步,其中4台超融合节点,1台仲裁节点,可通过增加节点模式动态扩容双活中心,初期投资成本更低。
8
总结
威努特超融合双活数据中心方案通过提供高可用性、灾难恢复能力、资源优化和广泛的适用场景,为企业关键业务提供了可靠的技术支持。双活数据中心方案能够帮助企业实现业务连续性、数据安全性和运营效率的提升,为企业的长远发展奠定坚实的基础。
渠道合作咨询 田先生 15611262709
稿件合作 微信:shushu12121
?发表于:中国 北京