跳到主要内容

数据中心复制用于灾难恢复

您可以为 Solace PubSub+ 事件代理实施灾难恢复(DR)解决方案,使用数据中心复制。复制提供了业务连续性,并允许关键应用程序在数据中心发生重大服务中断时继续运行。

要实现复制,必须为复制站点中的每个事件代理启用 Config-Sync。Config-Sync 提供消息 VPN 配置参数的自动同步,这些参数在复制的事件代理之间必须匹配。更多信息,请参见 Config-Sync。对于处理保证消息传递的冗余设备,无论是否启用 Config-Sync,都会自动传播持久端点信息,例如队列和主题端点、主题到队列的映射以及队列选项。

当启用复制时,在某个数据中心具有“active”复制状态的消息 VPN 发布的保证消息会自动传播到另一个数据中心具有“standby”复制状态的匹配消息 VPN。复制数据中心通常位于不同的地理位置。此外,如果消息是本地或 XA 事务的一部分,事务会被传播到备用站点,并尊重事务语义。例如,回滚事务将在两个站点上回滚。准备 XA 事务将在两个站点上准备事务。在一个复制数据中心(即一个复制站点)发生重大服务中断的场景中,可以执行服务故障转移到操作正常的伙伴复制站点。

典型的客户部署模型是将复制数据中心基础设施的一对站点相隔一定距离(可能50或100英里)。这些站点被认为是复制伙伴,并统称为复制组。主或主站点将使用一对高可用性(HA)事件代理来防止该站点的事件代理或设备发生本地故障。次或备用站点可能有单个事件代理或一对 HA 事件代理。主站点提供服务,除非主站点发生故障。如果主站点失败,服务将转移到备份站点。一旦主站点恢复,服务可以恢复到主站点。下图展示了此模型:

img

复制站点的故障转移通常是一个不能仅在消息层执行的操作——通常还有服务器、关键应用程序和其他基础设施必须作为故障转移的一部分进行切换。因此,故障转移是一个需要网络管理员执行的协调操作。它不会自动发生。

复制不是数据中心内 HA 事件代理冗余的替代品。事件代理冗余提供了对单个事件代理故障的自动保护。复制保护数据中心中更灾难性的事件,并需要手动干预以实现故障转移。

复制不支持消息重放。在活动站点上写入重放日志的消息可能不会写入备用站点的重放日志。

在消息 VPN 中配置双向消息 VPN 桥时,如果复制也已启用,请避免订阅桥的两端到相同的主题,如果这些主题也配置了复制。此限制也适用于重叠的通配符订阅。换句话说,它适用于任何匹配从桥接收的消息的订阅。如果存在这样的主题,那么在复制故障转移之后,它们可能会导致从桥接收的原始消息被发送回该桥到原始事件代理。这导致原始代理中的消息重复。

有关使用复制的更多详细信息,请参见:

  • 复制工作原理
  • 复制最佳实践
  • 选择复制哪些消息
  • 同步和异步消息复制
  • 复制队列已满
  • 在站点之间切换服务
  • 复制的部署选项
  • 与 DMR 一起使用复制

如果您使用 PubSub+ Cloud 进行复制,请参见用于事件代理服务灾难恢复的复制。

有关设置复制的说明,请参见配置复制。

要了解如何检查复制状态,请参见监控复制。

有关执行故障转移和从故障转移中恢复的详细信息,请参见在站点之间切换复制服务的程序。