跳到主要内容

监控您的DMR集群

如果您的事件网格出现问题,例如DMR配置不正确或网络中存在操作问题,一个或多个代理可能会报告拓扑错误或DMR在操作上处于关闭状态。

拓扑错误和故障排除

拓扑错误是由配置或操作网络拓扑中的问题引起的。

在网络中添加和移除节点时,预计会出现拓扑问题,因为配置更改需要时间在整个事件网格中传播。然而,如果您遵循本文档中的程序,预计不会有消息丢失,拓扑问题应该是暂时的,并且会自行解决。

一些拓扑错误的例子包括:

  • 缺少链接 - 集群中的每个节点都必须通过内部链接连接。链接必须是双向的;也就是说,每个链接都必须在两个节点上正确配置。
  • 链接跨度不匹配 - 链接要么是内部的(连接集群内的两个节点),要么是外部的(连接两个不同集群中的网关节点)。链接两端的配置必须匹配。
  • 缺少通道 - 每个链接都必须有一个控制通道加上每个消息VPN的一个数据通道。
  • 节点名称不匹配 - 每个节点都必须正确指定通过链接连接的远程节点的名称。
  • DMR未正确启用 - 每个参与的VPN都必须选择加入DMR。此外,对于通过内部链接连接的节点,每个节点上参与DMR的消息VPN列表必须相同。

DMR可能因其他原因而在操作上处于关闭状态,例如:

  • 其他区域的配置错误,如复制或冗余
  • 保证消息传递(例如,消息池处于关闭状态)的问题
  • 集群认证问题

如果出现拓扑错误,或DMR因其他原因而关闭,整个网络中的订阅传播和数据转发可能无法正常工作。

为了排查您的事件网格问题,请使用以下各节中的命令查看网格中对象的配置和操作状态。首先查看集群信息,然后是链接,再是通道。也就是说,从最详细的级别(集群)开始,然后根据需要缩小您的关注范围(首先是链接,然后是通道)。

显示集群信息

要显示集群信息,请输入以下命令:

show cluster <cluster-name-pattern> [detail]

其中:

<cluster-name-pattern> 显示与模式匹配的集群。集群模式可以是集群的全名,或部分名称,使用通配符字符?表示名称中的一个字符,或使用通配符字符*表示名称中的零个或多个字符。仅输入通配符*显示所有集群。

detail 显示指定集群的详细信息。

要显示集群链接信息,请输入以下命令:

show cluster <cluster-name-pattern> link <link-name-pattern> [detail | client-profile | queue | ssl]

其中:

<cluster-name-pattern> 显示与模式匹配的集群。

<link-name-pattern> 显示与模式匹配的集群链接。链接模式可以是链接的全名,或部分名称,使用通配符字符?表示名称中的一个字符,或使用通配符字符*表示名称中的零个或多个字符。仅输入通配符*显示所有集群链接。

detail 显示指定链接的详细信息。

client-profile 显示指定链接的集群链接客户端配置文件信息。

queue 显示指定链接的集群链接队列信息。

ssl 显示指定链接的集群链接TLS/SSL信息。

显示集群通道信息

要显示集群链接通道信息,请输入以下命令:

show cluster <cluster-pattern> link <link-pattern> channel message-vpn <vpn-name> [detail]

其中:

<cluster-name-pattern> 显示与模式匹配的集群。

<link-name-pattern> 显示与模式匹配的集群链接。

<vpn-name> 显示指定消息VPN的通道信息。

detail 显示指定链接的详细通道信息。

显示消息VPN信息

要显示特定消息VPN的DMR信息,请输入以下命令:

show message-vpn <vpn-name> dynamic-message-routing [dmr-bridge <remote-node-name-pattern>]

其中:

<vpn-name> 显示指定消息VPN的DMR信息。

<remote-node-name-pattern> 显示连接到指定远程节点的DMR桥接信息。