服务器群集:一般管理问题

您有什么问题?

群集服务失败并且该节点不能检测网络。

在这种情况下,可能存在配置问题。检查下面的事项:

原因:  最近是否修改过配置?

解决方案:  如果最近节点配置过,或者安装过需要重新启动计算机的资源,请确认该节点的网络配置仍然正确。

原因:  节点配置正确吗?

解决方案:  请验证该服务器的 TCP/IP 配置正确。同样检查是否在运行合适的服务。如果最近节点出过故障,就会有一个故障转移的实例;但是如果其他节点也错误配置,则故障转移将不完全,而且客户端访问将失败。

添加到群集中某个组的 IP 地址失败。

原因:  Internet 地址 (IP) 地址不是唯一的。

解决方案:  IP 地址必须和其他组以及网络上的其他所有 IP 地址不同。

原因:  这个 IP 地址不是静态 IP 地址。

解决方案:  这个 IP 地址必须在 DHCP 范围之外静态指派,否则必须由网络管理员保留。

脱机时 IP 地址资源没有响应,例如不能查询其属性。

原因:  等待资源脱机的时间不够长。

解决方案:  如果 IP 地址资源在脱机时停止响应,请确认等待资源脱机的时间要足够长。

某种资源脱机时间耗时较多。例如,IP 地址资源完全脱机可耗时达三分钟。

收到错误:“无法访问 RPC 服务器。”

原因:  该服务器可能无法操作,或者“群集服务”和“RPC 服务”没有运行。

解决方案:  如果收到“无法访问 RPC 服务器”的错误,请确保该服务器可操作,而且群集服务和 RPC 服务都在运行。同时,请检查该群集的名称解析,可能使用了错误的名称或者该名称没有被 WINS 或 DNS 正确解析。

群集管理器不能打开与节点的连接。

原因:  该节点可能没有运行。

解决方案:  如果“群集管理器”不能打开与节点的连接,请确认该节点正在运行。如果节点正在运行,请确认群集服务和 RPC 服务在运行。

应用程序启动后不能关闭。

原因:  可能没有使用“群集管理器”使资源脱机。

解决方案:  使用“群集管理器”使资源联机时,必须同时使用该程序让那些资源脱机;不要尝试从应用程序界面关闭或退出应用程序。

资源已经进行了故障转移但是不能进行故障回复。

原因:  硬件和网络配置可能无效。

解决方案:  请确认硬件和网络配置有效。

如果所有内部连接失败,故障转移就会因为群集服务不能检测“心跳信号”而发生,或者即使此节点一直联机,群集服务也可能不进行注册。在这种情况下,群集服务就会故障转移到服务器群集中的其他节点,但是却不能进行故障回复,因为该节点仍处于断开状态。

原因:  该资源组可能没有配置成可直接进行故障回复,或者在该资源允许故障回复的时间内没有排除故障。

解决方案:  请确认资源组配置成可直接进行故障回复,或者在该资源允许故障回复的时间内排除了故障。

只有在特定时间内,组才可以配置成可进行故障回复。通常,管理员禁止在业务高峰时间进行故障回复。要检查此项设置,请使用“群集管理器”查看资源故障回复策略。

原因:  重新启动节点以测试组的故障转移策略而不是按重启动按钮。

解决方案:  确认按了节点上的重启动按钮。如果关闭电源并重新启动节点,资源组将无法故障回复到首选节点。有关测试故障回复策略的详细信息,请参阅测试节点故障

所有节点功能表现正常,但是从一个节点上不能访问所有驱动器。

原因:  共享驱动器没有运行。

解决方案:  请确认共享驱动器在运行。

尝试从另一个节点访问该驱动器。如果能这样做,请检查不能进行访问的节点与设备之间的电缆。如果电缆没有问题,请重新启动计算机然后再尝试访问该设备。如果不能访问此驱动器,请检查配置。

原因:  驱动器彻底失败。

解决方案:  从其他节点确认该驱动器是否在真正运行。可能需要重新启动驱动器(通过重新启动计算机)或者更换驱动器。

有关资源的硬盘或者该资源的依存关系可能失败。可能需要更换硬盘。甚至可能还要重新安装群集。

群集管理器升级延迟。

原因:  如果可以从远程计算机上运行“群集管理器”,当群集网络名称从一个节点故障转移到另一个节点时,可能不会显示正确的(已更新的)群集状态。这会导致群集管理器显示节点已联机,而事实上该节点已经脱机。

解决方案:  要解决这一问题,请重新启动“群集管理器”。

可以通过节点名称连接群集来避免这一问题。然而,如果要连接的节点失败,那么“群集管理器”将会停止响应直到 RPC 连接超时。

节点失败时,“群集管理器”停止响应。

原因:  “群集管理器”在动态更新时可能速度缓慢。

解决方案:  如果“群集管理器”在节点失败时停止响应,请确认“群集管理器”在动态更新时速度并不慢。如果群集服务在其余节点上运行,“群集管理器”将不会响应或者更新缓慢。有两种方法可以查看群集服务是否在其余节点上运行。

  • 使用 TCP/IP 的 Ping 实用程序检查其余节点上的群集名称。
  • 在“控制面板”中,双击“服务”,然后检查群集服务是否在运行。

从最近的文件列表中不能连接群集。

原因:  在”群集管理器”的最近文件列表中列出的文件(在“文件”菜单上和“打开群集连接”对话框中都有)会将群集名称添加到路径后面。例如,最近的文件列表显示为 C:\Winnt\Cluster\Webclust1,而不是 Webclust1。Microsoft Visual C++ 5.0 版安装时就会出现这个问题。

解决方案:  要解决该问题,请在打开连接时,手工键入群集名称。

节点性能迟缓并且失败。

原因:  CPU 可能过载。

解决方案:  请检查节点不是处理器捆绑的。即 CPU 没有得到 100% 的利用。对该节点容量而言如果运行的资源太多,就会使 CPU 过载。

同样,请查看页面文件大小。如果页面文件太小,群集服务就会把这种情况检测为节点失败并对组进行故障转移。

群集日志包含多个资源信息消息(例如,Entered LooksAlive、Entered Open、Entered Offline)。

原因:   一个或多个“通用脚本”资源用 Entered LooksAlive、Entered Open、Entered Offline 消息的多个副本填满了群集日志。

解决方案:  为“通用脚本”资源创建脚本时不要使用 LogInformation 方法调用 LooksAlive 函数。详细信息,请参阅“Microsoft 平台软件开发工具包 (SDK)”。

群集服务不能启动并返回一个带有事件 ID 1144 (NM_EVENT_REGISTER_NETWORK_FAILED) 的 ERROR_SHARING_VIOLATION (32) 错误代码。

原因:  由群集网络驱动程序 (ClusNet) 使用的“Internet 号码指派机构 (IANA)”指派的端口 (3343) 被另一个进程绑定,阻止了群集服务的启动。

解决方案:  使用端口扫描和进程终止工具识别并结束绑定到端口 3343 的进程。为此,请执行:

  • 打开命令提示符。
  • 定位到%systemroot%\system32 目录。
  • 键入netstat -a -o

    这将显示所有监听和连接的端口以及绑定到该端口的每个进程的进程 ID。节点上每一个群集网络的端口 3343 将出现。

  • 注意

    • -a选项表明所有连接和监听端口将要显示出来。服务器群集使用 UDP,这样端口通常是监听模式而不是连接。
    • -o选项表明所属进程的 ID 将要显示出来。
  • 键入tasklist

    将显示所有在节点上运行的进程的 ID,包含与群集服务 (ClusSvc.exe) 匹配的的进程 ID。

  • 键入taskkill /pidID
  • 要终止绑定到端口 3343 (与群集服务 ID 不匹配)的进程。

无法通过从另一节点复制systemroot\cluster\CLUSDB 文件来手动恢复本地节点上的群集数据库。

原因:  如果群集服务已锁定并加载了群集注册表配置单元,那么操作系统将阻止您复制本地 CLUSDB 文件,或覆盖另一节点上的现有 CLUSDB 文件。

解决方案:  停止群集服务。然后,在恢复群集数据库文件之前,先卸载 HKEY_LOCAL_MACHINE\Cluster 配置单元。为此:

  • 打开命令提示符。
  • 键入net stop clussvc以停止群集服务。
  • 使用注册表编辑器,卸载 HKEY_LOCAL_MACHINE\Cluster 下的配置单元。详细信息,请参阅从注册表卸载配置单元。
这样,操作系统就将允许您从节点复制 CLUSDB 文件,然后将其手动还原到另一节点。

有关如何获得产品支持的详细信息,请参阅技术支持选项。

上页:服务器群集:组和资源故障问题 下页:服务器群集的一般驱动器配置提示

相关链接

服务器群集:一般管理问题服务器群集的一般驱动器配置提示
服务器群集:群集安装问题服务器群集:管理服务器群集
服务器群集:从命令行管理群集服务服务器群集:Debugresmon 命令
服务器群集:Fixquorum 命令服务器群集:Resetquorumlog 命令
服务器群集:Norepevtlogging 命令服务器群集:Forcequorum 命令
服务器群集:清单:安装 IIS 服务器实例资源服务器群集:清单:安装消息队列资源
服务器群集:清单:安装网络名称资源服务器群集:清单:安装物理磁盘资源
服务器群集:清单:安装后台打印资源服务器群集:清单:安装 WINS 服务资源
服务器群集:清单:创建服务器群集服务器群集:清单:创建服务器群集文件服务器
服务器群集:清单:创建服务器群集打印服务器服务器群集:清单:创建群集的 IIS Web 或 FTP 服务
版权所有 © 中山市飞娥软件工作室 证书:粤ICP备09170368号