服务器集群高可用性:DNS与故障转移(1)
即使虚拟化逐步成熟,高可用性HA仍然是集群里最难懂的组件之一。服务器集群能启动高可用性,它是一个hypervisor功能,当虚拟机崩溃时能限制宕机时间。VMware vSphere、Microsoft Hyper-V and Citrix XenServer都提供了高可用性功能,减轻虚拟架构中的灾难恢复任务。
太多的人在没有理解高可用性的情况下实施虚拟化项目。更糟的是,管理员在服务器集群实施期间忽视高可用性,导致现在发现它从解决问题的方案变成需要解决的问题。
事实上,高可用性能解决一些列问题。它就是一个简单的服务,无论你使用何种hypervisor,在主机发生故障后重新启动虚拟机。持续的可用性是个理想目标,但是虚拟机仍然经历一些宕机。
高可用性通常与热迁移相关,如XenMotion、vMotion,但实际上不是,我曾见过在第一次主机发生故障后,服务器集群里出现大量问题,由于混淆了这两个概念。
高可用性技术越来越智能,但是要注意下面的问题可能使你的服务器集群崩溃。
DNS如何影响高可用性
与VMware HA结合,域名服务器(DNS)分辨率会成为严重的问题。要允许服务器集群节点相互通信,VMware对DNS分辨率担负重要责任。通常,这不是问题。但如今很多的IT人员已经习惯DNS是个服务的概念,不需要进行管理。
这种不干预政策的部分原因在于Windows的动态DNS功能。许多管理员没有像以前那样花心思对待DNS,因为动态DNS现在自动执行多数任务。但是VMware服务器没有使用动态DNS.
如果在服务器集群中使用VMware HA,确保你的管理网络IP地址和相关的主机名都进入到DNS.在进行变更或添加附件到虚拟环境中时,需要进行手动操作与维护。如果DNS没有正确配置,VMware会出现明显的提示说明,但是如果发现得太晚就容易忽略这个提示。