Linux凭借其出色的性能和开放的特点在各行各业中被越来越广泛地应用,逐渐成为企业在进军信息化过程中的首选服务器操作系统。邮政行业为了提高生产效率和方便内部调度管理,在原有的企业内部网基础上建设了中心局生产管理及调度系统。 该系统就采用了Linux作为系统的操作平台。本文结合在邮政系统中的工作实际,将详细介绍该中心局生产管理及调度系统高可用性集群的方案、部署、配置和在线测试。 HA结构方案 HA(High Availability)方案即高可用性集群方案。由于邮政生产内部作业时间上的特殊性,该中心局生产管理及调度系统必须保证全天候响应客户端对服务器的请求。 一天中任何时候的系统宕机或软件停止,都会给整个工作带来严重影响。为此,高可用性模块成为系统的核心部分,所有后台程序都必须提供连续可靠的服务。 该方案将两台服务器配置成高可用集群,对外部网络提供服务。集群心跳通过内部网络连接和串口连接实现。所有高可用服务的数据都存储在共享磁盘阵列上,阵列通过SCSI线缆与两台服务器连接。高可用服务绑定在固定IP上,每台主机运行多个高可用服务,构成互为备份的系统。 外部网络上的客户机执行特定的业务操作,所有涉及到的服务请求也都指向特定的IP,这样不管后台服务运行在哪台服务器上,客户机都能得到服务响应。 实际系统配置 为达到系统预期的性能要求,实际工程建设中采用了红旗Linux数据库服务器3.0版。该版本主要针对Oracle、DB2等数据库做了优化和调整,使数据库软件的安装更加容易,不再需要为Oracle v8.1.7的安装对系统进行手工调整。 HA方案采用了RSF-1集群软件。该软件由HAC公司开发,并且得到了Sun、Oracle等软件厂商的认可。它不仅能够进行集群内各个主机的监控,还能通过代理对集群的服务和网络进行监控,做到真正的高可用性。 经试验,操作系统也可以采用其它发行版,除了有些版本在安装数据库时需要手工调整系统外,其它部分都没有区别,RSF-1集群也运行正常。 两台集群服务器使用各自的内置SCSI硬盘安装操作系统,通过第二块SCSI卡连接到共享的磁盘阵列。磁盘阵列上做好RAID 5和LUN设置,并做主机映射。 集群心跳通道使用网络心跳和串口心跳两种方式,以提高HA可靠性。集群对外部网络提供四个服务,分别是Oracle生产数据库实例、TUXEDO、Oracle历史数据库实例和WebLogic。前两个服务运行在主机一上,后两个服务运行在主机二上。下面介绍具体的配置过程。