IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第1页 牛新庄
HACMP 安装配置理诊断分析
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第2页 牛新庄
HACMP 工作原理
HACMP 工作原理利 LAN 监控机网络网卡状态 HACMP
环境中 TCPIP 网络非 TCPIP 网络TCPIP 网络应客户端访问公网
该网数 AIX 支持网络 EthernetTRFDDIATMSOCCSLIP
等等 非 TCPIP 网络 HACMP HA 环境( Cluster)中节点进行监控提
供代 TCPIP 通讯路径 RS232 串口线节点连接起
节点 SCSI 卡 SSA 卡设置成 Target Mode 方式
安装 HACMP 软件
机 屏幕显示 键盘操作
xinzhuan
g1
xinzhuan
g2
含 HACMP 软件光盘插入光驱
root:> smitty install_latest
INPUT device directory for devcd0
Software SOFTWARE to install All
PREVIEW only no
安装完成提示 OK
root:> shutdown –Fr
HACMP 进程
Cluster Manager daemon(usrsbinclusterclstrmgr): HACMP 核心进程运
行群集节点监视群集目标节点网络接口网络等变化生成事件
激活相应事件脚程序 script 做处理
Cluster SMUX Peer daemon(usrsbinclusterclsmuxpd):运行群集节点通
clinfo 客户端应提供 SNMP 支持该守护进程维护理信息库
MIB(Management Information Base)中群集状态通标准 SNMP 函数访问
数注意时运行 snmpd
Cluster Information Program daemon(usrsbinclusterclinfo):运行群集节点
RS6000 客户机通查询 SMUX Peer维护群集状态拓扑图客户端提供应
程序接口 API 访问数
Cluster Lock Manager daemon(usrsbinclustercllockd):群集配置成访问方式
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第3页 牛新庄
需该守护进程运行群集节点通 API 应访问享磁盘提供加锁功
避免突
HACMP 术语(课堂逐解释画张图)
Cluster
Node
Network
Topology
Resource
Resource group
Application server
Reintegration
Synchronization
Event
HACMP 事件
见usrsbinclusterevents 系统带事件脚
usrsbinclustereventscustom 华编写脚
HACMP 日志
clusterlog Generated by cluster scripts and daemons
clustermmdd Cluster history files generated daily
cspoclog Generated by CSPOC commands
cmlog Generated by the clstrmgr daemon
dms_loadsout Generated by deadman's switch activity
emuhacmpout Generated by the event emulator scripts
hacmpout Generated by event scripts and utilities
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第4页 牛新庄
HACMP 资源接三种方式
Resource Group 三种节点关系
(Node Relationship)
(1) Cascading
(2) Concurrent
(3) Rotating
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第1页 牛新庄
安装配置 HACMP
安装配置 HACMP 时应保证卷组 datavg 激活状态
参数规划
机参数
生产机 xinzhuang1 备份机 xinzhuang2
机名 xinzhuang1 xinzhuang2
网络掩码 255.255.255.0
网卡 IP 址
en0 xinzhuang1_svc
461471100
xinzhuang1_boot
461471102
xinzhuang2_svc 461471101
xinzhuang2_boot 461471103
en1 xinzhuang1_stb
461472100
xinzhuang2_stb 461472101
集群(HACMP)参数
生产机 备份机
Cluster ID 1
Cluster Name xinzhuang_cluster
Node Name xinzhuang1 xinzhuang2
Adapters
Service
Boot
StandBy
Serial
xinzhuang1_svc
xinzhuang1_boot
xinzhuang1_stb
xinzhuang1_tty
xinzhuang2_svc
xinzhuang2_boot
xinzhuang2_stb
xinzhuang2_tty
Application Server
Start Script
Stop Script
btpdb2_srv
etcbtpdb2_start
etcbtpdb2_stop
Resource Group
Group Name
Cluster Mode
Cluster Node
Service Adapter
Share VG
xinzhuang1_gr
cascading
xinzhuang1 xinzhuang2
xinzhuang1_svc
datavg
xinzhuang2_gr
cascading
xinzhuang2 xinzhuang1
xinzhuang2_svc
Filesystems
btp
btpdbs
btpmsg
btplog
btprpt
btpslg
db2catalog
db2log
db2tmp
Application Server btpdb2_srv
机etchosts 文件rhosts 文件容
生产机(xinzhuang1)
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第2页 牛新庄
etchosts rhosts
127001 loopback localhost xinzhuang1
461471100 xinzhuang1_svc
461471102 xinzhuang1_boot
461472100 xinzhuang1_stb
461471101 xinzhuang2_svc
461471103 xinzhuang2_boot
461472101 xinzhuang2_stb
xinzhuang1_svc
xinzhuang1_boot
xinzhuang1_stb
xinzhuang1_tty
xinzhuang2_svc
xinzhuang2_boot
xinzhuang2_stb
xinzhuang2_tty
备份机(xinzhuang2)
etchosts rhosts
127001 loopback localhost xinzhuang2
461471100 xinzhuang1_svc
461471102 xinzhuang1_boot
461472100 xinzhuang1_stb
461471101 xinzhuang2_svc
461471103 xinzhuang2_boot
461472101 xinzhuang2_stb
xinzhuang1_svc
xinzhuang1_boot
xinzhuang1_stb
xinzhuang1_tty
xinzhuang2_svc
xinzhuang2_boot
xinzhuang2_stb
xinzhuang2_tty
配置网络机名
屏幕显示 键盘操作
root:> smitty mktcpip
网卡设置成示(参见参数设定)
Hostname IP Address Network Mask Network Interface
xinzhuang1_svc 461471100 2552552550 en0
xinzhuang1_stb 461472100 2552552550 en1
xinzhuang2_svc 461471101 2552552550 en0
xinzhuang2_stb 461472101 2552552550 en1
root:> smitty chinet
en0 IP 址改应 xinzhuang1_boot 址( 461471102)
en0 IP 址改应 xinzhuang2_boot 址( 461471103)
编辑机etchosts rhosts 文件
配置心跳信号线:
机型支持心跳线串口:F50H50H70 置串
口口( S3)F80H80M80M85 置串口口
( S4)S70S7AS80S85 置串口做心跳线接口外接
户卡(般配置 8 口户卡)串口
机 屏幕显示 键盘操作
xinzhuang1 root:> smitty mktty
Parent Adaptersa1
Port number 0
Enable
LOGIN
xinzhuang2 root:> smitty mktty
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第3页 牛新庄
Parent Adaptersa1
Port number 0
Enable
LOGIN
检查配置
xinzhuang1 root:> stty < devtty1
命令进入等状态
xinzhuang2 root:> stty < devtty1
两机显示终端设置信息返回命令提示符
配置 HACMP 集群
节操作仅集群台机器执行里建议生产机操作
111 定义集群
# smitty hacmp
ÆCluster Configuration
ÆCluster Topology
ÆConfigure Cluster
ÆAdd a Cluster Definition
Cluster ID 1
Cluster Name xinzhuang_cluster
112 定义节点
# smitty hacmp
ÆCluster Configuration
ÆCluster Topology
ÆConfigure Nodes
ÆAdd Cluster Nodes
Node names xinzhuang1 xinzhuang2
113 定义网络
# smitty hacmp
ÆCluster Configuration
ÆCluster Topology
ÆConfigure Networks
ÆAdd a Network
分选择IPbased NetworkNon IPbased Network网络进行配置 配置 IPbased
Network时 F7 键时选择网段 461471024 461472024
Network Type Network Name Network Type Subnet(s)
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第4页 牛新庄
IPbased Network network1 ether 461471024
461472024
Non IPbased
Network
serialnet rs232
114 定义网卡
# smitty hacmp
ÆCluster Configuration
ÆCluster Topology
ÆConfigure Adapters
ÆAdapters on IPbased network
Adapter IP Label Network
Type
Network
Name
Network
Attribute
Adapter
Function
Adapter
Identifier
Node Name
xinzhuang1_svc ether network1 public service 461471100 xinzhuang1
xinzhuang1_stb ether network1 public standby 461472100 xinzhuang1
xinzhuang1_boot ether network1 public boot 461471102 xinzhuang1
xinzhuang1_tty rs232 serialnet serial service devtty1 xinzhuang1
xinzhuang2_svc ether network1 public service 461471101 xinzhuang2
xinzhuang2_stb ether network1 public standby 461472101 xinzhuang2
xinzhuang2_boot ether network1 public boot 461471103 xinzhuang2
xinzhuang2_tty rs232 serialnet serial service devtty1 xinzhuang2
115 定义资源组
¾ # smitty hacmp
ÆCluster Configuration
ÆCluster Resources
ÆDefine Application Servers
Æ Add an Application Server
Server Name btpdb2_srv
Start Script etcbtpdb2_start
Stop Script etcbtpdb2_stop
注意:请两脚生成容空确保 root x 权限
¾ # smitty hacmp
ÆCluster Configuration
ÆCluster Resources
ÆDefine Resource Groups
ÆAdd a Resource Group
Resources Group Name xinzhuang1_gr xinzhuang2_gr
Node Relationship cascading cascading
Participating Node Names xinzhuang1
xinzhuang2
xinzhuang2
xinzhuang1
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第5页 牛新庄
¾ # smitty hacmp
ÆCluster Configuration
ÆCluster Resources
ÆChangeShow ResourcesAttributes for a Resource Group
Resources Group Name xinzhuang1_gr xinzhuang2_gr
Node Relationship Cascading Cascading
Participating Node Names xinzhuang1
xinzhuang2
xinzhuang2
xinzhuang1
Service IP Label xinzhuang1_svc xinzhuang2_svc
Volume Groups datavg
File System btp
btpdbs
btpmsg
btplog
btprpt
btpslg
db2catalog
db2log
db2tmp
Application Servers btpdb2_srv
116 步 HACMP 集群定义
¾ 步集群拓扑
# smitty hacmp
ÆCluster Configuration
ÆCluster Topology
ÆSynchronize Cluster Topology
先 Emulate 确认问题时 Actual
¾ 步集群资源
# smitty hacmp
ÆCluster Configuration
ÆCluster Resources
ÆSynchronize Cluster Resource
先 Emulate 确认问题时 Actual
述两步骤运行状态 OK 时
117 校验 HACMP 集群定义
# smitty hacmp
ÆCluster Configuration
ÆCluster Verification
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第6页 牛新庄
ÆVerify Cluster
述步骤运行状态 OK报错时
118 HACMP 性调整
生产机备份机应分确认
¾ # smitty hacmp
ÆCluster Configuration
ÆAdvanced Performance Tuning Parameters
ÆChangeShow IO pacing
HIGH water mark for pending write IOs per file 33
LOW water mark for pending write IOs per file 24
¾ # smitty hacmp
ÆCluster Configuration
ÆAdvanced Performance Tuning Parameters
ÆChangeShow syncd frequency
Syncd frequency (in seconds) 10
¾ # smitty hacmp
ÆCluster Configuration
ÆAdvanced Performance Tuning Parameters
ÆChangeShow a Network Module
Ærs232 ethernet
Failure Detection Rate Slow
12 HACMPDB2BTP 启动停止脚
两台机器编辑启动停止 HACMPDB2BTP 脚修改脚权限
700文件均放etc 目录脚容参见附录
etcha_startetcha_stopetcha_statetcha_listetcbtpdb2_startetcbtpdb2_stop
测试 HACMP
检查心跳线否已配置:
1两台分输入命令:
S85_1# cat etchosts >devtty0
S85_2# cat
IBM SVC 25页 第7页 牛新庄
果 S85_2 机接收信息表明心跳线已配置
2测试心跳线否正常工作:
A 机:
# stty
# stty
3果 7133 做心跳先安装软件:devicessa*具体背出
target 者 tmssa 类系统盘
2chdev l ssar a node_number1
3cfgmgr v
4lsdec Cc tmssa 没 tmssa1tm tmssa1im
5测试心跳 stty < devtty0 测试实际配置关 3124 3125
6定义心跳时选 ssa target 方式 devtmssa1 做心跳设备
HACMP 测试:
HACMP 诊测响应三种类型障:1 网卡障2 网络工作3 节点障面
三种障分进行介绍
1网卡障
前面讲HACMP 群集结构中 TCPIP 网络外非 TCPIP
网络实际根心跳线专门诊测节点死机仅仅网络发生障
图示旦节点加入 Cluster(该节点 HACMP 已正常启动)该节点
网卡非 TCPIP 网络会断接收送 KeepAlive 信号KA 参数调
HA 连续发送定数量包丢失确认方网卡网络节点发生
障 KA HACMP 轻易发现网卡障旦某块网卡发
生障发该块网卡 KA 会丢失时 node 1 cluster manager( HACMP
脑)会产生 swapadapter 事件执行该事件 script(HACMP 中提
供部分通环境事件 scripts标准 AIX 命令 HACMP 工具写
)节点少两块网卡块 service adapter提供外服务
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第8页 牛新庄
块 standby adapter存 cluster manager 知道应 client
知道旦发生 swapadapter 事件cluster manager 原 service adapter
IP 址转移 standby adapter standby 址转移障网卡时网
络节点进行 ARP 刷新网卡互换 (swapadapter)秒完成太网
3 秒种转换应 client 说透明发生延迟连接中断
1网卡障:
网络接口障:
命令:# ps – ef | grep cluster确认节点 HACMP 已启动
命令:# errclear 0清空系统错误日志
命令:# tail – f tmphacmpout监控 HACMP 运行状态
命令:# ifconfig en0 down宕掉 Service 网卡
命令:# netstat – in查 Standby 网卡否接宕掉 Service 网卡 IP
址 MAC 址
命令:# ifconfig en1 down宕掉接 Service 网卡 IP 址 MAC 址
Standby 网卡
命令:# netstat – in查 Service 网卡否 IP 址 MAC 址接回
2网络障
果发 node1 service standby 网卡 KA 包全丢失非
TCPIP 网络 KA 然存 HACMP 判断 node1 然正常网络发生障
时 HACMP 执行 network_down 事件
网卡连接电缆障:
命令:# ps – ef | grep cluster确认节点 HACMP 已启动
命令:# errclear 0清空系统错误日志
命令:# tail – f tmphacmpout监控 HACMP 运行状态
断开 Service 网卡连接网线
命令:# netstat – in查 Standby 网卡否接 Service 网卡 IP 址
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第9页 牛新庄
MAC 址
重新连接原 Service 网卡连接网线
命令:# netstat – in查时原 Service 网卡 IP 址 MAC 址否原
Standby 网卡 IP 址 Service 址
断开原 Standby 网卡连接网线
命令:# netstat – in查 Service 网卡 IP 址 MAC 址否恢复原
Service 网卡 IP 址 MAC 址
重新连接 Standby 网卡连接网线
命令:# netstat – in查 Standby 网卡 IP 址 MAC 址否恢复原
Standby 网卡 IP 址 MAC 址
3 节点障
果仅 TCPIP 网络 KA 全部丢失非 TCPIP 网络 KA 丢
失 HACMP 断定该节点发生障产生 nodedown 事件时资源接
放享磁盘陈列资源备份节点接接包括系列操作:Acquire
disksVaryon VG Mount file systemsExport NFS file systems Assume IP network
Address Restart highly available applications中 IP 址接重新启动应
HACMP 实现 AIX 完成
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第10页 牛新庄
整节点发生障时HACMP 障节点 service IP address 转移备
份节点网络 client 然 IP 址程称 IP 址接
(IPAT)
节点 down 掉果设置 IP 址接网络 clients 会动
连接接节点样果设置应接该应会接节点动重启
系统继续外服务实现接应需 HACMP 中设置成
application server告诉 HACMP 启动应 start script 全路径名停止
该应 stop script 全路径名见应接配置 HACMP 中十分简单
重 start script stop script 写作需户应解
节点障:
模拟*作系统崩溃:
命令:# ps – ef | grep cluster确认节点 HACMP 已启动
命令:# errclear 0清空系统错误日志
命令:# tail – f tmphacmpout监控 HACMP 运行状态
命令:# cat etchosts > devkmem模拟*作系统崩溃状态
命令:# netstat – in# lsvg – o# ps – ef APP_PID查备份节点否接
障节点 Service 址享卷组应程序
重新启动障节点启动 HACMP
命令:# netstat – in# lsvg – o# ps – ef APP_PID查该节点否原
属 Service 址享卷组应程序接回
模拟 CPU 障:
命令:# ps – ef | grep cluster确认节点 HACMP 已启动
命令:# errclear 0清空系统错误日志
命令:# tail – f tmphacmpout监控 HACMP 运行状态
直接断开某节点电源模拟 CPU 障
命令:# netstat – in# lsvg – o# ps – ef APP_PID查备份节点否接
障节点 Service 址享卷组应程序
重新启动障节点启动 HACMP
命令:# netstat – in# lsvg – o# ps – ef APP_PID查该节点否原
属 Service 址享卷组应程序接回
4障
HACMP 检测网卡网络节点否发生障作出相应转移接
行障 HACMP 缺省作动作
a硬盘障
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第11页 牛新庄
般硬盘设置成 RAID5 方式 mirror 方式提供硬盘高
性RAID5 奇偶较验位分散硬盘组中组硬盘坏掉组
硬盘通奇偶较验位该硬盘数恢复出RAID5 方式般
硬件实现 7133 SSA 适配器果组两硬盘坏掉该组硬盘
数会全部丢失mirror 方式数写少两物理外置
效率没 RAID5 盘量安全性 RAID5 高易实
现通 AIX 中(Logic Volume Management)方便设置
b硬盘控制卡
存储设备连接机必须通块控制卡SCSI 设备 SCSI Adapter
SSA 设备 SSA Adapter果块卡坏掉连接外设法利种办法
解决问题
种办法 adapter机两块两块 adapter分连接
mirror 数硬盘坏掉 Adapter 坏掉数
机利会出现单点障种方法实现起难必须配置块 adapter
必须采数 mirror 方式种方法通 HACMP 实现
种方法块 adapter利 HACMP 中 Error Notification
Facility( 错误通告机制)解决
Error Notification Facility HACMP 提供设备监控工具
报告 AIX 错误(error)捕获采取相应措施HACMP 提供 smit 界面
配置简单化
已知道 LVM 实现硬盘镜盘坏掉份数镜
盘里数进行读写时数性镜盘坏掉数全部丢
失例中PV 丢失(LVM_PVMISS)信息会幅显示控制台面提
醒户仔细查 error log 找出障修复样例中 HACMP 提供界面
结合 AIX 功监控障发生
c应障
果户应 kernel call 调 root 身份启动等旦应
发生障容易导致操作系统 down 掉发生死机时实际等节点障HACMP
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第12页 牛新庄
会采取相应接措施果应身死掉AIX 正常运行HACMP 利 Error
Notification Facility 提供监控功应身采取动作果应
中调 AIX SRC (System Resource Controller)机制提供 API 接口
应 down 掉动重新启动 SRC 提供 API 接口外HACMP 中 clinfo
提供样 API
clinfo cluster Information daemon负责维护整 cluster 状态
信息clinfo API 允许应程序利状态信息采取相应行动
d HACMP 障
果 cluster 中节点 HACMP 进程 down 掉HACMP 升级节点障
发生资源接
述HACMP 全权负责诊断网卡障网络障节点障三类障
负责实现 IP 址转换接整系统资源 ( 硬件文件系统应程序
等等)接三类障外障结合 AIX 基功 HACMP 提供
机制 Error Notification Facility clinfo API 等样实现
障监控采取相应措施
HACMP 常见障解决:
1导致集群中节点失效反映开关(Deadman Switch)
问题现象:
集群中节点历着极端性问题:量 IO 传输错误记录存
足等导致集群理器( clstrmgr)没足够 CPU 处理时间引起反映
开关分配时间重置某应程序运行权限高集群理器时会导致问题
解决方法:
术语Deadman Switch指特定集群条件未时重置该开关引起系统
宕机转储核扩展部分反映开关超特定时间限制会宕掉处挂起
状态节点程导致集群中节点接处挂起状态节点资源解决
问题需解决相关性问题:
1调整系统 IO pacing
2增加信息步(syncd)频率
3增加通信子系统存量
4更改错误探测速率
1调整系统 IO 步调:
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第13页 牛新庄
IO pacing 调整系统量写*作时系统资源分配更合理 HACMP
集群激活 IO Pacing 必尤集群中会量磁盘数块写 *作时
侯
述步骤修改 IO Pacing 设置:
# smitty hacmp
Cluster Configuration
Advanced Performance Tuning Parameters
ChangeShow IO Pacing
修改 HIGH water mark for pending write IOs per file 域推荐值 33
值 0-32767 间
修改 LOW watermark for pending write IOs per file 域推荐值 24值
0-32767 间
系统两值修改两值稍微减少写次数通常够解决
述问题
2增 syncd 运行频率:
增加 syncd 运行频率缺省 60 秒运行次变 30 秒20 秒 10 秒运行次
样强迫增加 IO 刷新速率减少沉重 IO 流量触发反映开关
性
述步骤修改 syncd 运行频率设置:
# smitty hacmp
Cluster Configuration
Advanced Performance Tuning Parameters
ChangeShow syncd frequency
修改 syncd frequency in seconds 域推荐值 10 秒值 0-32767 间
3增加通信子系统存量:
果运行命令:# netstat – m发现请求 mbuf 拒绝运行命令# errpt 发现
LOW_MBUFS 错误应增加网络参数thewall值Thewall 缺省值 25%
系统实存增加 50%系统实存
述步骤修改 thewall 值设置:
# vi etcrcnet
文件末尾加入:
no o thewall xxxxx
xxxxx 指希设置供通信子系统实存值:
no o thewall10240
4修改错误探测速率:
果激活 IO Pacing 增加 Syncd 运行频率解决反映开关重置问题时
修改错误探测速率值该 Slow样延长挂起节点调反映开
关前接节点探测节点障获挂起节点资源前需时间
注意:
完成述步骤前IO Pacing 必须先激活修改设置会调整 IO 数
传输量
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第14页 牛新庄
二双机户组致
HACMP 常命令 SMIT 工具:
usressbinclusterutilitiescllscf Show Cluster Topology
2usressbinclusterutilitiescllsclstr Show Cluster Definitions
3usressbinclusterutilitiescllsnode Show Topology Information by Node
4usressbinclusterutilitiescllsnw Show Topology Information by
Network Name
5usressbinclusterutilitiescllsif Show Topology Information by
Network Adapter
6usressbinclusterutilitiesclshowres g'sxptt_con_rg'
Show Resource Information by Resource Group
7usressbinclusterutilitiesclshowres n's85a'
Show Resource Information by Node
1查 Cluster 运行情况:
# usrsbinclusterclinfo – a
# usrsbinclusterclstat
usrsbinclusterclstat 帮助查前 HACMP 节点状态
屏幕会显示:
clstat HACMP for AIX Cluster Status Monitor
Cluster cluster1 (1) Tue Jul 20 095203 CDT 1999
State UP Nodes 2
SubState STABLE
Node j50a State UP <节点 A 状态
Interface j50_a_srv (0) Address 19292001 < 服务 IP 址
State UP <服务 IP 状态
Interface j50_a_tty1 (1) Address 0000
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第15页 牛新庄
State UP <心跳线状态
Node j50b State UP <节点 B 状态
Interface j50_b_srv (0) Address 19292002 < 服务 IP 址
State UP <服务 IP 状态
Interface j50_b_tty1 (1) Address 0000
State UP <心跳线状态
2启动 HACMP:
# smitty clstart
注:两种启动 HACMP 方式:
now:手工启动 HACMP
restartboth:系统启动时动启动 HACMP
3停止 HACMP:
# smitty clstop
注:三种停止方式:
graceful:停止节点 HACMP 运行释放节点理资源
允许节点接
graceful with takeover:停止节点 HACMP 运行释放资源节
点接
forced:停止节点 HACMP 运行释放资源
4查 Cluster 进程状态:
# ps – ef | grep cluster
注:应三 HACMP 进程:clstrmgrclinfoclsnuxpd
5查 Cluster 日志错误信息:
# more tmphacmpout
# more varadmclusterlog
注:启动 HACMP 时 # tail – f tmphacmpout 命令查 HACMP
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第16页 牛新庄
启动否正常踪启动时错误信息
6查 Cluster 运行历史记录:
# cd usrsbinclusterhistory
注:目录存放着天 Cluster 运行记录
7查 Cluster 运行时网络情况资源组情况:
HACMP 启动前:
# netstat – i
时应 boot standby 址
# lsvg – o
时 VG
HACMP 启动:
# netstat – i
时应 service standby 址
# lsvg – o
时应 VG 享 VG
8存储恢复 Cluster 配置:
存储 cluster 配置:
#smitty hacmp
选择:Cluster Configuration→Cluster Snapshots→Add a Cluster Snapshot
键入 Snapshot 文件名(Cluster Snapshot Name)
恢复 cluster 配置:
# smitty hacmp
选择:Cluster Configuration→Cluster Snapshots→Apply a Cluster Snapshot
键入 Snapshot 文件名(Cluster Snapshot Name)
注:菜单中项意义:
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第17页 牛新庄
Cluster Snapshot Name:指定 Cluster Snapshot 文件名
Cluster Snapshot Des cription: Cluster Snapshot 描述
UnConfigure Cluster Resource:否重新配置 Cluster 资源
Force Apply if verify fails: Cluster 校验失败时否强制恢复配置
9注意: HACMP 理享 VG 中增加 FS 时具体步骤:
1)# smitty
选择:System storage management
File systems
Addchangeshowdelete file systems
Journaled file systems
Add a journaled file system
Add a standard journaled file system
选择享 VG
指定 FS Mount point
2)# smitty clstop
停止 HACMP 运行
3)增加 FS 节点作:
# varyoffvg SHARE_VG_NAME
# exportvg SHARE_VG_NAME
节点作:
# importvg – y SHARE_VG_NAME – f hdiskX
# varyonvg SHARE_VG_NAME
作步目新加入 FS 定义取
4)# smitty hacmp
选择:cluster configuration
cluster resources
define resource group
changeshow resources for a resource group
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第18页 牛新庄
增加 FS 加入 Cluster 资源组定义中
5)# smitty hacmp
选择:cluster configuration
cluster resources
synchronize cluster resources
步 Cluster 资源组配置
6)# smitty hacmp
选择:cluster configuration
cluster verification
进行 Cluster 配置校验
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第1页 牛新庄
附录
2 附录:HACMP 脚
21 ha_start 文件(HACMP 启动脚)
usrsbinclusteretcrccluster boot Nbi
22 ha_list 文件(查 HACMP 状态脚)
echo ' Cluster Processes ' > tmpha_listout
ps ef | grep cluster | egrep v grep >> tmpha_listout
echo >> tmpha_listout
echo ' Network Status ' >> tmpha_listout
netstat i >> tmpha_listout
echo >> tmpha_listout
echo ' VG Status ' >> tmpha_listout
lsvg o >> tmpha_listout
echo >> tmpha_listout
echo ' Filesystems Mounted ' >> tmpha_listout
mount >> tmpha_listout
echo >> tmpha_listout
echo ' Applications ' >> tmpha_listout
ps ef | grep db2 | egrep v grep >> tmpha_listout
ps ef | grep btp | egrep v grep >> tmpha_listout
pg tmpha_listout
rm tmpha_listout
23 ha_stat 文件(查集群状态脚)
usrsbinclusterclstat –a
24 ha_stop 文件(HACMP 关闭脚)
usrsbinclusterutilitiesclstop y –Ngr
25 btpdb2_start(DB2BTP 启动脚)
注:备份机应cp f btpetcbtppaswdrza btpetcbtppaswddat语
句中btppaswdrza改btppaswdrzb
¾ 未安装理服务器(DAS)启动脚
#binksh
#
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第2页 牛新庄
# Start Db2 Instance
#
su db2inst1 c db2start
#
chown db2inst1db2iadm1 devrcontainer0[03]lv
#
# Start BTP
#
su btp c
cominit s # Initial COMM module
sleep 1
comctrl s # Start COMM processes
sleep 1
cp f btpetcbtppaswdrza btpetcbtppaswddat # Get the BTP password file
btpinit r `head 1 btpetcbtpdatesdat | cut f4 d' '` # Reinitialize the BTP
system
sleep 3
btpctrl i # Start BTP processes
exit 0
¾ 安装理服务器(DAS)启动脚
#binksh
#
# Start Db2 Instance and DB2 Administrative Server
#
su db2inst1 c db2start
db2admin start
#
chown db2inst1db2iadm1 devrcontainer0[03]lv
#
# Start BTP
#
su btp c
cominit s # Initial COMM module
sleep 1
comctrl s # Start COMM processes
sleep 1
cp f btpetcbtppaswdrza btpetcbtppaswddat # Get the BTP password file
btpinit r `head 1 btpetcbtpdatesdat | cut f4 d' '` # Reinitialize the BTP
system
sleep 3
btpctrl i # Start BTP processes
exit 0
26 btpdb2_stop(DB2BTP 关闭脚)
¾ 未安装理服务器(DAS)关闭脚
IBM SVC 牛新庄 HACMP安装配置理诊断分析
IBM SVC 25页 第3页 牛新庄
#binksh
#
# Stop BTP system
#
su btp c
btpctrl e # Stop all the BTP processes
sleep 3
echo y | btpinit c `head 1 btpetcbtpdatesdat | cut f4 d' '` #Clear the
BTP environment
sleep 1
comctrl c # Stop all the COM processes
sleep 1
cominit c # Clear COMM environment
#
# Stop DB2 Instance
#
su db2inst1 c
db2 force application all
db2stop
echo '********** Applications Shutdown Completed **********'
exit 0
¾ 安装理服务器(DAS)关闭脚
#binksh
#
# Stop BTP system
#
su btp c
btpctrl e # Stop all the BTP processes
sleep 3
echo y | btpinit c `head 1 btpetcbtpdatesdat | cut f4 d' '` #Clear the
BTP environment
sleep 1
comctrl c # Stop all the COM processes
sleep 1
cominit c # Clear COMM environment
#
# Stop DB2 Instance and DB2 Administrative Server
#
su db2inst1 c db2admin stop
db2 force application all
db2stop
echo '********** Applications Shutdown Completed **********'
exit 0
《香当网》用户分享的内容,不代表《香当网》观点或立场,请自行判断内容的真实性和可靠性!
该内容是文档的文本内容,更好的格式请下载文档