Sei sulla pagina 1di 57

EMC Technical Solution Group

EMC Clariion CX 系列日常


系列日常管理和维护
日常管理和维护指南
管理和维护指南

2009 年 2 月

美国 EMC 公司广州代表处

技术解决方案部

广州市天河北路 233 号中信广场 7401 室

电话:(86-20) 38771938
声明:如果您对本文的操作有任何疑问或不确认,在您执行指令前,请务必致电
EMC 全球客户服务中心寻求技术支持,请不要在生产系统上尝试不确认的指令,
否者可能带来不可预料的结果

版权说明

本文件中出现的任何文字叙述、文档格式、插图、照片、方法、过程等内容,除
另有特别注明,版权均属美国 EMC 公司所有,受到有关产权及版权法保护。任何
个人、机构未经美国 EMC 公司的书面授权许可,不得复制、引用或传播本文件的
任何片断,无论通过电子形式或非电子形式。
EMC Clariion CX 系列日常管理和维护

目 录
1. 硬件部分 ...................................................................................................................................3
Clariion CX 系列产品硬件介绍 .............................................................................................3
1.1.1 Clariion CX 系列产品的基本构成 ..................................................................3
1.1.2 CX600 / CX700 基本部件及状态灯介绍.......................................................4
1.1.3 CX200 / 300 / 400 / 500 基本部件及状态灯介绍 ..........................................5
1.1.4 CX3-10 / 3-20 / 3-40 基本部件及状态灯介绍 ................................................6
1.1.5 CX3-80 基本部件及状态灯介绍 .....................................................................7
1.1.6 CX4-120 / 240 / 480 基本部件及状态灯介绍 ............................................10
1.1.7 CX4-960 基本部件及状态灯介绍 .................................................................12
1.1.8 AX4-5 基本部件及状态灯介绍....................................................................13
1.1.9 Disk Array Enclosure (DAE)基本部件及状态灯介绍...................................15
1.1.10 Standby Power Supply (SPS) 基本部件及状态灯介绍 ................................17
如何用 Navisphere 看存储的状态 ......................................................................................18
1.1.11 在 Navisphere 中,除正常状态以外,CX 磁盘阵列的四种常见状态....18
1.1.12 如在 Navisphere 发现有报错,检查 CX 磁盘阵列错误的简单方法.......20
客户发现 Clariion 出现问题,应如何报修?....................................................................21
1.1.13 获取 Clariion CX 系列阵列的序列号 ..........................................................21
1.1.14 拔打 EMC 全球响应中心 800 电话报修 ...................................................24
EMC Clariion CX 系列开关机注意事项及详细步骤..........................................................24
1.1.15 开机前注意事项:.........................................................................................24
1.1.16 开机步骤:.....................................................................................................25
1.1.17 关机前注意事项:.........................................................................................25
1.1.18 磁盘阵列关机步骤:.....................................................................................26
Clariion 主动性售后支持及 call-home 的介绍..................................................................26
1.1.19 EMC Powerlink 网站介绍.............................................................................26
1.1.20 CLARiiON Proactive Support Call-home 介绍..............................................26
1.1.21 客户开通 CLARiiON Proactive Support Call-home 所需要提供的条件 ....27
1.1.22 CLARiiON Proactive Support 安全考虑事项...............................................27
1.1.23 CLARalert 安全性 .........................................................................................27
1.1.24 介绍 Dial Out 的过程 ...................................................................................28
1.1.25 介绍 Email Home 的过程.............................................................................28
1.1.26 介绍远程拨入访问过程.................................................................................29
1.1.27 介绍 Webex 的访问过程...............................................................................29
如何收集日志........................................................................................................................34
1.1.28 收集 Clariion 存储日志..................................................................................34
1.1.29 收集交换机日志.............................................................................................37
1) B 系列 ......................................................................................................................37
2) MDS 系列 ................................................................................................................37
3) M 系列......................................................................................................................38
1.1.30 收集主机日志.................................................................................................38
常见故障处理........................................................................................................................39
1.1.31 存储开机后,SPE 前面板故障指示灯亮 .....................................................39
1.1.32 如果发现存储有部件显示故障指示灯,是否是部件松动,可以重新插拔
么? 39
1.1.33 我们想测试磁盘 RAID 的容错性,可以带电插拔硬盘么?........................39
1.1.34 忘记存储设备的管理 IP 该怎么办? ...........................................................39
1.1.35 忘记存储的帐号和口令怎么办?.................................................................40

第1页
EMC Clariion CX 系列日常管理和维护

1.1.36 如何获取当前存储系统运行的 flare 版本....................................................40


1.1.37 如何修改 Clariiion 存储的管理 IP 地址 .......................................................40
1.1.38 主机更换 HBA 卡,对存储有影响么?.......................................................40
1.1.39 浏览器无法通过 IP 访问存储 .......................................................................41
序列号查询方法....................................................................................................................41
1.1.40 CX300/400/500 系列序列号查询 ..................................................................41
1.1.41 CX3-20 系列序列号查询 ...............................................................................42
1.1.42 AX4-5 系列序列号查询................................................................................43
ZTE 常见问题汇总 ...............................................................................................................43
1.1.43 SPS-SP 电缆丢失 ...........................................................................................43
1.1.44 主机重装操作系统后的两点注意事项 .........................................................43
2. 软件部分 .................................................................................................................................45
2.1 PowerPath 管理与配置 ..............................................................................................45
2.1.1 Pseudo 设备和 Native 设备............................................................................45
2.1.2 powermt display ..............................................................................................46
2.1.3 powermt remove..............................................................................................48
2.2 主机信息收集(emcgrab) ............................................................................................48
2.3 更换 HBA 卡 ..............................................................................................................49
2.3.1 AIX 环境下更换 HBA 卡 ..............................................................................49
2.3.2 Solaris 环境下更换 HBA 卡 ..........................................................................50
2.3.3 Linux 环境下更换 HBA 卡............................................................................52
2.3.4 HPUX 环境下更换 HBA 卡..........................................................................53

第2页
EMC Clariion CX 系列日常管理和维护

1. 硬件部分

Clariion CX 系列产品硬件介绍

1.1.1 Clariion CX 系列产品的基本构成

构成:由 SPS,DPE/SPE 和 DAE 三部分组成


示例:CX4-960

(图 1-0)
名词解释:
SPS:Standby Power Supply,接 DPE 或者 SPE+DAE OS,对 Write Cache 提供后备电源保

SPE:Storage Processor Enclosure,包含两个全冗余的存储控制器
DPE:Disk Processor Enclosure,SPE 和 DAE OS 在同一个 Enclosure
DAE:Disk Array Enclosure,磁盘柜,包含 15 个硬盘槽位,磁盘 ID 从左至右为 0-14
DAE_OS:包含控制器系统(OS)的 DAE,占用 DAE 从左至右前五块硬盘
注:Clariion 系列中采用 DPE 架构的有 CX200/300/400/500,而 CX600/700,3 和 4 系列均为

第3页
EMC Clariion CX 系列日常管理和维护

SPE 架构

1.1.2 CX600 / CX700 基本部件及状态灯介绍

前视图
1.1.2.1 CX600 / CX700 Storage Processor Enclosure (SPE)--前视图

(图 1-1)
(1) 3 个热插拔风扇模块
(2) 风扇模块错误灯(黄灯亮表示有错误,在前面板上看不见,需拆下前面板才能看见)
(3) SPE 电源指示灯(绿灯)
SPE 错误指示灯 (黄灯)

后视图
1.1.2.2 CX600 / CX700 Storage Processor Enclosure (SPE)--后视图

(图 1-2)
(1) Storage Processors A
(2) Storage Processors B
(3) 2 个热拔插电源模块 (active/active, 1+1)

第4页
EMC Clariion CX 系列日常管理和维护

1.1.2.3 CX600 / CX700 Storage Processor 细节图


(SP)—细节图

(图 1-3)
(1) 4 个前端(连主机)2Gb FC 端口(每个 Storage Processor )
(2) 4 个后端(连扩展 DAE)2Gb FC 端口(每个 Storage Processor )
(3) 10/100 局域网管理端口
(4) SP Status LEDs--用于 SP 启动检测和检查 SP 的健康状态
(5) Port80h Card--在 SP 主板上,用与开机自检,
(6) SPS Monitoring Port--连接 SPS 的串口,用于 SP 与 SPS 之间的通讯和控制
(7) Serial/PPP Port--获取动态 IP 地址进行维护或也可通过 HyperTerminal 软件检测 SP 的启动

1.1.3 CX200 / 300 / 400 / 500 基本部件及状态灯介绍

1.1.3.1 CX200 / 300 / 400 / 500 Disk Processor Enclosure (DPE)


(四款产品均为 DPE 架构,除 SP 的前端和后端端口数量有差别外,基本一样,下图为 CX500
的 DPE)

第5页
EMC Clariion CX 系列日常管理和维护

(图 1-4)

(1) BE0 – 后端总线端口 0(HSSDC)--连接 DPE 和 DAE


(2) BE1 –后端总线端口 1(HSSDC)--连接 DPE 和 DAE
(3) 两个前端 2Gb 端口(FC) 每个 Storage Processor
(4) Enclosure 状态灯--绿色(电源灯)
,黄灯(错误灯或可用于检测启动过程)
(5) 10/100 以太网管理端口
(6) Serial Mgmt Port (RJ-45)--获取动态 IP 地址进行维护或也可通过 HyperTerminal 软件检测 SP
的启动
(7) SPS Monitoring Port--连接 SPS 的串口,用于 SP 与 SPS 之间的通讯和控制

1.1.4 CX3-
CX3-10 / 3-
3-20 / 3-
3-40 基本部件及状态灯介绍

前视图
1.1.4.1 CX3-10 / 3-20 / 3-40 Storage Processor Enclosure (SPE)--前视图

(图 1-5)

(A) 四个热插拔电源模块,从左至右依次为 PS_A0 A1 B0 B1


(B) 电源模块故障指示灯,故障时亮黄色
(C) 系统电源指示灯:绿色,常亮
系统故障指示灯:黄色,系统故障时亮

第6页
EMC Clariion CX 系列日常管理和维护

后视图
1.1.4.2 CX3-10 / 3-20 / 3-40 Storage Processor Enclosure (SPE)—后

(图 1-6)

细节图
1.1.4.3 CX3-10 / 3-20 / 3-40 Storage Processor (SP)—细节图
(三款产品均为 SPE 架构,除 SP 前端和后端端口数量有差别外,基本一样,下图为 CX3-40
的 SP)

(图 1-7)

A:SPS 监控端口
B:管理串口
C:电源指示灯:绿色,常亮
D:故障指示灯:黄色,故障时亮
E:服务管理网口
F:客户管理网口
G:后端扩展端口
H:前端光纤端口

1.1.5 CX3-
CX3-80 基本部件及状态灯介绍

第7页
EMC Clariion CX 系列日常管理和维护

前视图
1.1.5.1 CX3-80 Storage Processor Enclosure (SPE)—前

(图 1-8)
A:电源模块,上有黄色故障指示灯,故障时亮
B:冷却风扇模块,上有黄色故障指示灯,故障时亮
C:系统故障指示灯:黄色,故障时亮
D:系统电源指示灯:绿色,常亮

后视图
1.1.5.2 CX3-80 Storage Processor Enclosure (SPE)—后

(图 1-9)
A:电源模块
B:SAN Management Module
C:I/O 模块
电源模块

第8页
EMC Clariion CX 系列日常管理和维护

细节图
1.1.5.3 CX3-80 Storage Processor (SP)—细节图

(图 1-10)
A:SP 控制器工作状态指示灯
B:I/O Module

细节图
1.1.5.4 CX3-80 I/O Module --细节图

(图 1-11)
A:后端端口工作状态 LED
B:后端端口
C:前端端口
D:前端端口工作状态 LED
E:I/O 模块电源与故障指示灯,黄色灯亮表示有故障

细节图
1.1.5.5 CX3-80 SAN Management Module --细节图

A:电源指示灯
B:故障指示灯
C:用户管理网络端口
D:服务管理网络端口,仅限于 EMC 服务人员使用
E:管理串口
F:SPS 监控端口

(图 1-12)

第9页
EMC Clariion CX 系列日常管理和维护

1.1.6 CX4-
CX4-120 / 240 / 480 基本部件及状态灯介绍

前视图
1.1.6.1 CX4-120 / 240 / 480 Storage Processor Enclosure (SPE)—前

(图 1-13)
A0:电源模块
A1:电源模块
B0:电源模块
B1:电源模块
C:CPU 模块 A
D:CPU 模块 B
E:CPU 模块 A 电源和故障指示灯
F:CPU 模块 B 电源和故障指示灯
G:存储系统电源和故障指示灯

后视图
1.1.6.2 CX4-120 / 240 / 480 Storage Processor Enclosure (SPE)—后

(图 1-14)
A:Management Module(管理模块)
B:I/O Module(I/O 模块)
C:Power / Fault LED(电源/故障指示灯)

第 10 页
EMC Clariion CX 系列日常管理和维护

细节图
1.1.6.3 CX4-120 / 240 / 480 Storage Processor (SP)—细节图

(图 1-15)
A:Management Module(管理模块)
B:Back End Port on I/O Module(I/O 模块上的后端端口,连接 DAE)
C:FC Front End Port on I/O Module(I/O 模块上的前端光纤端口,连接主机)
D:iSCSI Front End Port on I/O Module(I/O 模块上的前端 iSCSI 端口,连接主机)

细节图
1.1.6.4 CX4-120 / 240 / 480 Management Module—细节图

A:Service LAN Port(服务端口,仅限于 EMC 服务使用)


B:Management LAN Port(用户管理端口)
C:SPS Port(SPS 监控端口)
D:Communications Port(管理端口)
E:NMI(系统维护用,勿触动)

(图 1-16)

第 11 页
EMC Clariion CX 系列日常管理和维护

1.1.7 CX4-
CX4-960 基本部件及状态灯介绍

前视图
1.1.7.1 CX4-960 Storage Processor Enclosure (SPE)—前

(图 1-17)
A1:Power Supply A(电源模块 A)
A2:Power Supply B(电源模块 B)
B1-B4:Blowers / Fans(风扇模块)
C:Enclosure Fault LED(系统故障指示灯)
D:Power LED(系统电源指示灯)

后视图
1.1.7.2 CX4-960 Storage Processor Enclosure (SPE)—后

(图 1-18)
A:Power Supply B(电源模块 B)
B:Power Supply A(电源模块 A)
C:Management Module(管理模块)
D:Management Module(管理模块)
E:I/O Annex(I/O 扩展模块)

第 12 页
EMC Clariion CX 系列日常管理和维护

细节图
细节图
1.1.7.3 CX4-960 Storage Processor (SP)—细节

(图 1-19)
A:Power LED(电源指示灯)
B:Fault LED(故障指示灯)
C:Unsafe to Remove LED
D1-D4:I/O Module(I/O 模块)

细节图
1.1.7.4 CX4-960 Management Module—细节图

A:Fault LED(故障指示灯)
B:Power LED(电源指示灯)
C:USB
D:Management LAN Port(以太网管理端口)
E:Service LAN Port(以太网服务端口,仅限于 EMC 服务人员)
F:NMI Button
G:Communications Port(服务端口)
H:SPS Port(SPS 监控端口)

(图 1-20)

1.1.8 AX4-
AX4-5 基本部件及状态灯介绍

1.1.8.1 后视图
AX4-5 –后
 双 SP 机型要求单个 SPS
 单 SP 机型不支持 SPS

第 13 页
EMC Clariion CX 系列日常管理和维护

该产品的硬件包括一个 2U 磁盘处理器箱 (DPE)、一个 1U 备用电源 (SPS) 以及零到四个 2U 磁盘阵列


箱 (DAE)。
每个双 SP 系统都要求配备单个的 1U SPS,也可以选择再增加一个 SPS。单 SP 系统不使用 SPS,所以
此系统不支持写缓存。单 SP 系统将忽略与其连接的 SPS。

1.1.8.2 AX4-5 DPE 前视图


每个 AX4-5 的 DPE 至少包括 4 块盘作为系统启动盘(槽为 0-3 是 Vault disks)
,不能把任何一块系统盘做为
热备份盘或插在其他槽位。

AX4-5启动共需8-10分钟完成自检。如系统发现故障,如上图可见错误状态灯。

1.1.8.3 AX4-5 DPE 后视细节


后视细节图
细节图
单/双存储处理器
4 Gb/s 光纤通道或 1 Gb/s iSCSI 个性模块
电源和风扇均为 N+1 配置
SP 电源 LED 也是电源按钮

第 14 页
EMC Clariion CX 系列日常管理和维护

每个 SP 包含一个串行 SCSI (SAS) 扩展端口

DPE 可以容纳一至两个存储处理器 (SP) 和两个可热更换电源/风机模块,每个处理器可以配备 1 GB 内


存,并具有两个 4 Gb/s 光纤通道 (FC) 端口或两个 1 Gb/s iSCSI 端口。
每个电源/风机模块可提供 420 瓦的电力并包含两个风扇。电源和电源模块内的风扇均为 N+1 配置。即,
一个电源/风机模块就可以为整个 DPE 供电,一个风扇就可以冷却其所在的电源/风机模块。如果风机内有
一个风扇发生故障,则另一个风扇将加速旋转以满足电源/风机模块的冷却需求。如果电源/风机模块中的两
个风扇都发生故障,那么阵列将在两分钟内关闭。在电源/风机模块进行热更换的情况下,两分钟关闭规则
同样适用。
DPE 必须包括至少 4 个串行 SCSI (SAS) 或串行 ATA 2 (SATA II) 驱动器,最多可以容纳 12 个串行
SCSI (SAS) 或串行 ATA 2 (SATA II) 驱动器。使用串行 SCSI (SAS) 扩展电缆即可通过 SAS 扩展端口与
其他机箱布线。可为电缆设置仅允许输入、输出连接的密钥。每个 SP 有一个 SAS 扩展端口或一个后端
环路。

1.1.9 Disk Array Enclosure (DAE)基本部件及状态灯介绍


(DAE)基本部件及状态灯介绍

前视图
1.1.9.1 Disk Array Enclosure (DAE) --前视图

(图 1-21)
(10) 硬盘状态灯--绿灯表示连接状态,绿灯闪烁表示磁盘活动状态,黄灯亮表示磁盘报错

第 15 页
EMC Clariion CX 系列日常管理和维护

(11) 盘柜状态灯--绿灯表示供电正常,黄灯亮表示盘柜有错误
(12) Slot0-4 ,共 5 块 DAE-OS Vault Drives (仅限于 DAE_OS)
,从左至右,Slot 0--Slot 4

后视图
1.1.9.2 Disk Array Enclosure (DAE) --后视图

(图 1-22)
Two Link Control Card (LCC)
(1) LCC 状态灯--绿色表示电源,黄色表示有错误
(2) Expansion 端口(HSSDC)--灯亮表示有信号
(3) 光纤环路 ID 指示灯( Loop ID LED)--0,1,2,3, 表示后端连接的光纤换路(Loop) ID
(4) Primary 端口(HSSDC)--灯亮表示有信号
Two DAE 电源模块
(5) 两个集成了风扇的电源模块
(6) 风扇错误灯(黄色)
(7) 电源状态灯(绿色--有电,黄色--有错)
(8) 交流电源输入开关,对 DAE-OS,DPE 或 SPE 关电,应使用此开关
(9) Enclosure 地址开关-如是 DAE-OS 的 Enclosure,则其必须被设置为 0

后视图
1.1.9.3 Disk Array Enclosure 2P/3P (DAE 2P/3P) --后视图

(图 1-23)
A:电源模块,下面电源模块为 PS A,上面为 PS B
B:LCC 模块,下为 LCC A,上为 LCC B
C:PRI 端口,连接 SP Back End 端口或者上级 DAE EXP 端口

第 16 页
EMC Clariion CX 系列日常管理和维护

D:EXP 端口,连接下级 DAE PRI 端口


E:Enclosure ID LED
F:Loop ID LED
G:电源与故障指示灯

1.1.10 Standby Power Supply (SPS) 基本部件及状态灯介绍

1.1.10.1 1 KW I U SPS

(图 1-24)
(1) 电源开关
(2) 交流电源输入
(3) SPE & 启动盘所在 DAE 的交流输出
(4) SPS 监测端口--连接 SP 的串口,用于 SP 与 SPS 之间的通讯和控制
(5) 状态灯 (从下至上)
内部监测灯—亮黄色表示 SPS 内部监测出错
更换 SPS 指示灯—亮黄色表示电池寿命已到或者自检出错
电池供电指示灯--当 SPS 给 SP 或 DAE OS 供电时亮黄色
电源灯--当 SPS 充满电后亮常绿,当 SPS 电池被充电时闪绿色

1.1.10.2 2.2KW 2U SPS

(图 1-25)
A:交流输入
B:交流输出

第 17 页
EMC Clariion CX 系列日常管理和维护

C:电源开关
D:SPS 监测端口--连接 SP 的串口,用于 SP 与 SPS 之间的通讯和控制
E:状态灯(从下至上)
内部监测灯—亮黄色表示 SPS 内部监测出错
更换 SPS 指示灯—亮黄色表示电池寿命已到或者自检出错
电池供电指示灯--当 SPS 给 SP 或 DAE OS 供电时亮黄色
电源灯--当 SPS 充满电后亮常绿,当 SPS 电池被充电时闪绿色

如何用 Navisphere 看存储的状态

1.1.11 在 Navisphere 中,除正常状态以外,


除正常状态以外,CX 磁盘阵列的四种常见
状态

T:一个或者多个部件处于 Transition 状态,比如 LUN 正在 Rebuilding,SPS 正在充电


F:一个或者多个部件出现故障,注意,存储刚加电,由于 SPS 充电,也会出现 F 状态
X:存储系统不可访问,比如网络连接断开等情况
?:当前 Navishper 版本不支持对该存储系统进行管理

举例如下:
Array in Transition

第 18 页
EMC Clariion CX 系列日常管理和维护

Array Faulted

Array Inaccessible

第 19 页
EMC Clariion CX 系列日常管理和维护

1.1.12 如在 Navisphere 发现有报错,


发现有报错,检查 CX 磁盘阵列错误的简单方

1、右击存储,选择 fault,会显示具体报错信息
2、展开 Physical 项,可以定位具体故障部件

3、Clariion 每个部件都有独立的故障指示灯,在 Navishpere 发现错误后,可以观察存储故障部


件的错误指示灯进一步确认

第 20 页
EMC Clariion CX 系列日常管理和维护

客户发现 Clariion 出现问题,


出现问题,应如何报修?
应如何报修?

(注:如客户已装了 dial-out 或者 Call-home, 存储会让管理工作站自动拨号并报修,若无,需


客户自己发现并报修)

1.1.13 获取 Clariion CX 系列阵列的序列号

有以下五种方法:
方法一:EMC 工程师在存储安装时会在存储贴上写有序列号的白色标签 , 标签上会注明客户
EMC 报修电话、Site ID 、存储序列号等信息,参见下图:

方法二:如安装工程师漏贴标签,注意必须查 SPE 或 DPE 上的标签

第 21 页
EMC Clariion CX 系列日常管理和维护

(DPE 架构的从机柜后面查看上图所示位置)

(SPE 架构的从机柜正面拆下 SPE 挡板,查看上图所示位置)

方法三:通过 serialization tag 查看(仅适用于 Clariion 4 系列产品)


CX4-120/240/480 请查看存储 SPE 后部的黑色标签,上面有产品的 PN(型号)
,SN(序列号)

第 22 页
EMC Clariion CX 系列日常管理和维护

CX4-960 和 CX4-120/240/480 差不多,也是在 SPE 后部有一个黑色标签,只是位置不同

方法四:通过 Navisphere 命令查看 CX 存储的序列号:


(红色字体)
C:\Program Files\EMC\Navisphere CLI>navicli -h 192.168.2.164 getagent
Name: K10
Desc:
Node: A-CK200072300124
Physical Node: K10
Signature: 1912950
Peer Signature: 1912955
SCSI Id: 0
SP Identifier: A
Revision: 3.26.40.5.016
Model: CX3-40c
Model Type: Rackmount
Prom Rev: 3.58.00
SP Memory: 4096
Serial No: CK200072300124
Cabinet: SPE3 C:\Program Files\EMC\Navisphere CLI>

方法五:通过 Navisphere 图形界面查看 CX 存储的序列号


右击存储,选择 Properties,在弹出窗口 General 选项卡中的 Serial Number 一项

第 23 页
EMC Clariion CX 系列日常管理和维护

1.1.14 拔打 EMC 全球响应中心 800 电话报修

如用固定电话报修,请拔打 8008190009
如用手机报修, 请拔打 4006700009
请依照语音提示进行报修
注意:必须事先准备好序列号,报修时需提供存储序列号( CX 系列的序列号格式基本都是
CK2000 开头,后跟 8 位数字)
,同时请提供具体的故障描述,如果部件故障,最好能提供故障
部件的 Part Number(PN),特别是硬盘的 PN,以便于服务人员准确准备备件

EMC Clariion CX 系列开关机注意事项及详细步骤

1.1.15 开机前注意事项:
开机前注意事项:

1. 磁盘阵列在加电前,为确保磁盘柜散热和工作正常,请确认所有磁盘柜的每个槽位都已经插
上硬盘和挡风板
2. 开机前需确保――SPE 或 DPE 至少要有一个正常工作的 SP,每个 DAE 都至少要一块正常
工作的 LCC

第 24 页
EMC Clariion CX 系列日常管理和维护

1.1.16 开机步骤:
开机步骤:

1. 检查所有供电线路联接是否正常,是否有松动或改动并改正
2. 从机柜顶部开始,由上至下打开所有 DAE 磁盘机箱的电源。
3. 打开机柜最底部两个电池(SPS)
(CX300 可能只有一个)开关
4. 开机完成.

1.1.17 关机前注意事项:
关机前注意事项:

1.警告: 请不要在关闭两个电池(SPS)的电源开关前,关闭 SPE,DPE,DAE 等盘柜的任何一个


电源,否则很可能会导致严重错误,并造成数据丢失! (CX300 可能只有一个 SPS)
2. 即使关闭两个电池(SPS)的电源开关后,也需要等待 3 分钟直到 CX 存储写缓存中的数据完
全写入硬盘,DAE OS 磁盘柜指示灯熄灭后才可关闭 DAE,SPE 或 DPE 等盘柜的电源
3.停止所有对 CX 磁盘阵列访问的应用,以便所有的 I/O 能被从 SP 的写缓存写回到前 5 块
盘上。
4.如果有 UNIX 服务器连接在 CX 磁盘阵列上,必须 umount UNIX 服务器所有与 CX 磁盘阵
列相关的文件系统,Windows 主机请关闭。

第 25 页
EMC Clariion CX 系列日常管理和维护

1.1.18 磁盘阵列关机步骤:
磁盘阵列关机步骤:

1. 关闭机柜最底部的两个电池开关并等待约 3 分钟直到 CX 存储写缓存中的数据完全写入到硬



上后,可看到电池的信号灯完全熄灭,且应看到因电池停止供电, SPE 或 DPE 机箱及 DAE-OS
磁盘机箱的电源灯熄灭。
2. 由下至上,关闭所有 DAE 磁盘机箱的开关(机柜内部的 PDU)
3. 关闭机柜后面两侧机柜总开关
4. 关机完成.

Clariion 主动性售后支持及 call-home 的介绍

1.1.19 EMC Powerlink 网站介绍

客户注册登陆后,可免费获取许多 EMC 相关的各类技术支持文档,界面和网址如下:

1.1.20 CLARiiON Proactive Support Call-


Call-home 介绍

CALL-Home 包括三项主要功能
a) 错误检测功能(需工程师安装软件在监控 PC 上)

第 26 页
EMC Clariion CX 系列日常管理和维护

b) 报错功能:存储出错时,软件会自动拨出 (Dial out)或自动发送电子邮件 (Email out)到 EMC


的全球技术支持中心
c) 远程诊断功能:EMC 的全球技术支持中心收到“Dial out”或“Email out”或客户报修电话后,开
始远程诊断
方法 1:通过客户提供的电话线路,远程拨入(Dial-in)
方法 2:通过客户提供给 PC 管理工作站的 Internet access ,由客户上 WebEx 网址申请,并
允许
全球技术支持中心远程通过 WebEx IP 连接访问 PC 管理工作站(可选)

1.1.21 客户开通 CLARiiON Proactive Support


Support Call-
Call-home 所需要提供
的条件

a) 由客户提供管理工作站 PC –必须是英文版 Windows NT 4.0 SP 6A 或 Windows 2000 SP 2


以上版本,或 Windows XP
b) 调制解调器 (ships with Clariion Systems)
c) 电话直线路 (不需打分机号码,由客户提供)
– PBX extension 或新设直通线路
d) 由 EMC 工程师在管理工作站上安装 CLARAlert 远程服务套件
– Navisphere Manager Event Monitor
– Navisphere Host Agent / CLI
– EMC 远程主机及客户端
e) WebEx 远程访问技术(可选,由客户提供 internet access 给 PC 管理工作站)
– Minimum Windows Requirements
– Windows 98 and higher
– Web Browser Support: Internet Explorer 5.x and 6, Mozilla 1.6, Netscape 4.7

1.1.22 CLARiiON Proactive Support 安全考虑事项

CLARalert 软件套件安装在客户提供的工作站上。这样,CLARiiON Proactive Support 的安全


级别不仅取决于 CLARalert 的安全特性,而且也取决于您在应用程序、主机和网络级别实施的
安全性

1.1.23 CLARalert 安全性

CLARalert 具有强大的安全功能,并且在提供针对远程访问策略的选项方面也具有灵活性。
您可以随时查看与远程访问活动相关的信息以进行审计。远程访问安全选项是由经授权的 EMC
人员代表客户设置的。这些选项包括:
a) 由
 客户指定的 EMCRemote 用户名和密码,这样它们就可以遵守您的与密码有关的策略

第 27 页
EMC Clariion CX 系列日常管理和维护

b) 拨入尝试通知,您可以对每次拨入请求进行批准/拒绝 
c) 客户可以设定在 EMCRemote 发出身份验证失败消息之前可允许的重拨次数 
d) 禁用 EMCRemote 远程访问功能的能力 
e) 使用 EMCRemote 将所有登录和登录失败尝试记录到 CLARalert 工作站上的一个文件中
f) 使用 Navisphere 响应日志和消息文件以记录拨出尝试和错误代码文本
EMCRemote 是一种专用的客户端/服务器应用程序,服务器组件驻留在 CLARalert 工作站
上。这样,只有获授权的人员可以访问该客户端/服务器应用程序。客户端/服务器通信使用一种
专有的按会话性质而设立的 40 位算法加密。在拨入时,会在拨号器和客户端软件之间执行特定
的“握手” 程序,此程序授权 EMC 客户服务人员连接到工作站上的 EMCRemote
EMC 支持专家的系统和 CLARiiON Proactive Support 工作站之间的成功 “握手”是建立
任何会话所必需的。“握手”过程中的协商是加密的,并且必须在协商成功后才能建立 PPP 会话。
因此,利用疯狂拨号(war dial)技巧的潜在攻击者不可能仅凭发现并拨打电话号码而在工作站
上建立会话

1.1.24 介绍 Dial Out 的过程

a) 存储系统生成一个事件,此事件记录到系统的 Host Agent 或 SP Agent 的 navimon.log 文


件中
b) Navisphere Event Monitor 中心监视器 Host Agent (事件监视器引擎)每隔2分钟轮询一
次其配置文件中的每一个受监视的存储系统,并从每一个系统的 navimon.log 文件中返回自上
次轮询以来出现的新事件。每个系统的 navimon.log 文件中的所有新事件接着将写入到中心监
视器 Host Agent navimon.log 文件中。事件监视器逻辑根据 Dial Home 筛选器模板文件配置决
定是否触发 Dial Home。事件监视器生成一个 XML 格式的事件消息文件并将其放置到一个运
行时目录中,ConnectEMC 服务将对它进行格式设置和处理,然后通过调制调解器发送到 EMC。
事件监视器在 response.txt 日志文件中记录此 Dial Home 响应
c) ConnectEMC 拨通调制解调器并启动 zmodem 传输。XML 消息文件被传送到 EMC 技术支
持中心前端处理器 (FEP)。在成功地将消息文件提交给 EMC 后,该文件的拷贝就存档在
archive.txt 文件中,而且呼叫过程的步骤记录在 dialemc.log 文件中
d) SYR 报告系统从 FEP 接收消息文件,分析消息文件以应用产品和业务规则,并将有关数据
保存到其数据存储区中
e) Clarify 案例跟踪系统接收此消息文件,分析文件,应用业务规则,创建案例,并将案例放置
到 CLARiiON Dial Home 队列中

1.1.25 介绍 Email Home 的过程

a) 存储系统生成一个事件,此事件记录到系统 Host Agent 或 SP Agent 的 navimon.log 文件


第 28 页
EMC Clariion CX 系列日常管理和维护

b) Navisphere Event Monitor 中心监视器 Host Agent(事件监视器引擎)每隔2分钟轮询一次


其配置文件中的每一个受监视的存储系统,并从每一个系统的 navimon.log 文件中返回自上次
轮询以来出现的新事件。每个系统的 navimon.log 文件中的所有新事件接着将写入到中心监视
器 Host
Agent navimon.log 文件中。事件监视器逻辑根据 Dial Home 筛选器模板文件配置决定是否生成
发送到 EMC 总部的电子邮件。事件监视器生成一个 XML 格式的事件消息文件,此文件写入到
Windows SMTP 邮件程序或 Solaris Sendmail 守护程序。事件监视器在 response.txt 日志文
件中记录此给总部发邮件响应
c) 取决于平台的电子邮件程序处理此事件消息邮件,并将此电子邮件转发到 SMTP 网关服务
器,此网关服务器将电子邮件发送到 EMC 的电子邮件邮箱 emailalert@emc.com。然后将此电
子邮件事件消息的一个拷贝存档到监视代理的消息目录日志中
d) EMC 电子邮件警报服务器处理传入的事件消息并将消息转发到 FEP
e) SYR 报告系统从 FEP 接收消息文件,分析消息文件以应用产品和业务规则,并将有关数据
保存到其数据存储区中
f) Clarify 案例跟踪系统接收此消息文件,分析文件,应用业务规则,创建案例,并将案例放置到
CLARiiON Dial Home 队列中

1.1.26 介绍远程拨入访问过程

a) 从支持专家或客户工程师的 Windows 客户端系统启动 EMCRemote 客户端(也称为拨号


器)
,也可以从 Clarify 呼叫跟踪系统启动拨号器
b) 调制解调器号码、登录和密码信息从数据库中检索出来并输入拨号器。如果拨号器是从未结
案例中启动的,那么登录和密码信息将自动输入拨号器
c) EMCRemote 拨号器连接到调制解调器, EMCRemote 主机执行一次客户端加密(是一种
因会话而异的 40 位专有加密方法)握手例程,必须成功完成此例程才可以开始远程会话
d) EMC 支持人员可能会代表您在 EMCRemote 中做几项与安全性有关的选择,包括:在进行
多少次拨入尝试后导致系统采取与不成功的拨入身份验证尝试有关的操作,以及密码的构成
e) 远程会话终止后, EMCRemote 主机将会话信息记录到 PWHOST.log 文件中,EMCRemote
客户端(拨号器)将会话信息记录到 PWCLIENT.log 文件中

1.1.27 介绍 Webex 的访问过程

A. 以下由 EMC 响应中心工程师做:

1.在浏览器中输入 Web 地址-https://emcsupport2.webex.com


2. Click “Start support session” icon

第 29 页
EMC Clariion CX 系列日常管理和维护

3. Input user name and password to login

4. After you input the user name and password, you have started a Webex session and got its
Session ID. You can tell the session ID to the on site engineer/customer, or you can send ID to
them via Email (click “Send Email Invitation” button).

第 30 页
EMC Clariion CX 系列日常管理和维护

5. Once customer/on site engineer join the Webex session, they can share their Desktop to
you and you can control the remote desktop through click “Request Control” button

第 31 页
EMC Clariion CX 系列日常管理和维护

Anytime you want to terminate the Webex session, please click “End Session” button.

B. 以下由客户通过 Webex 登陆后,并授权 EMC 支持中心访问 PC 管理工作站:

1. 在 IE 地址栏中输入:https://emcsupport2.webex.com
2. 点击 “Join a support session” 图标

3. 填入 Support 给予的 Session ID 以及其他信息 , 然后点击 “Submit”

第 32 页
EMC Clariion CX 系列日常管理和维护

4.当 Support 发出请求控制桌面时,会弹出如下对话框,建议打上选择框,然后点击 “OK”

5.成功连接后,会看到桌面右下角有相关图标出现,此时移动鼠标,会提示被远程控制,可以点
击鼠标左键,就可以重新控制鼠标

第 33 页
EMC Clariion CX 系列日常管理和维护

如何收集日志
如何收集日志

1.1.28 收集 Clariion 存储日志

1.1.28.1 利用 CLI 命令行收集


a) 进入 Navisphere CLI 目录,对两个 sp 执行 spcollect 指令,执行成功后无任何提示
C:\Program Files\Emc\Navisphere CLI>navicli -h spa_ip spcollect
C:\Program Files\Emc\Navisphere CLI>navicli -h spb_ip spcollect
b) 五分钟后执行命令(提醒:一定要等足够长的时间,因为 SPcollect 生成的时间比较长)
C:\Program Files\Emc\Navisphere CLI>navicli -h spa_ip managefiles –list
注 意 查 看 最 新 的 zip 文 件 是 否 生 成 , 一 般 格 式 为 :
序列号+SP
序列号
CK200071800079_SPB_2008-12-26_20-25-27_1e330b_data.zip,也就是:序列号 名字+
名字
日期时间的 zip 文件,
文件,也有可能是:
: SP 名字+序列号
名字 序列号+日期时间的
序列号 日期时间的 zip 文件
c) 获取最新的zip 文件,执行命令
C:\Program Files\Emc\Navisphere CLI>navicli -h spa_ip managefiles -retrieve -path d:\splog
-path 参数指定日志保存目录,默认在C:\Documents and Settings\Administrator(XP系统)
-retriever参数指定要收取的文件,如果没有指定文件名,则会出现选择文件的提示,注意,每一
个 文 件 前 面 都 对 应 一 个 编 号 , 比 如

第 34 页
EMC Clariion CX 系列日常管理和维护

CK200071800079_SPB_2008-12-26_20-25-27_1e330b_data.zip前面对应的是10,则输入10,
回车后确认后,会自动将文件存放到d:\splog目录中
d) 用同样的方法收集另一个SP 的SPcollect
注:如果没有安装 classic navicli 或者存储端禁用了 classic navicli(Clariion 4 系列默认禁止了
classic navicli 模式)
,请使用 secure naviseccli 指令连接
C:\ naviseccli –user xxx –password xxx –scope 0 -h spa_ip spcollect
Xxx 表示用户名和密码,除需要指定帐号和口令外,其余命令格式同 classic navicli 一样

1.1.28.2 利用 NST 工具收集

点击 Capture SPCollect 图标,输入控制器 SP 的 IP 地址,根据提示下一步

1.1.28.3 Navishpere 系统中 spcollect(


(适用于 Flare19 code 以上,
以上,包含

19)
a) 打开IE 浏览器,在地址栏输入阵列IP 地址,输入用户名、密码
b) 在 Navisphere 界面右键单击“SP A”,点击“SP Collect”,在弹出的对话框中点击“OK”

第 35 页
EMC Clariion CX 系列日常管理和维护

c) 五分钟后在 Navisphere 界面右击“SP A”,点击“File Transfer Manager”,弹出对话框, (注:


在点击“File Transfer Manager”之前,要等待足够的时间,因为生成 SPcollect 的时间会比较长。
上一步点击“SP Collect” 弹出操作成功的对话框,这只是 SP Collect 命令发送成功,而不是 SP
Collect 已经收集成功)

d) 在弹出的对话框中左侧选中最新的“zip”文件,点击对话框中右侧“Browse”按钮,选择文
件输出位置,点击对话框中下侧“Transfer”按钮传送文件,在对话框右侧观察文件传送状态,
如下

第 36 页
EMC Clariion CX 系列日常管理和维护

e) 按照同样的方法收集 SP B 的 SPcollect

1.1.28.4 使用 CAP2 工具
仅限于 EMC 服务人员

1.1.29 收集交换机日志

EMC 交换机分为三个系列:B 系列,M 系列和 MDS 系列,不同系列收集日志的方法不一样


1) B 系列(如
系列 DS-220B,DS-5000B,注:以 B 结尾)
a) 从 Start  Programs  Accessories  Communications  Hyperterminal 打开超级终
端程序
b) 创建一个新连接,选择 Connection using modem to TCP/IP (Winsock),并输入交换机的
IP 并确认
c) 输入帐号和口令登陆交换机,然后从 Transfer  Capture text  File C:\supportshow.wri,
选择捕获输出文字到文件 c:\supportshow.wri
d) 运行指令
supportshow
e) 当指令执行完毕后,停止捕获文字 Transfer  Capture text  Stop
f) 完成后,输入指令 quit 退出登陆

2) MDS 系列(如
系列 MDS-9120,MDS-9140,注:以 MDS 开头)
a) 从 Start  Programs  Accessories  Communications  Hyperterminal 打开超级终
端程序
b) 创建一个新连接,选择 Connection using modem to TCP/IP (Winsock),输入交换机的 IP
并确认
c) 输入帐号和口令登陆交换机,然后从 Transfer  Capture text  File C:\supportshow.wri,
选择捕获输出文字到文件 c:\supportshow.wri

第 37 页
EMC Clariion CX 系列日常管理和维护

d) 运行指令
term len 0
show tech-support details
e) 当指令执行完毕后,停止捕获文字 Transfer  Capture text  Stop
f) 完成后,输入指令 quit 退出登陆

3) M 系列(如
系列 DS-32M,DS-4700M,注:以 M 结尾)
a) 通过浏览器登陆交换机
b) 选择 Maintenance  Data Collection.
c) 输入保存的文件名,并点击 OK

1.1.30 收集主机日志

EMC 主机日志收集软件根据主机平台不同分为两类:unix 平台和 windows 平台


Unix 平台称为:emcgrab
请根据主机类型下载最新的 emcgrab 文件,
然后通过 ftp 等协议传送到主机上,
解包进入 emcgrab
目录,执行目录中的 emcgrab.sh 文件,一路回车,最后会在目录中 outputs 子目录中生成打包
的日志文件,形如 emcgrab_full_2008-06-30-07.15.54_aix_cdmid_prd_cc0000000000.tar
注:如果系统日志文件很大,请留意存放 emcgrab 文件所在磁盘的剩余空间

Windows 平台称为:emcreports
请根据平台类型,选择合适版本,然后安装,生成的日志存放在安装目录 COLLECTION 子目录

软件下载地址:ftp://ftp.emc.com/pub/emcgrab

第 38 页
EMC Clariion CX 系列日常管理和维护

常见故障处理

1.1.31 存储开机后,
存储开机后,SPE 前面板故障指示灯亮

Clariion 存储的启动需要一些时间,等控制器启动完毕后,因为会测试 SPS 电池的有效性,在


SPS 充放电的过程中,系统故障灯会亮,请等待两块电池充满电后再检查系统故障灯状态

1.1.32 如果发现存储有部件显示故障指示灯,
如果发现存储有部件显示故障指示灯,是否是部件松动,
是否是部件松动,可以重
新插拔么?
新插拔么?

在系统工作过程中,排除外接电源问题,如果发现有部件故障指示灯亮,请不要自行插拔(硬盘
也不可以)
,否则可能造成不可预知的故障,请即可拨打 EMC 全球服务热线报修

1.1.33 我们想测试磁盘 RAID 的容错性,


的容错性,可以带电插拔硬盘么?
可以带电插拔硬盘么?

我们强烈建议不要这么做,RAID 的容错性可以在系统的配置信息中确认,带电插拔硬盘有两个
不利于您的因素:

a) 当你拔出硬盘后,该硬盘所在的 LUN 会全部需要 rebuild,这会降低您的磁盘读写性能


b) 磁盘属于机械设备,带电插拔,可能给磁盘带来潜在的或者不可预料的损害
如果一定要测试,建议由我们的工程师用命令行来执行磁盘离线测试

1.1.34 忘记存储设备的管理 IP 该怎么办?


该怎么办?

方法一、通过 sniffer 抓包程序,抓取来自控制器的以太网端口的 TCP/IP 信息,适用于所有机型


方法二、利用 EMC 服务专用端口,只适用于 Clariion 3 和 4 系列

CX 3 和 4 系列有 EMC 服务专用端口,可以用默认的 IP 登陆,然后右


击存储,选择属性,在弹出窗口的 General 选项卡中会出现两个 SP 的
IP 地址
注:左图中 D 端口即是 EMC 服务专用端口,但需要注意一点,如果您
想连接 SP A,请连接靠近 SP B 的服务端口,即两边的服务端口是错位
的(容错考虑)
,其默认 IP 如下:
SPA: 128.221.1.250 Subnet Mask 255.255.255.248
SPB: 128.221.1.251 Subnet Mask 255.255.255.248
方法三、利用 Navisphere Storage System Initialization Wizard 程序,会自动扫描到已经初始化过的
存储,并显示 IP 配置信息
第 39 页
EMC Clariion CX 系列日常管理和维护

1.1.35 忘记存储的帐号和口令怎么办?
忘记存储的帐号和口令怎么办?

我们的工程师在存储安装时,会告诉您存储的管理信息,请妥善保存,如果您不幸忘记帐号口令,
请联系EMC ACCOUNT CE 或 EIC

1.1.36 如何获取当前存储系统运行的 flare 版本

方法一、通过 cli 指令(红色字体)


C:\Program Files\EMC\Navisphere CLI>navicli -h 192.168.2.164 getagent
Name: K10
Desc:
Node: A-CK200072300124
Physical Node: K10
Signature: 1912950
Peer Signature: 1912955
SCSI Id: 0
SP Identifier: A
Revision: 3.26.40.5.016
Model: CX3-40c
Model Type: Rackmount
Prom Rev: 3.58.00
SP Memory: 4096
Serial No: CK200072300124
Cabinet: SPE3 C:\Program Files\EMC\Navisphere CLI>

方法二、登陆 Navishpere,右击存储,查看存储属性,在弹出的窗口中选择 software 选项卡

1.1.37 如何修改 Clariiion 存储的管理 IP 地址

风险提示:修改存储 IP、网关等信息会导致控制器重启,有可能会造成控制器 Panic 等风险,


甚至造成数据丢失,请谨慎评估影响,联系 EMC 全球服务热线确认

1.1.38 主机更换 HBA 卡,对存储有影响么?


对存储有影响么?

主机更换 HBA 卡后,Clariion 存储端需要将新 HBA 卡的 WWPN 注册,否则存储无法识别新的

第 40 页
EMC Clariion CX 系列日常管理和维护

HBA 卡,详细步骤,请登陆 EMC PowerLink 网站(http://powerlink.emc.com),下载最新的


Clariion Procedure Generate 程序,安装后生成相应文档操作

1.1.39 浏览器无法通过 IP 访问存储

请按如下顺序排查故障
a) 看能否 ping 通控制器 IP
b) 客户端是否安装了相应的 JAVA 程序,如果没有,请安装
c) 通过 Navicli 指令看能否获取控制器信息:Navicli –h sp_ip getagent, 正常应该会输出控制器
版本等信息
d) 如果可以登陆,但非常慢,可能和您的客户端配置过低或者存储业务繁忙有关,请登陆 EMC
PowerLink 网站下载 Windows_UIs 程序,这在一定程度上会解决访问存储过慢的情况
e) 如果问题还没有解决,请联系 EMC 全球服务中心

序列号查询方法

一般来说,
设备安装后 EMC 工程师都会将序列号连同 800 保修电话填写在卡片上贴在设备上面;
新安装设备时 EMC 要求提供设备序列号,下面描述如何查找几种典型设备的序列号。

1.1.40 CX300/400/500 系列序列号查询

此类设备序列号在阵列后面,序列号以 CK2000 开头的 14 位字符串,位置如图所示:

第 41 页
EMC Clariion CX 系列日常管理和维护

1.1.41 CX3-
CX3-20 系列序列号查询

此类设备序列号在阵列前面,打开硬盘柜(控制器柜)的面板(标有 EMC 的前面板)即可


见。

第 42 页
EMC Clariion CX 系列日常管理和维护

1.1.42 AX4-
AX4-5 系列序列号查询

序列号在机柜后面。

ZTE 常见问题汇总

1.1.43 SPS-
SPS-SP 电缆丢失

EMC 阵列都配有 2 个电池(SPS)来支持突然掉电后保留 CACHE 数据,电池和 SP 之间有


连接线,CX3 和 AX4-5 系列该连接线的 PART NO 号是:038-003-085。

但我们多次接到前方报告说找不到该连接线,后来持续追踪了一段时间,发现绝大部分连
接线都在现场的废弃堆或其它位置找到了;原因在于在 EMC 工程师到场之前,前方办事处
工程人员就已经将阵列硬件上架,连接好电源线和光纤线,但忘了将 SPS-SP 的线连接上,
以为此线无用就随便放置了。

1.1.44 主机重装操作系统后的两点注意事项

第 43 页
EMC Clariion CX 系列日常管理和维护

SUSE 操作系统重装后遇到 EMC 设备识别出现问题,需要注意两点:


a. 重装操作系统时,请先拔掉连接 EMC 设备的光纤,以免主机识别设备顺序发生改变导
致不能启动,特别是 SUSE LINUX,内核默认参数会先启动 QLA2400,导致主机本地盘序
号靠后
b. 重装操作系统前,请先记录 POWERPATH 的 LICENSE,重新安装 POWERPATH 是需
要它激活,命令是:#powermt check_registration

第 44 页
EMC Clariion CX 系列日常管理和维护

2. 软件部分

2.1 PowerPath 管理与配置

2.1.1 Pseudo 设备和 Native 设备

通常在有 powerpath 的环境里面,主机到同一个 LUN 会有多条不同的路径,这些路径会创建出


对应的设备文件,称之为 Native device,而在某些平台(AIX、Solaris、Linux)PowerPath 还会对
每个 LUN 生成一个设备,称之为 Pseudo 设备。
以下是各平台 Pseudo 设备和 Native 设备的关系:

/dev/hdisk1
PowerPath Driver

AIX
/dev/hdisk2
/dev/hdiskpower1
/dev/hdisk3

/dev/hdisk4

第 45 页
EMC Clariion CX 系列日常管理和维护

/dev/rdsk/c1t1d1

PowerPath Driver
Solaris
/dev//rdsk/c1t2d1
/dev/rdsk/hdiskpowera

/dev/rdsk/c5t1d1

/dev/rdsk/c5t2d1

/dev/sda
PowerPath Driver

Linux
/dev/sdb
/dev/emcpowera
/dev/sdc

/dev/sde

为了使 Powerpath 生效,请试用 Pseudo 设备。

2.1.2 powermt display

所有支持并安装了 powerpath 的平台上,都统一试用 powermt 命令来管理 powerpath,powermt


有很多子命令,可以通过直接运行 powermt 来查看

第 46 页
EMC Clariion CX 系列日常管理和维护

powermt display 则是用来监控 PowerPath 以及个条路径的命令.

直接运行 powermt display 可以看到一共有多少 LUN,是 CLARiiON 的还是 Symmetrix 的,有多


少 HBA 卡,每个 HBA 下面的路径有多少条,状态如何。

而运行 powermt display dev=all 则可以看到当前主机上被 powerpath 管理的所有 LUN 的状态.


如果需要查看某个 LUN 的状态,则需要运行 powermt display dev=<pseudo device name>来查看:

从上图的结果可以看到:

第 47 页
EMC Clariion CX 系列日常管理和维护

o 该 LUN 的 pseudo 设备名为 hdiskpower2;


o 有 4 条路径(I/O Paths),对应的 Native 设备名为 hdisk13/hdisk17/hdisk1/hdisk5;每条链路的
状态(State)都是 alive 的,模式(Mode)都是 active。
o 对应的 CLARiiON 的序列号(CLARiiON ID)为 CK200075100113;
o 对应的 LUN ID 为 LUN 907;
o 所有的链路的 Q-Ios 为 0,表示该设备不忙,没有 I/O,Errors 为 0,表示没有出现过故
障。
在监控 powerpath 的时候尤其需要注意 Native 设备的状态(State),它有两种情况:

如果状态变成了 Dead,则表示该条路径出现故障,需要检查光纤、HBA 卡、交换机端口、存储前


端口等。

2.1.3 powermt remove

如果需要将一个 LUN 从某个主机上收回,则先需要在 powerpath 的配置里面先将该设备删除。


然后才能删除主机的 Native 设备,并在 CLARiiON 的 Storage Group 里面将该 LUN 移出。
powermt remove dev=hdiskpower0
-------删除 powerpath 管理的所有设备
powermt remove dev=hdiskpower0
-------从 powerpath 配置中删除 hdiskpower0 对应的 LUN
powermt remove dev=hdisk4
-------从 powerpath 配置中删除 hdisk4 所对应的路径
powermt remove hba=0
--------从 powerpath 配置中删除 HBA0 及其所有的路径。

2.2 主机信息收集(emcgrab)
主机信息收集

如果在监控过程中发现主机访问存储有问题,但又无法解决的时候,在联系 EMC 工程师之前,


请先收集现有系统环境的详细配置信息,可以帮助 EMC 技术专家进行有效的故障诊断。下面是
具体的系统环境信息收集方法:
请到以下地址下载 emcgrab,并 ftp(bin 方式)到主机上,
ftp://ftp.emc.com/pub/emcgrab/Unix/

在主机上运行:
tar -xvf emcgrab_SunOS_v3.9_1.tar
cd emcgrab

第 48 页
EMC Clariion CX 系列日常管理和维护

./emcgrab.sh

收集好的文件放在 emcgrab/outputs 目录下面。

2.3 更换 HBA 卡

2.3.1 AIX 环境下更换 HBA 卡

1) 换卡前的准备工作
A. 如果 HBA 卡时好时坏,建议先拔掉该 HBA 的光纤;
B. 如果是 PowerPath 5.1 或以上版本,先在 powerpath 中把 fail 的 HBA 置于 disable
模式:
先用 powermt display 找出 fail 的 HBA 卡的 ID:
# powermt display

Symmetrix logical device count=12


CLARiiON logical device count=9
==================================================================
========================
----- Host Bus Adapters --------- ------ I/O Paths ----- ------ Stats
------
### HW Path Summary Total Dead IO/Sec Q-IOs Errors
==================================================================
========================
1280 pci@1e,600000/QLGC,qla@2 optimal 30 0 - 0 0
1281 pci@1f,700000/QLGC,qla@2 optimal 30 0 - 0 0
# powermt disable hba=1280

# powermt display

Symmetrix logical device count=12


CLARiiON logical device count=9
==================================================================
========================
----- Host Bus Adapters --------- ------ I/O Paths ----- ------ Stats
------
### HW Path Summary Total Dead IO/Sec Q-IOs Errors
==================================================================
========================
1280 pci@1e,600000/QLGC,qla@2 failed 30 30 - 0 0
1281 pci@1f,700000/QLGC,qla@2 optimal 30 0 - 0 0
# powermt display hba_mode

Symmetrix logical device count=12


CLARiiON logical device count=9
==================================================================
=
----- Host Bus Adapters -- ------ I/O Paths ---- ------ Stats
### HW Path Summary Total Dead Q-IOs Mode
==================================================================
=
1280 pci@1e,600000/QLGC,qla@2 failed 30 30 0 Disabled
第 49 页
EMC Clariion CX 系列日常管理和维护

1281 pci@1f,700000/QLGC,qla@2 optimal 30 0 0 Enabled

C. 在 powerpath 中删除 fail 的 HBA 对应的链路:


# powermt remove hba=1280

D. 在 AIX 系统中删除 fail 的 HBA 及其对应的子设备:


# rmdev –dl fcs# -R

2) 更换 HBA 卡。
3) 如果交换机使用的是 WWN zoning,则需要重新添加新 HBA 卡的 WWN zoning。
4) cfgmgr 识别新的 HBA 设备以及 CALRiiON 的 LUNZ 设备
5) 重新注册新的 HBA 卡到 CLARiiON
A. 如果使用 Navisphere Agent 注册:
# rc.agent stop

# rc.agent start

B. 如果是手工注册,则需要在 Navisphere 中将新的 HBA 加入原来注册的 Host 中


去。
6) 在 Navisphere 中做 reconnect:
Navisphere -> Host tab -> 右键菜单 -> Connectivity Status -> Reconnect.

7) AIX 主机上重新识别新链路:
# lsdev –Ccdisk|awk ‘/LUNZ/{print “rmdev –dl “ $1}’|sh

# cfgmgr

# powermt config

# powermt display dev=all

# powermt save

8) 如果需要,在 Navisphere 里面 unregister 掉 fail 的 HBA 卡的 WWN。

2.3.2 Solaris 环境下更换 HBA 卡

1) 换卡前的准备工作
A. 如果 HBA 卡时好时坏,建议先拔掉该 HBA 的光纤;
B. 如果是 PowerPath 5.1 或以上版本,先在 powerpath 中把 fail 的 HBA 置于 disable
模式:
先用 powermt display 找出 fail 的 HBA 卡的 ID:
# powermt display

Symmetrix logical device count=12


CLARiiON logical device count=9

第 50 页
EMC Clariion CX 系列日常管理和维护

==================================================================
========================
----- Host Bus Adapters --------- ------ I/O Paths ----- ------ Stats
------
### HW Path Summary Total Dead IO/Sec Q-IOs Errors
==================================================================
========================
1280 pci@1e,600000/QLGC,qla@2 optimal 30 0 - 0 0
1281 pci@1f,700000/QLGC,qla@2 optimal 30 0 - 0 0
# powermt disable hba=1280

# powermt display

Symmetrix logical device count=12


CLARiiON logical device count=9
==================================================================
========================
----- Host Bus Adapters --------- ------ I/O Paths ----- ------ Stats
------
### HW Path Summary Total Dead IO/Sec Q-IOs Errors
==================================================================
========================
1280 pci@1e,600000/QLGC,qla@2 failed 30 30 - 0 0
1281 pci@1f,700000/QLGC,qla@2 optimal 30 0 - 0 0
# powermt display hba_mode

Symmetrix logical device count=12


CLARiiON logical device count=9
==================================================================
=
----- Host Bus Adapters -- ------ I/O Paths ---- ------ Stats
### HW Path Summary Total Dead Q-IOs Mode
==================================================================
=
1280 pci@1e,600000/QLGC,qla@2 failed 30 30 0 Disabled
1281 pci@1f,700000/QLGC,qla@2 optimal 30 0 0 Enabled

C. 在 powerpath 中删除 fail 的 HBA 对应的链路:


# powermt remove hba=1280

D. 在 Solaris 系统中 Disconnect fail 的 HBA 及其对应的子设备:


# cfgadm -vc disconnect <Ap_Id>

2) 更换 HBA 卡。
3) 如果交换机使用的是 WWN zoning,则需要重新添加新 HBA 卡的 WWN zoning。
4) cfgadm 识别新的 HBA 设备以及 CALRiiON 的 LUNZ 设备
# cfgadm -c configure <Ap_Id>

5) 重新注册新的 HBA 卡到 CLARiiON


A. 如果使用 Navisphere Agent 注册:
# /etc/init.d/agent stop

# /etc/init.d/agent start

B. 如果是手工注册,
则需要在 Navisphere 中将新的 HBA 加入原来注册的 Host 中去。

第 51 页
EMC Clariion CX 系列日常管理和维护

6) 在 Navisphere 中做 reconnect:
Navisphere -> Host tab -> 右键菜单 -> Connectivity Status -> Reconnect.

7) Solaris 主机上重新识别新链路:
# cfgadm -c configure <Ap_Id>

# powermt config

# powermt display dev=all

# powermt save

8) 如果需要,在 Navisphere 里面 unregister 掉 fail 的 HBA 卡的 WWN。

2.3.3 Linux 环境下更换 HBA 卡

1) 换卡前的准备工作
A. 停止主机对 CLARiiON 的 I/O,shutdown 数据库、umount 掉 CLARiiON 相关的
Filesystem。
B. 如果 HBA 卡时好时坏,建议先拔掉该 HBA 的光纤;
C. 如果是 PowerPath 5.1 或以上版本,先在 powerpath 中把 fail 的 HBA 置于 disable
模式:
先用 powermt display 找出 fail 的 HBA 卡的 ID:
# powermt display

Symmetrix logical device count=12


CLARiiON logical device count=9
==================================================================
========================
----- Host Bus Adapters --------- ------ I/O Paths ----- ------ Stats
------
### HW Path Summary Total Dead IO/Sec Q-IOs Errors
==================================================================
========================
1 qla2xxx failed 30 0 - 0 0
2 qla2xxx optimal 30 0 - 0 0
# powermt disable hba=1
# powermt display
Symmetrix logical device count=12
CLARiiON logical device count=9
==================================================================
========================
----- Host Bus Adapters --------- ------ I/O Paths ----- ------ Stats
------
### HW Path Summary Total Dead IO/Sec Q-IOs Errors
==================================================================
========================
1 qla2xxx failed 30 30 - 0 0
2 qla2xxx optimal 30 0 - 0 0
# powermt display hba_mode
Symmetrix logical device count=12
CLARiiON logical device count=9

第 52 页
EMC Clariion CX 系列日常管理和维护

==================================================================
=
----- Host Bus Adapters -- ------ I/O Paths ---- ------ Stats
### HW Path Summary Total Dead Q-IOs Mode
==================================================================
=
1 qla2xxx failed 30 30 0 Disabled
2 qla2xxx optimal 30 0 0 Enabled
D. 在 powerpath 中删除 fail 的 HBA 对应的链路:
# powermt remove hba=1

2) 更换 HBA 卡(可能需要关机和重启,请咨询 Linux 工程师)。


3) 如果交换机使用的是 WWN zoning,则需要重新添加新 HBA 卡的 WWN zoning。
4) 重启识别新的 HBA 设备以及 CALRiiON 的 LUNZ 设备
5) 重新注册新的 HBA 卡到 CLARiiON
A. 如果使用 Navisphere Agent 注册:
# /etc/init.d/naviagent stop

# /etc/init.d/naviagent start

B. 如果是手工注册,则需要在 Navisphere 中将新的 HBA 加入原来注册的 Host 中


去。
6) 在 Navisphere 中做 reconnect:
Navisphere -> Host tab -> 右键菜单 -> Connectivity Status -> Reconnect.

7) Linux 主机上重启识别新链路:
# shutdown –ry now

# powermt config

# powermt display dev=all

# powermt save

8) 如果需要,在 Navisphere 里面 unregister 掉 fail 的 HBA 卡的 WWN。

2.3.4 HPUX 环境下更换 HBA 卡

1) 换卡前的准备工作
E. 停止主机对 CLARiiON 的 I/O,shutdown 数据库、umount 掉 CLARiiON 相关的
Filesystem。
F. 如果 HBA 卡时好时坏,建议先拔掉该 HBA 的光纤;
G. 如果是 PowerPath 5.1 或以上版本,先在 powerpath 中把 fail 的 HBA 置于 disable
模式:
先用 powermt display 找出 fail 的 HBA 卡的 ID:
# powermt display

第 53 页
EMC Clariion CX 系列日常管理和维护

Symmetrix logical device count=0


CLARiiON logical device count=32
Hitachi logical device count=0
Invista logical device count=0
HP xp logical device count=0
Ess logical device count=0
HP HSx logical device count=0
=====================================================================
=========
----- Host Bus Adapters --------- ------ I/O Paths ----- ------ Stats
------
### HW Path Summary Total Dead IO/Sec Q-IOs
Errors
=====================================================================
=========
1 0/3/0/0/0/0.11.10.0.0 failed 32 0 - 0
1
3 0/4/0/0/0/0.12.10.0.0 optimal 32 0 - 0
0
# powermt disable hba=1

# powermt display hba_mode

Symmetrix logical device count=0


CLARiiON logical device count=32
Hitachi logical device count=0
Invista logical device count=0
HP xp logical device count=0
Ess logical device count=0
HP HSx logical device count=0
=====================================================================
=========
----- Host Bus Adapters --------- ------ I/O Paths ----- ------ Stats
------
### HW Path Summary Total Dead Q-IOs Mode
=====================================================================
=========
1 0/3/0/0/0/0.11.10.0.0 failed 32 32 0
Disabled
3 0/4/0/0/0/0.12.10.0.0 optimal 32 0 0
Enabled

2) LVM 处理:
注:这部分属于操作系统 LVM 的操作,详情请咨询 HP-UX 系统工程师
H. 备份 VG 的配置:
# vgexport -m /tmp/vg_name.map -p -v -f /tmp/pv_devs.out vg_name

备份 vg map 文件
----备份
# ls -l /dev/*/group >/tmp/vg_minor

# ls -l /dev/vg_name/* >/tmp/vg_name_permission

# cp /etc/lvmtab /etc/lvmtab.bak

I. 如果需要删除的路径是 PV Link 里面唯一的活动路径,则需要先将其他活动路径


加入到 VG:

第 54 页
EMC Clariion CX 系列日常管理和维护

# vgextend /dev/vgname /dev/dsk/c#t#d#

J. 从 VG 中将失败的路径移出:
# vgreduce /dev/vgname /dev/dsk/c#t#d#

3) 在 powerpath 中删除 fail 的 HBA 对应的链路


# powermt remove hba=1

4) 更换 HBA 卡(可能需要关机和重启,请咨询 HP-UX 系统工程师)。


5) 如果交换机使用的是 WWN zoning,则需要重新添加新 HBA 卡的 WWN zoning。
6) 重启识别新的 HBA 设备以及 CALRiiON 的 LUNZ 设备
7) 重新注册新的 HBA 卡到 CLARiiON
K. 如果使用 Navisphere Agent 注册:
# /sbin/init.d/agent stop

# /sbin/init.d/agent start

L. 如果是手工注册,则需要在 Navisphere 中将新的 HBA 加入原来注册的 Host 中


去。
8) 在 Navisphere 中做 reconnect:
Navisphere -> Host tab -> 右键菜单 -> Connectivity Status -> Reconnect.
9) Linux 主机上重启识别新链路:
# ioscan -fnCdisk

# insf –e –C disk

# rmsf –a

# powermt check

# powermt config

# powermt display dev=all

# powermt save

10) 如果需要,在 Navisphere 里面 unregister 掉 fail 的 HBA 卡的 WWN。

第 55 页

Potrebbero piacerti anche