爱达利培训资料江西电信基础数据网(新桥)应急预案080601new 本文关键词:江西,应急预案,新桥,培训资料,达利
爱达利培训资料江西电信基础数据网(新桥)应急预案080601new 本文简介:江西电信新桥DDN/ATM网络应急预案广州新科爱达利电讯技术有限公司2008年6月一、DDN网络1、节点设备故障网络在建设上尽量保证节点机框、电源设备、重要板卡的冗余备份,基本达到热备份切换的要求。加强节点数据库的日常备份工作,并妥善保管。(一)、本地网1、3645/3600设备故障——3645/3
爱达利培训资料江西电信基础数据网(新桥)应急预案080601new 本文内容:
江西电信新桥DDN/ATM网络
应急预案
广州新科爱达利电讯技术有限公司
2008年6月
一、
DDN网络
1、节点设备故障
网络在建设上尽量保证节点机框、电源设备、重要板卡的冗余备份,基本达到热备份切换的要求。加强节点数据库的日常备份工作,并妥善保管。
(一)、本地网
1、3645/3600设备故障——
3645/3600节点数据库异常表现在节点用户电路不正常工作,首先要查看两块控制卡之间数据同步是否正常,不正常就对节点两块控制卡进行数据隔离,判断分析问题出在哪块控制卡上,再将认为正常的控制卡切换作为主用,并拷贝数据至备用卡,然后做两卡之间的数据同步。在控制卡可能存在硬件损坏的情况下,维护人员必须到节点现场进行处理:在两卡隔离的情况下,安装好新件然后做同步并做切换操作,检验是否正常。
3645设备的交换机框全部采用冗余备份,实时热备份切换,在一个交换机框断电或损坏的情况下,仍然可以由另外一个机框进行控制,只须对故障设备进行隔离再修复即可。机框损坏必须选择晚间进行更换,控制卡损坏可以进行实时更换
3645设备的外围机框或单独的3600设备基本上都是采用双控制卡备份,在机框断电或损坏的情况下,只能采用更换新件的方式进行。
2、DDN节点数据备份和数据恢复
必须具备的物件有:4601A或CI8.0软件,FTP
SERVER软件
带串行口以及以太网口的PC或便携一台,
DB-9到RJ45直连电缆一根,
直连网线、交叉网线各一。
2.1、4601A/CI软件的使用(两者仅在菜单界面上有所区别,进入NMTI后完全一致。)
2.1.1连接使用图
2.1.2启动CI软件
在安装目录下,直接双击CI.EXE文件即可
按照屏幕菜单提示,首先要检查与设备之间连接是否正常——
表示与节点设备之间的通信没有建立起来。
“ALL
is
well”表示连接正常,可以进行后续相关操作。
2.1.3连接节点NMTI
根据已经编辑好的节点信息,选择节点进行登陆。节点名称后带有?表示该节点没有与4601A连通。未带任何表示连接正常,可以登陆。
2.2备份数据和恢复数据
2.2.1备份数据
进入节点NMTI界面,按照相应位置的菜单进行操作——
再次确认节点配置信息——F2
HOUSE
需要注意的是DOMAIN
NUMBER和NODE
NUMBER两个参数,其次是ROUTER
VERSION。
用光标选择待备份节点,选择ACTIVE进入。ACTIVE表示主用控制卡,INACTIVE表示备用控制卡,如果没有显示INACTIVE则表示该节点只有一块控制卡。
选择“MAINT——MORE——DATABASE——BACKUP——PROCESS”,输入文件名称(注意与节点名保持一致,例如:wuyi3645??.DB,??为01、02,表示序号自动累加数,第三次备份时若选用01将覆盖原有文件)。
在备份之前,还应该检查一下两块控制卡之间数据是否同步,以便提前发现设备是否存在故障隐患,可以及时排除。
上图表示只有一块控制卡。在3645节点下,冗余状态为Partitioned/Hot两种状态。
上两图双控制卡A、B后的数值0表示两者之间没有差异,Active表示当前为主用位置。Hotstanby
表示互为备用同步状态。独立的3600冗余状态为Hot
stanby和Warm。
每25个Record(s)在窗口中变化依次递增,直至备份完毕。注意:根据现有7版本,3600的数据库一般均在7000个记录以上,3645交换机框的数据库在2000左右,E3节点数据库在7000以上。备份时间至少要30-40分钟。
需要注意的是,如备份过程中,系统提示出现60#错误码,表示当前节点数据库发生变化,导致备份中断,原因可能为用户端口/中继端口状态变化或节点出现严重告警等,所以备份一般应该选择在晚间业务闲时,节点数据库基本没有变化干扰时进行。
备份完毕,系统会自动提示备份成功,并询问是否进行数据库校验。校验的时间相对备份快一点点,每25个记录刷新一次,并有百分比进度指示。
备份结束后,在CI的安装目录下将生成“节点名.DB”的文件。即备份前指定的文件名。
2.2.2恢复数据
恢复数据前,若有双控制卡,要求将一块拔出备用,然后恢复另一块卡。同时检查一下数据库的大小。
记录好数据,以便在恢复后做比较。
上图显示在4601A当前目录下没有发现备份的*.DB数据库,正常情况下,系统会搜索到备份的文件并让你选择需要恢复的文件。
选择“MAINT——MORE——DATABASE——RESTORE”选择对应目录下的原备份好的节点数据路径,执行PROCESS,等待数据重传至控制卡。
数据倒换完毕后,控制卡会自动引导节点断电重启。
节点重启完毕,上述方法再次进入节点NMTI,检查节点信息和连接数据是否正常。
若显示与网络连接正常,可以看到其他节点号等信息。
再次确认节点配置信息——F2
HOUSE**********************************************************
以下是整个备份和恢复数据步骤的简单汇总:
江西电信DDN网络节点数据备份/恢复操作流程
1、用CI软件进入相应节点:
(1)直接点击C:/*/CI.EXE文件,(2)进入CI界面;
(3)选择CONNECT
TO
NODE;
(4)用光标(5)选择待备(6)份节点,(7)选择ACTIVE进入。
2、选择“MAINT——MORE——DATABASE——BACKUP——PROCESS”,3、输入文件名4、称(注意与节点名5、保持一致,6、例如:CN3645??.DB,??为01、02,7、表示序号自动累加,8、第三次备9、份时若选用01将覆盖原有文件)。
10、等待备11、份完毕,12、选择“VERIFY——PROCESS”,13、等待校验完成,14、成功与否有提示。
15、退出节点控制台。
16、备17、份结束后,18、在安装目录下将生成“节点名19、.DB”的文件。执行人登记备20、份记录表。********************************
21、数据重置操作
22、选择“MAINT——MORE——DATABASE——RESTORE”选择对应目录下的原备23、份好的节点数据路径,24、执行PROCESS,25、等待数据重传至控制卡。
26、数据倒换完毕后,27、控制卡会自动引导节点断电重启。
28、节点重启完毕,29、上述方法再次进入节点NMTI,30、检查节点信息和连接数据是否正常。**********************************************************
2.3系统控制卡倒换
依次选择“MAINT”—“REDUNDANT”
——Redundancy:HotStandby表示A、B机框的两块控制卡处于热备份状态,即数据库自动同步且主用控制卡无法工作时备用卡自动倒为主用;Partition(3645)、Warm(3600)表示A、B机框的两块控制卡处于相互独立状态,其数据库是相互独立的,对主用或备用控制卡的任何操作将不会影响到另一块卡的数据
——:A、B机框的控制卡已处于同步状态,且B机框的控制卡为主用控制卡
——RLS_CTRL:当主备控制卡处于HotStandby状态且显示控制卡已经完全同步,选择该菜单将可以将备用控制卡倒为主用
3、节点设备重要信息的检查与操作
3.1检查节点时钟同步状态
将鼠标点中全网拓扑图任一空处,按右键拉出菜单“Highlight”—“SyncStatus”—“Node”
网管拓扑将变为以上显示:
1)同步的节点将变为蓝色,时钟丢失的节点将变为桔红色
2)显示为蓝色的中继表示该中继被某一节点作为了时钟信号提取来源,箭头指示出时钟提供的方向
3)若某一节点上的大量用户申告通信不正常,可以查看节点是否同步,若失步,手工更改一个有效的时钟源
——除了在网管上直接用“Hilight
synchronization
status”命令显示节点同步状态,还可以在NMTI界面查看信息。
current表示当前起作用的中继位置及在用状态,ready表示备用状态,在当前中继源不可用的状态下,会自动搜索可用同步源并置为主用,否则直至为FREE状态,节点自己的石英震荡时钟起作用,但只能保持24小时内保持与其他时钟精度没有较大差异。
节点失步24小时后会影响电路的通信质量。所以一旦发现节点时钟不同步,要马上查找原因,及时恢复时钟源正常工作。
3.2为设备修改时钟源
依次选择“config”—“synch”
每个节点可以配置4个时钟源(但只有一个为主用,另外3个为备用)。时钟可以是外部时钟源也可以是从某一中继端口提取,以下将说明如何从一个中继端口提取时钟。
选择“SRC_NUMBER”,输入1~4(对第一到第四个时钟源进行配置),选择“Source”—“Derived”,
输入某一个当前激活状态的中继端口,如A6-B(A6槽E1D板卡的B口)
选择“Recovery”来确定当某一时钟源失效而改为从另一时钟源提取时钟信号后,若原有时钟源恢复,如何切换到原时钟源上来。
可以通过对CLASS值的设置来确定4个时钟源的优先级,具有最低CLASS的时钟源优先级最高,当有多个时钟源都处于Enable状态时,拥有最低CLASS的时钟源将成为“Current”
3.3控制卡信息的检查
在每块DDM中都有两个BANK用于存放控制卡FLASH信息,升级或降级时一般只操作一个BANK,以便灵活调度节点版本。
上图显示两个BANK的版本Generic
均为1117-H0-40,可以不同,并可以在两个BANK之间切换(NEXT-ACTIV)。Active
Bank表示当前运行的Bank号,Next
Active
Bank表示下次重启后运行的Bank号。
注意:切换会引起节点数据库丢失必须恢复(restore)数据,只可以在实际需要时进行,平时严禁操作。
如果节点在恢复数据后不能在网工作,就需要检查节点的版本与现行的版本是否一致。
2、中继电路故障
网络的中继是网络的核心神经,电路必须保证有足够的迂回路由。要求在网络设备的硬件配备上、传输路由的冗余上有保证。只要网络有足够的中继资源,就可以尽快予以抢通电路。保证设备的备品备件是必要的。
(一)、本地网
如果只有某一局向的一条2M中断,在平时保证2M的中继带宽利用率在50%左右的情况下,网络仍然可以迂回中断的电路;
单点2M中继全阻
针对重点客户集中的区域,在物理传输路由上必须保证有不同局向的出口,并且在可能的情况下,安排备用的路由。
在节点路由的安排上尽量选择物理路径短、靠近母局的方向,并且一个节点的出口中继有两个以上的方向出口。传输部门在故障发生以后需要积极配合对电路予以调度。
(二)、骨干网
传输部门要保证路由的冗余,在故障时予以紧急调度。在发生骨干中继中断时,由网络监控中心派单至维护中心的传输处与数据处共同调通抢修。
二、
FR/ATM
1、节点设备故障
网络在建设上尽量保证节点机框、电源设备、重要板卡的冗余备份,基本达到热备份切换的要求。加强节点数据库的日常备份工作,并妥善保管。
1、36170设备故障——
36170节点数据库异常表现在节点用户电路不正常工作,首先
要查看两块控制卡之间数据同步是否正常,不正常就对节点两块控
制卡进行数据隔离,判断分析问题出在哪块控制卡上,再将认为正
常的控制卡切换作为主用,并拷贝数据至备用卡,然后做两卡之间
的数据同步。在控制卡可能存在硬件损坏的情况下,维护人员必须
到节点现场进行处理:在两卡隔离的情况下,安装好新件然后做同
步并做切换操作,检验是否正常。
36170设备的交换机框全部采用冗余备份,实时热备份切换,
在一个交换机框断电或损坏的情况下,仍然可以由另外一个机框进
行控制,只须对故障设备进行隔离再修复即可。机框损坏必须选择
晚间进行更换,控制卡损坏可以进行实时更换。(注:上饶
抚州
宜春
新余
萍乡
景德镇6个点的7470是单交换结构)
2、FR/ATM设备的数据备份和数据恢复
必须具备的物件有:CI8。0软件,FTP
SERVER软件
带串行口以及以太网口的PC或便携一台,
DB-9到RJ45直连电缆一根,
直连网线、交叉网线各一。
2.1节点数据备份
根据现有网管本身的功能,备份可以直接在网管上进行操作,也可以通过CI进行。
2.1.1连接使用图
2.1.2进入节点NMTI界面
与DDN操作界面基本相同,只是菜单内容有所不同。
根据实际需要选择不同的备份位置(IP地址),一般选择主用网管,Delegate网管也可,只是速度较慢。
根据菜单,逐一输入source/use_info/file_info等信息,请在图中参考。33000表示网管所在的Domain,1023固定表示DDN2的节点号(1021为DDN1,其余delegate都有各自的节点号)。Root表示用root用户ID登陆,并要输入正确的口令。Path为需要备份文件存放的位置,指的是1023网管的目录。文件名称一般取比较容易记的节点名称缩写,或备份事件内容,后缀自定,一般为conf或db等。
在备份启动后3-5分钟时间内,设备DB有一个准备的过程。
根据实际DB的大小,基本SIZE在200万个byte以上,所以需要有一定时间等待传完。在直接备份delegate的情况下,速度会更慢。而且在备份的过程中,要少开节点NMTI窗口进行操作,以免影响网管响应速度。
2.1.3数据恢复
数据恢复前要设置PC的IP地址为与节点同一网段,运行FTP
SERVER软件,确定相关数据存放目录位置,确定登录名称ID和密码。连接好网线至CCIP的ETH0/1,通过FTP到节点NMTI界面。
在正确输入source/use_info/file_info等信息之后,在dataebase目录下有restore选项,而且系统会提示此操作会引起节点重启。需要认真核对输入的内容后再执行。
2.2
控制卡冗余倒换:由于DDN与ATM/FR网络都是采用的Alcatel的设备,命令与DDN网络类似。
2、中继电路故障
网络的中继是网络的核心神经,电路必须保证有足够的迂回路由。要求在网络设备的硬件配备上、查传输路由的冗余上有保证。
(一)、本地网
155M中继断
网络采用裸光纤连接,结构为不完全或星状连接,所以路由上要有保护,将在今后在SDH传输系统上予以备份。
在以上7470节点配备1块备用155M板卡,平时作好数据,在判定板卡损坏的情况下,由维护中心维护人员起用,抢通电路,坏件返修好后继续做备件。
传输部门在系统上给予路由的备份,与数据设备之间保持连接,一旦发生故障,可以在较短时间里接通备份路由,网络监控中心负责用户电路的迂回割接,原中继电路等待故障修复后作为备用。
网络中可以用2M电路作为辅助中继,从而在155光缆中断时迂回用户电路。
(二)、省干网
省干中继由155M、IMA32M组成,每个节点基本具有两个以上局向出,网络内部也可以通过迂回中继迂回电路但IMA中继带宽太小只能迂回数量有限的电路。
三、
网管
由于网管数据库工作不正常也同样会造成大面积用户电路不能正常工作,因此在日常维护中加强对网管数据库的备份也同样重要,恢复网管数据库的步骤如下:在冗余配置中,先恢复备用网管数据库。
1、从5620主菜单选择“quit”。
2、打开command或shell工具。
3、以root身份登录:
su
root
输入口令后回车。
4、停止46020通讯进程和数据库:
RED_comms
stop
5、db_restore
6、回复以下的提示:
1)在数据库备份源提示处,输入存储备份文件的磁盘或磁带的路径。2)在执行抢救逻辑日志处,如果你有最后一次备份以后的逻辑日志备份,输入“n”。3)在执行逻辑恢复处,输入“n”。
7、重新启动系统:
/etc/init6
8、以admin身份登录并输入口令。
9、验证5620配置是正确的。更新由于数据库失效丢失的任何链路或节点的配置。
四、电路故障诊断方法:
当电路出现故障时,一时难以判断故障点在哪里,这时可以行将该故障电路高亮显示出来然后再通过打环的方法逐段排查。
高这显示电路的方法如下图:点中端口然后选HIGHLIGHT---PATH
(一)DDN中的打环
1、检测中继的LOOPBACK:
A.Equipment
Loopback:用于检测Dual
E1
card2M端口是否良好,是一种面向本端
交换机框所作的单向环路。
B.Line
Loopback:
用于检测中继线路是否中断,是一种面向远端节点所作的
单向环路。
LOCAL(本端)
REMOTE(远端)
2、检测DNIC及DTU的LOOPBACK:
2
B
loopback:用于检测DTU的好坏,是一种面向本端节点及用户接入端所作的
3
双向环路。
4
C
loopback:用于检测DNIC端口到DTU这一段是否良好,是一种作用在CTL
5
CARD并面向本端节点及用户接入端所作的双向环路。
6
E
loopback:用于检测DTU数据端口的好坏,是一种面向本端节点的双向环路。
7
3、检测DDC
CARD
及端口的LOOPBACK
DTU面板指示灯:
READY
:DTU和DTU间准备就续
DTR:路由器和DTU间准备就续
LINE:DTU和3600DNIC间准备就续
Maint
on_circuit
a6-10-a
show_signl
Input
DTR
RTS
ALB
RDL
1
1
0
0
Output
DSR
DCD
CTS
RI
1
1
1
0
如果DTR为0则外线有问题,路由器和DTU间。
v35查用户端信号是否正常:
INPUT:
DTR
RTS
=1
OK
OUPUT:
DSR
DCD
CTS
=1
OK
3600
MainStreet
1118-H0-15
TRyupin-A
Alarms:11
No
Date
3:01R
Circuit
Loopback
Connection
Application
Test
Bus
(Shelf
A)
N/A
None
Test
Bus
(Shelf
B)
N/A
None
A4-01
V.35_DCC
NoneA1-A-14
Cross
connect
Installed
Type
:
V.35_DCC
Firmware
ID
:
$13
Hardware
ID
:
$0
Feature
ID
:
$2
Status
:
OK
INPUTS:
DTR
RTS
ALB
RDL
1
1
0
0
OUTPUTS:
DSR
DCD
CTS
RI
1
1
1
0
=
Active
connect;
!
=
Maintenance
connect
MAINT
ON_CIRCUIT
A4-1
CTRL_LEADS
DNIC查用户端信号是否正常:
INPUT:
DTR
RTS
=1
OK
OUPUT:
DSR
DCD
CTS
=1
OK
3600
MainStreet
1118-H0-15
TRyupin-A
Alarms:11
No
Date
3:08R
Circuit
Loopback
Connection
Application
Test
Bus
(Shelf
A)
N/A
None
Test
Bus
(Shelf
B)
N/A
None
A2-04-A
DNIC
NoneA1-A-03
Cross
connect
INPUTS:
DTR
RTS
ALB
RDL
1
1
0
0
OUTPUTS:
DSR
DCD
CTS
RI
1
1
1
0
=
Active
connect;
!
=
Maintenance
connect
MAINT
ON_CIRCUIT
A2-4-A
SIGNAL
SHOW_SIGNL
CTRL_LEADS
(二)FR/ATM中的打环
1、155M中继
PVC上打环:
155PVC打环后是向线路方打单向环
打环方法:
config
connect
p1-10-1;1/32
to
p1-10-1;1/32
验证:打环后在FR端的2M路由器上PING自已的端口地址(FR配置为子接口点到点模式)
拆环方法:
config
connect
p1-10-1;1/32
disconnect
在网管对PATH
做DISCONNECT再做CONNECT恢复
2、E1CE中继时隙上打环:
例如:所测为P1的第2槽位E1CE板的第3个端口上的第8个时隙则:
MAINT
ENDPOINT
P1-3-8;CG8
LOOPBACK
BIDIR
LATCHED
3、E1CFR(4口)
E1UFR(8口)
E1FR(16口)
2M用户端口上打环
向2M用户方向打环:
直接对端口打LINE环OBJECT---DIAGNOSTICS----LOOPBACK----LINE
验证时2M路由器上能收到LOOP但不能PING自已。只能验证通路是好的但不能验证掉包多少。
向设备方向打环:
将资源协议改成NONE,将FRPATH电路中FR/ATM
里面的Protocol
mapping
:类型改为透明模式。
再对端口打EQUIPMENT
环OBJECT---DIAGNOSTICS----LOOPBACK----EQUIPMENT
验证时:让对端路由器PING自已接口地址。
(三)通过查电路流量判断故障
FR端口的流量
ATM端口的流量:
如要想要查看ATM指定的VPI/VCI上的流量就只能通过NMTI实现,方法如下:
state
object
endpoint
p1-6-1;11/277
atm
15_minute
curr_intvl
按ESC+R键进行刷新。
六.系统紧急恢复流程
1
5620网管系统重新启动
如果遇到5620出现死机或者出现问题,则需要重起5620网管。(注意:重起前一定要有数据库备份)
1---停止5620运行
#RED_comms
stop
等5分钟,完成后会出现#提示符
2----重起备用网管
init
6
3---网管重起后,应该可以正常登陆。
4---如果有问题,则需要联系厂家值班人员或者报CASE处理。
2
7470节点的重新启动
1----准备好节点的数据库,作为备用。
2---把整个节点关闭电源。如果有多机框,则先关闭外围框,再关闭交换框。
3---打开节点电源。如果有多机框,则先开交换框,再开外围框。
4---正常情况下,节点经过关电后重开后,会恢复正常工作。
5---如果有问题,则需要联系厂家值班人员或者报CASE处理。
3
7470节点重建步骤
1---准备好5620网管数据库。
2---准备好7470节点数据库。CCIP分配盘,手提电脑,直连网线。
3---在网管上把有问题的节点的电路list出来,尽可能把受影响的电路迂回到其它节点上使用。
4---把网管的自动迂回,bump功能关闭。
5---到现场,重新建立节点信息。内容包括:IP地址,CPSS地址,节点号,节点类型,时钟设置,booking
factors设置,所有板卡的定义,STM1卡的CELL交换容量等等(IP
address,CPSS
address
and
links,booking
factors,slots
and
I/O
ports
configuration,stream
names
of
Frame
Links,physical
layer
settings
of
UCS
ports,IMA
group
and
link
settings,any
switched
services
settings
on
the
shelf
(PNNI
node
level,shelf’s
call
control
group,etc.)
6---恢复节点的数据库,现场执行---à
MAINT
FILE_TRANSFER
NETWORK
DATABASE
RESTORE
7---恢复完成后,重起节点。
8---在网管上把节点的数据库读上网管,执行databaseàget
from
objectàfull
9---完成后,在网管上把该节点的电路重新进行连接,处理有问题的垃圾电路。
10---节点重建工作完成。
11---如果有问题,则需要联系厂家值班人员或者报CASE处理。
5
36XX系列设备的重建步骤
1---准备好5620网管数据库。
2---准备好36XX节点数据库。手提电脑,直连网线,DB9转换头。
3---在网管上把有问题的节点的电路list出来,尽可能把受影响的电路迂回到其它节点上使用。
4---把网管的自动迂回,bump功能关闭。
5---到现场,重新建立节点信息。内容包括:DOMAIN地址,CPSS地址,节点号,节点类型,时钟设置等等
6---恢复节点的数据库,现场执行---à
MAINT
MORE
DATABASE
RESTORE
7---恢复完成后,重起节点。
8---在网管上把节点的数据库读上网管,执行databaseàget
from
objectàfull
9---完成后,在网管上把该节点的电路重新进行连接,处理有问题的垃圾电路。
10---节点重建工作完成。
11---如果有问题,则需要联系厂家
七、日常维护流程
1
每周清理一次List
Trouble
Tickets
保证Trouble
Tickets不会增长从而降低46020性能
ListàTrouble
TicketàDELETE
ALL(可在清理前用SAVE
AS
FILE将Trouble
Ticket信息保存为一文件)
2
查
Alarms
3600节点:在网管上选中节点,点鼠标右键,选择communications---active
进入该节点的命令行界面.选择
ALARMS
---
MAJ/PROMPT查主要告警,选择ALARMS
---
minor查次要告警.
7470节点:在网管上选中节点,点鼠标右键,选择communications---active
进入该节点的命令行界面.选择
ALARMS-----outstanding---major查主要告警minor查次要告警.
4
确认节点同步状态.
HightlightàSync
StatusàNode
验证节点同步状态(针对全网节点)
经常性检查节点的同步情况可以防止发生由于节点时钟的不同
步而引起电路的滑码和误码等问题。
操作如下:
从主菜单选择?HIGHLIGHT――SYNC
STATUS――NODE?。
兰色:表明是取中继时钟
黄色:表明是取外部时钟
橙色:表明节点处于取自震荡时钟状态
DDN/FR/ATM
网络与设备日常维护作业建议书省数据局运维部编制
紫色:表明节点SSU
模块工作不正常
5
确认电路状态
ListàPathsSort
by
Status
对CONNECT(DOWN)RFC
电路进行清理,对
INTER
VIA
电路最好择时进行重连处理。
6
查看系统产生的信件,
每天检查在主、备用网管上由系统为root
和ADMIN帐号的用户产生的EMAIL。例如,46020自动产生EMAIL提醒ROOT
和ADMAIN用户注意为46020数据库指定的空间要满了。(将E-MAIL信件清除)
7
确认46020数据库的冗余状态
检查46020
STANDBY的图标在ACTIVE的网管上是否显示为绿色。
8
验证查看统计数据文件
在主、备用网管上同时打开command
shell界面;
在主、备用网管上都进入46020统计数据文件目录,键入:
cd
/installdir/stats/data
这里installdir是46020的安装目录。
列出统计数据文件,键入:
ls
-al
验证主备网管所有列出的文件具有相同的大小,名称,日期。
9
验证统计日志文件冗余
在主、备用网管上同时打开command
shell界面;
在主、备用网管上都进入46020统计数据文件目录,键入:
cd
/installdir/stats/collectorpair_1
这里installdir是46020的安装目录。
列出统计数据文件,键入:
ls
-al
验证主备网管所有列出的文件具有相同的日期戳,并且每个间隔15分钟。
10.验证网管系统的验证46020
数据库冗余(针对主备网管)
(1)、在主备网管上执行
JXDDN1%
pwd
/opt/netmgt/informix
JXDDN1%
tail
-100
online.log
要求输出的最后一行的红色字部分要一致。
比如:
16:04:05
checkpoint
loguniq
238,logpos
oxc1c018
发现不一致注意及时和省数据局技术人员联系或者报CASE。
(2)、在主备网管上执行执行RED_comms
status
验证。
11
查看磁盘和46020数据库的容量
su
root
cd
/installdir/bin
audit
-doit
检查dbs46020磁盘空间使用率不能超过80%
12
查磁盘交换SWAP
空间
swap
?s
例如:available
swap
space:
325928K这是正常的,如果只有几十M的available
swap
space则系统需要重新启动。
13
进行人工网管主备用切换(建议每月或每季度一次)
备份46020数据库
检查主/备用网管系统数据库是否处于同步状态下
在网络拓扑上选择STANDBY图标,DatabaseàSwitch
to
Standby
或在主用网管的#下./RED_comms
activity(建议用此法)
14
优化网络
HightlightàUtilization
对显示红色的中继Listàpathàoptimize
all
15
看CPSS通道是否畅通
cd
/installdir/bin
nodes
links
五、
局方应做好相应的数据备份工作:
1、网管数据库备份(每月一次):
在主用网管上进入COMMAND
TOOLS命令行后为%模式,
%su
root
%输入密码
#cd
/opt/netmgt/bin
#./db_backup
-dc
/opt/netmgt/backup/数据库名.db
(格式例如:5620080523.db)
2、7470节点数据库备份(每月一次):
在网管上选中节点,点鼠标右键,选择communications---active
进入该节点的命令行界面将DOMAIN设为33000将NODE设为1021,USER
ID设为admin
password设为mainstreet.
选择:MAINT
FILE_TRANSFER
NETWORK
DATABASE
BACKUP
Source
CPSS
Address
Domain
:
33000
Node
(number)
:
1021
User
ID
:
admin
Password
:
Path
:
/opt/netmgt/backup
File
Name
:
yb7470080505.db
如果是在本地做备份的话需要本地的PC上装好FTP
SERVER软件,将7470中上述Source
CPSS
Address改
为Source
IP
Address
填写你PC的IP地址.
PATH
填写你PC的硬盘存放目录.
3、3600节点数据库备份(在电路没有更改的情况下可半年一次):
在本地进入CI软件,maint
more
database
backup
4、其他数据备份:
备份Trouble
Ticket
ListàTrouble
TicketàSAVE
AS
FILE(可在清理前用将Trouble
Ticket信息保存为一文件)
备份告警文件alarmfile.nowrap
cd
/installdir/bin
这里installdir是46020的安装目录,一般为/opt/netmgt
备份alarmfile.nowrap,键入:
cp
alarmfile.nowrap
/filesystem/alarmfile.nowrap.date
这里filesystem是你选择的另一个文件系统,date是当前的日期表示为yy/mm/dd
alarm.nowrap文件被备份下来,并且有一个唯一的日期戳。
备份pathStatusLog文件(在磁盘空间允许的条件下才做)
su
root
cd
/installdir/interfaces
mv
pathStatusLog
/filesystem
备份online.log文件(在磁盘空间允许的条件下才做)
cd
/installdir/informix
cp
online.log
/filesystem/online.log.date
备份ELS.46020.events.**
文件(针对网管)
在/opt/netmgt/bin/els/ELS.46020.events.*文件是记录ELS
的一
些日志文件.这些文件记录了系统的全部操作过程.要求对这些文件备份到PC
机上的硬盘上.
附一:CI软件用的DB9转RJ45图谱
SP1直接
1
无(空针)
2
黑
3
红
4
黄
5
绿
6
棕
7
橙
8
蓝
9
附二:常用开FR
电路的参数如下:
FR
TO
FR
PROTOCOL
MAPPING
:
TRANSPARENT
Gz/p1-7-3-1
文档编制:
爱达利南昌办
王宝
24小时技术支持13807097996