中午机房空调故障,弄得一堆机器温度过高报警!贼郁闷!以下是IBM小型机告警灯的处理:
1、sxdh1[/]#errpt
IDENTIFIER TIMESTAMP
BFE4C025
3C81E43F
2、sxdh1[/]#errpt -a -j BFE4C025
显示错误详细信息
3、sxdh1[/]#diag
a、选择:Task Selection
b、子菜单中选择:Log Repair Action
c、选择错误报告中的resource:
d、回车,前面出现一个加号:
e、按:esc+7,提交选择;
f、出现提示,回车确认,后显示加号变成星号表示已经update成功:
g、sxdh1[/var/adm]#errpt
IDENTIFIER TIMESTAMP
2F3E09A4
BFE4C025
3C81E43F
==============================================================
附1:aix的日志系统(转自:http://www.chinaunix.net 作者:天涯明月刀
通常我们在进行服务器的健康性检查,和在出现问题的时候都会去考虑查看系统的日志。
我在学习aix的过程中发现,aix的日志跟solaris或linux的日志存储和查看的方式有着相当大的区别,为了使自己对aix的日志认识的更系统就总结了一下。
相当一部分是参考的
1.一旦系统的某个功能模块检测到一个错误或定义的需要记录日志的事件,则记录到/dev/error设备,把它保存在NVRAM中,这样可以保证即使在系统崩溃的情况下也不会丢失最新的错误日志。
2.同时,错误日志进程errdemon从/dev/error文件中读取错误日志,然后根据错误模版库(/var/adm/ras/errtmpit)和错误消息库(/usr/lib/nls/msg/$LANGcodepoint.cat)
错误日志进程由/usr/lib/errdemon命令启动,/usr/lib/errstop停止,默认是启动的。
以上并不是重点,了解过程而已
errdemon进程:
从/dev/error逻辑设备文件中读取纪录,然后在系统错误日志中创建错误日志纪录,显然这才是重点。
Errdemon的配置:
/usr/lib/errdemon
例如:
/usr/lib/errdemon
最可能用到的可能就是-l参数了
/usr/lib/errdemon
#
Error
--------------------------------------------
Log
Log
Memory
Duplicate
Duplicate
Duplicate
上面显示我的错误日志文件是/var/adm/ras/errlog,这也是系统默认的错误日志的存放位置。
具体其他的参数可以参看man
查看错误日志:errpt命令
用more或者其他文本的查看命令来打开errlog文件我们看到的只是一对乱码,为了能够查看错误日志文件需要使用aix的errpt命令。
使用errpt命令查看日志,可能根据使用的参数来确定输出什么样的日志,甚至排序的方式,这是使用纯文本的日志不能做到的,或者说不能轻易做到的。
下面我们来看errpt命令的使用。
#
IDENTIFIER
9DBCFDEE
192AC071
C092AFE4
A6DF45AA
9DBCFDEE
192AC071
369D049B
这里的输出分为六列依次为:
1.错误标示符IDENTIFIER:并不唯一,由它来确定使用的错误模板,显然同一种错误的IDENTIFIER是相同的。
2.时间戳TIMESTAMP:错误发生的时间,MMDDhhmmYY,依次表示月日时分年。
3.类型TYPE:错误的类型,或者说严重的程度。
分为6个:
PEND 设备或功能组件可能丢失
PERF 性能严重下降 P
PERM 硬件设备或软件模块损坏,确诊了的
TEMP 临时性错误,经过重试后已经恢复正常 T
INFO 一般消息,不是错误 I
UNKN 不能确定错误的严重性 U
4.种类CLASS
H 硬件或介质故障
S 软件故障
O 人为错误
U 不能确定
5. 资源名RESOURCE_NAME
最初检测到错误的资源名软件或者硬件,并不代表这个资源有问题,而只是最先在它发现的。
6.描述
显示详细的日志信息
#
Standard
---------------------------------------------------------------------------
Standard
LABEL:
IDENTIFIER:
Date/Time:
Sequence
Machine
Node
Class:
Type:
Resource
Description
ERROR
Probable
ERRDEMON
User
/USR/LIB/ERRDEMON
其它
指定日志文件
-t
-s
-d
详细的参数只能看man
#
#
IDENTIFIER
9DBCFDEE
192AC071
C092AFE4
A6DF45AA
9DBCFDEE
日志的清理
errclear命令可以用来清理错误日志
并且默认情况下cron会每天清理错误日志
#
0
0
0
显然,找上面的例子,S,O
errclear
errclear
smit
syslogd
unix普遍用到的日志系统,配置文件/etc/syslog.conf
没有什么多说的,比较普遍,定义的话是修改syslog.conf,保存的日志为文本格式
syslog.conf配置文件格式
信息类别.错误等级 记录的位置
其中,各项的含义
信息类别
auth
cron
daemon
kern
lpr
mail
mark
news
user
uucp
错误等级
debug
info
notice
Warning any
err
crit
Alert any
emerg
none
acility
记录的位置
可以是本地的文件(包括设备文件如/dev/console)或远程syslog日志服务器。
假如我要记录cron的所有错误信息,则可以在/etc/syslog.conf加入下面一行
cron.err
定义记录cron的err信息到/var/cronerr.log文件
具体syslog的具体配置,网上遍地都是。
=========================================================
附2:AIX命令参考大全:http://study.chyangwa.com/IT/AIX/aixcmds2/mastertoc.htm
评论专区