關于烏魯木齊電業局服務檢測主要關鍵點說明
數據庫服務:采用 QUEST 自帶的檢測工具即可
l???????? 保證沒有持續鎖情況:如果短時間出現 可以自動解開 注意一定不要慌忙殺死一個鎖 尤其是 JAVA 的鎖 對于其他的例如 QUEST,PB 等引起的 必須進行殺死處理――――一般處理方式先把 QUEST,PB , JAVAW 或者邦聯的等全部殺死 刷新一下檢測 看看是否消失 否則可以一層一層向上尋找 找到引起源 沒有辦法的情況下殺死該進程
l???????? 晚上或者吃飯前殺死一遍 QUEST,PB , JAVAW 等連接 同時檢測是否有 CURR UOW(SEC) 占用的情況,如果有并且是 JAVA 的并且 CPU 被占用了并且一直釋放不了 肯定程序有問題,為了放心期間 對這種情況可以殺死 一般不要這樣做
?
對于應用服務 WEBSPHERE 的檢測
telnet 10.218.103.6
NAME?? /?? PASSWORD
?
l???????? CPU 等檢測
top
SHIFT+M
一定不能出現 CPU 99 。 99 的情況 如果出現 長時間不能釋放 肯定有程序被掛起了
?
這種情況下: kill –3 pid 一分鐘后再執行一次
獲得 CORE 文件 觀測是否有 .yxgl. 的相關內容 如果重復出現 基本是由該程序操作引起的進程掛起 不能釋放
?
CPU 比較嚴重 導致系統速度等很慢 無法登陸等現象出現 執行 kill –11 pid 可以殺死該服務 自動重啟該服務(一般情況下 可以多執行幾次該命令) 同時觀察 TOP 中的 CPU 的情況 殺死后應該重啟了一個進程
?
/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/ 目錄下 類似
javacore.20060615.164429.6088.txt 一類的文件
?
l???????? 后臺服務日志檢測(共四個服務)
cd
/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/server1/
?
tail – f SystemOut.log
tail – f SystemErr.log
?
l???????? 系統內存垃圾自動清除日志
尤其是當出現 CPU 饑餓等癥狀 無法釋放的情況下 執行了 kill –3 pid
注意觀測:
/opt/IBM/WebSphere/AppServer/profiles/AppSrv01/logs/server1/下的
native_stderr.log
?
?
?
l???????? 常用命令
ps –ef|grep java? -- 查看 WEBSPHERE 啟動的幾個進程的情況 和 TOP 中的進程號對比 可以知道對應的服務情況
?
?
l???????? 應用服務的管理:
啟動: /opt/IBM/scripts
./ start_was.sh
停止: /opt/IBM/scripts
./ stop_was.sh
?
結合 ps –ef|grep java 觀察啟動和停止情況
如果出現緊急情況 停止不了 可以 kill –9 pid ( 一般不要這樣操作 )