Nagios的插件是真正工作在檢測(cè)服務(wù)和主機(jī)工作的第一線的真正英雄,沒(méi)有他,nagios系統(tǒng)只是一個(gè)空殼而已.因此,在安裝了nagios平臺(tái)之后的第一件事情就是將插件安裝上去。
從nagios主頁(yè)下載了最新的nagios官方插件,本文中用到的是nagios-plugins-1.4.9.tar.gz 。
解壓
tar xzf nagios-plugins-1.4.9.tar.gz
編譯
./configure --prefix=prefix
#變量prefix 為安裝目錄,例如/usr/local/nagios
安裝
make
make install
檢查
ls /usr/local/nagios/libexec
如果安裝成功的話,你可以看到在這個(gè)目錄下有很多可執(zhí)行程序或者腳本,名稱類似:check_icmp。
經(jīng)過(guò)上述4個(gè)步驟,nagios的腳本就宣告安裝成功,但是如何讓這些腳本工作起來(lái)呢?nagios并沒(méi)有提供每個(gè)監(jiān)控程序的腳本的說(shuō)明文檔,想了解這些腳本如何工作的話,需要通過(guò)--h參數(shù),顯示其使用方法和參數(shù)。例如:
./check_icmp --h Usage: check_icmp [options] [-H] host1 host2 hostn Options: -h, --help
Print detailed help screen -V, --version
Print version information -H
specify a target
-w
warning threshold (currently 200.000ms,0%) -c
critical threshold (currently 500000.000ms,80%) -n
number of packets to send (currently 5) -i
max packet interval (currently 80.000ms) -I
max target interval (currently 0.000ms) -m
number of alive hosts required for success -l
TTL on outgoing packets (currently 0) -t
timeout value (seconds, currently 10) -b
icmp packet size (currenly ignored) -v verbose ... |
根據(jù)提示的方法,可以在命令行中嘗試使用一下:
./check_icmp -H www.baidu.com OK - www.baidu.com: rta 33.632ms, lost 0%|rta=33.632ms;200.000;500.000;0; pl=0%;40;80;; |
可以看到狀態(tài)值“OK”,以及一些詳細(xì)的數(shù)據(jù)信息。
經(jīng)過(guò)了上述實(shí)驗(yàn),說(shuō)明這些插件都是可以獨(dú)立使用的,那在nagios之中,是如何調(diào)用這些插件的呢?如果要加入?yún)?shù)又需要用哪種格式呢?
首 先,要了解這些插件會(huì)被nagios用在什么地方。nagios有很多個(gè)cfg文件,用來(lái)定義各式各樣的信息,其中hosts.cfg和 services.cfg(一般是這兩個(gè),也可能是其他定義主機(jī)和服務(wù)的配置文件)是用來(lái)定義主機(jī)和服務(wù)的信息的。這些插件就被使用在這里。例如,我在 services.cfg中定義個(gè)一需要監(jiān)控的SSH服務(wù),名稱為TestSSH:
define service { host_name TestSSH service_description check_ssh check_command check_ssh } |
除了直接使用插件來(lái)做check_command項(xiàng)的參數(shù)以外,還可以使用自己定義的命令來(lái)。例如,我定義一個(gè)需要監(jiān)控的主機(jī),名字是test.VN:
define host { host_name test.VN alias test.VN address 192.168.0.1 check_command check-host-alive } |
在此例中,check_command項(xiàng)的參數(shù)“check-host-alive”并非一個(gè)插件,而是在commands.cfg文件中定義的一個(gè)命令。其實(shí)他的本質(zhì)也是插件,只不過(guò),他把插件加工包裝了。我們來(lái)看一下在commands.cfg中對(duì)這個(gè)命令的定義:
# 'check-host-alive' command definition define command{ command_name check-host-alive command_line $USER1$/check_ping -H $HOSTADDRESS$ -w 3000.0,80% -c 5000.0,100% -p 1 } |
在這個(gè)定義中,可以看到,命令名稱就定義為“check-host-alive”,命令實(shí)際的操作定義為藍(lán)色部分。我們對(duì)應(yīng)check_ping的說(shuō)明來(lái)分析一下這個(gè)操作的意圖。
|
首先,$USER1$這個(gè)參數(shù)在resource.cfg中定義,這個(gè)值會(huì)指向插件的目錄(如:/usr/local/nagios/libexec)。“-H $HOSTADDRESS$” 是定義目標(biāo)主機(jī)的地址,這個(gè)地址在hosts.cfg中定義了(如:www.baidu.com 或者 192.168.0.1)。“-w 3000.0,80%” 其中-w說(shuō)明后面的一對(duì)值對(duì)應(yīng)的是“WARNING”狀態(tài),“80%”是其臨界值。“-c 5000.0,100%” 其中“-c”說(shuō)明后面的一對(duì)值對(duì)應(yīng)的是" CRITICAL",“100%”是其臨界值。“-p 1”說(shuō)明每次探測(cè)發(fā)送一個(gè)包。
有很多朋友問(wèn)我這樣的問(wèn)題,如何監(jiān)聽非默認(rèn)端口的服務(wù)。下面我就舉例說(shuō)明一下這個(gè)問(wèn)題:
例如:現(xiàn)需檢查的一個(gè)運(yùn)行在8080端口上的http服務(wù)。那么我們可以對(duì)commands.cfg文件中對(duì)關(guān)于check_http的聲明做如下修改(紅色部分為添加的內(nèi)容)。
# 'check_http' command definition define command{ command_name check_http command_line $USER1$/check_http -H $HOSTADDRESS$ -p $ARG1$ } |
其中$ARG1$是指在調(diào)用這個(gè)命令的時(shí)候,命令后面的第一個(gè)參數(shù)。
再把services.cfg中,對(duì)應(yīng)服務(wù)的檢測(cè)命令后面加一個(gè)參數(shù):
define service { host_name ... ... check_command check_http!8080 } |
這樣就可以對(duì)8080端口的http服務(wù)進(jìn)行監(jiān)控了。如果你要添加多個(gè)參數(shù)的時(shí)候,也可以類似操作。
綜上,插件的安裝和調(diào)用方法也就舉例介紹完畢了,大家在使用中也可以使用自己寫的檢測(cè)腳本來(lái)完成比較特殊的檢測(cè)功能。