nagios自体を監視する

2018年10月1日

nagiosについての全投稿は/tag/nagiosにあるので参照されたい。

nagiosが様々なサービスを監視してくれ、問題がある場合にメールで知らせてくれるのは良いのだが、そのnagios自体が停止してしまった場合はどうすればよいのだろうか?

これを監視してくれるサービスがある。もちろん、このサービスが停止してしまったら?と堂々巡りになってしまう。できれば日常的に使用しているWindowsマシンのデスクトップに「nagiosの動作をチェックした最終時刻はこれこれです」と表示してくれれば良いのであるが、現在のところ適当なものが見つからない。

しかし、そのようなウェブサービスもあるようだ。

Cronitor

結論としては、これは使えない。使わない方がよい

https://cronitor.io/docs/monitor-nagios-itselfというサービスがある。

無料で使用できるし、クレジットカードの入力も必要無い。単一のサーバをモニタするのは無料だという。有料のプレミアムプランではより便利な機能が使用できるようだ。

以下手順を説明する。

アカウントを作成する

https://cronitor.io/signupにいって適当に入力する。

機能設定する

他の機能もあるのだが、HeartBeatを選択する。

以下のように入力する

以下の表示になる

2分以内にpingがこなければ通知するということだが、何にしても最初のpingを出さないと何にしても通知はしてこない。

nagiosを設定する

以下のようにnagiosを設定して再起動する。

commands.cfg

define command{
    command_name    check_http_url
    command_line    $USER1$/check_http -I $HOSTADDRESS$ -u $ARG1$
}

localhost.cfg

※****の部分は先にHeartBeatを登録したとき表示されたものにする。

define host{
        use                     linux-server            ; Name of host template to use
                            ; This host definition will inherit all variables that are defined
                            ; in (or inherited by) the linux-server host template definition.
        host_name               cronitor
        }

.....


define service{
    host_name                       cronitor
    service_description             External Nagios Monitoring
    check_command                   check_http_url!http://cronitor.link/*****/run
    max_check_attempts              3
    check_interval                  1
    retry_interval                  1
    check_period                    24x7
    notification_interval           300
    notification_period             workhours
}

初期化の確認

nagiosがcronitorを最初にpingすると、次のようなメールが来る。

Your monitor is initialized
----------------------------
Your "nagios" monitor is now initialized for and you will be notified if anything goes wrong.

Dashboard link:
https://cronitor.io/dashboard?search=****

View activity:
https://cronitor.io/v3/monitors/****/activity

Pause monitoring:
https://cronitor.io/****/pause

Next step:
If you haven't already, please complete the integration for this monitor. Follow the https://cronitor.io/docs/integration-guide to get started.

nagiosを止めてみる

あとはnagiosを止めてみて、本当にメール通知が来るのかをみる。

service nagios stop

おかしい。nagiosを停止してもメールが来ない。そのうちに、nagios自体がcronitorに到達できないと言い出す。とりあえず削除する。