nginxのサーバー監視ツール

こんにちは。よしおかです。

最近のサーバーは安定はしているものの、どうもピーク時のアクセスが多すぎて、何が問題か、原因切り分けが今何もできていません。

ある時間になるとピークになったり。

サーバー内にしかけているCRON関係のピークは時間(分刻み)でのしているので、うまく分散しているんですが、それ以外になると
ロードアベレージが規定値(目安ですね)12どどーーんと超えてしまうんです。

SnapCrab_NoName_2015-10-19_8-42-2_No-00

ウェブサーバーのロードアベレージで、中央にある赤い点線を越えたら警告という設定にしています。

(このツールはサーバーにZABBIXを入れています。)

これだけだと結局解析ができないので、nginxの数字化になるよう、各種ツールを入れました。

・nginxがステータスみられるように、「stub_status」導入
・「stub_status」を横1行タイプに整形するPythonのソフトを導入
・「stub_status」をZABBIXへ取り入れられるようAgent化のソフトを導入
・ZABBIXでnginxを監視

という感じになりました。

ZABBIXのソフトは以下のような感じです。

SnapCrab_NoName_2015-10-19_8-51-40_No-00

切り分けができるようにしたいです。

そういえば、ピークを挙げているのって、インターネット上のたくさんのBot・クローラーでした。

機会あれば、Bot・クローラーがアクセスしているアクセスログをお見せしますね。