WEB+DB PRESS Vol.40に寄稿しました
今回はトピックは「監視」です。
- 監視={異常を検知する,変動を観察する}
という切り口で、現場で実際に行っていることを書きました。細かいところ(実際に使っているスクリプトのコードとか)は出せなかったものもあるのですが、考え方やヒントなど、運用の現場の方の参考になれば幸いです。
監視にまつわるエトセトラ
- はじめに
- なぜ監視をするか?
- 監視の目的
- 異常を検知する
- 変動を観察する
- 監視の目的
- 監視項目を概観
- 異常の通知
- 通知の手段
- 通知のコツ
- レベルをわける
- 不必要な通知はしない
- 通知の間隔
- 通知メールの文面
- 監視の具体例
- hdmond
- 閾値の設定方法
- Ganglia
- グラフ化ツールいろいろ
- 大量ノード向けのグラフ化ツール
- apmond
- hdmond
- おわりに
- 今回のまとめ
そのほかぐっときた記事
データセンタに学ぶ/サーバの消費電力問題とは何か
さくらインターネットの田中氏による記事。
サーバがいっぱいになってくると、キモになってくる電力とかエアフローの問題について。このへんのノウハウはまとまったものがあまりみかけないので、とても貴重な記事だと思いまっす。