#PrometheusCasual #1 に行ってきた
発表資料
@wyukawa Hadoop, Fluentd cluster monitoring with Prometheus and Grafana
@mtanda Prometheus on AWS
@tokuhirom promgen - prometheus management tool
promgen - prometheus managemnet tool / simpleclient_java hacks @ Prometheus casual from Tokuhiro Matsuno
kawamuray HBase, Kafka cluster monitoring with Prometheus and Grafana
@moznion 5分で作るprometheus exporter
なお先程のライブコーディングのカンペはこちらになります https://t.co/4sep5VgvmH #prometheuscasual
— 好評分譲中 (@moznion) 2016年6月14日
Togetter まとめ
メモ
- Prometheus の特徴
- アーキテクチャ - https://prometheus.io/docs/introduction/overview/#architecture
- Pull 型
- Prometheus は監視ノードの HTTP インタフェース(Exporter)を叩いてデータを取得
- pushgateway を使うと push 型もできる
- アドホックタスクの監視に使っている @kawamuray
- 監視対象に Exporter を仕込む方法:
- 1) 監視対象自体に HTTP エンドポイントを持たせる
- 2) 独立した Exporter プロセスを動かす
- データを演算できる。クエリが書ける
- PromQL
- Local の TimeZone 使えない
- @kawamuray「彼らは local time に猛烈な嫌悪感を持っている」
- Exporter を作る
- Prometheus の運用について
- 楽でほぼ手間はないらしい @mtanda
- バージョンアップ時に非互換の変更があると、設定を書き換えないといけなかったり
- ディスクをかなり使う @mtanda
- 1ノード 150 メトリクスで1ヶ月あたり 200MB とか
- YAML 管理がつらい
- Exporter の管理など
- Solution:
- Service Discovery
- EC2, Consul, k8s などと連携して監視対象リストを自動更新
- ★ @mtanda 氏の資料
- promgen by @tokuhirom
- Service Discovery
- 設定
- データの保持期間がデフォルト15日
- storage.local.memory-chunks デフォルト 1MB
- 変える場合、max-chunks-to-persist も合わせて変更しないといけない。罠い。
- 楽でほぼ手間はないらしい @mtanda
- データを長期保存する工夫 @mtanda
- Prometheus を2台用意
- 片方で 1時間ごとにデータをサマライズしている
所感
- 勉強会
- 出席率よかった。次世代監視ツールとして、注目度が高い雰囲気
- Prometheus 手元でちょっと動かしたぐらいでほとんど情報がなかったので、ユーザ事例をたくさん聞けてよかった
- Prometheus
- 他
- promgen は公開予定はあるのだろうか?
ありがとうございました。