Cloud Monitoring によるログ監視
[履歴] [最終更新] (2021/11/21 22:41:20)
最近の投稿
注目の記事

概要

Cloud Logging で管理するログを監視するためには Cloud Monitoring を利用できます。基本的な使い方を記載します。

補足: Cloud Monitoring の監視対象は Cloud Logging に限りません。

組織のログを監視する設定例

組織は Cloud Logging を持ちますが Cloud Monitoring を持ちません。そのため、組織のログを監視するためには、あるプロジェクトの Cloud Monitoring を利用する必要があります。

Pub/Sub トピックの作成

Cloud Monitoring を利用するプロジェクト myproject-20210411 で Pub/Sub トピックを作成します。

Uploaded Image

Sink の作成

組織の Cloud Logging における Sink を作成します。Destination として先程作成した Pub/Sub トピックを指定します。こちらのページと同様の設定です。

Uploaded Image

IAM

myproject-20210411 プロジェクトの Pub/Sub トピックに Publish できる権限を、Sink のサービスアカウントに付与します。

Uploaded Image

プロジェクトレベルではなく、トピックレベルで permission を与えることもできます。

Uploaded Image

Alerting Policy

Pub/Sub トピックを利用した Alerting Policy を作成します。

Uploaded Image

ある時刻において、過去一分間の範囲で Pub/Sub トピックへのメッセージ Publish がなされた count を計測して、それが 0 を越えていれば condition が満たされるような Alerting Policy を作成してみます。参考: Alerting behavior

pubsub.googleapis.com/topic/send_message_operation_count を利用するのがポイントです。

Uploaded Image

通知先のメールアドレスも適宜登録します。以下のようなメールが通知されます。

Uploaded Image

アラートメールには Markdown でテンプレートを追加することができます。参考: Using Markdown and variables in documentation templates

プロジェクトのログを監視する設定例

組織と異なり、プロジェクトは Cloud Monitoring を持ちます。
Pub/Sub を用いずに直接 Alerting Policy を作成してログ監視することができます。

補足: 組織のログをプロジェクトのログバケットに Sink で入れ込んだとしても、上記 logs-based alert/metrics は利用できません。

Error Reporting と Cloud Trace

Error Reportingは、Cloud Logging のエラーログを分類します。新しい分類先となるログが出力された際にアラートメールを送信することもできます。主な GCP のサービスのログについては初期設定が不要です。

Cloud Trace は、latency データを可視化するサービスです。SmokePing でネットワーク遅延を可視化するのと同様です。

関連資料:

Uptime checks

Cloud Monitoring の機能として Uptime checks が存在します。Uptime を check される側のサーバにおいて、Cloud Monitoring からの Uptime check トラフィックであることは、以下の情報を確認することで判別できます。

接続元 IP

$ cat ~/Downloads/uptime-source-ips.txt | jq -C .
[
  {
    "ipAddress": "35.187.242.246",
    "region": "ASIA_PACIFIC",
    "location": "Singapore"
  },
  ...

Uploaded Image

HTTP の場合、User-Agent ヘッダの値

GoogleStackdriverMonitoring-UptimeChecks(https://cloud.google.com/monitoring)

参考資料: Reviewing uptime checks

関連ページ