PagerDutyでIncidentの訓練をする
本記事
本記事ではPagerDutyで設定した項目であるIncidentがあったときのオンコールのスケジュール、電話番号、SMSなどが正しくくるかなどが正しいのかをTest Incidentを故意に起こすことで確認することができます。
想定読者
PagerDutyははじめてPagerDutyを触る人です。
私は新卒で入社し、まだPagerDutyのコンソールが全くわからなかったため、このような記事を書くことによって入門しようとしています。
用語
- Service: サービスのことで、マイクロサービスなら一つ一つのマイクロサービスがサービスに当たります。
- Assigned To: 予定されているオンコール担当者です。
- Status: Incidentの状態のことです。
準備
1. Serviceを作成する
以下のようにServiceを作成する。
試しにIncidentをマニュアルで作るだけなので特にIntegration Typeは必要ありません。
Incidentを処理する
1. Test Incidentを起こす
PagerDutyのコンソールからIncidentを作成することができます。
2. Incidentをどのように処理をするかを決める
以下の主に3つの方法が選べます。
- Resolve: 問題が解決されたとき
- Acknowledge: 問題を認知したとき
- Reassign: 他の人にアサインしなおすとき
3. Acknowledgeをする
問題を認知し、取り組む段階でAcknowledgeを押します。
4. Resolve
問題を解決したと感じるならば、右上のResolveを押して、問題終了です。
まとめ
実際にSMSがきたり、メールが飛んできたりするので、実際のIncidentが起こる前に、正しく設定ができているかを見直すためにも一回やってみるのがいいかもしれません。
最後までありがとうございます。