ICは作業に手を出さないってのが鉄則だけど、人手不足の現場だと理想論になりがちよな
運用前に緊急連絡網を作成する、対応時のSlackチャンネルは1ヶ所で行う、ミーティングしたら直後にメモを残す、そして絶対にサービスを止めないという認識をチームで共有しよう。健闘を祈る。
自分がインシデントって言葉を習った頃は、問題や出来事だった認識、最近はセビリティが高い、アクシデントかそれ一歩手前の表現に変わったという印象。インシデント分解・分析してた頃が懐かしい
関係者への連絡ってサラッと書いてあるな...ワリと対応設計の肝なんだけど
ITILちゃんと読んでるのかな……
エスカレ遅い。ITILは時代遅れ。1速報→2調査→3詳報 の流れが基本。1、3 を受けて各部署が同時並行的に対応できるようにする。SREだけで完結するインシばかりじゃない。法務や経営層も初動から巻き込む必要がある時ある
資料を見る限り、いきなり手法に走ってる感がある。冒頭に、「目的は”絶対に次は起こさない仕組みを作る”こと!」とか宣言して、その目的に向かった対応策として説明した方が伝わる気がする。
めも
この手のやつはジュニアメンバーが作るとうまく回らないがちなのでちゃんとした人にレビューしてもらった方が良さそう。
どれだけルールやガイドラインを整備して諸々調整しても運用サイドのマインドセットが…うっ…頭が………何も思い出せない…
インシデント対応入門
ICは作業に手を出さないってのが鉄則だけど、人手不足の現場だと理想論になりがちよな
運用前に緊急連絡網を作成する、対応時のSlackチャンネルは1ヶ所で行う、ミーティングしたら直後にメモを残す、そして絶対にサービスを止めないという認識をチームで共有しよう。健闘を祈る。
自分がインシデントって言葉を習った頃は、問題や出来事だった認識、最近はセビリティが高い、アクシデントかそれ一歩手前の表現に変わったという印象。インシデント分解・分析してた頃が懐かしい
関係者への連絡ってサラッと書いてあるな...ワリと対応設計の肝なんだけど
ITILちゃんと読んでるのかな……
エスカレ遅い。ITILは時代遅れ。1速報→2調査→3詳報 の流れが基本。1、3 を受けて各部署が同時並行的に対応できるようにする。SREだけで完結するインシばかりじゃない。法務や経営層も初動から巻き込む必要がある時ある
資料を見る限り、いきなり手法に走ってる感がある。冒頭に、「目的は”絶対に次は起こさない仕組みを作る”こと!」とか宣言して、その目的に向かった対応策として説明した方が伝わる気がする。
めも
この手のやつはジュニアメンバーが作るとうまく回らないがちなのでちゃんとした人にレビューしてもらった方が良さそう。
どれだけルールやガイドラインを整備して諸々調整しても運用サイドのマインドセットが…うっ…頭が………何も思い出せない…