장애 후 사후 분석(Post-Mortem) 회의 소집 및 브리프
서버 터진 후 누구 탓할지 찾는 게 아니라 재발 방지를 위한 건설적인 회의 소집
비난 없는 시스템 개선 초점
블레임리스(Blameless) 문화
안녕하세요, 어제 있었던 로그인 장애 건에 대해 사후 분석(Post-mortem) 회의를 짧게 가지고자 합니다.
- 목적: 누구의 책임 인지가 아닌, 향후 동일 알림 시스템(모니터링) 부재 이슈 재발 방지 논의
- 필수 참석: 백엔드팀, 인프라팀, 관련 기획자
각 파트별 타임라인과 향후 개선 액션 아이템만 위주로 30분 내외로 랩업 하겠습니다. 캘린더 인바이트 보냈습니다!
💡 '네 탓 안 한다'를 미리 명시해야 참석자들이 숨기지 않고 회의에 임합니다.
💡 사용 팁
- 장애 후 2~3일 내에 기억이 생생할 때 바로 진행하는 것이 원칙입니다.
⚠️ 주의사항
- 메일 참조에 윗선을 잔뜩 넣고 'A님의 실수로 장애 났으니 회의합시다'라고 하면 팀워크는 박살 납니다.