카오스 엔지니어링(Chaos Engineering)을 설명하시오.
마이크로서비스·클라우드 환경에서 장애가 언제든 발생한다는 전제 하에 의도적으로 장애를 주입하여 시스템 복원력을 사전에 검증하는 방법론입니다. SRE·에러 버짓과 연계하여 설명하면 완성도가 높아집니다.
카오스 엔지니어링이란 운영 환경에서 통제된 장애를 의도적으로 주입하여 시스템의 불확실성을 드러내고, 약점을 사전에 발견·개선하여 복원력(Resilience)을 높이는 실험적 훈련 방법론입니다. Netflix가 AWS 의존 시스템의 복원력 검증을 위해 2010년 Chaos Monkey를 공개하며 체계화되었습니다.
| 단계 | 활동 | 예시 |
|---|---|---|
| ① 가설 수립 | 정상 상태(Steady State) 정의, 예상 영향 가설 작성 | “결제 서버 1대 중단 시 전체 결제 성공률 99% 유지” |
| ② 장애 주입 | 실험 대상 선정, 최소 범위로 장애 실행 | 랜덤 EC2 인스턴스 종료, 네트워크 지연 50ms 주입 |
| ③ 관찰·검증 | 실제 지표 vs 가설 비교, 편차 분석 | 성공률이 95%로 하락 → 가설 기각 |
| ④ 개선·반복 | 발견된 약점 수정, 범위 확대 재실험 | 서킷 브레이커 추가 후 동일 실험 재수행 |
요양원 선택 전 반드시 확인해야 할 체크리스트를 공개합니다. 공식 평가 자료 조회법, 방문 시 확인…
공공기관 채용 비리의 실태와 피해 지원자의 대응법을 정리했습니다. 채용 비리 신고 방법, 공익신고자 보호제도, 취준생…
주식 손실을 세금 절약에 활용하는 합법적 방법을 공개합니다. 해외주식 손익통산, ISA 계좌 활용, 연금계좌 절세까지…
배달이 예상 시간보다 크게 늦으면 취소·환불을 요청할 수 있습니다. 배달앱별 지연 취소 방법과 잘못 배달됐을…
통신비 절약의 핵심은 요금제 최적화입니다. 내 데이터 사용량 확인법, 알뜰폰 전환 비교, 위약금 없이 요금제…