← 목록

2025-11-12 · 한예준

SLO를 도입할 때 팀 합의를 이끄는 질문 목록

에러 예산 개념을 설명하는 데 그치지 않고, 제품·플랫폼·고객지원이 같은 표를 보도록 만드는 실무 질문들을 정리했습니다.

SLO를 도입할 때 팀 합의를 이끄는 질문 목록
서비스 수준 목표(SLO)는 숫자 하나가 아니라 의사결정 규칙입니다. 먼저 "누구를 위한 가용성인가"를 명확히 하지 않으면 지표는 장식이 됩니다. 고객 대면 API와 내부 배치 작업을 같은 슬라이딩 윈도우에 넣을지부터 합의가 필요합니다. 두 번째 단계는 증상 기반 측정과 원인 기반 측정을 분리하는 일입니다. 사용자가 느끼는 지연과 인프라 CPU 사용률은 다른 시간축에서 움직입니다. 대시보드에 두 신호를 나란히 두되, 알림은 증상 쪽에 더 가깝게 두는 편이 온콜 피로를 줄입니다. 세 번째로, 에러 예산 소진 시 행동 규칙을 미리 씁니다. 기능 개발 중단, 임시 인력 투입, 고객 커뮤니케이션 중 무엇을 선택할지 제품 리더십과 합의해야 합니다. 마지막으로 분기마다 SLO 자체를 재검토할 시간을 캘린더에 박아 두세요. 지표는 살아 있는 문서여야 합니다.