SLO, SLI, SLA

2025. 6. 16. 16:00개발로그/SRE

SLO, SLI, SLA는 서비스의 신뢰성과 품질을 측정하고 관리하는 개념


1. SLI (Service Level Indicator, 서비스 수준 지표)

SLI는 서비스의 성능을 측정하는 실제 데이터입니다. 즉, 특정 서비스의 품질을 측정하기 위한 핵심 지표로, 사용자 경험과 직접적으로 관련이 있습니다.

예시

  • 웹사이트 응답 속도 (예: 200ms 이하)
  • 서비스 가용성 (예: 99.9% 이상)
  • 오류율 (예: 1% 이하)

2. SLO (Service Level Objective, 서비스 수준 목표)

SLO는 SLI의 목표치입니다. 즉, 서비스의 성능을 일정 수준 이상으로 유지하기 위해 정한 목표값입니다. SLO는 내부적인 목표이며, 이를 통해 서비스의 신뢰성을 유지하거나 개선할 수 있습니다.

예시

  • "우리 서비스의 응답 시간은 95%의 요청에서 300ms 이하여야 한다."
  • "한 달 동안의 가용성은 99.95% 이상이어야 한다."

SLO는 내부적인 기준으로 사용되며, 이를 통해 서비스 운영팀은 성능을 관리하고 개선할 수 있습니다.


3. SLA (Service Level Agreement, 서비스 수준 계약)

SLA는 서비스 제공자와 고객 간의 공식적인 계약으로, 특정 수준의 서비스가 제공되지 않을 경우 보상을 포함하는 법적 합의입니다. SLA는 SLO를 기반으로 작성되지만, 계약의 일부이므로 법적 구속력이 있습니다.

예시

  • 클라우드 서비스 제공자가 99.9% 가용성을 보장하는 SLA를 설정하면, 가용성이 이를 충족하지 못할 경우 고객에게 서비스 비용을 환불해 줌.
  • AWS, Google Cloud, Azure 등의 클라우드 업체는 서비스 가용성이 SLA 기준 이하로 떨어지면 크레딧(환불)을 제공.

SLI, SLO, SLA의 관계

  1. SLI는 서비스의 성능을 측정하는 실제 데이터입니다.
  2. SLO는 SLI를 기준으로 설정한 목표 값입니다.
  3. SLA는 SLO를 기반으로 고객과 계약한 서비스 수준이며, 미달 시 보상이 따릅니다.

요약 정리

개념
설명
예시
SLI
실제 서비스 성능 측정값
응답 시간 250ms, 가용성 99.95%
SLO
내부 목표 (SLI 기준)
응답 시간 95% 이상 300ms 이하 유지
SLA
고객과의 계약 (미달 시 보상)
가용성 99.9% 미달 시 환불