티스토리 뷰

Infrastructure

SPOF(Single Point of Failure)

Hero_O 2022. 8. 17. 01:01

SPOF(Single Point of Failure)

해당 서비스의 문제가 발생했을 때, 전체 서비스에 장애를 낼 수 있는 지점.

 

물리 장비를 한 대로 운영하는 경우

  • 해당 물리장비에 장애가 생기면 서비스 전체가 중단 된다.
  • 한 대의 물리 장비는 반드시 SPOF가 발생한다.
    • 예시
      • 한 대만 존재하는 API 서버가 죽었을 때, 정상 작동을 하지 않는다.
      • 한 대의 DB 서버만 운영할 때 해당 DB가 죽었을 때 서비스 전체가 정상 작동하지 않음
      • 스위치의 가용 용량을 넘어서면 패킷 드랍이 발생함.

SPOF 제거를 위해서는?

모든 물리 장비를 이중화 하거나, 적어도 상황에 따라 자동적으로 확장이 가능해야 한다.

  • 데이터 베이스 서버에 경우 SPOF를 제거하기 위해 Replication이 필요하다.
  • API 서버의 경우 기본적으로 이중화하고 트래픽에 따라 자동 확장할 수 있도록 한다.
  • 물리 장비를 이중화 혹은 자동 확장이 가능하도록 한다.

댓글