백엔드/os 및 일반 지식

네트워크 - 부하 분산

JerryTheSWEngineer 2023. 2. 12. 00:27
반응형

서비스 규모가 커지면서 물리나 가상 서버 1대로는 모든 서비스를 수용할 수 없게 됩니다. 

서비스의 가용성을 높이기 위해 하나의 서비스는 보통 2대 이상의 서버로 구성하는데, 각 서버 IP주소가 다르므로 사용자가 서비스를 호출할 때는 어떤 IP로 서비스를 요청할지 결정해야 합니다. 

특정 서버에 장애 발생시, 전체 사용자에게 영향을 미치지않아 장애 범위는 줄어들어도 여전히 서비스 장애가 발생한다.

 

이를 해결하기 위해 L4나 L7 스위치라는 로드 밸런서를 사용. 

로드밸런서에는 동일한 서비스를 하는 다수의 서버가 등록, 사용자로부터 서비스 요청이 오면 로드밸런서가 받아 사용자별로 다수의 서버에 서비스 요청을 분산시켜 부하를 분산. 

 

 

 

반응형