지난 15일 카카오 서비스 장애 원인이 데이터센터 화재와 전원 차단으로 밝혀지면서 데이터센터 관리의 중요성이 부각되고 있다. 재해 복구를 어떻게 하느냐가 정보기술(IT) 업체의 역량을 판가름하는 중요한 요소로 떠오르고 있다.
해외 빅테크들은 철저한 데이터센터 관리를 하고 있다는 평가가 나온다. 아마존, 구글 등은 ‘재해 복구 계획(DR·Disaster Recovery)’을 마련하고 데이터센터 연결 시스템을 가동하고 있다. 최소 3개 이상의 데이터센터가 서로 연결돼 데이터를 실시간으로 주고받는다. 데이터센터끼리 서로 백업해주기 위해서다.
아마존은 서울에 가용영역을 4개 갖추고 서로 연동해 놨다. 가용영역을 통해 데이터센터 한 곳에서 예상치 못한 장애가 발생해도 다른 데이터센터에서 즉시 서비스를 지원한다. 이 데이터센터들은 각각 서로 다른 장소에서 물리적으로 분리돼 있고 전력 공급망 등도 따로 사용한다.
마이크로소프트는 140여 개 국가에서 데이터센터를 운영 중이고 센터를 두 곳 이상 갖춘 지역도 60개를 웃돈다. 아마존과 구글은 30여 개 지역에서 데이터센터를 보유하고 있다. 넷플릭스의 경우 글로벌 12개 권역마다 서버를 분산했고, 각 권역 안에도 물리적으로 분리된 2개 이상의 서버를 갖춰놨다. 이 데이터센터들은 초고속 고성능 네트워크를 통한 연결로 서비스 차질을 방지하고 있다.
해외 빅테크들은 데이터센터에 비상사태가 발생할 경우 즉시 투입되는 인력 구성은 물론이고 △전력 공급이 끊어질 때를 대비한 비상 전력 확보 △재해복구 소요 시간 예측 △해킹 방지 대책 △백업 및 복원 절차 등의 세부 계획을 수립해놓는 게 일반화돼 있다.
서버 전체가 마비되는 극단적인 상황을 가정한 훈련도 한다. 구글은 1년에 2회 이상 복구 훈련을 하고, 마이크로소프트도 연 1회 훈련하고 있는 것으로 전해졌다.
보안도 철저하다. 사용자들의 개인 정보와 데이터를 처리하는 데이터센터는 특급 보안 시설로 분류된다. 외부인의 출입이 제한되고 정확한 위치도 대외적으로 공개되지 않는다. 테러 위험을 차단하기 위해서다. 설계 단계에선 지반이 단단한지 등을 고려하고 화재를 방지하는 자재를 쓴다.
온도 관리에도 신경 쓴다. 데이터센터 내부 온도를 21~27도로 유지하기 위해 적당한 장소를 찾는다. 마이크로소프트는 2018년부터 스코틀랜드 인근 해저에 데이터센터를 구축했다. 북해의 바닷물로 서버의 열을 냉각하기 위해서다. 메타(옛 페이스북)도 2016년 바람이 많이 부는 아일랜드에 데이터센터를 지었다.
오현우 기자 ohw@hankyung.com