20일 오후 4시(한국시간)께 미국 아마존웹서비스(AWS·사진) 최대 서버에서 오류가 발생했다. AWS 인프라에 의존하던 퍼플렉시티 등 대규모언어모델(LLM) 기반 AI 서비스와 게임 등 글로벌 서비스가 한때 일제히 중단됐다.이번 대규모 장애 사태는 AWS의 미국 버지니아주 북부 데이터센터 ‘US-EAST-1’의 시스템 오류에서 시작됐다. 이 데이터센터는 AWS의 서버 허브로 세계 수많은 인터넷 서비스의 백엔드 역할을 한다.
AWS는 이날 “US-EAST-1 지역의 서비스에서 오류가 발생했다”며 “아마존 데이터베이스, 자격증명관리(IAM), 콘텐츠 전송망인 클라우드 프런트, 가상 서버(EC2), 가상 네트워크(VPC) 등 10여 개 주요 서비스가 영향을 받으면서 연쇄적으로 중단됐다”고 밝혔다. 1000건 이상의 오류 보고가 AWS에 접수된 것으로 알려졌다.
아마존닷컴, 알렉사, 스냅챗, 슬랙, 줌 등 AI 서비스가 한때 일제히 마비됐다. 디즈니플러스도 AWS 먹통 사태로 동영상서비스 제공을 중단했다. 암호화폐거래소 코인베이스의 거래도 멈췄다.
월간활성이용자가 3억8000만 명에 달하는 게임 로블록스도 접속장애를 겪었다. 크래프톤이 운영하는 게임 배틀그라운드도 접속이 지연됐다. 크래프톤 관계자는 “글로벌 플랫폼인 스팀을 통해 게임을 운영하는데 스팀이 AWS 인프라를 기반으로 한다”며 “배틀그라운드 접속 장애가 산발적으로 일어나고 있으며, 특정 지역에서 접속이 불가능한 것으로 파악하고 있다”고 밝혔다. 카카오게임즈도 입장을 내고 “현재 일어나고 있는 서버 불안정 현상은 글로벌 외부 인프라 서비스 장애로 인한 것”이라고 했다.
AWS는 세계 클라우드 시장의 약 33%를 점유하는 글로벌 사업자다. AWS는 서비스 오류가 점차 안정화되며 한국시간 오후 7시 전후로 대부분 서비스가 복구됐다고 밝혔다. 다만 미국 정부 주요 기관과 글로벌 기업들이 AWS US-EAST-1 서버를 이용하고 있어 금융권을 중심으로 추가 피해 사례가 나올 가능성도 제기된다. 업계 전문가들은 “이번 사태는 단일 클라우드에 대한 과도한 의존이 글로벌 규모의 위기로 확산될 수 있음을 드러냈다”고 지적했다.
최지희/고은이/이영애 기자 mymasaki@hankyung.com
