2025년 10월 20일, 전 세계 수많은 온라인 서비스가 일시적으로 멈춰버리는 초유의 사태가 발생했습니다. 바로 아마존 웹 서비스(Amazon Web Services, 이하 AWS) 에서 일어난 대규모 장애 때문이었죠.
이번 사건은 우리가 얼마나 클라우드 인프라에 의존하고 있는지를 여실히 보여주며, 인터넷의 ‘숨은 심장’이 잠시 멈췄을 때 어떤 혼란이 일어나는지 생생하게 드러냈습니다.
장애 발생 시점과 지역
사건은 한국 시간 2025년 10월 20일 오후 4시 11분(미국 동부 시간 오전 3시 11분), AWS의 미국 동부 리전(US-EAST-1) 에서 시작되었습니다.
이 지역은 전 세계 수많은 기업과 서비스들이 핵심 인프라로 활용하는 곳으로, AWS 전체 트래픽 중에서도 가장 높은 비중을 차지하는 리전 중 하나입니다.
AWS 측은 공식 성명을 통해 “해당 리전의 여러 서비스에서 오류율과 지연 시간이 급격히 증가했다”고 밝혔으며, ‘복구를 가속화하기 위해 여러 병렬 경로를 통해 조치 중’ 이라고 설명했습니다.
장애 원인: ‘리전 게이트웨이’ 문제
AWS는 장애의 근본 원인이 미국 동부 해안 지역의 ‘리전 게이트웨이(Regional Gateway)’ 에 있다고 밝혔습니다.
이 게이트웨이는 각 리전 간 트래픽을 연결하고 서비스 요청을 전달하는 핵심 경로인데, 이 부분에서 문제가 발생하면서 전체 서비스 흐름이 막혀버린 것입니다.
특히 AWS의 주요 데이터베이스 서비스인 DynamoDB 에서 요청 오류가 급격히 늘어나며, 다른 AWS 기반 서비스들에도 연쇄적인 장애가 일어났습니다.
즉, 하나의 서비스 오류가 domino처럼 퍼지며 전 세계 여러 기업에 영향을 미친 셈이죠.
피해를 입은 글로벌 서비스들
이번 장애는 단순히 기술 기업 몇 곳이 멈춘 것이 아니라, 우리 일상과 밀접한 글로벌 서비스들까지 마비시키며 파급력을 보여줬습니다.
영향을 받은 서비스들은 다음과 같습니다.
- 게임: Fortnite, Roblox, PUBG: 배틀그라운드
- 소셜 미디어: Snapchat
- 스트리밍 서비스: Disney+, Hulu, Prime Video
- AI 서비스: Perplexity
- 금융 및 암호화폐 거래소: Coinbase, Robinhood
- 기타 주요 서비스: Canva, Reddit, McDonald’s 앱, Duolingo, Zoom, Airtable
- 아마존 자체 서비스: Amazon.com, Alexa, Ring
특히 AI 검색 서비스 Perplexity의 CEO 아라빈드 스리니바스는 X(구 트위터)를 통해 “근본 원인은 AWS의 문제이며, 복구를 위해 전사적으로 대응 중”이라고 밝혔습니다.
국내 서비스들도 직격탄 맞다
한국에서도 이번 장애의 여파가 이어졌습니다.
AWS 클라우드를 사용하는 삼성닷컴에서는 일시적인 접속 오류가 보고되었고, 크래프톤의 ‘배틀그라운드’ 서버 역시 장애로 인해 유저들이 게임에 접속하지 못하는 상황이 벌어졌습니다.
기업 입장에서는 직접적인 시스템 다운뿐만 아니라, 고객 신뢰 하락과 실시간 매출 손실이라는 이중의 타격을 받았다는 점이 더 큰 문제로 지적되고 있습니다.
장애 규모와 전 세계 반응
IT 장애 모니터링 사이트인 DownDetector에 따르면,
- AWS 관련 오류 신고: 5,852건
- Amazon.com 관련 오류 신고: 14,000건 이상
이 수치는 미국 동부 시간 오전 3시 44분 기준으로 집계된 것이며, 실제 장애가 확산되던 당시에는 수만 건 이상의 추가 신고가 들어온 것으로 추정됩니다.
전 세계 SNS에서는 “AWS가 멈추면 세상이 멈춘다”는 반응이 쏟아졌고, 일시적으로 “#AWSdown”이 트렌드 1위를 차지하기도 했습니다. 🌐
AWS의 대응과 복구 상황
AWS는 장애 발생 직후 엔지니어링 팀을 즉각 투입해 문제 원인을 파악하고 복구를 시작했습니다.
미국 현지 시간 오전 8시 40분경(한국 시간 오후 9시 40분) 부터 장애 신고 건수가 감소하기 시작하면서, 부분적인 복구가 이루어졌음을 확인할 수 있었습니다.
현재 AWS는 “근본 원인을 분석 중이며, 향후 동일한 문제가 발생하지 않도록 인프라 안정성 강화를 추진하겠다”고 밝혔습니다.
클라우드 시대, 편리함의 이면에 숨은 위험
이번 사태는 단순한 기술적 문제를 넘어, 클라우드 의존성의 위험성을 보여주는 대표적 사례로 꼽힙니다.
AWS, Microsoft Azure, Google Cloud와 같은 대형 클라우드 기업은 전 세계 인터넷 인프라의 중심을 차지하고 있습니다. 하지만 이처럼 한 리전 혹은 하나의 시스템에 문제가 생기면, 글로벌 서비스 전체가 멈출 수 있다는 구조적 한계가 존재합니다.
기업 입장에서는 멀티 클라우드 전략이나 리전 분산 설계를 강화하는 등 대비책이 필요하며, 사용자 입장에서도 “인터넷은 완벽하지 않다”는 현실을 다시금 인식해야 하는 계기가 되었습니다.

