AWS 15시간 먹통 후 복구…업계 "소수 클라우드 집중 구조 한계" 작성일 10-21 41 목록 <div id="layerTranslateNotice" style="display:none;"></div> <strong class="summary_view" data-translation="true">DNS 오류로 전 세계 서비스 마비…복원력·다중 리전 분산 전략 필요성 제기</strong> <div class="article_view" data-translation-body="true" data-tiara-layer="article_body" data-tiara-action-name="본문이미지확대_클릭"> <section dmcf-sid="GFylzeUZo9"> <p contents-hash="93fc034a487fa0df5156da45f9a7987f4e7850c98e170e2ac9b5245d26acd072" dmcf-pid="H3WSqdu5gK" dmcf-ptype="general">(지디넷코리아=한정호 기자)<span>세계 최대 클라우드 서비스인 아마존웹서비스(AWS)에 대규모 장애가 발생해 전 세계 주요 인터넷 서비스가 마비됐다. 현재 대부분 복구가 완료됐지만 일부 서비스는 여전히 불안정한 상태로, 인터넷 인프라 집중화의 구조적 취약성이 다시 드러났다는 평가가 나온다.</span></p> <p contents-hash="83b9992cc3cf12b58ccb75c183d61457a5bd6ac951f2a5c438fafc6ad17cc7e5" dmcf-pid="XXhs0PtWAb" dmcf-ptype="general">21일 업계와 주요 외신에 따르면 이번 장애는 지난 20일 미국 버지니아 북부 리전(US-EAST-1)에서 발생했다. AWS의 핵심 데이터베이스(DB) 서비스 '다이나모DB'의 도메인 네임 시스템(DNS) 오류가 근본 원인으로 지목됐다.</p> <p contents-hash="832209edb2fcb0afb49b9d6f9ac6af536ebe6f064f18e73bc7c389a34d3cd966" dmcf-pid="ZZlOpQFYNB" dmcf-ptype="general">DNS는 인터넷의 전화번호부 역할을 하는 핵심 인프라로, 주소(URL)를 실제 서버의 IP로 연결해주는 기능을 한다. 이 시스템이 멈추자 수많은 앱과 웹사이트가 데이터 접근을 잃고 동작을 멈췄다.</p> <figure class="figure_frm origin_fig" contents-hash="7e31cd0f081a395703294edc108edd4e8859816d78024fb226f30557a6b3ea80" dmcf-pid="55SIUx3Gkq" dmcf-ptype="figure"> <p class="link_figure"><img alt="(사진=AWS)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202510/21/ZDNetKorea/20251021110448369rsrh.jpg" data-org-width="640" dmcf-mid="Wi70RwQ9cV" dmcf-mtype="image" height="auto" src="https://img2.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202510/21/ZDNetKorea/20251021110448369rsrh.jpg" width="658"></p> <figcaption class="txt_caption default_figure"> (사진=AWS) </figcaption> </figure> <p contents-hash="a68d4d3a133df1bc634e6eda66eba1167d08e379fbf220e2ae30eb57bf969174" dmcf-pid="11vCuM0Hoz" dmcf-ptype="general"><span>AWS 측은 "아마존 EC2 서버 내부 네트워크의 트래픽 분산 모니터링 서브시스템 문제로 인해 네트워크 부하가 급증했다"며 "DNS 오류와 맞물리면서 연쇄 장애가 확산됐다"고 설명했다.</span></p> <p contents-hash="03713c46e8310fe75fd302192a52581d5b84b2a720971b330b29db4a5f6f04e3" dmcf-pid="ttTh7RpXA7" dmcf-ptype="general">AWS는 15시간가량 이어진 복구 작업 끝에 대부분의 서비스를 정상화했다. 회사는 "현재 모든 AWS 서비스에서 복구가 진행 중이며 일부 백로그 메시지는 몇 시간 내 처리될 예정"이라고 밝혔다.</p> <p contents-hash="1228406cdb6251c628769cb86ebddc4ee5208e38637f7d564ea30068211fba18" dmcf-pid="FFylzeUZku" dmcf-ptype="general">다만 일부 지역에서는 여전히 접속 오류가 간헐적으로 발생 중이며 AWS의 서버 임대 서비스 '람다'와 일부 데이터 분석 서비스는 복구가 지연되고 있는 것으로 알려졌다.</p> <p contents-hash="4a4c86676266a9aa62b9999c3c083f0b46b342455d9718ff649e1b68e1485ad4" dmcf-pid="33WSqdu5cU" dmcf-ptype="general">이번 장애로 슬랙·퍼플렉시티·스냅챗·포트나이트·로블록스·챗GPT·스타벅스·디즈니플러스·페이팔·코인베이스·유나이티드항공 등 수천 개의 글로벌 서비스가 일시적으로 중단됐다. 국내에서도 삼성월렛·배틀그라운드·네이버웹툰·배달의민족 등 다수 기업 서비스가 멈춰 업무와 이용에 불편이 발생했다.</p> <p contents-hash="1a5c5b84bde771517d9f01dee8fbdd5ba3a7231d905fc0e6ed3014179bef56a0" dmcf-pid="00YvBJ71kp" dmcf-ptype="general">현재는 대부분 서비스가 정상화됐지만 일부 기업은 캐시 데이터 손상과 API 지연으로 복구 점검을 이어가고 있는 것으로 전해졌다.</p> <figure class="figure_frm origin_fig" contents-hash="3b8f108dc62e93f9afaf77d3c45af0ae23c37f0afd7d8a2dd534fb773a7e9379" dmcf-pid="ppGTbiztA0" dmcf-ptype="figure"> <p class="link_figure"><img alt="AWS가 15시간 동안 서비스 복구를 진행했다. (사진=지디넷코리아 DB)" class="thumb_g_article" data-org-src="https://t1.daumcdn.net/news/202510/21/ZDNetKorea/20251021110448620poct.png" data-org-width="640" dmcf-mid="Y25GVgKpg2" dmcf-mtype="image" height="auto" src="https://img1.daumcdn.net/thumb/R658x0.q70/?fname=https://t1.daumcdn.net/news/202510/21/ZDNetKorea/20251021110448620poct.png" width="658"></p> <figcaption class="txt_caption default_figure"> AWS가 15시간 동안 서비스 복구를 진행했다. (사진=지디넷코리아 DB) </figcaption> </figure> <p contents-hash="81b5a3c6d905ccbbfcd34e7b934f67975d3f7cdd65627007c26cb37ae843ddfb" dmcf-pid="UUHyKnqFc3" dmcf-ptype="general"><span>장애가 발생한 US-EAST-1은 AWS에서 가장 오래되고 많은 서비스가 연결된 리전으로, 일종의 허브 역할을 한다. DNS 오류로 다이너모DB 접근이 막히자 리전 간 장애 복구 시스템도 제대로 작동하지 못했다. 트래픽을 다른 리전으로 우회하려던 복구 시도마저 DNS가 마비되며 실패했고 복구에 최대 15시간이 소요됐다.</span></p> <p contents-hash="1d9020bbf68e0e478fcc56788aa285ce5fa31d33579ace5effce840ff96a3930" dmcf-pid="uuXW9LB3kF" dmcf-ptype="general">메흐디 다우디 캐치포인트 최고경영자(CEO)는 "이번 사태로 인한 생산성 손실과 사업 중단 등을 고려할 때 경제적 피해는 수천억 달러 규모에 이를 수 있다"고 전망했다. 이는 지난해 크라우드스트라이크 장애 이후 최대 규모의 IT 대란으로 평가된다.</p> <p contents-hash="24a7e4e8ee130521418a1acfe0986c4975852c71997d01966c186a004cff8692" dmcf-pid="77ZY2ob0kt" dmcf-ptype="general">업계는 이번 사건을 계기로 멀티 클라우드 전략과 독립적 DNS·네트워크 복원 구조의 중요성을 재조명하고 있다. 특히 정부·공공기관도 긴급 복구 체계와 데이터 이중화, 리전 분산 아키텍처를 도입해야 한다는 목소리가 커지고 있다.</p> <p contents-hash="d66c60527c655b78119b46a3a13b7c901b104caab1f0f70594baf73f306ade75" dmcf-pid="zz5GVgKpN1" dmcf-ptype="general">AWS뿐 아니라 구글 클라우드, 마이크로소프트 애저 등 다른 사업자들도 최근 유사한 장애를 겪으면서 집중형 인프라의 한계가 업계 전반의 공통된 고민으로 떠올랐다.</p> <p contents-hash="65a6adab6e52e3e2295f2086918c5e5762b48f709c437eb0519d29e333397f3a" dmcf-pid="qPBuJsRfk5" dmcf-ptype="general">업계 관계자는 "세계 인터넷 서비스 대부분이 3~4개의 클라우드 기업에 의해 운영된다"며 "하나의 사업자가 멈추면 전 세계가 영향을 받는 구조 자체가 문제"라고 지적했다. 이어 "대형 사업자 중심의 클라우드 의존을 낮추고 서비스 복원력과 다중 리전 분산 전략을 강화하는 것이 앞으로의 핵심 과제"라고 덧붙였다.</p> <p contents-hash="0faa232b2ddcef975a71c7ef75952d1ebf6e51f539edaed12386601314db20c9" dmcf-pid="BQb7iOe4NZ" dmcf-ptype="general">한정호 기자(jhh@zdnet.co.kr)</p> </section> </div> <p class="" data-translation="true">Copyright © 지디넷코리아. 무단전재 및 재배포 금지.</p> 관련자료 이전 [KES2025]AI·로보틱스·모빌리티, 미래 혁신 방향 제시 10-21 다음 목동아이스링크, 서울시민의 날 맞아 무료 개방 10-21 댓글 0 등록된 댓글이 없습니다. 로그인한 회원만 댓글 등록이 가능합니다.