AI가 아마존 사이트를 6시간 동안 멈췄다
아마존 전자상거래 사이트가 AI 보조 코딩 오류로 1주일간 4차례 대규모 장애를 겪었다. 연간 200조 원 AI 인프라 투자와 동시에 진행 중인 대규모 감원의 역설을 짚는다.
지난주 목요일, 아마존닷컴에서 물건을 사려던 수백만 명의 사용자가 약 6시간 동안 결제도, 가격 확인도, 계정 접속도 할 수 없었다. 아마존이 공식적으로 밝힌 원인은 "소프트웨어 코드 배포 오류"였다. 하지만 내부 메모는 더 불편한 진실을 담고 있었다.
1주일에 4번, 그리고 AI라는 공통분모
아마존 이커머스 기술 총괄 부사장 데이브 트레드웰(Dave Treadwell)이 직원들에게 보낸 내부 메모가 CNBC에 의해 공개됐다. 메모에 따르면, 아마존은 최근 단 1주일 사이에 '심각도 1등급(Sev 1)' 장애를 4차례 겪었다. Sev 1은 핵심 시스템의 서비스 중단 또는 심각한 성능 저하를 뜻하는 최고 단계 경보다.
트레드웰은 별도의 메모에서 이 장애들의 공통 원인 중 하나로 "GenAI 보조 변경 사항"을 지목했다. 구체적으로는 "AI 도구가 운영 환경 변경 지시를 보완하거나 가속화하는 과정에서 안전하지 않은 관행으로 이어졌다"고 썼다. 그는 또한 "생성형 AI 활용에 관한 모범 사례와 안전장치가 아직 완전히 확립되지 않았다"고 인정했다.
이 문제는 2025년 3분기부터 누적되어 온 것으로 알려졌다.
'속도'를 택한 대가
아마존이 AI 코딩 도구를 도입한 배경은 명확하다. 더 빠르게, 더 적은 인력으로 개발하기 위해서다. 아마존은 올해 2,000억 달러(약 280조 원)의 자본 지출을 예고했는데, 이는 구글, 마이크로소프트, 메타 등 빅테크 경쟁사 중 최대 규모다. AI 인프라에 대한 공격적 투자가 진행 중이다.
동시에, 아마존은 인력을 빠르게 줄이고 있다. 2025년 1월에 1만 6,000명의 기업 직원을 해고했고, 2024년 10월에도 1만 4,000명을 감원했다. 2022~2023년 사이에는 2만 7,000명 이상이 회사를 떠났다. 3년도 안 되는 기간 동안 약 5만 7,000명이 넘는 인력이 줄었다.
트레드웰의 메모는 이 두 흐름의 충돌 지점을 정확히 짚는다. 숙련된 시니어 엔지니어가 줄어드는 가운데, 주니어 직원들이 AI 도구를 활용해 운영 환경에 변경을 가하는 상황이 만들어졌다. 아마존이 내놓은 단기 해법도 이를 방증한다. "주니어 직원이 AI 보조로 만든 운영 환경 변경 사항은 시니어 엔지니어가 반드시 검토하도록 하겠다"는 것이다.
임시방편과 더 근본적인 질문
아마존은 이번 사태에 대응해 임시 안전 관행을 도입하겠다고 밝혔다. 핵심 리테일 시스템에 대한 변경에 "통제된 마찰"을 도입하고, 장기적으로는 결정론적(deterministic) 안전장치와 에이전틱(agentic) 안전장치를 병행 개발하겠다는 계획이다.
AWS(아마존 웹서비스) 역시 최근 수개월간 별도의 장애를 겪었다. 2024년 12월에는 AI 코딩 도구 '키로(Kiro)'가 비용 관리 기능에 변경을 가한 뒤 장시간 서비스 중단이 발생했다는 보도가 나왔다. 아마존은 당시 "AI가 아닌 사용자 오류"라고 해명했지만, 이번 메모와 함께 읽히는 맥락은 사뭇 다르다.
국내에도 시사하는 바가 크다. 네이버, 카카오, 쿠팡 등 국내 주요 IT 기업들 역시 AI 코딩 도구 도입을 가속화하고 있다. 아마존이 먼저 부딪힌 이 문제—AI 보조 코딩의 속도와 안전성 사이의 긴장—는 한국 기업들도 조만간 정면으로 마주할 가능성이 높다.
본 콘텐츠는 AI가 원문 기사를 기반으로 요약 및 분석한 것입니다. 정확성을 위해 노력하지만 오류가 있을 수 있으며, 원문 확인을 권장합니다.
관련 기사
아마존이 AI 브라우저 퍼플렉시티의 웹사이트 무단 접근을 법원에서 막았다. 이 판결이 AI 쇼핑 에이전트 시대에 소비자와 기업에 어떤 의미를 갖는지 분석한다.
이란의 중동 데이터센터 공격으로 UAE 디지털 서비스 마비. 클라우드 의존도 높아진 시대, 지정학적 리스크가 일상을 위협하는 새로운 현실.
이란이 아마존 데이터센터를 공격하며 중동 지역 AI 발전 계획에 타격을 가했습니다. 지정학적 리스크가 글로벌 클라우드 인프라에 미치는 영향을 분석합니다.
아마존 대규모 장애로 2만2천 명이 쇼핑 중단. 클라우드 시대 디지털 인프라 의존도의 위험성과 소비자 대안을 살펴본다.
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요