2주 전, 전 세계 주요 인터넷 서비스가 마비된 일이 있었습니다.
Claude, Perplexity, 업비트, 리멤버, 배달의민족 등 많은 기업들이 ‘클라우드플레어 500 에러’ 문구와 함께 사용할수 없게 됐습니다.
오늘(25년 12월 5일 저녁 6시경) 클라우드플레어 장애가 또다시 발생하게 된 겁니다.
다만, 해당 오류는 약 16분만에 복구 되었습니다.
글 구성
클라우드플레어 장애 : 500에러 발생 원인
25년 12월 5일 발생한 클라우드플레어 장애로 인한 주요 피해 서비스 다음과 같습니다.
국내 : 배달의 민족, 무신사, 리멤버, 업비트 등
국외 : 클로드, 퍼플렉시티, 리그오브레전드, 디스코드 등
이번 클라우드플레어 장애의 경우 약 16분정도 오류 발생후 바로 해결됐습니다.
하지만 보름 전 발생했던 대규모 라우팅 장애 이후 주요 인프라에서 오류가 발생했다는 점에서 관심을 갖고 있습니다.
발생 오류 원인은?
클라우드플레어에서 공식 발표한 오류의 원인은 다음과 같습니다.
클라우드 플레어의 API 및 대시보드 서비스와 관련된 문제이며, 내부 설정 및 관리 시스템의 오류로 파악되고 있습니다.
2주 전의 단순한 광범위 트래픽 라우팅 문제가 아닌 클라우드플레어 기능을 제어하고 설정하는 서비스에 문제가 발생한 것입니다.
자세한 오류 해결 과정은 아래 사이트에서 확인할수 있습니다.

클라우드플레어 장애 원인이 인터넷을 마비시킨 이유
IT 기업들의 대다수는 고객들이 빠르게 서비스를 이용할 수 있도록 웹서비스 속도 개선 서비스를 이용 합니다.
이것을 CDN(Contetns Delivery Network) 입니다.
클라우드플레어는 CDN의 역할뿐 아닌 웹사이트의 보안, DNS, 봇 관리, 트래픽 라우팅 등의 핵심 서비스를 API와 대시보드 UI를 통해 제공하고 있습니다.
(관련 뉴스 기사 : Search Engine Journal – Shelley Walsh, 클라우드플레어 500에러 사태 보도)
클라우드 플레어 API (Application Programming Interface)
- 클라우드플레어 서비스를 사용하기 위해 API를 통해 기능을 설정하고 관리하게 됩니다.
- 많은 기업들이 API를 통해서 보안 정책 업데이트, 트래픽 흐름 관리, 신규 서비스를 배포하게 됩니다.
- 하지만, API에 오류가 발생하게 되면, 기업들이 요청한 설정 변경 등의 정보들이 처리되지 않거나 잘못 배포될수 있습니다.
대시보드 서비스
클라우드플레어 API를 사용하게 되면, 설정, 이용 등을 관리하기 위해 대시보드를 통해 모니터링하게 됩니다.
대시보드 서비스가 마비될 경우, 장애가 발생해도 클라우드플레어에 오류 요청을 하거나 직접 설정 변경이 어려울수있습니다. 즉, 바로 대응이 불가하게 됩니다.
클라우드플레어는 어떤 회사?
클라우드플레어는 웹호스팅뿐 아닌, 인터넷의 속도, 보안, 안정성을 제공하는 인터넷 인프라 서비스 기업입니다. 전 세계 인터넷 트래픽의 약 20% 이상이 클라우드플레어를 이용하고 있습니다(W3Techs).
주요 사업 영역은 다음과 같습니다.

| 사업 영역 | 핵심 역할 |
| CDN (Contents Delivery Network) | 웹사이트 콘텐츠를 전 세계 수백 개의 데이터센터에 분산 저장했다가 사용자에게 가장 가까운 위치에서 전송 |
| DDoS 방어 및 웹 방화벽(WAF) | 대규모 디도스(DDoS) 공격으로부터 웹사이트를 보호하고, 악의적인 트래픽을 차단 |
| Edge Computing (Cloudflare Workers) | 코드를 서버가 아닌 사용자와 가까운 ‘엣지(Edge)’ 네트워크에서 실행하여 지연 시간을 최소화하는 서버리스 환경을 제공 |
| DNS 및 Zero Trust Security | 빠르고 안정적인 도메인 네임 서비스(DNS)와 원격 접속 환경을 위한 보안 솔루션(Zero Trust)을 제공 |
클라우드플레어 주요 대표 고객들은 다음과 같습니다.
아래 고객뿐 아닌, 웹사이트와 온라인에서 필수적으로 사용되고 있으며 스타트업부터 포춘 1,000대 기업중 약 19%를 고객으로 보유하고 있습니다.
- 전자상거래 및 리테일 : Shopfity, Walmart, Nike, H&M, Etsy
- 미디어 콘텐츠 : Canva, BBC Shop
- 개발 및 기술 : MongoDB, Automattic(WordPress, WooCommerce)
- 금융 및 기타 : DHL, EY, SpaceX(starlink)
- AI 기업 : OpenAI, Anthropic(Claude), Perplexity 등
클라우드플레어 장애가 더 주목받는 이유
앞서 말했듯이 클라우드플레어는 전세계 웹사이트의 약 20% 이상을 점유하고 있습니다.
만약 클라우드가 멈추게 될 경우 전 세계 인터넷 1/5가 멈추게 되는것과 다름 없습니다.
따라서, 이번 일에 대해서 일각에선 ‘디지털 재난’ 이라고 부르기도 합니다.
최근 디지털 시장을 되돌아 보면 디지털 서비스 선두에는 AI 서비스 기업들이 큰 인기를 끌고 있습니다.
클라우드플레어를 쓰는 고객들에 당연히 AI 서비스 기업들도 눈에 띕니다.
– Open AI – ChatGPT
– Anthropic – Claude
– Perplexity
등이 있습니다.
이 AI 기업들이 클라우드플레어를 쓰는 이유는 다음과 같습니다.
– DDoS 공격 방어: AI 구동에 쓰이는 GPU 비용을 노린 악성 공격 방어
– 봇 관리 : 학습 데이터를 훔쳐가는 스크레이핑(Scraping) 봇 차단
– 검색 속도 : 실시간으로 검색 결과를 빠르게 보여주기 위한 Edge 네트워킹 기술 활용
위 이유로 클라우드플레어를 사용하고 있지만
정작 클라우드플레어 오류로 인해 AI 서비스(ChatGPT, Claude, Perplexity 등)에 가장 큰 직격탄을 주었습니다.
즉, AI의 두뇌는 클라우드에 저장되어 있지만
클라우드에 접근하기위해 사용되고
클라우드를 보안하기 위해 사용되는 도구중 하나인 클라우드플레어가 멈추니 오히려 큰 이슈를 불러오는 것이죠.
투자 관점에서 클라우드플레어의 전망과 위기
클라우드플레어는 최근 반복적으로 발생한 장애로 인해 고객들에게 큰 불안감을 심어주었습니다.
따라서 단기적으론 클라우드플레어(NET) 주가에는 악재일수 있습니다.
(하지만 주가에는 장애 이슈가 큰 문제가 되지 않는것 같네요 ! – 25.12.05 기준 차트 캡쳐)

반면, 경쟁사인 Akamai, AWS, CloudFront 또는 데이터 이중화 솔루션 제공 업체 들에게 좋은 호재가 될 수 있습니다.
이중화 작업의 중요성이 높아지는 이유
클라우드플레어 장애 이전엔 기업들이 IT 예산 집행시 비용 절감을 위해 한 곳(Single Vendor)만 사용 했었습니다.
그러나 클라우드플레어의 장애가 두 번이나 터지게 되면서
서비스가 멈췄을시 매출이 크게 손실을 보는 곳의 경우엔 장애를 미리 예방할 준비를 하게 됩니다.
즉, 서비스가 멈추지 않고 계속 돌아가기 위한 예비 시스템을 더 만들어두죠.
따라서 이중화 작업의 중요성이 올라가고, 멀티 CDN (CDN 서비스를 2개 이상 사용) 사용 가능성이 높아집니다.
쇼핑몰과 같이 서비스가 멈춤으로 인해 매출에 크게 영향을 받는 업체(배민, 무신사, shopify 등)는
매출 감소보다 인프라 사용 비용 투자를 더 하게 되는 의사결정을 할 수 있습니다.
서비스가 멈추는걸 방지하기 위해 이중화(백업) 시스템을 구축해 보안 및 인프라 이중화 예산에 투자하게 됩니다.
어떤 경쟁사가 있을까?
1등 업체인 클라우드플레어가 멈출 경우 바로 다른 기업의 서비스를 이용할 수 있도록 멀티 CDN 전략을 이용하게 됩니다. 그렇게 되면 경쟁사 서비스가 반사이익을 얻을수 있습니다.
- Akamai: 전통 CDN 시장의 강자. 클라우드플레어보다 가격이 비싸지만, 안정성이 높습니다.
금융권, 대기업들이 사용하는 이유는 비싸도 안전성이 높기 때문입니다. - AWS CloudFront /Azure Front Door : 아마존이나 마이크로소프트 서버를 사용하는 기업들은 별도의 다른 기업 솔루션을 쓰는 것 보다, 동일한 회사의 클라우드 제품 백업을 활용하는 관점으로 접근할 수 있습니다.
- Fastly : 개발자 친화적이며 속도가 빨라 클라우드플레어의 대안으로 화용할 수 있습니다.
그래도 긍정적인건..?
클라우드 플레어는 이러한 장애 발생에도 불구하고 최근, ‘최대 규모 DDoS’ 공격 방어에 성공 했습니다.
29.7Tbps에 달하는 최대 규모 이지만, 공격 탐지 후 차단한 것입니다.
DDoS 공격은 특히나 AI 업체와 게임, 금융 업체와 같이 클라우드 서비스 의존도가 높은 곳에서 많이 발생하고 있습니다. 클라우드 플레어와 같은 보안 서비스에 관심과 집중할 수 있습니다.
또한, AI 클라우드 구축을 위한 Replicate를 인수할 예정으로 개발자들을 위한 원활한 AI 클라우드를 제공할 계획이라고 합니다.
클라우드플레어 장애로 알게된 AI 시대 시사점
✅ 클라우드플레어 두 번째 장애는 내부 서비스 문제
클라우드 플레어는 12월 4일 대규모 DDoS 공격을 막았지만, 하루 뒤 12월 5일 내부 API 및 대시보드 설정 오류로 다시한번 전 세계 인터넷을 마비 했습니다.
복구는 16분만에 되었지만 시장에는 클라우드플레어 하나만 의존하는 것에 대해 위험성을 주었습니다.
✅ 이중화 전략의 중요성
데이터와 클라우드 의존도가 높은 AI, IT 산업은 클라우드플레어 장애를 통해 큰 터닝포인트를 얻었습니다.
즉, 서비스를 연속적으로 제공하기 위한 ‘이중화 전략’의 중요도가 높아진 것입니다.
✅ 클라우드플레어와 같은 IT 인프라 서비스도 지켜보기
클라우드 시대에 단순히 전력, 데이터 센터, GPU등의 기술만 알고 있었습니다.
서버와 서비스를 연결시켜주고 보안을 지켜주는 클라우드플레어와 같은 기업들의 의존도도 높아지고 있습니다.
이러한 점에서 향후 투자 포인트로 함께 생각해보면 좋을것 같습니다.
특히나 AI 서비스 등에선 외부 DDoS 공격, 봇넷 공격등에 대응하기 위한 투자를 더 하게 될 것입니다.





