Компания Cloudflare предоставила подробное объяснение масштабного сбоя, который во вторник 18 ноября вывел из строя значительную часть интернета, включая сервисы X, ChatGPT, УНИАН и Downdetector.
Причина инцидента
По словам технического директора компании Дейна Кнехта, виновником стал баг в одном из ключевых сервисов. Обычная смена конфигурации привела к сбою в системе защиты от ботов, что вызвало цепную деградацию инфраструктуры. Компания уже извинилась перед пользователями.
Мы подвели клиентов и интернет в целом. Спящий баг в сервисе, который обеспечивает работу нашей системы бот-митigation, начал приводить к сбоям после рутинной смены конфигурации. Это запустило цепную деградацию сети и других компонентов.
Хронология событий
Проблемы начались около 13:48 по Киеву 18 ноября. На странице Cloudflare сначала появилась информация о внутренней деградации сервисов. Затем посыпались жалобы от пользователей из разных регионов. Перестали работать сайты, использующие Cloudflare, а также сервисы Access и WARP. Кнехт подчеркнул, что сбой не связан с хакерской атакой.
К 16:42 инженеры подготовили исправление. Панель управления, аналитика и журналы ошибок оставались частично недоступными еще некоторое время. Специалисты отслеживали возможные остаточные проблемы.
Сбой оказался таким масштабным, потому что система защиты от ботов расположена непосредственно на пути пользовательского трафика. Если этот узел функционирует некорректно, он может блокировать запросы даже от обычных пользователей.
