Почему крупнейший хостинг IT-проектов в мире перестал быть стабильным.

Почти не проходит дня без сбоя у какого-нибудь облачного сервиса, и в начале февраля GitHub тоже пополнил эту статистику. Девятого февраля у платформы возникли проблемы сразу с несколькими ключевыми компонентами: пользователи жаловались на GitHub Actions, запросы на слияние изменений (pull request), уведомления и Copilot. В 18:54 мск компания признала неполадки «в некоторых сервисах GitHub», а затем сообщила, что задержки уведомлений достигают примерно 50 минут. Полное восстановление подтвердили только к 22:29 мск, хотя к 20:57 мск задержка уже сократилась до примерно 30 минут.
Отдельно досталось Copilot. С 19:29 мск 9 февраля и до 12:57 мск 10 февраля GitHub фиксировал сбой с распространением политик Copilot для части пользователей. Из-за этого у некоторых могли не появляться недавно включенные модели, когда они пытались получить к ним доступ.
На этом фоне снова всплыл старый вопрос: насколько удобно вообще следить за надежностью платформы. Некоторое время назад GitHub обновил страницу статуса так, что стало сложнее быстро оценивать картину за длительный период, например за 90 дней, и особенно смотреть суммарную доступность. Энтузиасты пытаются восстановить «пропавшую» картину по публичной ленте статуса в виде неофициальной реконструкции, но к таким данным стоит относиться осторожно. Тем не менее из этой реконструкции следует неприятный вывод: в какой-то момент в 2025 году доступность GitHub якобы опускалась ниже 90%.
Проблемы GitHub при этом не уникальны. «Пять девяток» (99,999% доступности) остаются эталоном для индустрии, но на практике даже удержание уровня в 90% для некоторых поставщиков становится испытанием, а это уже напрямую бьет по клиентам, которые строят процессы на этих платформах. У GitHub в SLA для Enterprise Cloud заявлено 99,9%, но такая гарантия распространяется не на всех пользователей, поэтому компаниям и командам приходится планировать не только «аптайм», но и неизбежные окна недоступности.