24 Августа, 2011

10 крупнейших в истории сбоев в интернете

Andrey Prozorov

Отличная статья в Forbes.
Для тех, кому лень читать, привожу краткую справку (думаю, что пригодится):


1. AOL, сбой на 19 часов 16 августа 1996 года.
Результат: Более 6 млн клиентов самого популярного в США провайдера почти на сутки лишились доступа в интернет и к сервисам AOL.
Причина: ремонтные работы
  
2. eBay, сбой на 24 часа 15 июля 1998 года
Результат: eBay понес убытки в размере $3 млн и был вынужден возобновить все прерванные аукционы. За год сервис онлайн-аукционов пережил еще около 10 подобных случаев.
Причина: сбой программного обеспечения и устаревшая архитектура дата-центров (предположительно).
 
3. Skype, (1) 48 часов 16 августа 2007 года / (2) 56 часов в декабре 2010 / май и июнь 2011.
Результат (1): пользователи не могли ни звонить, ни отправлять сообщения, рыночная капитализация владельца Skype, сервиса интернет-аукционов eBay, за первые сутки сбоя упала на $1 млрд.
Причина (1): проблема в алгоритме, работающем с сетевым ПО.

4. YouTube, 2 часа 24 февраля 2008 года.
Результат: от видеохостинга оказался отключен почти весь земной шар.
Причина: запрет властей Пакистана (как реакция на датский карикатуры Мухаммеда) и ошибки провайдеров.

5. MobileMe (сервис Apple), несколько недель в июле 2008 года.
Результат: нестабильная работа сразу после запуска.В июне 2011 года представлен новый сервис iCloud взамен MobileMe.
Причина: неготовность серверов к наплыву трафика.

6. Gmail, два часа 11 августа 2008 года.
Результат: почти все пользователи (100 млн.) лишились доступа к почте.
Причина: неполадки в системе контактов.

7. Twitter, 1 час 25 июня 2009 года.
Результат: падение сервиса на 1 час
Причина: смерть Майкла джексона спровоцировала повышенный трафик на серверах.

8. Facebook, три часа 23 сентября 2010 года
Результат: падение на 3 часа (500 млн.)
Причина: ошибка в реализации системы изменений сайта.

9. Amazon, (1) 4 дня до четырех дней 21 апреля 2011 года / (2) август 2011
Результат: (1) сбой в работе «облачного» сервиса Amazon Elastic Compute Cloud (EC2) и  отсутствие доступа от 12 часов.
Причина: (1) неправильные сетевые настройки, спровоцировавшие перегрузку маршуритизаторов.
(2) удар молнии в дата-центре Дублина.

10. «Яндекс», 3 часа 19 августа 2011 года
Результат: на три часа перестал работать не только поиск, но и все остальные сервисы — почта, карты, погода, веб-аналитика и т.д.
Причина: ошибки в маршрутизации (предположительно).