Белка, Стрелка и для чего нужен SLA

Белка, Стрелка и для чего нужен SLA

StrelkaСегодня по новостным лентам прошла новость о том, что все комплексы фотовидеофиксации [Стрелка-СТk Московской области перестали работать в ночь с 9 на 10 января ( основной пруфлинк ). Не скажу, что я испытываю нежные чувства к Стрелкам, но мне они более симпатичны, чем гаишники с радаром на обочине. И это объективно цивилизованный способ контроля безопасности на дорогах.

Немного математики. По победоносным рапортам Министерства транспорта Московской области за 2013 год подмосковные Стрелки выписали штрафов более, чем на 1 млрд рублей. Это чуть больше, чем 2.7 млн рублей в день. С учетом того, что показатель общий за год, а число камер постоянно растет, не сильно ошибусь, для простоты взяв выручку в 3 млн руб. в день. Т.е. каждый день простоя систем приносит государству прямой убыток в 3 млн. руб. Кроме того, по моему наивному мнению, основной целью ГИБДД и региональных ЦБДД является не зарабатывание денег, а обеспечение безопасности дорожного движения, и этому процессу тоже наносится ущерб выходом из строя средств контроля. Логично было определить какие-то целевые показатели восстановления, и гарантировать их достижение. Давайте посмотрим, что было сделано.

Итак, находим первый попавшийся свежий конкурс ЦБДД МО на обслуживание Стрелок. Вот он:P Выполнение работ по обеспечению безаварийного, бесперебойного функционирования стационарных комплексовPфотовидеофиксацииPнарушений Правил дорожного движения на базеPККДДАСP»Стрелка-СТ», расположенных на автодорогах Северного направления Московской области . Слова все такие родные: безаварийного, бесперебойного…

Я не знаю ничего про подрядчика. Априори я предполагаю что все было кристально честно, если нет, то к Навальному. Я сейчас про математику и немного про SLA.P6 931 488 рублей 40 копеек за 36 Стрелок за два месяца. Итого 6 Стрелко-лет. Т.е. годовое обслуживание одной Стрелки стоит примерно 1,15 млн. рублей. Это порядка трети стоимости самой Стрелки (я не знаю, почему она стоит, как самолет, но, уверен, там продвинутые технологии в большом количестве. Возможно, нанотехнологии, их больше помещается в ограниченном объеме).

На этом месте мое увлекательное изучение сайта госзакупок прервало вот такое сообщение, поэтому заранее приношу извинения за возможные неточности в цифрах. Это Старый Новый год начался…

ooops

Итак, треть от стоимости оборудования. Обычно производители за поддержку с такой стоимостью гарантируют восстановление на следующий день. Иногда — быстрее. В принципе, за такие деньги под каждой Стрелкой можно посадить дедушку в палатке с ветошью, спиртом для протирки оптических осей и флешкой с образом системы для перезаливки в случае чего.

Смотрим SLA, прописанный в ТЗ, или, говоря языком ГОСТов, «Требования к качеству работ». PBingo,есть такое слово! «Простой оборудования не может составлять более 48 часов». Не волшебно P(рискуем потерять 6 млн рублей), но терпимо. Так спрашивается, в чем проблема? Почему уже трое суток не работает,Pа СМИ говорит нам про минимум месяц, необходимый на восстановление 144 (!) Стрелок. А на решение проблемы дали 10 дней (не 2, а сразу 10). У меня есть два вопроса.

WTF1: О чем думал подрядчик, подписываясь под SLA? Впрочем, тут у меня есть версия. Штрафные санкции по контракту в худшем случае составляют 1/150 ставки рефинансирования Банка России от цены контракта за день простоя. Это 0,055% в день , или максимум 8.25% от стоимости контракта, если не делать вообще ничего весь срок контракта. В принципе, на таких условиях подрядчику можно и заранее принять риск, выйдет дешевле.

WTF2: Технологически проблема в чем? Ну не rocket science ни разу. Полторы сотни компьютеров на WinXP. Про резервные копии никто не слышал? Про BMR? Централизованное хранение конфигураций с возможностью восстановления — это чересчур сложная технология для системы со стоимостью одного узла в $100 000? Вы когда-нибудь слышали про пораженные вирусом и восстанавливаемые долгими неделями все базовые станции оператора, например?

К чему все это я?PА к тому, что если ваш бизнес существенно зависит от сторонних провайдеров, то у вас должны быть выполнены три условия:

  1. Определен SLA.
  2. Определены существенные штрафные санкции за нарушение SLA.
  3. Возможность поставщика выполнять свои обязательства по аварийному восстановлению в рамках требований SLA должна быть объективно оценена, а еще лучше протестирована.

Если это все будет, то тогда у провайдера будет более чем убедительная мотивация задумываться и об архитектуре, и о резервном копировании, и о других аспектах непрерывности бизнеса.

Извлеченные уроки Непрерывность бизнеса Стрелка-СТ SLA
Alt text

Тени в интернете всегда следят за вами

Станьте невидимкой – подключайтесь к нашему каналу.