Непрерывность бизнеса и “проблема 2000”: вопросы и ответы
Пока гром не грянет - мужик не перекрестится.
Русская народная пословица
Расчет на “авось” (“авось пронесет”) не является, как принято считать, только русской национальной чертой. Он присущ в той или иной степени всем народам, в том числе и хваленым американцам. Но наша ментальность отягощена тем, что слой хозяев был когда-то тотально уничтожен, а сейчас он только нарождается. Беднякам же нечего хранить и передавать следующим поколениям в материальном плане. Отечественные же нью-бизнесмены сегодня не планируют и не загадывают на годы, а живут от кризиса до кризиса. В силу этих причин в России пока не нашел широкого применения столь распространенный в развитых странах способ страхования бизнеса, как планирование его непрерывности. Что это за способ?
Воспользуемся аналогией с советскими временами. Многие помнят такое понятие, как гражданская оборона (или сокращенно “гроб”). Все готовились к третьей мировой войне, на всех более или менее крупных предприятиях имелись штабы гражданской обороны с несколькими отставниками, которые проводили как минимум раз в год учения по гражданской обороне, в основном нацеленные на спасение людей. Сотрудники предприятия распределялись по различным подразделениям (медицинским, транспортным, связным, химическим и др.), посещали соответствующие занятия и на учениях выполняли свои задачи.
Концепция непрерывности бизнеса состоит в подготовке и поддержании готовности предприятий к разного рода бедствиям, среди которых, правда, мировая война уже не рассматривается.
Почти каждый день мы видим по телевизору, слышим по радио или читаем в газетах о событиях, которые повлекли за собой частичное или полное прекращение деятельности организаций в результате воздействия внешних и внутренних бедствий. Можно быть уверенным, что и в дальнейшем всевозможные катаклизмы будут сказываться на людях и компаниях во всем мире. После несчастных случаев и катастроф необходимо восстанавливать нормальную жизнь людей и бизнес. При этом некоторые организации находятся в более выгодном положении: у них есть план обеспечения непрерывности бизнеса (далее просто план), по-английски - business continuity plan (BCP).
Зачем нужен план?
По мере того как все большее число критически важных бизнес-процессов (рис. 1) переносится на информационные системы с распределенной архитектурой (например, архитектурой клиент-сервер), компании начинают беспокоиться о том, как защитить эти системы от различных бедствий. При переносе приложений из вычислительного центра, где существует жесткий контроль за безопасностью и воздействием внешней среды, на рабочие места в оперативных подразделениях вероятность сбоев существенно возрастает. Если в вычислительном центре пожары, прорывы водопровода и канализации, отключения телефонной связи и электрического питания случаются не часто, то с распределением приложений по локальным или глобальным сетям неизбежность того, что где-нибудь что-нибудь произойдет, резко увеличивается.
Рис. 1. Модель бизнес-процессов компании
Средства массовой информации постоянно сообщают о самых разнообразных природных и техногенных катастрофах. Вероятность их продолжает оставаться высокой. Многие несчастья приходят неожиданно, в этом случае на планирование работ уже нет времени: нужно бороться за выживание. Но вот бедствие, о приближении которого мы постоянно слышим, - “Проблема 2000” - должно произойти в определенный час. И было достаточно времени предпринять что-либо, чтобы его последствия не стали непоправимыми. Но по самой своей природе эта проблема такова, что она в принципе может быть решена или устранена не более чем на 85% (см. http://www.mitre.org/research/y2k/briefings/y2k_odds.doc), ее глобальный характер (негативные проявления Y2K зашагают по земному шару вслед за солнцем, а на них наложатся расходящиеся волны сбоев систем, привязанных к единому времени), отсутствие необходимых финансовых и людских ресурсов в развивающихся странах и странах с переходной экономикой, использование компьютеров в критически важных системах, управляющих опасными процессами, - все это позволило участникам 2-й Глобальной конференции ООН по “Проблеме 2000” заявить в июне, что большинство стран не справится с решением Y2K, в момент наступления Нового года с очень большой вероятностью начнутся бедствия различного масштаба из-за отказов в компьютерных системах и необходимо срочно заняться планированием непрерывности бизнеса организаций.
Поскольку полностью негативные проявления “Проблемы 2000” нельзя предотвратить, необходимо подготовиться к ним, составив план, выполнение которого должно обеспечить быстрое и успешное восстановление деятельности предприятия. С наибольшими трудностями столкнутся компании, использующие сложные распределенные вычислительные среды и разнородные технические средства, ПО и протоколы связи.
Организации должны предусмотреть меры по быстрейшему восстановлению тех видов деятельности, которые имеют для них критически важное значение. Разумеется, это касается не только информационных систем. Потребуется заменить оборудование локальных телефонных станций, восстановить справочную службу и дистанционное обслуживание, найти помещение для работы сотрудников, наладить спасение имущества, которое пригодно к использованию, и т. д. Если все это не будет сделано своевременно, управление организацией станет практически невозможным.
Что представляет собой план и почему он так важен?
План обеспечения непрерывности деятельности организации - это детальный перечень мероприятий, которые должны быть выполнены до, во время и после бедствия. Необходимо этот план задокументировать и провести его испытание, чтобы удостовериться, что он гарантирует продолжение деятельности и сохранение критически важных ресурсов после бедствия.
Поскольку каждая компания уникальна, то в плане обеспечения непрерывности деятельности должны быть отражены ее особенности: ключевые бизнес-функции, время, необходимое на восстановление работы и обслуживание заказчиков, и т. п. План является руководящим документом в системе обеспечения непрерывности деятельности организации (рис. 2).
Рис. 2. Система обеспечения непрерывности бизнеса компании
К сожалению, отечественные государственные интерпретаторы понятия непрерывности бизнеса в контексте “Проблемы 2000” относят требования непрерывности исключительно к информационным и инфраструктурным технологиям и говорят о неких резервных планах. Например, если отказала информационная система, то резервный план состоит в переходе на ручной режим работы. Для эволюционно построенных информационных систем, т. е. когда бумажная технология была постепенно замещена безбумажной, это, может быть, и выполнимо. Но есть информационные системы, не имеющие бумажного аналога. Что тогда - разрабатывать его? Короче, под резервными планами имеется в виду переход при отказе основных на дублирующие системы (например, наземная связь дублируется сотовой, электроснабжение от местной тепловой станции дублируется автономными мотор-генераторами, внешнее снабжение питьевой водой дублируется запасами таковой в бутылках и др.). Однако везде в мире “Проблема 2000” рассматривается как бизнес-проблема, т. е. как проблема обеспечения непрерывности бизнеса. А в бизнесе есть такие понятия, как сотрудники, клиенты, поставщики продуктов и услуг, фискальные органы, банки, бухгалтерия, финансы и, конечно, информационные и инфраструктурные технологии. Все это не продублируешь.
Каковы выгоды от наличия плана?
Хороший план будет служить руководством к действию до, во время и после кризиса. Он должен быть составлен таким образом, чтобы ни один важный аспект не был упущен и даже неопытные служащие знали, где, как и чем они будут заниматься в критических ситуациях.
Наличие детального, регулярно испытываемого плана может оградить любую организацию от судебных исков по поводу халатности. Само существование плана послужит доказательством того, что руководство компании не пренебрегало подготовкой к бедствиям.
Составление детального плана обеспечения непрерывной деятельности позволит:
- минимизировать потенциальные финансовые потери;
- уменьшить юридическую ответственность;
- сократить продолжительность сбоя нормальной работы;
- быстро восстановить деятельность;
- свести к минимуму суммы страховых выплат;
- уменьшить нагрузку на ведущих сотрудников;
- эффективнее защитить имущество;
- обеспечить безопасность персонала и защититься от недобросовестных заказчиков и поставщиков продуктов и услуг;
- соблюсти требования законов и инструкций;
- уменьшить объем принятия решений во время бедствия.
Чем грозит отсутствие плана?
В часто цитируемом исследовании Техасского университета приведена следующая отрезвляющая статистика:
- 85% организаций сильно или полностью зависят от вычислительных систем;
- в среднем на шестой день перерыва в работе компания теряет 25% ежедневного дохода, а на 25-й день - 40%;
- после перерыва в работе наблюдается быстрый рост финансовых потерь и ухудшение функционирования;
- спустя две недели после прекращения работы вычислительных систем у 75% компаний потеря функционирования становится критической или полной;
- 43% компаний, испытавших бедствие и не имевших плана обеспечения непрерывности функционирования, не возобновляют свою деятельность, а спустя два года продолжает функционировать лишь 10% таких компаний.
Это исследование показало, что организации, которые подготовились к длительному перерыву в работе вычислительной техники, составив план действий в чрезвычайных обстоятельствах, имели существенно меньшие потери доходов, у них были ниже дополнительные затраты и менее значительное ухудшение функционирования. По оценке, потери доходов этой группы организаций были бы в 2,5 раза выше, если бы при возникновении чрезвычайной ситуации они не привели в исполнение соответствующие планы.
Если компании повезло и она смогла пережить бедствие, не имея плана обеспечения непрерывности деятельности, ей все равно не удастся избежать потерь. Кроме прямых потерь доходов из-за останова вычислительных средств организация понесет также и косвенные убытки, связанные с нарушением процедур производственного и финансового учета, потерей расположения заказчиков, снижением конкурентоспособности, ухудшением имиджа в промышленном мире и, следовательно, уменьшением доли на рынке.
Кто отвечает за разработку плана?
Конечно же, руководство компании. Оно обязано контролировать имущество компании, а это включает и контроль ее информационных систем, упреждающее управление ими и обеспечение их непрерывного функционирования.
Однако восстановление деятельности должно быть заботой всех сотрудников компании, а не только руководства подразделения, отвечающего за вычислительную сеть. Руководителям подразделений, деятельность которых зависит от услуг, предоставляемых сетью, необходимо продумать процедуры действий в чрезвычайных обстоятельствах, касающиеся собственных функциональных обязанностей, а также участвовать в разработке плана восстановления вычислительной сети. Каждое функциональное подразделение должно быть способно привести в действие свою часть плана в рамках общих усилий по возобновлению деятельности.
Что требуется для разработки плана?
Для того чтобы усилия по составлению плана увенчались успехом, наиболее важным является участие высшего руководства. Без его поддержки практически невозможно заставить функциональные подразделения предоставить ресурсы, необходимые для разработки плана, который можно будет реализовать на практике.
Существенное значение имеет также привлечение служащих. Если они не будут участвовать в процессе разработки плана, маловероятно, что план окажется действительно полезным. С их помощью можно уточнить некоторые важные факторы: вероятные последствия бедствия для деятельности организации и ресурсы, которые будут необходимы для того, чтобы свести к минимуму убытки.
Ведение плана обеспечения непрерывности деятельности требует постоянных затрат времени и финансовых ресурсов. Без периодического обновления план теряет всякий смысл.
Каковы этапы разработки плана?
Необходимо составить проект по разработке плана обеспечения непрерывности деятельности, чтобы управлять его задачами, сроками и конечными результатами (рис. 3). Основные этапы типичного проекта приведены ниже.
Рис. 3. Методология планирования непрерывности бизнеса
Организация выполнения проекта. Включает в себя административное управление проектом, определение допущений, проведение совещаний и разработку политики.
Оценка риска, уменьшение нежелательных последствий от наступления событий, связанных с риском. Выявляются типы бедствий, которые могут произойти в каждом конкретном месте. Исследуется физическая инфраструктура здания и его окрестностей. Каждому типу бедствия приписывается относительная величина и делается прогноз его продолжительности. Используется шкала, например от 0 до 3, где 0 означает невероятное событие, а 3 - весьма вероятное. В результате этого выявляются области, в которых следует провести дальнейшие исследования, чтобы уменьшить неблагоприятные последствия событий и связанный с ними риск.
Анализ последствий бедствий для бизнеса. Определяются потери от невозможности продолжать нормальную деятельность. Они могут быть очевидными (например, выражаться количеством продукции, не продаваемой в час, день или неделю) или косвенными, в этом случае руководству придется сделать предположительную оценку потерь. В любом случае цель заключается не в том, чтобы получить точные данные, а в том, чтобы выявить факторы, которые являются критически важными для продолжения деятельности компании. На этом этапе определяется широта плана обеспечения непрерывности деятельности. Чрезмерные меры предосторожности потребуют лишних средств, а недостаточные - не гарантируют должной безопасности.
Разработка стратегии обеспечения бесперебойной деятельности. Существует несколько стратегических вариантов, в том числе следующие:
- использование “горячего” резервного помещения. Поставщик этой услуги предоставляет компании подготовленное рабочее помещение с оборудованием, средствами телекоммуникации, персоналом, осуществляющим техническую поддержку, и т. д., обычно по годовому контракту. Заказчики получают доступ к оборудованию по принципу “первый пришел - первым обслуживается”;
- использование “холодного” резервного помещения. Компания организует работу в пустующем или арендуемом помещении, которое подготовлено к использованию. Сразу после бедствия в помещение переводится оборудование (возможно, закупаемое у поставщиков), ПО и службы обеспечения;
- использование внутренних резервов. Для предоставления услуг в чрезвычайных обстоятельствах задействуется оборудование компании, которое расположено в ином месте;
- заключение соглашения о взаимной поддержке с другой компанией о коллективном использовании ресурсов после бедствия. Предполагается, что резервное оборудование всегда имеет нужную пропускную способность и вас устраивает степень защиты информации при коллективной работе.
В некоторых случаях может оказаться необходимой комбинация этих вариантов. Крупные транснациональные компании все в большей степени используют для локальных вычислительных сетей метод внутреннего резервирования. Поскольку количество имеющихся резервных помещений ограничено, может случиться, что при чрезвычайных обстоятельствах не окажется помещения, которое было бы пригодно для работы. Бедствие в масштабе региона может привести к тому, что все резервные помещения окажутся занятыми и компании негде будет возобновить деятельность.
Хорошо продуманный план обеспечит предприятие пошаговыми инструкциями, соответствующими типу и тяжести бедствия. В нем указаны функциональные группы служащих, которые обучены реализации плана обеспечения бесперебойной деятельности. Наличие хорошо проработанного плана гарантирует, что в стрессовой ситуации после возникновения чрезвычайных обстоятельств не будут упущены факторы, имеющие критически важное значение.
Документирование плана. Большинство компаний все еще применяет традиционные текстовые редакторы, другие используют более современное и сложное ПО (см. http://www.drj.com). В любом случае важно обеспечить строгое выполнение процедур управления внесением изменений, чтобы поддерживать план в состоянии, соответствующем реальной ситуации.
Обучение. Имеет важное значение для того, чтобы каждый сотрудник знал свои функции и обязанности при восстановительной работе после бедствия.
Имитация бедствия. Большинство компаний проводит испытания плана минимум один раз в полгода. Имитируя бедствия, можно проверить план, найти его слабые места и отработать взаимодействие участников. Обнаружение недостатков обычно влечет за собой корректировку плана. Для того чтобы быть успешным, план должен регулярно проходить испытания и корректироваться. Лишь немногие планы выполняются так, как это было первоначально предусмотрено. Поскольку внесение поправок в план необходимо делать регулярно, должна быть обеспечена простота корректировки плана.
Что еще следует предусмотреть?
Если у организации в настоящий момент нет плана обеспечения непрерывности бизнеса, уведомьте высшее руководство о потенциальных опасностях, которые связаны с отсутствием подготовленного и испытанного плана.
При разработке и ведении плана необходимо:
- обеспечить регулярное проведение полных испытаний плана; проводить циклическую замену специалистов, участвующих в испытаниях, чтобы через этот процесс прошло максимальное число сотрудников, которые будут участвовать в восстановлении деятельности после бедствия;
- добиться того, чтобы планирование непрерывности бизнеса стало одной из задач руководства. Это поможет обеспечить сотрудничество всех участвующих сторон;
- при выборе альтернативных рабочих помещений позаботиться, чтобы ими можно было воспользоваться при первой необходимости;
- не принимать существующие системы и процедуры резервирования на веру, провести полную экспертизу резервирования и внести необходимые изменения. Провести испытания процедур восстановления;
- при определении приоритетов приложений выявить точку зрения старших руководителей: они видят картину более широко;
- учесть в плане все мелочи, которые могли бы помешать процессу восстановления деятельности;
- разработать механизм, обеспечивающий регулярное обновление плана.
Какие функции следует описать в плане?
План должен содержать описание выполнения следующих функций:
- ввода в действие процедур в случае чрезвычайных ситуаций;
- уведомления сотрудников, поставщиков и заказчиков;
- формирования группы (групп) восстановления;
- оценки последствий бедствия;
- принятия решения о реализации плана восстановления деятельности;
- ввода в действие процедур восстановления деятельности;
- переезда в альтернативное рабочее помещение (помещения);
- восстановления функционирования приложений, имеющих критически важное значение;
- восстановления основного рабочего помещения.
Кроме того, в плане необходимо указать документы, которые могут быть использованы персоналом, незнакомым с восстанавливаемыми функциями. Эти документы должны включать такие данные, как:
- схемы коммутации телефонов;
- процедуры для аварийного понижения питания;
- организационная структура Центра восстановления;
- требования к оборудованию и снабжению Центра восстановления;
- конфигурация Центра восстановления;
- список приложений, имеющих критически важное значение;
- список восстанавливаемого оборудования;
- сводные данные об оценке риска.
Для реализации плана обеспечения непрерывности деятельности в нем обычно предусматривается создание в организации следующих групп (конкретный набор зависит от масштаба и вида бизнеса компании):
- первоначального реагирования. Определяет размер ущерба;
- восстановления. Выполняет функции командного центра в процессе возобновления работы;
- по связям с общественностью. Подготавливает сообщения для печати и поддерживает связь со средствами массовой информации;
- управления сооружениями. Оборудует новое помещение и начинает реконструкцию поврежденного рабочего помещения;
- управления кадрами. Решает проблемы, связанные с командировками, переездами и т. п.;
- информационных систем. Восстанавливает информационную инфраструктуру;
- функциональной деятельности. Координирует возобновление работы всех функциональных подразделений, участвующих в бизнесе;
- систем связи и передачи информации. Восстанавливает системы речевой связи и передачи информации;
- учета. Координирует спасение и восстановление пострадавших учетных документов и их хранение вне рабочего помещения;
- административной поддержки. Обеспечивает поддержку работы Группы восстановления.
Кто поможет?
Для разработки реального плана существует три основных способа:
- Разработка плана собственными силами.
- Разработка плана с помощью коммерческого ПО автоматизированного составления планов обеспечения бесперебойной деятельности.
- Приглашение внешнего консультанта для оказания помощи или непосредственной разработки плана.
Каждый из этих способов может оказаться успешным. Они отличаются по стоимости, но во всех случаях требуется выделение персонала для проведения исследований, составления и реализации плана.
Разработка собственными силами требует наличия квалификации в области составления планов обеспечения непрерывности бизнеса. Эту квалификацию можно приобрести только путем обширного обучения и накопления опыта. Большинство организаций не имеют такой возможности.
Что можно сделать самостоятельно?
Приведенный ниже неполный перечень может дать руководству компании некоторые представления о том, в чем заключается подготовка к восстановлению бизнеса.
- Выявите потенциальные бедствия для вашего бизнеса и задайте им приоритеты в соответствии с вероятностью возникновения.
- Оцените последствия каждого возможного бедствия и определите, чему может быть нанесен ущерб.
- Оцените время, необходимое для восстановления, и потенциальный ущерб от прерывания деятельности.
- Определите ресурсы, которые имеют критически важное значение.
- Проведите инвентаризацию имущества.
- Позаботьтесь о встроенных механизмах отказоустойчивости (зеркальные диски, RAID, UPS и т. п.) и дублирующих системах жизнеобеспечения (охрана, связь, электропитание, тепло- и водоснабжение и др.).
- Защитите ваши приложения и данные (защита от вирусов, создание резервных копий, хранящихся вне рабочих помещений, и т. п.).
- Поддерживайте работоспособность систем передачи данных.
- Создайте альтернативные рабочие помещения и разработайте план получения необходимых ресурсов.
- Подготовьте официальный план, регулярно проводите испытания плана и пересматривайте его.
Литература
1. Дрожжинов В. И., Моисеенко Г. Е. Непрерывность бизнеса и проблема 2000 года. Серия “Связь и бизнес”. М., Международный центр научной и технической информации, 1999. - 86 с.
2. Методические рекомендации по обеспечению непрерывности деятельности организаций и планированию на случай непредвиденных и чрезвычайных обстоятельств в связи с “Проблемой 2000”. Госкомтелеком России, http://www.ptti.gov.ru/gk-doc/2000/index.htm.
3. Говард А. Рубин. Руководство по планированию на случай возникновения непредвиденных и чрезвычайных ситуаций, связанных с “Проблемой 2000”. http://www.worldbank.org/infodev/y2k/cp/russian.htm.
Автор - Генеральный директор компании “Аквариус Консалтинг”, с ним можно связаться по телефону: (095) 268-0869.
“С начала работ по "Проблеме 2000" мы узнали, что она слишком глобальна, слишком сложна и слишком системна, чтобы быть полностью решенной вовремя. Несмотря на все наши мероприятия, невозможно гарантировать, что не произойдет что-то чрезвычайное в связи с "Проблемой 2000". До конца 1999 г. осталось меньше 200 дней, поэтому этот прогноз вряд ли изменится существенно. Короче, с удвоенной энергией мы должны продолжить нашу работу по техническому устранению проблемы и параллельно разрабатывать всеобъемлющие планы обеспечения непрерывности”.
Из выступления Карлоса А. Примо Брага, руководителя программы
“Информация для развития” (InfoDev) Всемирного банка, на 2-й Глобальной
конференции по “Проблеме 2000”, ООН, Нью-Йорк, 21 - 23 июня 1999 г.