Ли Шнипг отлично помнит тот день, когда тревога, связанная с проблемой отказоустойчивости, вновь возникла в ее сознании. Тогда не произошло ни землетрясения, ни наводнения, ни какого-либо иного природного катаклизма. Просто в прошлом году случилось так, что она, сетевой администратор, обслуживающий юридическую фирму Ziffren, Brittenham & Branca в Лос-Анджелесе, получила непосредственное подтверждение своим сомнениям. В тот день сетевой сервер остановился во время телефонного разговора с клиенткой, выражавшей сожаление по поводу кончины своей родственницы  -  одной из самых известных женщин Америки  -  и желавшей изменить свое завещание.

Описанный инцидент, конечно, не стал для фирмы катастрофой, но заставил серьезно задуматься. Проблему устойчивости к ошибкам, решение которой Швинг откладывала из года в год из-за необходимости приобретения дорогих аппаратных средств, больше игнорировать было нельзя.

Быстро оценив обстановку, она нашла, что для защиты от потери будет вполне достаточно копировать данные на стример и на диски, не доступные из сети. А вот потеря производительности представлялась сущим кошмаром. Ли так описывала ситуацию: "Если мы теряем информацию па протяжении одного часа, это еще терпимо. Но что при этом совершенно удручает  -  так это вынужденное бездействие наших сотрудников".

Конечно, компания со штатом в 70 человек не может позволить себе заказать такие дорогостоящие отказоустойчивые системы, которые предлагают, к примеру, фирма Tandem Computer и корпорация Stratus Computer. Поэтому Швинг решила приобрести у корпорации Vinca за $5000 продукт Standby Server с автоматическим переключением. Этот продукт, состоящий из ПО, дополнительной платы и кабелей, встроили в старенький файл-сервер, который стоял в подсобном помещении. ’’С тех нор иногда случались фатальные сбои сервера, но при этом система автоматически переходила в резервный режим и уже через каких-нибудь 10 минут сотрудники могли приступить к своей работе. Это замечательно",  -  резюмировала Швинг.

Системы восстановления после сбоя быстро становятся альтернативой дорогим аппаратным средствам. Хотя они не очень дешевы и не предотвращают сбои, их стоимость варьируется в широких пределах, что позволяет менеджерам информационных технологий (ИТ) рационально распределять ограниченные финансовые средства.

Пайщик компании KPMG Peat Marwick’s strategic services group (Пало-Альто, шт. Калифорния) Робин Палмер считает, что нужно тщательно взвесить свои потребности, тогда может оказаться, что восстановление работоспособности  -  наиболее подходящее решение. "Не допускайте, чтобы вами управлял страх",  -  обычно советует он менеджерам ИТ, которые сплошь и рядом отвергают системы восстановления работоспособности в пользу отказоустойчивых систем, дабы свести к минимуму риск.

Для больших компаний, чьи требования к сохранности информации являются более жесткими, восстановление работоспособности можно даже ввести в ПО в качестве дополнительной функции. Так. Медицинской ассоциации MacGregor 100%-й доступ к данным ее центрального сервера необходим в течение всего рабочего дня. При этом необходимо поддерживать полную информационную интеграцию. Несмотря на это компания, которая уже "защитила" свою СУБД, расположив ее на центральном компьютере Tandem, не считает нужным покупать дополнительные аппаратные средства даже при условии, что они расширят ее сетевые возможности, обеспечив дополнительно 30 рабочих мест.

"А я не вижу смысла устанавливать на каждое рабочее место отказоустойчивое оборудование. Это было бы слишком",  -  сказал Джим Слоун, директор по ИТ Медицинской ассоциации из Хьюстона. С помощью резервных линий стандарта Т1 он собирается создать информационные пути между каждым рабочим местом и центральным сервером так, что при выходе из строя какой-то части сети всегда останется связь с центральной базой данных.

КАК ЖЕ ДОБИТЬСЯ ВОССТАНОВЛЕНИЯ?

Все-таки принцип восстановления более обоснован, чем добавление линий Т1 и нового оборудования. Но не надейтесь отыскать окончательное решение. "Вам придется подходить к нему постепенно", -  говорит Том Вилмонт, вице-президент консалтинговой фирмы Aberdeen Group из Бостона.

Господин Палмер считает, что в первую очередь компании должны обратить внимание на все три уровня сетей, в которых возможны сбои: основную аппаратную часть, ПО и устройства связи. Дублирование жестких дисков и установка бесперебойных источников питания  -  верный путь к укреплению аппаратной части.

Приемлемое решение  -  хранение информации на дисковых массивах, но они все-таки дороги. Например, цена дисковых массивов фирмы Conner Storage Systems Group (Лейк-Мэри, шт. Флорида) колеблется от $8500 до $30 000.

Что касается устройств связи, то тщательное планирование их архитектуры становится ключевым фактором в вопросе восстанавливаемости системы. Пал-мер дает еще один совет: "Сведите к минимуму риск". Кстати, он приветствует решение Медицинской ассоциации MacGregor об установке резервных линий Т1, связывающих удаленные отделения, а также о перемещении жизненно важных серверов в иное место. Для компаний же, занимающих всего одно рабочее помещение, он предлагает для установки сервера арендовать дополнительную площадь.

Восстанавливаемость может быть достигнута также с помощью специальных программных продуктов, таких как Forte фирмы Forte Software, позволяющих программистам добавлять в приложения средства борьбы со сбоями. Только одно предостережение: не применяйте в этом случае макрокоманды.

"Поспешность, неаккуратность и желание сэкономить могут принести массу неприятностей",  -  говорит Чет Гешихтер, вице-президент и руководитель исследований фирмы Hurwitz Consulting Group в г. Уотертауне.

И наконец для большинства компаний вопросы внедрения отказоустойчивых систем или систем восстановления все еще отодвинуты на задний план. Сейчас продавцы занимаются поставкой продуктов, которые отвечают потребностям пользователей, однако более развитые возможности вряд ли появятся в их ассортименте до тех нор, пока компании не доведут приложения непрерывного действия до уровня, удовлетворяющего требованиям технологии клиент-сервер.

ЭРИН КАЛЛАВЕЙ