ОБЗОРЫ

Во второй половине прошлого года в заголовках новостей, посвященных индустрии систем хранения, все чаще стала мелькать аббревиатура CDP, которая расшифровывается как Continuous Data Protection (непрерывная защита данных), а уже осенью свои продукты, реализующие эту концепцию, представили Microsoft и лидеры рынка ПО резервного копирования Symanteс-Veritas, EMC-Legato и IBM Tivoli. Прежде чем разбираться, что принципиально новое привнесла CDP, рассмотрим проблемы классического подхода к организации резервного копирования.

Чем плоха лента

Для примера рассмотрим типичную схему резервного копирования в небольшом офисе, где на файл-сервере, оборудованном дисками большой емкости, каждому пользователю выделена отдельная папка. Для защиты данных, хранящихся на файл-сервере, применяется резервное копирование на ленточный автозагрузчик. Поскольку на ленту нельзя копировать открытые файлы и сама операция резервного копирования создает дополнительную нагрузку на сервер, то ее можно выполнять только в нерабочее время, т. е. ночью или в выходные (промежуток времени, выделяемый для этой цели, называется окном резервного копирования). Обычно за ночную смену не удается скопировать содержимое всех дисков сервера на ленту (например, самый распространенный сейчас ленточный привод DAT72 (DDS-5) за 8 ч способен записать не более 172 Гб). Поэтому полностью диски сервера копируются только один раз в неделю: вечером в пятницу системный администратор запускает программу резервного копирования и к понедельнику получает полную резервную копию на одной или нескольких лентах. В остальные рабочие дни на отдельные ленты записываются только изменения содержимого дисков, сделанные с того момента, когда была создана последняя полная (дифференциальная) копия, либо, если требуется максимально сократить окно резервного копирования, производится инкрементальное резервное копирование (т. е. на ленте фиксируются изменения по сравнению с предыдущим резервным копированием).

Выбор файлов для восстановления в окне консоли администратора DPM

В чем заключаются главные недостатки такого метода? Рассмотрим ситуацию, когда одному из пользователей понадобилось срочно восстановить в своей папке случайно удаленный файл. Для этого ему придется обращаться к системному администратору, который должен найти ленты с последней полной резервной копией и, возможно, еще и ленты с дифференциальной или инкрементальными копиями, загрузить эти ленты в автозагрузчик, прочитать их содержимое, после чего можно будет восстановить файл с ленты на диск. Этот процесс может растянуться на несколько часов (особенно если у системного администратора есть более важное задание или ленты хранятся в другом здании), и в результате нужный файл будет восстановлен слишком поздно (например, сотрудник не успеет к назначенному сроку выслать клиенту полный комплект документации).

Другой недостаток классического резервного копирования - периодичность создания резервной копии. Резервное копирование производится только в конце рабочего дня, поэтому в случае удаления или порчи файлов, созданных в течение дня (например, если сотрудник до обеда подготовил новый документ в Microsoft Word, а в пять часов вечера обнаружил, что этого файла нет в его папке), их нельзя восстановить, поскольку они еще не были скопированы на ленту.

Архитектура Microsoft DPM

Наконец, не следует забывать, что восстановление файлов с ленты может выполнять только системный администратор, и если с запросами на восстановление к нему каждый день будет обращаться несколько пользователей, то у него просто не останется времени на другую работу. Сейчас выход из строя дисков или серверов случается довольно редко, поэтому основная часть запросов на восстановление по резервной копии приходит от пользователей, которые случайно удалили важные файлы или сохранили вновь созданный файл под именем уже существующего (например, пользователь решил подготовить сокращенный вариант своей презентации PowerPoint и выбросил из нее часть файлов, но затем вместо команды “Сохранить как ...” по привычке выбрал в меню PowerPoint команду “Сохранить” и в результате затер исходную презентацию).

Согласно приведенным корпорацией Microsoft оценкам аналитиков, в американских компаниях в 40% случаев попытка восстановления данных с ленты кончается неудачей. По-видимому, такой высокий процент связан не столько с надежностью самих ленточных технологий, сколько со сложностью процесса резервного копирования на ленту, который требует выполнения множества ручных операций, четкой организации кассет и не позволяет проверить правильность полученной копии.

Основная проблема ленты - это низкая скорость чтения и записи, из-за чего резервное копирование приходится переносить на нерабочее время и применять усложняющее восстановление инкрементальное и дифференциальное копирование. Логичное решение в данном случае - замена ленты на более быстрые жесткие диски, т. е. резервное копирование по схеме D2D, при которой резервная копия записывается с одного жесткого диска на другой (следует уточнить, что такие новейшие ленточные накопители старшего класса, как Ultrium 960, могут обгонять по скорости диски, однако эти устройства слишком дороги для небольших компаний). Сама концепция D2D не нова, однако широко применяться на практике она стала только в последние годы, когда был налажен выпуск RAID-массивов на базе недорогих SATA-дисков. Следствием популярности D2D стало появление идеологии резервного копирования CDP, которая предусматривает постоянное отображение в резервной копии всех изменений оригинала, благодаря чему можно практически мгновенно восстановить состояние данных на любой момент времени в прошлом с неограниченной детализацией (вплоть до секунд). Рассмотрим некоторые из наиболее известных решений CDP, которые появились за несколько последних месяцев.

Microsoft DPM и Symatnec Backup Exec 10d

Пакет Microsoft System Center Data Protection Manager 2006 (DPM, www.microsoft.com/windowsserversystem/dpm) был представлен еще в сентябре 2004 г., за год до выхода окончательной версии, и этот анонс софтверного гиганта стал серьезным стимулом для становления рынка решений CDP. Резервное копирование DPM основано на использовании функции “теневого копирования” Volume Shadow Copies Services (VSS) в ОС Windows Server 2003 и ее специализированной версии Windows Storage Server 2003: сначала исходные данные копируются на диски сервера DPM, а затем VSS записывает на него все последующие изменения в виде так называемых теневых копий. В этих теневых копиях изменения оригиналов фиксируются на байтовом уровне, поэтому после редактирования какого-то файла на DPM пересылается не его новая версия, а только те байты, в которые было записано новое значение. Это сокращает объем трафика резервного копирования и уменьшает дополнительные расходы емкости на дисках DPM для хранения теневых копий (Microsoft рекомендует, чтобы они были в полтора раза больше дисков, где хранятся оригиналы файлов). При необходимости по первоначальной и теневой копиям можно практически мгновенно восстановить состояние файлов в разные моменты времени. Однако VSS накладывает существенные ограничения на использование теневого копирования - его можно производить не чаще восьми раз за сутки и одного раза в час, а число теневых копий одного тома не может быть больше 64 (кроме того, оно ограничено размером дискового пространства на сервере DPM, а общий объем исходных файлов должен быть не более 6 Тб). Из-за этих ограничений невозможно реализовать непрерывную защиту данных, поэтому Microsoft предпочитает классифицировать свой продукт как решение “почти CDP”. Кроме того, DPM пока не поддерживает такие функции классического ПО резервного копирования, как защита в онлайновом режиме баз данных и систем электронной почты и восстановление вышедшего из строя сервера с нуля (bare-bone restore; т. е. без предварительной инсталляции и настройки серверной ОС).

Web-интерфейс Backup Exec 10d

В отличие от резервного копирования на ленту системный администратор может без больших затрат времени просматривать диски DPM и проверять, есть ли там все необходимые резервные копии. По сравнению с использованием ленты существенно упрощается и восстановление данных - достаточно указать в окне консоли администратора нужные резервные копии, хранящиеся на диске DPM, и дать команду Recover. Кроме того, благодаря интеграции с Windows XP и Microsoft Office 2003 восстановление удаленных и поврежденных файлов могут проводить сами конечные пользователи, задав команды Open и Recover previous version в диалоговом окне приложения Office или Windows Explorer.

DPM рассчитан прежде всего на организацию резервного копирования в офисах небольших компаний, где часто нет системного администратора, а также для организации централизованного резервного копирования в корпорациях с территориально распределенной структурой. Например, сама Microsoft уже больше года использует этот продукт для централизованной защиты в 130 своих отделениях - по глобальной сети теневые копии пересылаются в центральный офис, где записываются на сервер DPM. По оценкам корпорации, она сэкономит за первые два года не менее 2,7 млрд. долл. за счет стоимости ленточных систем и ПО резервного копирования, которые раньше использовались в каждом из этих филиалов, а также значительно уменьшит окно резервного копирования. Например, в одном из ее офисов, где раньше на ленту копировались 300 Гб, после внедрения DPM продолжительность резервного копирования сократилась с 8 ч до 10 мин.

DPM устанавливается на выделенный сервер с Windows Server 2003 или Windows Storage Server 2003 и способен защищать только серверы с теми же ОС, а также Windows 2000 (на этих серверах инсталлируются программы-агенты DPM, обеспечивающие передачу теневых копий). Кроме того, на сервер DPM можно установить обычное ПО резервного копирования и с его помощью сбрасывать содержимое дисков DPM на ленту для его архивации или хранения на другой площадке.

Пакет DPM в минимальной конфигурации, включающий лицензии на один сервер DPM и обслуживание трех файл-серверов, стоит 950 долл.

Первые анонсы DPM были расценены аналитиками рынка систем хранения как вызов Microsoft компаниям, специализирующимся на разработке ПО резервного копирования, прежде всего Veritas (сейчас это подразделение корпорации Symantec), чей пакет Backup Exec (www.backupexec. com) является лидером среди программных решений для резервного копирования в среде Windows. Корпорация Symantec не заставила себя ждать с ответом - в тот же день, 27 сентября 2005 г., когда Microsoft объявила о начале поставок DPM, вышла новая версия Backup Exec 10d (кодовое название Panther). От представленного в начале прошлого года Backup Exec 10 новая версия отличается наличием модуля Continuous Protection Server, который и реализует функции CDP на основе технологии VSS (буква d в ее названии говорит об использовании жестких дисков). В качестве интерфейса Symantec в своем продукте использовала консоль на базе Web-браузера, которая, как и Windows Explorer в DPM, позволяет конечному пользователю самому восстанавливать файлы по резервным копиям. В остальном по своей основной функциональности Backup Exec 10d мало отличается от продукта Microsoft, к тому же имеет почти такую же цену, как и у конкурента: лицензия на сервер и три программы-агента для клиентских машин стоит 995 долл.

Для Tivoli CDPF можно задать сохранение резервных копий на локальном диске, удаленном файл-сервере или сервере TSM

Каковы же основные различия этих продуктов? Если Backup Exec 10d продается только как отдельный программный продукт, который необходимо инсталлировать и настроить, то DPM можно приобрести также как готовый аппаратно-программный комплекс на базе Intel-сервера. Например, корпорация HP предлагает три модели, работающие под управлением DPM NAS-устройств ProLiant Data Protection Storage Server на базе серверов ProLiant, а компания Fujitsu Siemens Computers выпустила систему FibreCAT N40-DPM на базе двухпроцессорного стоечного сервера Primergy RX. По-видимому, продукт Microsoft заинтересует в первую очередь те небольшие компании, где до сих пор не использовалось резервное копирование, а решение Symantec - пользователей Backup Exec, которые хотели бы дополнить (или заменить) резервное копирование на ленту технологией DPM. Кроме того, благодаря наличию в портфеле Symantec различных дополнительных модулей для Backup Exec в этом продукте можно реализовать ряд функций, отсутствующих в DPM, например восстановление серверов с нуля.

IBM Tivoli CDP for Files (CDPF)

Представленное на месяц раньше DPM и Panther решение CDP от компании IBM (www.ibm.com/ru/software/tivoli/ products/cont_data_prot_files.html) рассчитано прежде всего на защиту в среде Windows файлов, хранящихся на дисках ноутбуков, а также настольных ПК и файл-серверов. Каждый раз, когда пользователь создает на локальном диске своего ПК новый файл или изменяет существующий, CDPF копирует его в специальную папку RealTimeBackup на этом же диске, а затем, сразу по подключении компьютера к сети, пересылает ее на удаленный файл-сервер, в NAS-систему или на сервер резервного копирования Tivoli Storage Manager (TSM). Кроме того, это ПО позволяет копировать файлы и на съемные накопители компьютера, например флэш-диски, что удобно в тех случаях, когда ноутбук длительное время отключен от сети. Оно практически не накладывает никаких ограничений на периодичность создания резервных копий, т. е. в чистом виде реализует CDP, но поскольку каждая новая версия файла копируется целиком, то по сравнению с продуктами Microsoft и Symantec это решение значительно интенсивнее расходует емкость дисков и создает больший трафик при пересылке копии через сеть.

CDPF может использоваться как отдельный продукт либо как компонент TSM. Его серверная лицензия стоит 995 долл. (в расчете на один процессор), а лицензия для ноутбука или настольного ПК - 35 долл.

EMC RecoverPoint

Решение RecoverPoint (www.legato.com/products/backup/recover_point.htm), разработанное подразделением Legato корпорации EMC, наиболее полно реализует концепцию CDP - оно обеспечивает восстановление не только данных, но и приложений по состоянию на произвольный момент времени в прошлом. Архитектура продукта EMC (в нем использованы технологии CDP небольшой калифорнийской фирмы Mendocino, www.mendocinosoft.com) включает три компонента: программный сервер RecoverPoint Engine, программы-агенты RecoverPoint Protection Drivers и систему, в которой сохраняются резервные копии RecoverPoint Recovery Storage. Первый компонент управляет всеми метаданными, с помощью которых фиксируются изменения исходных данных, и на их основе подготавливает “образы” для восстановления по резервной копии. Он может устанавливаться на любой Intel-сервер с ОС Red Hat Linux 3.0 (EMC рекомендует использовать стоечный Сервер высотой 2U). Агенты RecoverPoint Protection Drivers, устанавливаемые на серверы приложений, отслеживают и сохраняют изменения данных приложений. В первую версию RecoverPoint включены агенты для Solaris 8/9 и приложений Oracle 9i/10g, UFS и VxFS на этой платформе и Windows 2003 с поддержкой SQL Server и NTFS.

Архитектура EMC RecoverPoint

Изменения, зафиксированные драйверами Protection Drivers, записываются на RecoverPoint Recovery Storage. Этот компонент устанавливается на любом дисковом массиве с интерфейсом Fibre Channel (разумеется, EMC рекомендует выбрать ее собственные системы хранения Symmetrix и Clariion).

RecoverPoint с помощью драйверов отслеживает все изменения в приложениях, для которых необходимо обеспечить резервное копирование, и записывает их на Recovery Storage. Одновременно с этим отслеживанием драйверы передают RecoverPoint Engine метаданные с описанием изменений данных на уровне блоков. Из этих метаданных Engine подготавливает виртуальные копии, по ним и производится восстановление данных.

Системный администратор взаимодействует с Engine с помощью ПО EMC Replication Manager или EMC-Legato Networker. Когда требуется восстановить данные приложений, администратор в окне Replication Manager или Networker указывает время, на которое нужно сделать “откат”, после чего RecoverPoint создает нужную виртуальную копию, по которой мгновенно восстанавливаются данные.

RecoverPoint может использоваться для защиты баз данных, файл-серверов, а также для организации резервного копирования и архивирования данных на ленту с промежуточной записью на диски по схеме D2D2T и создания “мгновенных копий” баз данных для тестирования и разработки новых приложений.

Поставки RecoverPoint начнутся в марте 2006 г. Тогда же будут объявлены и цены на этот продукт.