ОБЗОРЫ

    

Резервное копирование не относится к числу тех технологий, которые пользуются особой популярностью на российском ИТ-рынке. С одной стороны, во многих малых и средних фирмах все еще невелик объем накопленной информации, важной для их бизнеса, и для ее резервного копирования вполне хватает емкости встроенного в сервер автозагрузчика, одиночного стримера либо даже съемного винчестера. С другой - эффект от внедрения системы сетевого резервного копирования с использованием мощной ленточной библиотеки трудно выразить в деньгах или каких-либо количественных показателях улучшения производительности, понятных руководству предприятия (например, таких как сокращение времени обработки запросов или рост числа обслуживаемых пользователей), и поэтому при распределении бюджета на ИТ основные средства выделяются на другие проекты. Кроме того, часто случается, что организация приобретает дорогой RAID-массив, в котором применяются различные средства предотвращения сбоев, и считает, что хранящиеся на нем данные будут надежно защищены, а значит, их резервным копированием можно пренебречь. Наконец, у традиционной технологии резервного копирования с использованием ленточных накопителей имеется ряд серьезных недостатков, прежде всего низкая скорость записи информации на ленту, из-за чего при больших объемах данных переписывание на ленту резервной копии не удается завершить за ночную смену, так что эту процедуру обычно запускают в конце рабочей недели.

Рис. 1. Затраты времени при резервном копировании

Не следует забывать, что главная цель резервного копирования - это обеспечение восстановления данных, однако согласно некоторым оценкам сейчас в 20-40 процентах случаев попытка считать резервную копию с ленты заканчивается неудачей. И хотя эти неудачи могут объясняться как проблемами ленточной технологии (например, износом ленты или привода), так и другими причинами (чаще всего ошибками оператора), факт остается фактом: процесс резервного копирования на ленту слишком медленен, сложен и ненадежен и поэтому не соответствует требованиям к ИТ-системам современной компании. Кроме того, проверить правильность резервной копии, хранящейся на ленте, практически невозможно из-за больших затрат времени на выполнение этой операции.

Ускорить резервное копирование можно, если производить запись копий не на ленту, а на более быстрые жесткие диски. Такой подход довольно давно используется в дисковых RAID-массивах класса high-end, построенных на основе технологии Fibre Channel, - данные копируются на другие накопители, установленные в том же массиве. Но для большинства компаний эти системы слишком дороги (их стоимость составляет несколько сот тысяч долларов), а приобретение дополнительных дисков Fibre Channel и специализированного ПО, выполняющего такое копирование, также требует значительных расходов. Кроме того, поскольку стоимость хранения на дисках Fibre Channel высока, резервные копии затем все равно надо переносить на ленту.

Более доступным по стоимости решением является использование для резервного копирования выпускаемых для настольных ПК дешевых ATA-дисков. Массивы на основе таких накопителей вышли на рынок в начале нынешнего десятилетия, и в настоящее время для них выпускаются специальные модели ATA-винчестеров с емкостью 250-500 Гб. Применение в этих массивах механизма RAID-5 обеспечивает повышенную надежность системы, и при выходе из строя одного из дисков RAID-группы хранящиеся на нем резервные копии можно будет восстановить.

Но прежде чем рассмотреть различные варианты использования ATA-массивов в резервном копировании, попробуем выяснить, почему же лента работает медленнее, чем жесткие диски.

Почему лента отстает от дисков по скорости

Разработчики современных ленточных накопителей постоянно наращивают производительность своих продуктов. Например, у второй версии популярного ленточного формата LTO Ultrium она равна 40 Мб/с, а у выпущенной в конце прошлого года LTO-3 - 80 Мб/с. Как отмечает технический консультант московского представительства компании Computer Associates Михаил Митрошин, далеко не всякий компьютер способен выдавать данные на ленточный привод с такой скоростью, и если резервное копирование выполняется слишком долго, то это может быть связано с такими проблемами, как недостаточная производительность сервера резервного копирования, неправильная настройка установленного на нем управляющего ПО, неравномерное поступление данных с клиентских машин или низкая пропускная способность локальной сети. В таких случаях замена ленты на жесткие диски скорее всего проблемы не решит.

Распределение затрат времени при записи данных на ленту хорошо иллюстрируют результаты тестов, проведенных в лаборатории корпорации EMC, в ходе которых сравнивалось резервное копирование файлов с помощью ПО Veritas NetBackup на ее ленточную библиотеку и "дисковую библиотеку" Clariion DL. Как видно из рис. 1, разница в скорости передачи данных у диска и ленты незначительна, однако прежде чем начнется запись на ленту, ее нужно загрузить в привод, перемотать, а по завершении записи извлечь из привода. Выполнение этих операций продолжается почти две минуты. В то же время при восстановлении (рис. 2) только на позиционирование ленты уходит от шести до десяти минут, а при небольших размерах файлов сама передача данных продолжается не более одной десятой от общей продолжительности восстановления с ленты! В результате на восстановление даже одного файла может уйти несколько часов, что вряд ли устроит руководителя, в последний момент обнаружившего, что он по ошибке стер из своего почтового ящика важное письмо (по статистике 80% запросов на восстановление данных по резервной копии приходит от пользователей, которые случайно удалили или испортили файлы).

Рис. 2. Затраты времени при считывании резервной копии

Таким образом, хотя скорость передачи данных у современных ленточных накопителей и приближается к скорости жестких дисков, однако из-за применяемой в них последовательной записи и чтения, а также ввиду необходимости установки картриджа с лентой в привод общая продолжительность резервного копирования и восстановления у ленточных систем оказывается в несколько раз больше, чем у дисковых массивов, обеспечивающих произвольный доступ к данным.

Резервное копирование Disk-to-Disk

Наиболее простая реализация резервного копирования на диск Disk-to-Disk (D2D) - это применение тех же технологий, опробованных на дисковых массивах high-end, т. е. копирование внутри дискового массива, но с использованием дешевых ATA-дисков, тем более что для большинства современных модульных массивов выпускаются полки расширения с такими накопителями. Однако этот подход не обеспечивает доступность данных при выходе из строя самого дискового массива - ясно, что при его неисправности (например, поломке RAID-контроллера) нельзя будет считать резервные копии с ATA-дисков.

Вместо этого можно приобрести отдельный дисковый массив на ATA-дисках с хорошим запасом по емкости и хранить резервные копии на нем. Такие массивы предлагают многие производители систем хранения (например, HDS TagmaStore AMS200, HP StorageWorks MSA1500, IBM DS4100 и Storagetek FlexLine 600), однако есть и специализированные ATA-массивы для резервного копирования, скажем, EMC Clariion DL и Network Appliance NearStore (их характеристики приведены в таблице), в которых реализована дополнительная функциональность. Например, Clariion DL позиционируется как устройство для замены ленточных библиотек, способное эмулировать эти системы и их ленточные приводы, а также поддерживающее наиболее распространенное ПО резервного копирования, а в продукте NetApp (рис. 3) с помощью технологии SnapVault реализована инкрементальная передача блоков данных, благодаря которой уменьшается трафик по сети, создаваемый при резервном копировании. Кроме того, в массивах D2D используются программные утилиты, помогающие системному администратору отслеживать выполнение копирования и загрузку дискового пространства, а также организовывать внутри массива разделы, которые выделяются для хранения резервных копий, созданных с помощью разных ОС.

Рис. 3. NetApp NearStore R200 (файл vtl1.tif)

    

    

Лента остается

Как утверждает EMC, при использовании Clariion DL резервное копирование выполняется на 30-60% быстрее, чем при записи на ленту, а при восстановлении с резервной копии выигрыш в скорости доходит до 90%. Не удивительно, что за последние два года сектор специализированных массивов D2D стал одним из самых быстрорастущих сегментов рынка систем хранения. Например, компания Overland Storage, известная как один из ведущих производителей ленточных библиотек, за последний квартал прошлого года продала своих ATA-массивов REO больше, чем за предыдущий. И тем не менее говорить о вытеснении ленты жесткими дисками пока рано - по данным исследовательского агентства Freeman Reports, за прошлый год продажи ленточных библиотек выросли на 13,5%, а в нынешнем году оно ожидает увеличения объема продаж на 7% в денежном или на 10% в штучном выражении.

Основной секрет "долголетия" ленточных технологий, которые применяются с 1952 г., - это низкая стоимость хранения. Хотя ленточные системы работают медленнее, чем дисковые массивы, магнитная лента остается самым дешевым электронным носителем информации: 1 Гб емкости магнитной ленты стоит 1-4 долл., а для ATA-дисков этот показатель составляет 4-10 долл. Таким образом, хранение каждого терабайта на дисках обойдется на несколько десятков тысяч долларов дороже, чем на лентах. Кроме того, в отличие от жестких дисков ATA-массива картриджи с магнитными лентами большую часть времени не требуют электропитания и их можно извлечь из библиотеки и хранить отдельно, поэтому ленточные системы позволяют сэкономить на энергопотреблении и площадях в помещении центра обработки данных (ЦОД). Ленточные библиотеки обладают и более эффективной масштабируемостью - если емкость дисковых массивов увеличивается с установкой новых накопителей или полок расширения, то по исчерпании емкости библиотечных картриджей часть их можно вынуть и отправить в хранилище, а на освободившееся место поставить чистые.

Большинство опрошенных нами российских специалистов по системам хранения полагают, что по экономическим соображениям решения D2D стоит применять только в тех случаях, когда объем резервных копий не превышает нескольких терабайтов, а для защиты больших объемов информации следует применять магнитную ленту. Например, менеджер российского представительства HP Дмитрий Матчин считает, что D2D следует рассматривать как временное решение для компаний, которые в будущем планируют внедрить резервное копирование на основе ленточных технологий.

Стоит отметить и еще на одно важное преимущество магнитной ленты с точки зрения Disaster Recovery (защиты от крупномасштабных аварий). Ленточные картриджи, на которых записаны резервные копии, можно хранить удаленно (например, в специальном хранилище или дома у системного администратора), а в случае выхода из строя ЦОД их содержимое считывается с помощью другого ленточного привода. Для дисковых систем Disaster Recovery реализуется путем дистанционной репликации на резервный ЦОД, где должен быть установлен второй дисковый массив. Хотя такое решение позволяет проводить восстановление данных намного быстрее, чем с лент, оно требует инвестиций в создание резервного ЦОД, закупку второго массива, приобретение специального ПО репликации и аренду каналов связи. Далеко не каждая крупная компания располагает бюджетом на ИТ, который позволит сделать такие крупные инвестиции.

Наконец, в случае возникновения аварийных ситуаций в здании, где расположен ЦОД (скажем, при угрозе пожара или наводнения), когда системный администратор должен покинуть помещение за несколько минут, он вряд ли успеет вынести дисковый массив. Разумеется, так же невозможно вынести и ленточную библиотеку, а вот ленточные картриджи с последними по времени резервными копиями занимают немного места и вполне уместятся в портфеле или сумке, так что администратор может захватить их с собой.

Резервное копирование D2DT и VTL

Как мы видели, появление ATA-массивов не означает полного отказа от резервного копирования на ленту, однако сочетание технологий дисков и лент позволяет реализовать новую схему резервного копирования Disk-to-Disk-to-Tape (D2D2T), при которой данные с основного дискового массива сначала переносятся на ATA-массив, а с него - на ленту (D2D2T поддерживается как стандартная функция либо опция в большинстве массивов D2D). Наиболее простая реализация D2D2T - использование ATA-массивов для временного хранения (staging) резервных копий, т. е. данные быстро переписываются на диск, что позволяет уменьшить до минимума "окно" резервного копирования, в течение которого приостанавливается работа основных приложений.

Возможен также и другой сценарий D2D2T: на ATA-массиве хранятся последние по времени резервные копии, которые по мере устаревания или исчерпания свободной емкости дисков переносятся на ленту. Такой механизм, аналогичный трехуровневой схеме HSM (иерархического хранения данных), когда лента используется только для архивного хранения, обеспечивает быстрое восстановление последних версий файлов.

D2D2T хорошо подойдет для тех компаний, которые начинают с нуля строить систему резервного копирования или уже внедрили решение D2D. Но как быть корпорациям, уже вложившим значительные средства в инфраструктуру резервного копирования на основе ленточных технологий - ведь добавление ATA-массива для реализации D2D2T потребует изменения отлаженной годами схемы работы копирования на ленту? Для таких заказчиков предназначен еще один тип специализированных устройств - виртуальные ленточные библиотеки VTL (virtual tape library), полностью эмулирующие физические ленточные библиотеки и приводы, благодаря чему их интеграция в существующую инфраструктуру резервного копирования потребует минимальных усилий.

Поскольку VTL одновременно может эмулировать несколько приводов, запись резервных копий на диски производится параллельно, что сокращает время резервного копирования. Кроме того, в VTL применяется специализированная файловая система, оптимизированная для чтения и записи на ленту, благодаря чему по производительности они обгоняют собранные из обычных ATA-массивов решения D2D2T. В то же время VTL стоят дороже ATA-массивов и для них нужно приобретать дополнительные лицензии на ПО резервного копирования.

Характеристики дисковых массивов D2D и виртуальных ленточных библиотек

Одним из примеров виртуальной ленточной библиотеки является HP StorageWorks VLS 6000 (рис. 4), состоящая из дискового RAID-массива StorageWorks MSA и управляющего Intel-сервера HP ProLiant. Для экономии места на дисках в ней используется аппаратное сжатие копируемых данных. Пока VLS 6000 может эмулировать только ленточные библиотеки и автозагрузчики самой HP, но, по-видимому, в будущем список поддерживаемого оборудования расширится.

Рис. 4. HP StorageWorks VLS6000 (файл vtl2.jpg)

К классу VTL относятся и появившиеся в конце 1990-х системы IBM Virtual Tape Server и StorageTek VSM. Основное назначение этих разработанных для обслуживания мэйнферймов виртуальных библиотек - виртуализация емкости лент (правда, в этом году вышла версия VSM для открытых систем). Дело в том, что ленты, на которых хранятся резервные копии, часто бывают заполнены менее чем наполовину, и если в компании существуют сотни или тысячи таких лент, то объединение их в единый пул позволяет добиться существенной экономии. Принцип виртуализации ленточного пространства применяется и в библиотеке Fujitsu Siemens CentricStor (рис. 5), однако эта система может служить и в качестве D2DT, и для организации централизованного резервного копирования на ленту в тех фирмах, где используются несколько ленточных библиотек либо разные форматы ленточных накопителей.

Рис. 5. Fujitsu Siemens CentricStor (файл vtl3.jpg)

Программные решения

Все основные пакеты ПО сетевого резервного копирования сейчас поддерживают технологии D2D, D2DT и VTL - например, в Veritas NetBackup для реализации этих механизмов предназначены опции Disk Storage Unit и Disk Staging Storage Unit, в Veritas Backup Exec - функция Backup-to-Disk и опция Advanced Disk Based Backup Option, в Legato Networker - опция DiskBackup, а в последней версии HP OpenView Storage Data Protector появилась функция File Library для копирования на ATA-массивы. Кроме того, на рынке имеется несколько специализированных программных решений, с помощью которых можно построить систему VTL (правда, в отличие от варианта с приобретением готовых VTL покупателю придется самому выполнять инсталляцию и настройку этого ПО на своем дисковом массиве).

В сентябре нынешнего года Microsoft планирует выпустить собственный продукт D2D под названием Data Protection Manager (DPM), который будет тесно интегрирован с серверными версиями Windows и приложениями Microsoft Office. Этот пакет стоимостью от 950 долл. ориентирован прежде всего на рынок SMB, и Microsoft рекомендует использовать один сервер DPM для резервного копирования не более 2 Тб и не более 15 работающих под управлением Windows файл-серверов; при этом сама корпорация уже внедрила его в своих 130 филиалах вместо ленточных систем. Резервные копии с DPM из филиалов передаются по корпоративной сети в штаб-квартиру Microsoft, где записываются в мощные ленточные библиотеки. По оценкам корпорации, за два года применение DPM сэкономит ей около 800 тыс. долл. за счет сокращения расходов на ручные операции с ленточными накопителямиКроме того, внедрение этого решения существенно сократило время резервного копирования - например, в одном филиале копирование 300 Гб данных на ленту продолжалось восемь часов, а теперь с помощью DPM они переписываются на диск всего за 10 минут.

Особенностью нового продукта Microsoft является возможность восстановления файлов по резервной копии самими пользователями из окна Windows Explorer и непосредственно из приложений Office 2003, что существенно экономит рабочее время системного администратора.

Многие аналитики считают, что DPM может произвести переворот на рынке решений резервного копирования для SMB и повторить успех Windows Storage Server, который стал стандартом де-факто для NAS-систем начального уровня.

Внедрения

Согласно недавнему опросу читателей журнала InfoStor, специализирующегося на технологиях хранения данных, уже в 49% американских компаний внедрены решения резервного копирования с использованием жестких дисков, в 28% компаний планируется внедрить их в течение ближайших полутора лет и только 17% предприятий по-прежнему полагаются исключительно на магнитную ленту. В то же время по данным Freeman Reports доля компаний, которые полностью заменили ленту на жесткие диски, составляет всего несколько процентов.

Аналогичные данные по российскому ИТ-рынку нам не известны, однако и у нас отмечается рост интереса к решениям D2D и D2DT. По словам старшего системного инженера представительства Legato Павла Карнауха, первые в России внедрения таких решений с использованием Legato Networker выполнены несколько месяцев назад, а системный консультант Hitachi Data Systems Евгений Денисов сообщил, что D2D часто реализуются с использованием выпущенного в конце прошлого года ATA-массива HDS Thunder 9520V и ПО Veritas NetBackup. По словам менеджера по решениям высокой доступности компании "Ай-Теко" Романа Тюльпанова, ряд заказчиков использует D2D на основе Veritas Netbackup с дисковым массивом HP StorageWorks MSA или Thunder 9520V. В начале нынешнего года в медицинском центре Центрального банка РФ установлен дисковый массив NetApp NearStore R200 емкостью 8 Тб для резервного копирования по схеме D2D, а с 2004-го в Сибирском научно-аналитическом центре (СибНАЦ), специализирующемся на задачах геолого-геофизического анализа, ATA-массив BladeStore B280 компании StorageTek используется для промежуточного хранения копируемых на ленточную библиотеку данных.