ТЕМАТИЧЕСКИЙ ОБЗОР

За прошедшие пять лет рынок дисковых массивов претерпел радикальные изменения. В начале нынешнего десятилетия больше всего были распространены дисковые системы начального класса, рассчитанные на непосредственное подключение к серверу (Direct Attached Storage, DAS), либо внутренние дисковые подсистемы серверов. Только в крупных корпорациях были установлены так называемые "монолитные" массивы класса high end (классический пример - Symmetrix компании EMC), позволяющие с помощью технологии SAN построить централизованное хранилище данных в масштабе предприятия. Как показывают недавние отчеты аналитиков, системы среднего класса, выполненные в модульном конструктиве, стали безусловным фаворитом рынка дисковых массивов. И если в секторе high end за последний год уровень продаж практически не изменился, то модульные массивы продавались буквально как горячие пирожки. Например, у EMC во II квартале продажи модульного Clariion подскочили на 40% по сравнению с прошлогодним уровнем, в то время как доход компании от Symmetrix увеличился всего на несколько процентов.

Основные характеристики дисковых массивов

В чем же причина такой популярности модульных массивов? Если массивы старшего класса представляют собой один или несколько шкафов, заполненных дисками, то модульные системы строятся из устанавливаемых в стандартную 19-дюймовую стойку блоков - одного управляющего, где размещена вся процессорная логика, и нескольких блоков расширения (обычно это дисковые полки на 12-14 накопителей, не имеющие своих процессоров, т. е. относящиеся к классу JBOD). Такой модульный принцип построения массивов среднего класса делает их доступными по стоимости даже для компаний с ограниченным ИТ-бюджетом - можно сначала купить управляющий модуль с минимальным числом дисков, а затем постепенно приобретать дополнительные накопители или модули расширения. Если в 2002-м уровень цен на модульные массивы начинался примерно со 100 тыс. долл., то сейчас он снизился до 20-30 тыс. долл. (для сравнения - даже в самой скромной конфигурации монолитный массив стоит около полумиллиона долларов, поэтому приобретение такой системы могут позволить себе только крупные предприятия). Кроме того, модульные массивы экономят место в корпоративных центрах данных - в одну стойку вместе с ними можно установить серверы, ленточную библиотеку и сетевое оборудование.

К настоящему времени производители модульных массивов реализовали в них большинство необходимых для построения централизованной инфраструктуры хранения функций, которые ранее поддерживались только в системах класса high end: поддержка SAN и одновременное обслуживание серверов с разными ОС, средства управления дисковыми томами, контроля и настройки производительности массива, получение "мгновенных снимков" данных на дисках и зеркалирование между дисками, поддержка нескольких уровней RAID (чаще всего применяются RAID 0 (простое расщепление, stripe, данных по нескольким дискам), RAID 1 (зеркалирование данных между двумя дисками) и RAID 5, при котором данные расщепляются и на отдельном диске сохраняется контрольная сумма четности) и кластерных конфигураций. Стандартом для модульных массивов стали и средства обеспечения высокой готовности, обеспечивающие отсутствие в системе точки одиночного отказа - дублированные RAID-контроллеры, "горячая" замена блоков и вентиляторов. Кроме того, в некоторых из них, например HDS Thunder 9500V, реализована функция call home - автоматический звонок в центр поддержки компании-изготовителя при обнаружении в системе потенциальных проблем с дисками.

С прошлого года во многих модульных массивах была встроена поддержка накопителей с интерфейсом SATA, хотя уступающих по быстродействию традиционным для таких систем дисков с интерфейсом Fibre Channel (FC), но зато существенно более выгодных по стоимости хранения одного гигабайта данных. Полки расширения с дисками SATA сейчас чаще всего применяются для хранения резервных копий и мгновенных снимков данных, а также электронных архивов, т. е. там, где объемы данных велики и не требуется максимальной скорости доступа. Однако диски SATA имеют еще один существенный минус по сравнению с винчестерами Fibre Channel - они менее надежны и, хотя обращение к ним происходит не так часто, риск потери данных из-за аппаратного сбоя все же достаточно высок. Эту проблему должна решить технология RAID 6, которая в нынешнем году получит статус стандарта. Она похожа на RAID 5, но для повышения надежности хранит контрольные суммы не на одном диске, а на двух, что позволяет восстановить данные даже в случае выхода из строя двух накопителей. Применение RAID 6 снижает быстродействие массива и его полезную емкость, но поскольку эта технология рассчитана на относительно дешевые SATA-диски, то ее недостатки перевешивает улучшенная защита от аппаратных сбоев.

И все же существует ряд задач, которые остаются прерогативой систем high end. Это прежде всего консолидация хранения в масштабах крупного предприятия (примерно от 300-500 пользователей), для которой модульные массивы неспособны обеспечить необходимый уровень емкости (обычно они поддерживают не более 300 дисков, в то время как монолитные системы способны вместить свыше 1000 приводов), производительности подсистемы ввода/вывода и подключение к большому числу серверов. Кроме того, у модульных массивов, как правило, отсутствует поддержка географически распределенных кластеров, поэтому для построения катастрофоустойчивых вычислительных комплексов по-прежнему используются монолитные массивы. Наконец, модульные массивы поддерживают только "открытые системы" (компьютеры, работающие под управлением Windows, Linux и Unix), но не мэйнфреймы и серверы IBM eServer iSeries (AS/400). Правда, есть три модели модульных массивов, которые плохо вписываются в традиционное деление на модульные массивы среднего класса и монолитные старшего, а именно EMC Symmetrix DX800, IBM DS6000 и только что анонсированный HDS NCS55. В них полностью реализован функционал моделей старшего класса, однако из-за модульной конструкции они уступают монолитным системам по емкости и производительности. Хотя IBM и HDS относят их к среднему классу, на наш взгляд, их правильней рассматривать как особый тип систем high end, имеющий более низкую начальную цену, которая все же выше, чем у обычных модульных массивов.

Судя по данным, которые не так давно огласили московские представительства EMC и HDS, в России продажи модульных массивов у этих компаний успешно развиваются - за 2004 г. было поставлено 99 систем Clariion и более 130 Thunder. Учитывая, что в качестве своих основных конкурентов оба вендора рассматривают HP и IBM, можно предположить, что и у этих двух корпораций годовой объем российских продаж модульных систем примерно на том же уровне (100 и более систем). Но имеется ряд проблем, мешающих продвижению модульных дисковых систем в нашей стране. Прежде всего это ограниченный бюджет на покупки ИТ, из-за чего российские предприятия часто вынуждены приобретать систему в конфигурации, которая не соответствует масштабу задач. Кроме того, директор аналитического агентства Elashkin Research Михаил Елашкин отмечает, что многие заказчики все еще рассматривают дисковые системы всего лишь как периферийное оборудование и при реализации проекта построения корпоративного центра обработки данных основные деньги идут на приобретение мощного сервера и по остаточному принципу для него покупается недорогой массив. В результате массив, мощности которого не хватает на обработку запросов ввода/вывода от сервера, становится узким местом всего вычислительного комплекса.

EMC Clariion CX

Зарубежные аналитики рассматривают выпущенную в 2002 г. серию Clariion CX как лидера рынка систем хранения среднего класса (например, в своих последних анонсах модульных систем HP и IBM сравнивали свои продукты именно с Clariion CX). Успех этого продукта EMC определяется несколькими составляющими. Во-первых, в Clariion CX использованы те же хорошо проверенные на практике программные средства управления, что и в системах старшего класса Symmetrix, поэтому системным администраторам компаний, где уже установлены флагманские массивы EMC, не нужно осваивать новые инструменты для обслуживания модульного массива. Во-вторых, под своими торговыми марками Clariion CX продвигают входящие в пятерку крупнейших производителей серверов Dell и Fujitsu Siemens Computers, а первая из них даже выпускает модель CX300 на собственных заводах. Наконец, применение в Clariion CX стандартных компонентов позволило EMC установить агрессивные цены на свои массивы и фактически первой предложить модульную дисковую систему дешевле 100 тыс. долл.

Семейство EMC Clariion CX

Успеху Clariion CX способствует и постоянное расширение функциональности этих дисковых массивов. Например, с февраля в моделях CX300/CX500 поддерживается протокол iSCSI, позволяющий построить сеть хранения SAN на базе Ethernet.

В московской фармацевтической компании "Морон" уже несколько лет действует программно-аппаратный комплекс централизованного заказа лекарств. Когда весной 2004 г. в связи с ростом числа заказов потребовалось приобрести новый сервер, то компания выбрала четырехпроцессорный Kraftway G-Scale ET10, к которому в качестве системы хранения DAS был приобретен Clariion CX300. Как поясняют сотрудники "Морона", продукт EMC привлек их тем, что производитель дал комплексную гарантию на его совместимость с Itanium-сервером, в том числе с серверной ОС и адаптерами Fibre Channel.

HP StorageWorks EVA

Концепция виртуализации VersaStor, реализованная в дисковом массиве EVA, была разработана инженерами Digital Equipment еще в конце 1990-х, а первый массив этой серии компания Compaq представила в конце 2001-го, незадолго до слияния с HP, так что он может считаться одним из пионеров среди модульных массивов. По утверждению HP, на сегодняшний день EVA единственный среди продуктов, предлагаемых лидерами рынка систем хранения, поддерживает технологию виртуализации. Как указывают специалисты компании, виртуализация, реализованная в EVA, не ограничивается только организацией RAID из физических дисков. EVA объединяет емкость своих дисков в виртуальный пул, из которого системный администратор может "нарезать" блоки с разными характеристиками производительности и надежности, а массив автоматически выполняет необходимые операции с дисками на физическом уровне. По данным производителя, автоматизация управления дисковым пространством сокращает в два-три раза затраты на обслуживание системы по сравнению с традиционными "невиртуализованными" модульными массивами.

HР StorageWorks

EVA8000

Еще одна уникальная особенность EVA - это диски FATA, специально разработанные для дискового массива совместно с компанией Seagate. По своей механической конструкции FATA не отличаются от обычных винчестеров SATA, но благодаря наличию в них интерфейса Fibre Channel их можно непосредственно устанавливать на одной полке с FC-дисками, а не приобретать для них отдельную полку. FATA-диски предназначены для тех же задач, для которых другие производители массивов используют SATA - для резервного копирования, хранения мгновенных снимков, архивных данных. Однако по быстродействию, как и обычные SATA, они уступают FC-дискам, поэтому RAID-группы нельзя строить из накопителей разного типа.

В нынешнем полугодии HP существенно обновила линейку EVA - сначала для этих дисковых массивов была реализована поддержка географически распределенных кластеров, а затем они были снабжены более мощными контроллерами, увеличился размер кэша и число портов Fibre Channel. По данным компании, новые модели EVA, представленные в мае (см. PC Week/RE, N19/2005, с. 1), на 200-375% превосходят по производительности ранее выпускавшиеся EVA3000/5000.

HP продвигает EVA как систему хранения для своих моделей среднего класса серверов Integrity и HP9000, а также Unix-серверов других производителей. В России их используют промышленные предприятия (среди них Западно-Сибирский металлургический комбинат), операторы мобильной связи (один из них установил систему емкостью в несколько десятков терабайтов), банки (например, в одном из банков реализована репликация между двумя EVA) и сети магазинов розничной торговли.

HDS Thunder 9500 и TagmaStore WMS100/AMS200/AMS500

Модульные дисковые массивы Hitachi Data Systems (HDS) долгое время оставались в тени выпускаемых этой компанией систем старшего класса Lightning, которые под торговой маркой StorEdge 9900 продает компания Sun, а также их OEM-версии HP StorageWorks XP. Примерно два года назад HDS скорректировала свои приоритеты с учетом роста популярности модульных систем и начала энергично продвигать Thunder. Хотя в отличие от EMC у нее нет таких мощных партнеров, как Dell и Fujitsu Siemens Computers (правда, в прошлом году реселлером Thunder стала российская компания Kraftway), HDS основную ставку делает на широкое использование в своих модульных массивах технологий, обкатанных на Lightning. Более того, старшая модель Thunder 9585V поддерживает удаленную репликацию данных с Lightning, поэтому если обычно для построения катастрофоустойчивых комплексов на основном и резервном центре обработки данных должны стоять дисковые массивы класса high end, то при использовании тандема Lightning /Thunder 9585V в качестве резервной дисковой системы можно установить более дешевый модульный массив.

HDS TagmaStore

AMS500

11 июля HDS полностью обновила линейку своих модульных массивов (за исключением самой старшей модели). Подробно об этом мы рассчитываем рассказать в следующем номере PC Week/RE, а пока отметим основные усовершенствования по сравнению с Thunder 9500V:

- увеличение емкости и производительности;

- поддержка RAID 6;

- распределение разделов кэш-памяти между разными приложениями;

- использование 4-Гб Fibre Channel;

- поддержка iSCSI и возможность использования в качестве систем хранения NAS.

Кроме того, компания решила объединить все свои дисковые массивы под брендом TagmaStore, который она впервые использовала для монолитных систем TagmaStore USP.

В России первые инсталляции Thunder были выполнены в начале 2003 г. и, как отмечают представители московского офиса HDS, после выпуска в конце прошлого года модели Thunder 9520V с дисками SATA (сейчас ей на смену приходит TagmaStore WMS100) число поставок систем резко пошло вверх. Среди заказчиков, у которых установлены Thunder 9500V, - Уральский банк реконструкции и развития и телевизионный канал СТС.

IBM TotalStorage DS4000 (FAStT)

Системы FAStT, в конце прошлого года получившие название DS4000, разработаны IBM на основе модульных массивов производства Engenio (бывшего подразделения LSI Logic, выделившегося в самостоятельную компанию). В них реализованы функции мгновенного копирования, удаленного зеркалирования данных, а также динамического изменения размера томов. В то же время упоминавшийся выше модульный массив DS6000, в котором имеется практически вся функциональность DS8000, IBM в настоящее время позиционирует как систему хранения для заказчиков, у которых есть мэйнфреймы или системы iSeries, а также для резервных вычислительных центров в качестве дублера DS8000.

IBM TotalStorage

DS4800

В мае IBM представила новую флагманскую модель DS4800. В ней применен новейший 4-Гб интерфейс Fibre Channel, за счет чего максимальная пропускная способность системы выросла до 1600 Мб/с.

Системы DS4000 (FAStT) установлены в московском Межведомственном суперкомпьютерном центре (здесь четыре FAStT обслуживают суперкомпьютер МВС-1000), петербургской торговой сети "Лента", уральском интернет-магазине "Сфера", Объединенном энергетическом управлении Урала, на Оскольском электрометаллургическом комбинате.

Network Appliance FAS

Компания Network Appliance (NetApp) занимает особое место среди производителей дисковых массивов. С момента своего основания в 1992 г. она специализировалась на системах хранения класса NAS (файл-серверных приставках, или файлерах) и является признанным лидером в этом секторе. Примерно два года назад руководство NetApp решило расширить функциональность своей продукции и реализовала для файлеров поддержку блочного доступа к данным, применяемого в сетях хранения, что позволило применять FAS в составе SAN. Впоследствии компания отказалась от самого термина "файлер" и сейчас позиционирует FAS как универсальные системы хранения.

NetApp FAS3050

Как свидетельствуют последние отчеты аналитиков, NetApp за последний год удалось увеличить объем продаж почти на 30%, что объясняется простотой настройки и управления FAS (не забудем, что они изначально разрабатывались как приставки), поддержкой в них протоколов NAS и SAN, а также применением ряда интересных фирменных технологий, например динамического выделения емкости при операциях записи, репликации данных FlexClone, существенно экономящей пространство, занимаемое мгновенными снимками, и RAID DP, похожей на RAID 6, но работающей быстрее не только шестого, но и пятого RAID. Кроме того, во всей линейке FAS используется единая архитектура и операционная система Data ONTAP, поэтому для модернизации даже младшей модели FAS250 до флагманской FAS980 достаточно только установить новый управляющий модуль и не требуется переписывания данных или переформатирования дисков.

В нашей стране первая система NetApp была установлена в 2001 г. в Межведомственном суперкомпьютерном центре. Сейчас основными пользователями FAS у нас являются отделения зарубежных компаний, закупающие технику NetApp по корпоративным контрактам (среди них - представительство Intel). Тем не менее можно ожидать, что в ближайшее время круг российских покупателей массивов NetApp расширится - прошлой осенью компания открыла московский офис, а весной заключила соглашение с IBM, по которому последняя получает право на поставки OEM-версий FAS.

Sun StorEdge 6920

Линейка модульных массивов Sun Microsystems состоит из трех моделей - StorEdge 6120/6320, представляющих собой OEM-версию систем Engenio, которые IBM поставляет как DS4000, и собственной разработки StorEdge 6920, основанной на технологиях фирмы Pirus, приобретенной Sun в 2002 г. Главная особенность StorEdge 6920 - объединение в пул внутренних дисков и ресурсов внешних дисковых массивов. Стоит также отметить, что он существенно превосходит остальные модульные массивы по объему кэш-памяти и числу хост-портов.

Sun StorEdge 6920

Нынешней весной Sun представила новые программные инструменты для StorEdge 6920, расширяющие возможности виртуализации дискового массива. Программа Pool Manager реализует консолидацию хранения с помощью виртуализации систем разных вендоров, Data Replicator выполняет удаленную репликацию томов данных с дисковых массивов Sun, а также EMC и HP для защиты от локальных и крупномасштабных аварий, Data Mirror позволяет создать полную копию томов данных приложений, которую можно использовать для резервного копирования и тестирования и быстро синхронизировать с оригиналом. Наконец, Data Snapshot предназначена для получения мгновенных снимков данных приложений.

Adaptec SANbloc/ FS4500

Массив SANbloc 2Gb RAID компании Adaptec, построенный на основе двухгигабитного Fibre Channel, рассчитан на обслуживание сетей SAN и кластеров. Он оборудован двумя заменяемыми в горячем режиме двухпортовыми RAID-контроллерами, дублированными источниками питания, блоками вентиляторов, а также энергонезависимой кэш-памятью и системой контроля окружающей среды. Поставляемое в комплекте с массивом ПО Storage Director осуществляет локальное и удаленное управление SANbloc в гетерогенной среде, а программная утилита PATHpilot реализует переключение приложений и каналов ввода/вывода при сбоях.

Другой дисковый массив этой же компании FS4500 Fibre to SATA RAID использует более дешевые диски SATA и предназначен для хранения архивных данных и неструктурированного контента. Для повышения надежности в нем применена фирменная технология Dual Channel Multiplexer, реализующая доступ к диску обоих RAID-контроллеров. Кроме того, для упрощения интеграции массива в среду Fibre Channel RAID-контроллеры "маскируют" SATA-характеристики винчестеров и показывают их хост-компьютерам как высокопроизводительные накопители FC.

Adaptec FS4500

В Санкт-Петербургском монетном дворе 4-Гб Adaptec FS4500 служит в качестве централизованной системы хранения оперативных данных. Ее внедрение взамен ранее использовавшегося хранения данных на внутренних дисках серверов позволило решить проблему нехватки емкости, ускорить и упростить процесс резервного копирования, повысить его надежность, а также обеспечить доступность данных при замене ОС на серверах.

Перспективы на будущее

По всей видимости, рост популярности SATA-дисков как экономичного решения для хранения больших объемов данных будет продолжаться. Этому будет способствовать и внедрение RAID 6, а также появление накопителей SATA с быстродействием 10 тыс. об/мин (сейчас оно не превышает 7200 об/мин, а диски Fibre Channel вращаются со скоростью 10 либо 15 тыс. об/мин). В начале следующего года начнется массовое внедрение дисков Serial SCSI с теми же показателями быстродействия и надежности, что и у модели с интерфейсом Fibre Channel, но их можно устанавливать в одной полке с SATA. В более далекой перспективе - переход на 2,5-дюймовые накопители, который позволит не только сделать массивы компактнее, но и повысить их производительность за счет более эффективного распараллеливания операций чтения и записи между большим числом дисков.

Также можно ожидать, что в ближайшее время производители массивов перейдут на 4-Гб Fibre Channel и для значительного числа моделей будет реализована поддержка iSCSI и протоколов NAS.