ОБЗОРЫ

От того, где и как хранятся данные, существенно зависит бизнес компании. Постоянно увеличивающийся объем информации, возрастание ее важности и доступности, поставили задачу хранения в центр внимания всей ИТ-индустрии. По оценкам IDC, расходы на хранение данных в 2001 г. составят около 50% от всех затрат на информационные системы, а к 2002 г. увеличатся до 665 млрд. долл. И все это для того, чтобы избежать еще более высоких расходов из-за потерь доступа к хранилищам данных, которые в зависимости от приложения могут вылиться в суммы от 20 тыс. до 6 млн. долл. в час.

Независимые консалтинговые фирмы отмечают, что стоимость хранения данных больше чем на две трети состоит из стоимости обслуживания и поддержания их целостности (создание резервных копий, восстановление данных после потери и несанкционированного доступа и т. д.). Аналитики отмечают, что к концу прошлого года общий объем данных, хранимых компаниями на дисках (без учета архивов на магнитных лентах), превысил 2600 Пб (1 петабайт = 1000 терабайт = 1 000 000 гигабайт). По оценкам IDC, лидером продаж дисковых ЗУ по итогам 1999 г. стала корпорация Compaq Computer (20,6%), на втором месте EMC (14,4%); на третьем - IBM (12,8%), затем идут Hewlett-Packard (8,1%) и Sun Microsystems (7,5%).

Пример сети хранения данных SAN

Кроме накопления и использования значительных объемов данных, компании должны обеспечить доступ к этой информации, чтобы получить от нее максимум пользы. Корпоративные системы хранения в первую очередь должны обеспечивать высокую доступность и защищенность данных от сбоев и при форс-мажорных обстоятельствах. Иными словами, чтобы в случае возникновения критических ситуаций данные не утрачивались и доступ к ним мог быть восстановлен за приемлемое время. При этом длительность простоя определяется областью применения системы. Высокая доступность достигается обычно за счет использования избыточного дискового пространства (RAID), а также созданием копий в удаленных резервных центрах и с помощью средств переключения пользователей и серверов на удаленные системы хранения. При этом немаловажное значение имеет схема организации эффективного резервирования и архивирования корпоративных данных. Большое число устройств хранения данных, разбросанных по сети, при достижении ею определенного размера создает большие трудности для управления ресурсами хранения, выявления и устранения дефицита ресурсов. Администрирование усложняется разнообразием средств управления и необходимостью содержать значительный штат подготовленных сотрудников. Кроме того, использование прикладных систем от разных поставщиков и, как правило, на разных аппаратных платформах требует доступа с гетерогенных серверов к единым ресурсам хранения.

Итак, налицо необходимость обеспечить: доступность данных (гарантия выполнения операций за требуемое время); резервирование; разделение доступа; а также унифицированное управление хранилищами независимо от платформ и конфигураций. В разной степени удовлетворить требования к системе поддержки корпоративных хранилищ сегодня могут четыре модели: прямое подключение к серверам (DAS, Direct Attached Storage); централизованное хранилище (CS, Centralized Storage); сетевые устройства хранения (NAS, Network Attached Storage); выделенная сеть хранения (SAN, Storage Area Network).

Традиционная модель DAS не дает адекватного решения ключевых задач, кроме достижения высокой доступности. Помимо того, организация удаленного зеркалирования затруднена, часто возможна только транспортировка в резервный центр копий данных. Тем не менее, по данным ассоциации Fibre Channel Association, до недавнего времени около 95% информации хранилось на файловых серверах и непосредственно подключенных к ним дисковых массивах и других устройствах хранения.

Централизованное хранилище обычно реализуется на базе дискового массива большой емкости и некоторого количества каналов для подключения серверов. Как правило, имеется аппаратно реализованный массив RAID, обеспечивающий высокий уровень доступности, развитые средства управления и т. п. К недостаткам данной модели следует отнести ограниченную масштабируемость и высокую стоимость устройств. Кроме того, для резервного копирования и удаленного зеркалирования нужны специальные решения.

Генеральный менеджер IBM SSD Рон Килпатрик

представляет Enterprise Storage Server (кодовое название

Shark - “Акула”), который может хранить более 11 Тб данных

Устройства хранения типа NAS подключаются к уже имеющейся локальной сети и обмениваются по ней данными. Они легко устанавливаются и сравнительно недороги. Вместе с тем их использование ведет к увеличению сетевого трафика, в результате чего падает общая производительность сети.

SAN представляет собой выделенную сеть для высокоскоростного соединения серверов и устройств хранения данных, таких, как избыточные (RAID) и простые дисковые массивы JBOD (Just a Bunch of Disks), ленточные, оптические и CD-ROM-библиотеки и т. п. SAN предоставляет любому серверу доступ к любому накопителю, не загружая при этом ни другие серверы, ни локальную сеть. Возможен обмен данными между накопителями и без участия серверов. Для подключения к сети SAN используется протокол Fibre Channel.

Концепция SAN

Впервые концепция SAN была предложена в 1998 г. Она, естественно, возникла не на пустом месте. Как и многие другие современные компьютерные технологии, она была заимствована из мира мэйнфреймов, где применялась, например, в центрах обработки данных для подключения компьютеров к системам хранения и распределенным сетям через интерфейс ESCON. Благодаря высокой производительности и надежности, а также поддержке больших расстояний протоколом Fibre Channel сети SAN открывают новые возможности для построения серверных кластеров, совместного использования накопителей несколькими серверами и приложениями и для создания новых приложений защиты данных (резервное копирование). В то же время в сетях SAN осуществляется централизованное управление накопителями.

Основное различие между SAN и NAS состоит в способе организации обмена данными между устройствами хранения и серверами. Каждый из серверов NAS взаимодействует с локальной сетью с помощью стандартных сетевых протоколов, таких, как TCP/IP, и полностью контролирует передачу данных между подключенными к нему устройствами хранения и другими узлами в сети. Доступ к данным происходит только через выделенный сервер NAS. В случае, когда другим узлам необходимо обратиться к серверу, данные должны передаваться по локальной сети, что значительно увеличивает трафик в ней. SAN же допускает взаимодействие между любыми системами в сети, что позволяет избежать проблем, вызванных избыточной загрузкой сети. В отличие от архитектуры NAS, сеть хранения не использует существующую локальную сеть для передачи данных между серверами и устройствами хранения; данные перемещаются по самой сети хранения, не вызывая в локальной сети избыточного трафика.

Применение SAN дает возможность рассматривать все дисковые массивы предприятия как единый управляемый ресурс, который может быть легко перераспределен между различными серверами и приложениями. SAN обеспечивает эффективное наращивание и масштабирование дисковой системы предприятия. Это относится не только к дисковым системам, но и к другим накопителям, например ленточным и магнитооптическим библиотекам. Кроме того, SAN позволяет отказаться от применения большого числа накопителей малого объема в пользу нескольких крупных дисковых массивов и ленточных библиотек, что зачастую оказывается дешевле и облегчает администрирование.

Наиболее очевидное преимущество SAN - уменьшение нагрузки на основную локальную сеть. Как известно, резервное копирование обычно заметно замедляет работу других приложений. В случае же применения SAN оно практически никак не скажется на работе пользователей. Еще раз следует подчеркнуть другое необходимое для корпоративных сред качество SAN - почти неограниченную масштабируемость. Это касается как увеличения пропускной способности самой SAN, так и общей емкости системы хранения. Устройства хранения можно добавлять в сеть по мере роста потребностей, причем они оказываются доступны из любой точки сети.

Еще одно немаловажное преимущество - централизация управления,так как SAN позволяет управлять системой хранения как единым целым, что особенно ценно, когда она состоит из десятков или даже сотен устройств. Кроме того, все устройства хранения можно разместить в одном месте отдельно от серверов и обеспечить для них надлежащие условия окружающей среды, физическую защиту доступа и т. д. Это повышает и удобство обслуживания. Впрочем, устройства хранения могут находиться не только в разных помещениях, но и в разных городах, и все равно распределенная система будет оставаться для пользователя единым целым.

В состав сетей SAN входят обычно такие же компоненты, как и в локальные сети (LAN): адаптеры, оптоволоконные или медные кабели, хабы (концентраторы), коммутаторы, мосты и удлинители, ПО управления сетями. Теоретически возможны четыре типа подключения устройств SAN: точка - точка (подключение сервера к дисковому массиву), петля FC-AL (Fibre Channel Arbitrated Loop), коммутируемое подключение (подключение накопителей и серверов к FC-коммутатору), смешанное подключение (используются и коммутаторы, и хабы).

Простейшая сеть SAN представляет собой петлю FC-AL. Часто соединение устройств организуется при помощи концентратора. Это упрощает проводку и подключение устройств, а также позволяет автоматически изолировать отказавшие участки. Такая реализация наиболее экономична. Помимо концентратора по сути обязательным компонентом SAN является мост между Fibre Channel и SCSI, применение которого позволяет подключить к сети уже имеющиеся устройства.

Говоря о SAN, нельзя обойти стороной ОС, которые работают с ними. Согласно данным Gartner Group, среди ОС для SAN доминировали NT, Unix и OS/390.

Поддержка индустрии

Ожидается, что с развитием Интернета рынок SAN вырастет в течение пяти лет в 10 раз. Если в 1998 г. его оборот оценивался в 2,7 млрд. долл., то к 2003 г. он, по прогнозам, увеличится до 27 млрд. долл. Аналитики предсказывают, что 70% всех средних и больших предприятий к 2002 г. будут использовать SAN. О ее поддержке заявили все лидеры индустрии, многие из них не только выпустили или планируют к производству новые продукты, но и занимаются активным продвижением этой архитектуры.

Например, корпорация IBM (www.ibm.com) совместно со своими бизнес-партнерами уже организовала более 30 центров по разработке решений для SAN и планирует открыть еще столько же более чем в 20 странах. Осенью прошлого года IBM на базе компании Hetnet открыла первый в России демонстрационный центр решений корпорации в области SAN. Заказчики получили возможность не только увидеть реально работающие системы хранения данных и компоненты SAN, но также спроектировать и протестировать решение для конкретного окружения. В центре будут регулярно проводиться семинары по системам хранения данных с показом новых продуктов. Сейчас в нем демонстрируются все используемые на данный момент архитектуры IBM: от мэйнфреймов S/390 до персональных компьютеров, включая серверы RS/6000 и AS/400. Оборудование центра позволяет тестировать системы и приложения на базе самых современных компьютерных технологий.

Летом прошлого года Compaq Computer (www.compaq.com) предложила новые сети хранения данных, простые в эксплуатации и приемлемые по цене. Они позволяют Интернет-компаниям, отделениям и филиалам корпораций получить средства хранения данных с высокой скоростью передачи информации, отличающиеся простотой управления и высокой отказоустойчивостью. Новые решения Compaq StorageWorks RAID Array 4100 SAN не только помогают заказчикам преодолеть проблемы хранения данных, но и предоставляют гибкие возможности модернизации.

Система RA4100 SAN расширяет спектр средств Compaq, разработанных в соответствии с ее стратегией ENSA (Enterprise Network Storage Architecture), которая направлена на создание недорогих неоднородных реализаций SAN со средствами управления ресурсами, открывающих путь к будущим решениям Open SAN. В RA4100 SAN использованы средства управления, применяемые в продуктах серии StorageWorks и SANworks. Эти решения предусматривают интеграцию со стандартными серверами и поддерживают широкий спектр ОС, включая Windows NT Server, NetWare, Windows 2000, SCO Unix и Linux. RA4100 SAN имеет емкость 218 Гб, которую можно увеличить до 4 Тб.

Сеть SAN на базе RA4100 упрощает управление хранением, позволяет справиться со взрывным ростом данных и сокращает время простоев систем. Она объединяет средства хранения для нескольких серверов в централизованную сеть. Благодаря интеграции первичных и вторичных систем хранения решение на базе RA4100 увеличивает доступность, масштабируемость и производительность систем, а также делает более эффективной и удобной настройку, управление и обслуживание ресурсов хранения. В частности, сети хранения на базе RA4100 могут включать серверы Compaq и других производителей на платформе x86 с различными ОС. Соединение компонентов обеспечивается за счет коммутатора StorageWorks FC-AL Switch 8 с дополнительным трехпортовым модулем расширения. Резервное копирование и восстановление данных осуществляются с помощью ленточных устройств по общей инфраструктуре Fibre Channel. Входящие в сеть серверы соединяются с одной или несколькими библиотеками через контроллер Compaq Fibre Channel Tape Controller или маршрутизатор Modular Data Router. В августе 2000 г. корпорация Compaq открыла в Колорадо-Спрингс центр Enterprise Storage Customer Center для тестирования совместимости решений Open SAN.

В заключение надо отметить, что помимо несомненных достоинств SAN у них есть один серьезный недостаток - высокая стоимость. По мнению ряда экспертов, перед индустрией стоят два вопроса: во что выльется технология SAN и станут ли компании покупать системы хранения сами или же предпочтут услуги сторонних фирм - сервис-провайдеров (storage service providers, SSP).