ТЕХНИЧЕСКИЙ АНАЛИЗ

Без новой концепции хранения с множащимися данными не справиться

     Порой кажется, будто проблема корпоративного хранения данных в принципе уже решена. Остается, мол, только развивать проверенную временем технологию и совершенствовать управление информацией, чтобы свести к минимуму весьма дорогостоящую избыточность данных. Однако создатели ИТ-систем просто обязаны заглядывать как можно дальше вперед, иначе они рискуют оказаться в тупике эволюции жестких дисков. Пора начинать думать о других путях, помогающих укротить неумолимо множащиеся информационные массивы.

Развилки на пути к хранилищам будущего.

 

При выборе нужной технологии хранения приходится искать четкий баланс между четырьмя различными и зачастую противоречивыми требованиями: общей емкостью хранилища, скоростью доступа (как произвольного, так и последовательного - смотря что нужно конкретному приложению), физической плотностью записи и долговечностью среды хранения.

Улучшение одной из таких характеристик, к сожалению, довольно часто достигается за счет других. У новых технологий, обещающих прийти на смену магнитным дискам, есть не только сильные, но и слабые стороны. Поэтому корпорации и должны тщательно оценить все аспекты, не ограничиваясь одним только объемом хранения. Не меньшее внимание стоит уделить рабочим показателям и даже требованиям законодательства.

Исследователи из калифорнийского университета в Беркли выяснили, что в 2000-м на одного пользователя в среднем приходилось около 250 Мб сохраненных данных, а с каждым годом эта величина грозит почти удваиваться. Такой прогноз полностью подтвердился в 2003-м. Та же группа аналитиков определила, что за истекшие пару лет прежний показатель практически утроился, дойдя до ежегодного уровня в 800 Мб. В одном только Интернете к тому времени скопилось информации в 17 раз больше, чем на всех полках библиотеки Конгресса.

Если для оценки грядущих потребностей хранения воспользоваться простой экстраполяцией экспоненциального тренда, результат в равной степени может вызвать улыбку и чувство отчаяния. Даже при условии, что каждый атом будет отображать 1 бит информации, где-то около 2100 г. данными придется покрыть всю земную поверхность (чисто теоретически, конечно). Чтобы избежать столь мрачной перспективы, нужна скрупулезная политика экономной генерации данных, дополненная агрессивными алгоритмами сжатия мультимедийной информации и постоянным совершенствованием технологии хранения.

Поиск же практических путей повышения плотности записи быстро вводит инженеров в мир нанотехнологий, где габариты устройств измеряются нанометрами, т. е. миллионными долями миллиметра. IBM, скажем, уже выпускает электромеханические системы хранения с ячейками диаметром 10 нм (человеческий волос примерно в 6000 раз толще)... Да что там: даже в нынешних жестких дисках некоторые компоненты, не говоря уж о допусках, по размерам все ближе подходят к одиночному атому.

Впрочем, корпоративных покупателей ИТ больше волнует не физика, а финансовая сторона вопроса. За два последних десятилетия показатели хранилищ в долларовом выражении выглядят очень даже неплохо. Как ни сильно различаются конкретные цифры (это зависит от уровня устройства), общая тенденция удешевления налицо. Более того, по мнению Стива Джилени, старшего системного инженера консультационной фирмы ArchiveBuilders.com, специализирующейся на управлении документооборотом, кривая имеет чисто экспоненциальный вид.

Об этом говорит и анализ, который Джилени провел в 2000 г., сопоставив исторические тенденции с развитием перспективных технологий. Согласно прогнозу, к 2010-му цена 1 Гб на магнитных устройствах хранения для настольных систем снизится до двух центов. Устройства для мэйнфреймов будут примерно в 12 раз дороже, а вакуум между крайними точками заполнит оборудование среднего звена с разной производительностью и степенью защиты RAID.

Но эти оценки уже приходится корректировать. В ходе дискуссии, которую в октябре провел Тестовый центр eWeek Labs, Джилени признал, что цены сейчас снижаются намного быстрее, чем раньше, поэтому использованные им данные с высоты сегодняшнего дня выглядят весьма пессимистично. В 2000 г., скажем, он предсказывал, что к 2004-му гигабайт памяти будет стоить 77 центов, тогда как на момент подготовки статьи 250-гигабайтный жесткий диск обходился в 55 центов за 1 Гб. Нынешний же рост спроса на устройства хранения бытового уровня, как нам представляется, должен еще больше ускорить падение цен на магнитные носители.

Вот только ученые далеки от всеобщего оптимизма. Они не видят возможности ни сократить размеры атомов, ни вынести на утверждение сообщества производителей новые физические законы. А без этого впереди уже маячит знак полной остановки на плотности около 60 Гб на квадратный дюйм (9,3 Гб/см2). Попытку упаковать данные еще плотнее теоретики считают бесплодной, так как те просто потеряются в шуме самопроизвольной переориентации магнитных доменов.

Впрочем, впадать в полное отчаяние было бы преждевременно. Манипулирование с магнитными свойствами материала порой больше напоминает алхимию, чем строгую науку. Конструкторы устройств хранения, например, уже научились создавать пленки толщиной буквально в несколько атомов, а наслоение друг на друга различных материалов может дать самые неожиданные результаты.

Правда, прежний опыт показывает, что стабильные магнитные среды хранения зачастую оказываются слишком медленными. Если материал способен сохранять свое магнитное состояние невзирая на произвольные колебания поля, то его будет не так-то легко перемагнитить и внешним воздействием. А это значит, что записывать информацию приходится медленно.

В поисках баланса

Возникает проблема компромисса между объемом хранения и пропускной способностью хранилища. Представим себе на секунду, что кому-то все же удалось уложить терабайт информации на одну крохотную магнитную тарелочку размером с монету. Но чтобы создать резервную копию такого массива, пусть даже за 3 ч - а это, согласитесь, не так уж быстро, потребуется скорость передачи 776 Мбит/с (новый рубеж для стандарта IEEE 1394b FireWire следующего поколения).

Балансировка битов

    

Деньги, вкладываемые в технологии хранения, должны разнообразить ваш арсенал взаимодополняющими системами.

 

- Емкость. Технологии хранения на магнитных лентах продолжают развиваться, однако остаются очень медленными; в ближайшее десятилетие на сцену должны выйти голографические и микроэлектромеханические системы хранения.

 

- Скорость. Твердотельные элементы стоят недешево, однако, выступая в роли кэш-памяти или шлюза доступа для многих процессов, они способны повысить эффективность хранения информации; в долгосрочной перспективе победителем на этом поле обещают стать голографические системы, использующие безынерционный лазерный луч.

 

- Плотность записи. Стоимость хранения во многом зависит от физических размеров носителя; современные технологии жестких дисков приближаются к теоретическому пределу, тогда как у магнитной ленты все еще остается солидный запас для дальнейшего совершенствования: к 2010 г. ожидается появление картриджей емкостью 10 Тб (дисковые тарелки за это же время могут выйти на уровень 3 Тб); наибольшую же плотность записи в перспективе обещают обеспечить микроэлектромеханические системы.

 

- Долговечность. Любая технология магнитного хранения данных предполагает некий компромисс между стабильностью и плотностью записи; микроэлектромеханическим системам по самой их природе свойственна очень высокая стабильность; голографические носители однократной записи способны обеспечить аутентичность информации на уровне самых строгих корпоративных требований.

А ведь ближе к 2010 г. такая емкость будет вызывать разве что усмешку даже у обычного пользователя. В видеоверсии iPod фирмы Apple Computer, скажем, эта память обеспечит лишь сотню часов телепрограмм высокой четкости со сжатием по алгоритму MPEG-2. Уже сегодня ничего фантастического в подобной концепции нет, поскольку производители настольных систем уже вышли на этот путь. Корпорация Sony в октябре анонсировала новый компьютер с четырьмя жесткими дисками по 250 Гб каждый. Два из них предназначены для хранения обычной информации, а еще два отведены специально для записи телепрограмм из расчета 19 ч в сутки в течение 7 дней по 6 каналам.

Что ж, совершенно очевидно: пора выходить на новые рубежи.

Не вширь, так вглубь

Если главным препятствием к повышению емкости является поверхностная плотность данных, то возникает естественный вопрос: а почему бы не начать осваивать третье измерение - глубину? Здесь на помощь может прийти технология голографического хранения, основанная на том, что в точке соприкосновения двух лазерных лучей возникает четкая интерференционная картина.

Имея нужное оборудование, таким способом можно записывать и считывать данные сразу в нескольких местах одного и того же носителя. Лазерный луч, в отличие от механических приводов магнитных головок, не имеет массы, что невообразимо ускоряет скорость поиска нужных участков при операциях с произвольным доступом к данным.

Более того, сама природа голографической интерференции открывает путь к новым режимам ассоциативного извлечения информации. Эффективность поиска в среде оптического хранения обеспечивается за счет сравнения с заданным шаблоном сразу во многих точках объема. Появляется возможность находить нужную информацию даже не зная, где та расположена, и не тратя времени на последовательный анализ всех ячеек хранилища. Достаточно определить, какую структуру нужно искать, и выбрать место, наиболее точно отвечающее ей.

Это способно не только изменить всю экономику хранения данных, но и открыть совершенно новый подход к концепции построения приложений. Возникает мощный импульс для дальнейшего развития бизнес-интеллекта, укрепления национальной безопасности и совершенствования многих других областей, которые очень интересуют корпоративных и правительственных создателей ИТ.

После десятков лет ожидания голографические технологии наконец-то начинают облекаться в физическую форму. Первое устройство хранения под названием Tapestry 200-R, построенное на этом принципе, уже готовит к выпуску компания InPhase Technologies. Оно должно увидеть свет в следующем году. В нем пользователи найдут 200 Гб записываемого (пока только однократно) пространства хранения. Съемный носитель при этом обойдется покупателю в 25 центов за гигабайт - всего вдвое дороже нынешнего записываемого диска DVD.

К 2008 г. эта дочерняя фирма Lucent Technologies собирается выпустить и перезаписываемый диск с пропускной способностью 40 Мб/с. А к 2010-му емкость памяти планируется довести до уровня 1,6 Тб, скорость же передачи данных - до 120 Мб/с.

Еще дальше от традиций электромагнитного хранения отходит микроэлектромеханическая технология Millipede корпорации IBM, представляющая собой по существу невероятно уменьшенную компьютерную перфокарту.

В основу привода Millipede положено нечто вроде щетки, своего рода двумерной матрицы из нескольких тысяч субмикроскопических датчиков, которая нанесена на пленку из термопластичного материала на кремниевой подложке. Длина стороны такого квадратика измеряется считанными миллиметрами. Кончик каждого датчика размером всего 10 нм никогда не выходит за пределы области порядка 100 мкм, благодаря чему удается избежать весьма энергоемкого перемещения всей матрицы. Несмотря на свои малые размеры, каждая такая область способна хранить тысячи бит данных в виде крохотных углублений в пластмассе. Формируются они в результате нагрева и давления датчиков, к которым подводится электрический ток.

Каждый волосок-датчик способен перезаписывать данные со скоростью более мегабита в секунду, а единичная область хранения выдерживает не менее 100 тыс. циклов записи. А теперь вспомним, что "щетка" Millipede содержит тысячи независимых "волосков", обеспечивая колоссальный параллелизм в работе устройства. Как говорят очень близкие к проекту специалисты, IBM уже создала матрицу из 4096 датчиков, и та успешно функционирует в экспериментальном устройстве со скоростью передачи данных 800 Гбит/с.

Благодаря высокой стабильности, которая присуща механическим средам записи, корпорации удалось довести плотность хранения Millipede до 125 Гб на квадратный дюйм (19,4 Гб/см). Это в 20 раз превышает возможности современных магнитных носителей и вдвое больше их теоретических пределов.

Как и любая механическая система, Millipede позволяет конструкторам определять, что важнее - скорость передачи данных или энергопотребление, - оптимизируя таким образом устройство для конкретного применения. IBM уже включила в свои планы выпуск подобного носителя емкостью порядка 40-80 Гб в формате SD (Secure Digital). Способный по всем характеристикам конкурировать с нынешней флэш-памятью, он может появиться в 2006 г., если только будет четко выдержан путь развития таких хранилищ.

Возможность применения новой технологии на корпоративном уровне еще даже не обсуждалась, однако в eWeek Labs считают, что вполне достаточно будет логической экстраполяции уже существующей концепции. Свойственные ей высокая плотность записи, долговечность и низкое энергопотребление отлично подходят для целей, не требующих высокой скорости, например, для автономного архивирования данных.

Все это, впрочем, ни в коей мере не принижает значения таких заслуженных технологий, как магнитная лента и твердотельная память, которые давно и прочно утвердились на противоположных концах спектра. Магнитная лента дешево стоит, но медленно работает, тогда как невероятно быстрая память на кремнии обходится во много раз дороже других массовых хранилищ данных.

По оценкам специалистов индустрии хранения, к 2006 г. удельная стоимость жестких дисков окажется лишь в 10 раз выше стоимости магнитной ленты. Это намного меньше 40-кратного разрыва, наблюдавшегося в 1998 г., вот только в дальнейшем сближение цен, видимо, затормозится. Более того, современная дорожная карта развития жестких дисков вскоре грозит завести в тупик. Как уже отмечалось, плотность записи на магнитных дисках вот-вот подойдет к своему физическому пределу, тогда как магнитной ленте до этого еще очень далеко.

Но и здесь есть одно "но". Те, кому приходится иметь дело с магнитной лентой, знают, что долговечность сохраненной информации зависит скорее от механических, чем от магнитных свойств носителя. И производителям лент, и разработчикам устройств хранения такого типа немало сил приходится тратить на контроль физического состояния носителя с помощью микроскопических средств мониторинга как в процессе производства, так и при эксплуатации. Без этого просто невозможно обеспечить требуемое качество записи и свести к минимуму потерю данных вследствие механического износа поверхности.

Что же касается хранилищ на твердотельных элементах, то оспаривать их преимущество по скорости просто бессмысленно. Задержка у них в 250 раз меньше, чем у жестких дисков, вот только мегабайт такой памяти стоит в 1000 раз дороже. Как ни привлекательны подобные устройства, практичными их никак не назовешь.

Впрочем, такие хранилища средней емкости - от 16 до 64 Гб, иногда собранные в массивы, - хорошо подходят для ресурсоемких приложений. Они приходят на помощь там, где к одним и тем же данным обращается множество процессов или требуется обеспечить произвольный доступ к информации.

Семикратное ускорение при обработке запросов SQL, скажем, может послужить надежным обоснованием инвестиций в твердотельное хранилище. Это, конечно, не универсальное решение, а хорошо продуманная политика, помогающая создателям корпоративных ИТ обеспечить эффективное хранение данных.

С редактором Питером Коффи можно связаться по адресу: peter_coffee@ziffdavis.com.