Беспокоитесь по поводу занимающего несколько дней восстановления дисков объемом 6, 8 или даже 10 Тб? Не волнуйтесь. Объектное хранение избавляет от такого реликта, как созданная 25 лет назад архитектура RAID. Вот как оно работает.

Массивы RAID сконструированы таким образом, чтобы доступ к данным не утрачивался в случае отказа одного или двух дисководов. К вашим данным добавляются сведения о четности, чтобы обеспечить доступ к данным даже после выхода из строя одного или нескольких дисководов.

Биты четности и данные распределены между дисководами. Малые массивы RAID насчитывают четыре дисковода, но наиболее распространены массивы с 6-8 дисками. В RAID 5 под контроль четности отводится емкость одного диска, в RAID 6 — двух.

RAID 5 способен выдержать отказ одного дисковода, RAID 6 — двух или, что более вероятно, выход из строя одного дисковода и одну ошибку типа Unrecoverable Read Error (URE).

Когда в массиве RAID выходит из строя один из дисководов, все потерянные данные должны быть записаны на заменяющий его. Поэтому при объеме дисков 8 Тб данная операция занимает так много времени.

Предположим, что средняя скорость записи составляет 100 Мб/с. Это соответствует 360 Гб/ч, или более чем 22 ч на восстановление данных диска емкостью 8 Тб при максимальной скорости.

Поскольку обычно массивы параллельно с восстановлением данных выполняют и другую работу, администраторы часто снижают скорость восстановления. Поэтому для восстановления диска объемом 8 Тб может потребоваться два дня и более. Все это время производительность будет снижена при наличии острой угрозы еще одного отказа или URE.

К счастью для производителей дисководов, новая архитектура, объектное хранение, заменила RAID в больших масштабируемых системах. Объект — это файл и метаданные, которые обычно хранятся в файловой системе. Доступ к объектам осуществляется напрямую по их ID-номеру, а не через файловую систему.

Обход файловой системы дает много преимуществ, таких как доступ нескольких серверов к одному пулу данных. Но по сравнению с RAID большим преимуществом является то, что формат данных не ограничивается массивами RAID.

Вместо этого при объектном хранении большой файл обычно разбивается на фрагменты или куски, содержащие данные и биты четности. Пследние можно модифицировать таким образом, чтобы система, например, выдерживала отказ нескольких дисков (обычно четырех или пяти) без потери данных и снижения производительности.

Еще более важно, что объектное хранение может реплицировать данные на несколько дисков, устраняя узкое место, связанное с записью на один диск. Заменяющий диск не обязательно должен содержать конкретный набор данных. При добавлении нового дисковода для замены вышедшего из строя или для расширения емкости хранения контроллер объектного хранения начинает заполнять его нужными фрагментами данных.

Объектное хранение лежит в основе всех гипермасштабируемых систем хранения. Поэтому на протяжении десятилетия это был наиболее быстро растущий компонент хранения.

Но не все обстоит хорошо. Появляется дополнительная вычислительная нагрузка, а неудачный выбор конфигурации может снизить производительность. Объектное хранение еще молодо, и эта технология быстро совершенствуется.

В высокопроизводительных массивах жесткие диски чаще всего заменяются твердотельными. Но нет причины, по которой бэкэнд-хранилище на базе RAID нельзя заменить объектным хранилищем, которое и дешевле, и надежнее массивов RAID.

Некоторые производители уже это делают. Так поступили Clear Sky и Infinidat. Полный отказ от использования RAID для корпоративного хранения — вопрос времени. Вместе с RAID останутся в прошлом и заботы, связанные с продолжительностью восстановления данных.