Сегодня трудно представить заслуживающего внимания поставщика компьютерных компонентов, в ассортименте предложений которого не было бы твердотельных накопителей (SSD) разного класса и разных производителей. Хотя степень проникновения SSD в сегментах клиентских устройств и корпоративных инфраструктурных решений пока заметно различается, «фактически они уже давно перестали быть технологией для избранных и перешли в разряд решений общего пользования», отмечает Игорь Макаров, менеджер по продажам корпоративных решений компании OCZ Storage Solutions. Это подтверждают и результаты опроса, проведенного на сайте PC Week Live — только 22,6% респондентов сообщили о том, что в их компаниях не применяются решения для хранения данных на базе флеш-технологии.

И потребителей, и корпоративных заказчиков в таких решениях привлекает прежде всего возможность существенно повысить производительность своих систем при одновременном снижении энергопотребления и улучшении масс-габаритных характеристик аппаратных устройств. Во многом схожи (по принципу работы, базовым функциям, используемым интерфейсам) и представленные на рынке SSD для потребительского сегмента и корпоративного рынка, что порождает у корпоративных заказчиков соблазн сэкономить, приобретя вместо продуктов класса Enterprise заметно более дешевые клиентские SSD. «Точных данных нет, но примерные оценки говорят о том, что до 10% SSD потребительского класса приобретаются для установки в серверные системы», — отмечает Игорь Макаров.

Между тем, как это имеет место и во многих других продуктовых категориях, потребительские и корпоративные SSD разделяет настоящая пропасть. Различия между ними определяются принципиальной разницей в характере использования и требованиях к надежности, что влечет за собой отличия в двух ключевых компонентах их архитектуры — используемой для хранения данных энергонезависимой флеш-памяти NAND и контроллерах, управляющих работой с флеш-памятью. Игнорирование этих различий при выборе твердотельных накопителей для работы в корпоративных системах (по незнанию или из желания сэкономить) может свести на нет начальную экономию и обернуться для ИТ-отдела предприятия серьёзными проблемами.

Проблема производительности

Современные твердотельные накопители (потребительские и корпоративные) демонстрируют высокие скорости выполнения операций последовательного и случайного чтения/записи не в последнюю очередь благодаря многоканальной архитектуре контроллера и распараллеленному доступу контроллера к массивам флеш-памяти NAND. Однако можно ли полагаться на то, что устройство, хорошо справляющееся с клиентскими задачами, столь же успешно будет обслуживать и корпоративные приложения?

За редким исключением, клиентская система предназначена для обслуживания одного пользователя. И даже в том случае, когда у него одновременно открыты несколько приложений, обращения к SSD носят эпизодический и кратковременный характер. При этом допустимая задержка отклика подсистемы хранения на запрос от ЦПУ может «гулять» в сравнительно широких пределах — это не критично. Поэтому SSD потребительского класса разрабатываются для режимов с «пульсирующим» характером нагрузки и в расчете на то, что большую часть времени они будут находиться в ждущем режиме. К этому следует добавить, что пользователи, как правило, не заполняют установленные в их систему накопители данными до отказа, а используемая операционной системой команда TRIM (предусмотрена спецификацией интерфейса ATA) позволяет уменьшить негативное влияние так называемой операции сборки мусора, приводящей по мере заполнения диска данными к падению скорости выполнения операций записи в затронутые секторы SSD. Производительность диска в описанных условиях эксплуатации можно оценить по характеристикам скорости последовательного и случайного чтения/записи, и у современных потребительских накопителей с интерфейсом SATA III они могут быть близки к пределу, определяемому быстродействием данного интерфейса.

Увы, в корпоративной системе (сервере, массиве хранения) такой накопитель, скорее всего, себя не оправдает. Проблема в том, что такие системы, как правило, предназначены для обслуживания десятков, а то и сотен пользователей и множества приложений (виртуализация этому поспособствовала). Чтобы при этом пользователи не испытывали дискомфорта в работе, требования к времени задержки отклика SSD заметно ужесточаются. Кроме того, корпоративные системы обслуживают большие потоки данных — не случайно современные SSD категории Enterprise допускают до нескольких циклов полной перезаписи в день. И для них критически важной оказывается производительность в устоявшемся режиме случайной записи, т. е. на длительном отрезке времени. С учетом того, что корпоративные приложения практически не используют команду TRIM, а объем зарезервированной памяти у потребительских SSD оказывается явно недостаточным, в реалиях корпоративной среды последние просто пасуют. Убедиться в этом можно, например, сравнив характеристики максимальной скорости случайной записи и скорости записи в устоявшемся режиме у только что выпущенных на рынок потребительских SSD OCZ Trion 100 — у некоторых моделей семейства показатели различаются более, чем в 20 раз.

Вопросы надежности и выносливости

И обычные потребители, и тем более корпоративные пользователи рассчитывают на то, что приобретенные ими SSD прослужат верой и правдой отпущенный им срок. Но тут тоже есть свои нюансы. При оценке надежности флеш-памяти NAND-типа оперируют такими ключевыми параметрами, как коэффициент ошибок и ожидаемый срок эксплуатации.

Технология флэш-памяти NAND не гарантирует, что записанная в ячейки памяти информация впоследствии будет считана без ошибок. Естественную (то есть обусловленную несовершенством технологического процесса изготовления памяти) вероятность их возникновения определяет измеряемый на стадии производства пластин с памятью коэффициент битовых ошибок (Raw Bit Error Rate — RBER или просто BER). Однако реализуемые в контроллере SSD механизмы коррекции ошибок «на лету» (в частности, с использованием Error Correction Code, ECC) позволяют существенно уменьшить вероятность ошибок на выходе устройства, поэтому для пользователей SSD более важен другой показатель — коэффициент неисправляемых битовых ошибок (Uncorrectable Bit Error Ratio, UBER).

Профильный комитет организации JEDEC, разрабатывающий соответствующие стандарты для твердотельной памяти, ещё в 2010 году принял нормативные документы, в которых определил требования к показателю UBER для клиентских и корпоративных SSD: менее 10-15 для первых и менее 10-16 для вторых (разница — на порядок). Т. е. если для клиентских SSD стандартом допускается одна неустранимая ошибка на 110 Тб, то для корпоративных — одна на 1,11 Пб. Между тем в середине июня JEDEC объявила о начале работы по очередному пересмотру требований и методик тестирования SSD (документ JESD218A), так что не исключено ужесточение ранее принятых норм, что, в частности, может быть обусловлено появлением твердотельных накопителей высокой емкости — до 2 Тб и более.

Чтобы удовлетворить определенные стандартом повышенные требования к корпоративным SSD (а тем более реализовать даже более жесткие требования), необходимо в них использовать и флеш-память с как можно более низким показателем BER (сегодня это память типа SLC или e-MLC, см. табл.), а значит, более дорогую, и контроллер с развитыми функциям коррекции ошибок, а значит, тоже более дорогой.

В накопителях корпоративного класса также нередко предусматриваются меры на случай внезапного отключения питающего напряжения, что чревато потерей данных. Примером может служить технология Power Failure Management Plus (PFM+), реализующая специальные алгоритмы аварийного спасения данных и предполагающая использование высокоемких страховочных конденсаторов для питания накопителя в течение нескольких секунд после отключения основного питания. Кроме того, в гораздо более полном виде, нежели в потребительских SSD, в них реализуется технология самоконтроля, анализа и отчётности S.M.A.R.T., позволяющая в ходе эксплуатации накопителя оценить его состояние, в частности износ ячеек и коэффициент битовых ошибок на физическом уровне, и на основе этих данных предупредить возможные проблемы еще до их проявления. Это также вносит свой вклад в цену устройства. Стоит ли удивляться, что такой SSD будет стоить дороже?

А что же со сроком службы SSD?

Как известно, в процессе эксплуатации флеш-память деградирует с каждым циклом перезаписи ячеек — ее скоростные характеристики, а также параметры BER и UBER ухудшаются. Память с более плотным размещением битов (TLC и MLC) выдерживает меньше циклов перезаписи, с менее плотным (SLC) — больше циклов перезаписи. Но так или иначе через некоторое время любой SSD становится непригодным для использования. Чтобы обеспечить работоспособность устройства на протяжении всего оговоренного производителем срока эксплуатации в каждом SSD предусмотрен скрытый от пользователя и операционной системы резервный раздел с дополнительным объёмом ячеек флеш-памяти, который может использоваться в качестве буфера записи для обеспечения высокой устойчивой производительности устройства, а также для замены дефектных ячеек по мере их деградации. Кроме того, в контроллере накопителя реализуются специальные алгоритмы для уменьшения избыточных циклов перезаписи (их характеризует параметр WAF, или write amplification factor), обусловленных особенностью организации записи данных во флеш-память. Учесть все эти факторы в реальных условиях эксплуатации довольно сложно, поэтому для удобства оценки износоустойчивости SSD введен специальный параметр TBW (TeraBytes Written), определяющий общий объем данных, который может быть записан на твердотельный накопитель, прежде чем он станет непригоден для эксплуатации.

Сравнивая TBW одинаковых по емкости и сроку службы корпоративного и клиентского SSD, вы в большинстве случаев обнаружите между ними значительную разницу. Это и понятно — у предназначенных для обслуживания интенсивной нагрузки в режиме 24/7 корпоративных SSD этот показатель по определению должен быть выше, чем у рассчитанных на более мягкий режим эксплуатации лишь 8 часов в сутки клиентских SSD. И ожидать, что последний протянет в корпоративной системе положенный ему срок, увы, не приходится.

Выводы

В условиях ограничения ИТ-бюджетов стремление ИТ-служб сэкономить вполне понятно. Однако каждый раз, когда появляется мысль установить в корпоративную систему SSD потребительского класса, стоит задуматься — не получится ли так, что деньги будут потрачены зря, поскольку изначальная цель не будет достигнута. Неудовлетворительная производительность в устоявшемся режиме, недопустимый уровень ошибок при чтении данных, преждевременный и непредсказуемый выход накопителя из строя, — все это обусловливает риски, которые в корпоративной среде могут дорого обойтись.

Таблица. Основные различия в технологиях NAND-флеш

Тип флеш-памяти NAND

Архитектура

Ёмкость

Надёжность (циклов стирания / записи)

Коэффициент битовых ошибок (BER)

Цена

SLC (Single-Level Cell)

1 бит на ячейку

Мин.

Макс.

10-9

Макс.

e-MLC (Enterprise Multi-Level Cell)

2 бита на ячейку

Высокая

Высокая

10-8

Высокая

MLC (Multi-Level Cell)

2 бита на ячейку

Высокая

Средняя

10-7

Средняя

TLC (Triple Level Cell)

3 бита на ячейку

Макс.

Мин.

10-4

Мин.

Другие статьи раздела «OCZ Storage»