Наверняка вы слышали предсказания смерти жестких дисков (HDD). Некоторые эксперты делают прогнозы, что рост применения твердотельных накопителей (SSD) приведет к исчезновению спроса на HDD в течение пяти лет. Другие оценивают рынок иначе. Видя, как компании успешно развертывают приложения обработки больших данных (Big Data) как на SSD, так и на HDD, а иногда и на тех, и на других, возникает желание взвешенно обсудить эту тему, пишет на портале Datanami Уолли Макдермид, вице-президент по стратегическим альянсам компании Scality.

Рабочие нагрузки Big Data связаны с обработкой, хранением и анализом огромных объемов данных, с которыми не справляются традиционные средства и методы управления данными. Для эффективного управления данными и извлечения из них полезных инсайтов часто требуются специализированные технологии, такие как фреймворки распределенных вычислений. Такие рабочие нагрузки обычно встречаются в отраслях, где способность обрабатывать и извлекать ценные инсайты из больших и сложных массивов данных имеет решающее значение для принятия обоснованных решений.

Многие руководители ИТ-команд часто полагают, что рабочие нагрузки Big Data подразумевают необходимость использования более дорогостоящих SDD для хранения данных. Шумиха по этому поводу со стороны производителей настолько велика, что заслоняет нюансы реальных рабочих нагрузок — особенно с учетом инноваций в области плотности и производительности HDD, предлагаемых различными производителями.

В целом, SSD могут обеспечить новый уровень производительности и эффективности рабочих нагрузок Big Data за счет значительного повышения скорости доступа к данным и их обработки, снижения задержек и поддержки требований современных приложений, интенсивно работающих с данными. Во многих случаях это действительно так, но не во всех. Несмотря на то что поставки HDD недавно упали на 20% по сравнению с предыдущим кварталом, акции производителей дисковых накопителей, микросхем памяти и полупроводникового оборудования растут, причем значительно. Хотя некоторые утверждают, что HDD умирают, на самом деле SSD не могут полностью заменить этот носитель информации. Более того, существует множество обстоятельств, при которых жесткий диск подходит лучше.

Сохраняйте баланс: в каких случаях жесткий диск имеет больше смысла, чем флэш-память

Первый сценарий, когда HDD может оказаться лучшим вариантом, — это последовательные рабочие нагрузки (IO).

Флэш-память действительно обладает лучшими характеристиками произвольного ввода-вывода по сравнению с жесткими дисками сопоставимой плотности. В системах обработки транзакций — например, при запросе клиентских счетов и балансов в базе данных — это выгодно для приложений, в обязанности которых входит чтение небольших объемов данных в режиме произвольного доступа.

Однако разрыв в производительности между флэш-памятью и жестким диском при выполнении последовательных операций ввода-вывода гораздо менее значителен. Последовательные рабочие нагрузки сканируют большие файлы данных от первого до последнего байта, например, при создании или считывании огромных медицинских изображений, таких как МРТ-снимки, при резервном копировании или восстановлении файла резервной копии, а также при передаче потокового видео.

По цене за гигабайт SSD и HDD сегодня все еще различаются в пять раз. Нам уже много лет обещают «паритет стоимости SSD с HDD», но все время кажется, что до этого еще пять лет.

Еще один сценарий, в котором предпочтение отдается жестким дискам, —неструктурированные данные петабайтных масштабов. Здесь SSD высокой плотности не могут полностью заменить HDD по производительности и стоимости. В системах хранения петабайтных массивов неструктурированных данных (в основном файловых и объектных) в основном используются жесткие диски, что обусловлено их высокой плотностью, производительностью и надежностью, а также, что, пожалуй, наиболее важно, низкой стоимостью гигабайта емкости.

В обозримом будущем HDD останутся жизнеспособным вариантом для многих профилей рабочих нагрузок с неструктурированными данными петабайтного масштаба, особенно если учитывать их стоимость — как в пересчете на терабайт, так и в соотношении цена/производительность.

Проблемы деградации производительности

Производительность твердотельного накопителя начинает снижаться, когда он заполняется примерно на 50%. Соответственно, для обеспечения производительности используемая емкость не должна превышать 70%. Что это означает для пользователей в целом? При первом развертывании флэш-накопители работают на пределе своих возможностей, а со временем, по мере заполнения системы, их производительность снижается. Для устранения этого эффекта некоторые проницательные администраторы даже прибегают к использованию специальных уровней «избыточного резервирования» на SSD. Однако эта особенность SSD фактически ограничивает доступную емкость накопителя для хранения данных и повышает его реальную стоимость.

Не все крупномасштабные критически важные операции требуют хранения данных на базе современной флэш-памяти с четырехуровневыми ячейками (QLC). Флэш-память QLC не лучшим образом подходит для многих рабочих нагрузок, даже для резервного копирования, которое лежит в основе современных методов обеспечения безопасности данных и защиты от вирусов-вымогателей. Однако ей найдется место в рабочих нагрузках, требующих интенсивного чтения и чувствительных к задержкам, что оправдывает ее более высокую цену.

SSD лучше подходят для интенсивных операций чтения

Важно учитывать требования к долговечности и надежности, предъявляемые приложениями. Повышенные долговечность и надежность флэш-памяти QLC или другой флэш-памяти высокой плотности для использования в рабочих нагрузках с «большим оборотом» можно поставить под сомнение. С технической точки зрения, при увеличении числа ячеек (например, при переходе от TLC к QLC) показатели записи/перезаписи, основанные на принятых в отрасли «циклах программирования/стирания» (P/E-циклы), снижаются. В целом флэш-накопители, и особенно QLC, имеют худшие циклы P/E, чем жесткие диски. Особенности «большого оборота», характерные для рабочих нагрузок резервного копирования/восстановления, вызывают опасения относительно долгосрочной жизнеспособности QLC в данном сценарии использования.

Однако SSD/QLC часто оказываются лучшим выбором для таких приложений, как дистрибуция контента и потоковая передача мультимедиа-данных. Эти сценарии предполагают в основном операции с интенсивным чтением, где скорость получения данных имеет решающее значение. Твердотельные накопители QLC обеспечивают высокую скорость чтения, низкую задержку и эффективный доступ к данным, поддерживая бесперебойную доставку контента конечным пользователям.

Не стоит полагать, что твердотельные накопители экологичнее

В последнее время в отрасли говорят о том, что флэш-память в целом должна превосходить такие вращающиеся накопители, как HDD. Казалось бы, это логично, поскольку жестким дискам требуются электродвигатели для перемещения рычагов привода и вращения механических пластин, а флэш-памяти SSD — нет.

Однако наш недавний анализ показал, что в некоторых сценариях SSD высокой плотности не всегда превосходят HDD по плотности энергопотребления. Конечно, в ближайшие несколько лет плотность дисков, скорее всего, будет расти, поэтому со временем этот результат может измениться. Кроме того, в соответствии со сбалансированным профилем рабочих нагрузок, использованным в исследовании, плотность энергопотребления жестких дисков на 19% выше, чем у твердотельных накопителей. При этом преимущество HDD возрастает до 94% при профиле нагрузки с высокой потребностью в записи. Увеличение плотности может нивелировать предполагаемое преимущество SSD в экологичности при различных рабочих нагрузках.

Твердотельные накопители в ландшафте Big Data

Роль SSD в рабочих процессах с большими данными является более тонкой, чем принято считать. Хотя твердотельные накопители, безусловно, повышают производительность, их необходимость во всех сценариях не является само собой разумеющейся. По мере развития сектора искусственного интеллекта жесткие диски вновь становятся конкурентоспособными, особенно в сценариях последовательных рабочих нагрузок и неструктурированных данных петабайтного масштаба. Проблемы с долговечностью ставят под сомнение пригодность QLC для решения специфических задач с высоким оборотом данных, из-за чего их долгосрочная перспективность оказывается под вопросом. Также можно говорить о развенчании мифа о превосходстве SSD в плане экологичности.

В условиях меняющихся требований ИТ-руководители при выборе между HDD и SSD должны ориентироваться на рабочие процессы. Тщательная оценка применимости SSD-накопителей становится жизненно важной для принятия обоснованного и устойчивого решения по созданию инфраструктуры данных.