Вычислительные системы хранения данных (сomputational storage) способны привнести высокопроизводительные вычисления в традиционные устройства хранения. О том, как ваша организация может воспользоваться преимуществами этой технологии, рассказывают опрошенные порталом InformationWeek эксперты.

Вычислительные системы хранения — это инновационная технология, объединяющая функции процессора и СХД в одном устройстве. «Это подсистема хранения данных, включающая несколько процессоров, расположенных на носителях или их контроллерах», — говорит Йохан Александер, генеральный директор компании APKCima, занимающейся разработкой приложений.

«Считайте, что это мини-сервер, встроенный в накопитель, — поясняет Синди Лашапель, консультант компании ISG. — Способность вычислительных систем хранения перемещать обработку и сканирование данных ближе к источнику данных за счет прямой интеграции вычислительных возможностей в устройство хранения значительно снижает сетевой трафик и энергопотребление, уменьшает задержки и повышает масштабируемую производительность».

Ассоциация Storage Networking Industry Association (SNIA) определяет вычислительные системы хранения как «разгружающие хост-обработку или уменьшающие перемещение данных архитектуры, которые обеспечивают вычислительные функции хранения (computational storage functions, CSF)». Лашапель отмечает, что преимущество вычислительного хранилища перед традиционным заключается в том, что оно лучше удовлетворяет вычислительные требования к запросам и обработке данных, тем самым уменьшая сетевой трафик и снимая нагрузку с центральных процессоров.

Существуют две общие категории вычислительных систем хранения: фиксированные (fixed computational storage services, FCSS) и программируемые (programmable computational storage services, PCSS). «FCSS оптимизированы для выполнения специфических, требующих больших вычислительных затрат задач, таких как сжатие и шифрование данных на диске на лету, — говорит Лашапель. — PCSS могут содержать операционную систему, как правило, на базе Linux, и динамически программируются конечным пользователем».

Существует несколько различных подходов к вычислительным системам хранения, например, интеграция вычислительной мощности в отдельные диски (обработка на месте), а также ускорители, которые размещаются на шине хранения в контроллере системы хранения, а не в самих дисках. «В большинстве решений для вычислительных систем хранения в качестве базовой технологии используются твердотельные накопители NMV-Express», — говорит Лашапель.

Пионеры вычислительных систем хранения

Большинство первых пользователей вычислительных систем хранения данных — это организации, которые работают с большими объемами данных и при этом нуждаются в высокопроизводительных вычислениях. К таким организациям относятся поставщики облачных услуг, операторы дата-центров и разработчики искусственного интеллекта, отмечает Александер. По его словам, среди компаний, которые взяли на вооружение эту технологию, — Tesla, Google и Yahoo Mail.

Гиперскейлеры, такие как Alibaba и AWS, также используют вычислительные системы хранения, говорит Лашапель. Она отмечает, что и основные поставщики СХД также берут на вооружение фундаментальные концепции вычислительных систем хранения, такие как поточное сжатие и шифрование, выполняемые на уровне устройств хранения или контроллеров. Развитие технологии в конечном счете приведет к тому, что приложения смогут поддерживать вычислительные системы хранения «из коробки», прогнозирует Лашапель, добавляя, что «технология еще не готова».

Сценарии использования вычислительных систем хранения

Отраслевые наблюдатели прогнозируют множество сценариев использования вычислительных систем хранения в таких областях, как аналитика данных, обработка видео, периферийные вычисления и приложения Интернета вещей (IoT). «Вычислительные системы хранения эффективно приближают вычисления к конечным пользователям и могут улучшить шифрование, управление и контроль доступа к контенту», — говорит Лашапель.

Несмотря на большие перспективы вычислительных систем хранения, важно понимать, что их развитие находится на ранней стадии. В конце 2022 г. SNIA выпустила новые стандарты архитектуры аппаратного и программного обеспечения, а также предварительный стандарт API, необходимого для доступа к вычислительным устройствам хранения данных. «По мере развития этих стандартов и принятия их ключевыми инноваторами в рамках будущего цикла разработки технология начнет приобретать зрелость», — говорит Лашапель.

Как и для любой другой новой технологии, для массового внедрения необходимо создать согласованную и хорошо понятную модель угроз и требования к безопасности. Лашапель также предупреждает, что для интеграции с технологией вычислительного хранения может потребоваться значительная модификация существующих приложений, что является потенциально серьезным препятствием для широкого внедрения. Кроме того, разработчикам потребуется найти сотрудников, обладающих знаниями и навыками в этой новой области.

Перспективы на будущее

Несмотря на радужные перспективы, вычислительные системы хранения пока остаются скорее концепцией, чем общепринятой технологией. Лашапель считает, что постоянно растущие объемы данных, связанные с периферийными вычислениями, IoT и большими данными, а также растущий спрос на более глубокие возможности анализа данных вскоре приведут к тому, что эта технология станет массовой. «Продолжающийся рост требований к масштабированию, а также снижению энергопотребления и оптимизации площади ЦОДа также является ключевым фактором, который приведет к более широкому внедрению технологии», — прогнозирует она.

Александер согласен с тем, что будущее вычислительных систем хранения выглядит «весьма обнадеживающе», поскольку их внедрение, совершенствование, стандартизация и появление новых приложений происходят очень быстро. По его мнению, эта технология «будет играть ключевую роль в удовлетворении постоянно растущих потребностей приложений, использующих большие объемы данных, и обеспечит более быструю и эффективную обработку и анализ данных».