Метрики производительности облачного хранилища позволяют определить потолок возможностей при работе приложений, однако сделать это не так просто — хранилища бывают разных форматов, в них применяются различные типы хранения и наборы оборудования. Портал ComputerWeekly рассматривает ключевые метрики, а также необходимые облачные функции, которые необходимо учитывать, чтобы правильно выбрать облачную СХД.

Сегодня около половины объема бизнес-данных хранится в публичном облаке, но если учесть частные и гибридные облака, то объем данных, хранящихся с помощью облачных технологий, еще выше. Облачное хранение данных является гибким и потенциально экономически эффективным. Организации могут выбирать предложения гиперскейлеров — Amazon Web Services, Google GCP и Microsoft Azure, а также локальных или специализированных облачных провайдеров. Но как измерить производительность облачных сервисов хранения данных?

Если речь идет об онпремисном хранилище, то существует множество устоявшихся метрик, позволяющих отслеживать его производительность. Однако в облаке все может быть не так однозначно.

Отчасти это объясняется тем, что пользователь сталкивается со сложностями еще на этапе выбора облачного хранилища. Они обладают разными форматами, объемами и производительностью, включая файловые, блочные и объектные хранилища, системы на базе HDD, NVMe, SSD. Бывают хранилища для развертывания виртуальных машин и даже хранилища на базе ленточных накопителей, а также технологии, работающие онпремис, но на базе облако-подобной технологии. Это может усложнить сравнение облачных СХД с локальными и их мониторинг. Помимо обычных показателей производительности хранения данных, таких как IOPS и пропускная способность, ИТ-специалистам необходимо учитывать такие критерии, как стоимость, доступность услуг и даже безопасность.

Стандартные метрики хранения данных

Стандартные метрики также применимы и в облаке, но разобраться в них может быть гораздо сложнее. Корпоративные СХД имеют два основных показателя «скорости»: пропускная способность (скорость передачи данных на носитель и с носителя, измеряемая в байтах в секунду) и IOPS (количество операций чтения и записи в секунду). Производители оборудования обычно разделяют скорость чтения и скорость записи, причем скорость чтения обычно выше. Производители HDD, SSD и массивов также различают последовательное и случайное чтение или запись.

На эти метрики влияют такие факторы, как скорость перемещения головок для считывания/записи по пластинам HDD и необходимость стирания существующих данных на флэш-памяти. Обычно лучшим ориентиром для измерения реальной производительности является случайное чтение и запись. Производители HDD указывают число оборотов в минуту для вращающихся дисков (7200 об./мин для обычных систем, иногда 12 000 об./мин для корпоративных систем более высокого класса и 5400 об./мин для менее производительного оборудования). Однако эти показатели не применимы к SSD.

Чем выше показатель IOPS, тем выше производительность системы. Для вращающихся он обычно лежит в диапазоне от 50 до 200 IOPS. Системы на базе SSD значительно быстрее. Паспортная скорость высокопроизводительного флеш-накопителя может достигать 25 000 IOPS и даже выше. Однако если принять во внимание контроллер хранения, сеть и другие накладные расходы, например, использование RAID и кэш-памяти, то в реальных условиях разница в производительности будет меньше.

Латентность (задержка) — третий ключевой показатель производительности, который необходимо учитывать. Это время выполнения каждого запроса ввода-вывода. Для системы на базе HDD оно составляет от 10 до 20 мс. Для SSD — несколько миллисекунд. Задержка часто является наиболее важной метрикой для определения того, может ли система хранения поддерживать приложение.

Облачные метрики

Однако проекция стандартных показателей хранения данных на облако редко бывает простой задачей. Обычно покупатели облачных СХД не знают, как именно она обслуживается. Точное сочетание флэш-памяти, HDD и даже ленточных или оптических носителей зависит от облачного провайдера и его уровня обслуживания. Большинство крупных облачных провайдеров используют комбинацию аппаратных средств хранения, технологий кэширования и балансировки нагрузки, что затрудняет понимание производительности аппаратных средств. Они также предлагают различные форматы хранения данных — в основном блочные, файловые и объектные, что еще больше затрудняет сравнение показателей производительности.

Метрики также будут зависеть от типа хранилища, которое приобретает организация, поскольку гиперскейлеры сегодня предлагают несколько уровней хранения данных, исходя из их производительности и цены. Кроме того, существуют предложения, ориентированные на услуги, такие как резервное копирование и восстановление, а также архивирование, для измерения которых применяются отдельные метрики, например, время восстановления (recovery time objective, RTO) или время извлечения.

Самой простой областью для сравнения по крайней мере крупных облачных провайдеров, является блочное хранение данных. Облачная платформа Google, например, указывает для своего блочного хранилища максимально устойчивое IOPS и максимальную устойчивую пропускную способность (в Мб/с). Далее эти показатели разбиваются на IOPS для чтения и записи, а также пропускную способность на один гигабайт данных и инстанс. Но, как заявляет Google, IOPS и пропускная способность зависят, среди прочего, от объема диска, количества vCPU на инстанс и размера блока ввода-вывода.

Google также приводит полезное сравнение производительности своей инфраструктуры с физическим диском с частотой вращения 7200 об./мин. Microsoft опубликовала руководство, предназначенное для мониторинга ИТ-пользователями производительности объектного хранилища Blob. У AWS есть аналогичное руководство для Elastic Block Store (EBS). Оно может помочь пользователям разобраться в различных уровнях хранения данных, от высокопроизводительных SSD до дисковых хранилищ холодного хранения.

Стоимость, доступность услуг и другие полезные метрики

Поскольку облачное хранилище — платное, его стоимость всегда является ключевым показателем. Опять же, все основные облачные провайдеры имеют уровни, основанные на стоимости и производительности. Например, AWS предлагает gp2 и gp3 — тома на базе SSD общего назначения, тома io1 и io2, оптимизированные по производительности, и тома HDD st1, ориентированные на пропускную способность и предназначенные для «больших последовательных рабочих нагрузок».

Но метрики облачного хранилища — это не только стоимость и производительность. Стоимость одного гигабайта или инстанса необходимо рассматривать наряду с другими платежами, включая стоимость загрузки данных и особенно их выгрузки или извлечения. Что касается последнего, то некоторые предложения по извлечению данных, кажущиеся на первый взгляд очень дешевыми, в итоге могут стать очень дорогими.

Еще одной метрикой является полезная емкость: какой объем приобретенного хранилища фактически доступен клиентскому приложению, и в какой момент его использование начнет сказываться на реальной производительности? Опять же, этот показатель может отличаться от показателей для технологии хранения онпремис.

CIO также захотят обратить внимание на доступность услуг. Надежность компонентов и подсистем хранения традиционно измеряется средним временем наработки на отказ (mean time between failures, MTBF), а для SSD — дополнительным объемом, записываемым за определенное время (terabytes written over time, TBW). Однако при крупномасштабном предоставлении облачных услуг более распространенной и полезной метрикой является доступность. Облачные провайдеры все чаще используют показатели доступности, или времени безотказной работы по аналогии с ЦОДами или телекоммуникационными компаниями, причем «пять девяток» (гарантия уровня доступности не ниже 99,999%) — это часто лучший и самый дорогой SLA.

Но и эти метрики — не единственные, которые необходимо принимать во внимание. Покупателям облачных хранилищ также необходимо учитывать географическое расположение, избыточность, защиту данных и соответствие нормативным требованиям, безопасность и даже финансовую устойчивость облачного провайдера. Хотя эти показатели не являются показателями производительности, но если провайдер не соответствует им, это может стать весомой причиной для отказа от его услуг.