В течение многих лет решение о размещении рабочих нагрузок было простым: все определяла их вариативность. Для сильно изменчивых рабочих нагрузок предпочтение отдавалось эластичности облака, в то время как предсказуемые, стабильные рабочие нагрузки оставались на онпремисных серверах для повышения экономической эффективности. Сегодня стоимость оборудования и сроки его поставки заставляют клиентов стремиться как можно быстрее получать доступ к облачным мощностям. Шок со стороны спроса, вызванный стремлением гиперскейлеров к развертыванию ИИ, коренным образом изменил экономику инфраструктуры, пишет на портале BigDataWire Брэндон Уайтлоу, старший вице-президент и руководитель отдела продуктов компании Qumulo.

Аппаратное давление

Гиперскейлеры монополизировали рынок критически важных компонентов центров обработки данных, вознамерившись потратить в этом году 700 млрд. долл. (+70% в годовом исчислении). Крупнейшие облачные провайдеры заключили многолетние соглашения о поставках DRAM, NVMe и GPU. Напомню, что в 2021 г. пять крупнейших гиперскейлеров потратили на это оборудование около 100 млрд. долл., что было сопоставимо с закупками семи крупнейших поставщиков корпоративного «железа». В 2025 г. расходы пяти крупнейших облачных компаний выросли до 410 млрд. долл., а их нынешний скачок до 700 млрд. долл. — это вдвое больше, чем расходы всей «большой семерки», которые составили 145 млрд. долл.

Эффект оказался очень ощутимым, особенно для компаний, стремящихся расширить свои онпремисные среды. Теперь они сталкиваются с восьми-десятимесячными сроками поставки и значительным повышением цен. Только системы хранения данных на основе флэш-памяти стали более чем на 472% дороже, чем год назад. В большинстве случаев общая стоимость владения инвертировалась. То, что раньше было дешевле онпремис, теперь не только дороже облачных решений, но и доступно только с четырех-шестимесячными сроками поставки.

Не стоит ожидать, что это будет временным явлением. Дело в том, что гиперскейлеры конкурируют не только по услугам и цене. Они конкурируют по доступу к самим вычислительным ресурсам, и их масштаб позволяет им обеспечивать безопасность цепочек поставок способами, недоступными даже крупнейшим предприятиям. Чтобы снизить риски, связанные с десятками миллиардов долларов, необходимыми для ввода в эксплуатацию новых фабрик, гиперскейлеры взяли на себя многолетние, постоянно растущие обязательства, оправданные их совокупным портфелем заказов на сумму 1,4 трлн. долл. Кроме того, рынок ИИ сместился от разработки моделей из-за страха упустить выгоду (FOMO) к внедрению в корпоративной среде. Восемь из десяти лучших моделей ИИ доступны только в облаке. Подключение предприятия к этим моделям и обеспечение доступности GPU теперь являются важнейшими бизнес-задачами.

Это означает, что для многих организаций облако больше не является просто стратегическим вариантом. Это может быть единственное место, где мощности и вычислительные ресурсы действительно доступны.

Сдвиг в мышлении

Эта динамика вынуждает к сдвигу в мышлении. Ключевой вопрос для CIO больше не «Облако или онпремис?», а «Какой самый быстрый и наименее разрушительный способ получить доступ к вычислительным ресурсам и ресурсам СХД, необходимым для развития бизнеса?».

Ответ кроется в гибридных решениях, но не в тех гибридных решениях, что были в прошлом. Речь идёт не о миграции множества бизнес-приложений в облако, что может занять месяцы или годы, которых ни у одного бизнеса нет в сегодняшнюю эпоху стремительного развития ИИ. Речь идёт об объединении рабочих нагрузок в целостную платформу данных, которая обеспечивает масштабируемую облачную ёмкость без ущерба для контроля или непрерывности.

Для этого предприятиям необходимы три базовые возможности: интеллектуальное кэширование для обеспечения производительности уровня флэш-памяти в гибридных дисковых системах, перепрофилирование существующих систем на основе флэш-памяти в качестве периферийных кэшей с поддержкой облачной объектной ёмкости и ткань данных, которая может объединять заблокированную на изолированных периферийных или удалённых узлах ёмкость.

Скорость флэш-памяти при экономичности жёстких дисков. В то время как цены на флэш-память выросли в годовом исчислении на 472%, цены на жёсткие диски выросли всего на 35%, и они могут быть фактически поставлены в разумные сроки. Интеллектуальные и адаптивные технологии кэширования могут обеспечить производительность уровня флэш-памяти, необходимую для обработки горячих данных, в то время как всё остальное хранится на жёстких дисках. Компаниям больше не приходится выбирать между скоростью флэш-памяти и преимуществами жестких дисков с точки зрения стоимости, если у них есть подходящее ПО.

Настоящая гибридная архитектура, а не копии или изолированные хранилища. Миграция в облако, ориентированная на приложения, занимает годы, но гибридные архитектуры, ориентированные на данные, могут ускорить внедрение облака до нескольких дней, если все делать правильно. Организациям необходима возможность беспрепятственно подключать онпремисные среды к облачным ресурсам без рефакторинга приложений и доступа клиентов или нарушения текущей онпремисной среды. Это включает в себя использование небольшого высокопроизводительного периферийного хранилища локально с одновременным расширением основной части хранилища и вычислительных ресурсов в облако. Модели настоящего гибридного облака беспрепятственно и прозрачно расширяют вашу онпремисную среду в облако для архивирования, повышения надежности данных или улучшения совместной работы. Такой подход позволяет избежать непомерных затрат на масштабирование флэш-хранилища онпремис, одновременно открывая доступ к облачным сервисам ИИ и возможностям графических процессоров.

Единый источник достоверной информации. Предприятиям необходимо поддерживать единый, авторитетный уровень данных, не копируя и не дублируя данные в разных средах. Это крайне важно как для развивающихся систем агентного инференса и автономных систем, так и для высвобождения заблокированных в изолированных средах ресурсов. Когда системы действуют независимо, они должны работать в режиме реального времени с согласованными данными, а не с копиями. Фрагментированные или устаревшие наборы данных приводят к принятию неверных решений и ухудшению результатов. Единый источник достоверной информации гарантирует доступ к данным и возможность их использования в любом месте — будь то на периферии, на заводе или в облачном конвейере ИИ — без ущерба для их целостности.

Как осуществить переход без сбоев в бизнесе

Путь вперед — это не рискованная многолетняя миграция. Это набор целенаправленных шагов по сохранению непрерывности работы при одновременном высвобождении облачных ресурсов. Достижение этих базовых возможностей требует продуманного шестиэтапного стратегического плана, ориентированного на поддержание непрерывности бизнеса при немедленном снижении нагрузки на ресурсы.

Шаг 1. Переоценка текущего положения дел. Начните с трезвой оценки текущих ограничений инфраструктуры. Задержки в закупке оборудования, рост затрат и ограничения пропускной способности следует рассматривать как стратегические риски, а не как операционные неудобства.

Шаг 2. Примите во внимание возможность выбора. Просто сохранение текущего положения дел и покупка большего количества флэш-накопителей по более высоким ценам не дадут желаемого результата. Необходимо следовать за предложением. Если новые накопители и память находятся в облаке, необходимо получить к ним доступ. Нужно иметь возможность работать со всеми поставщиками серверов x86 с жесткими дисками и флэш-памятью, в основном с теми, кто предлагает лучшие сроки поставки и цены, а не попадать в ловушку «оборудования на заказ».

Шаг 3. Переосмысление стратегии работы с данными. Представьте себе мир без гравитации данных. Если бы данные могли храниться где угодно и быть доступны мгновенно, как бы изменилась архитектура? Это упражнение помогает разорвать привязанность к устаревшим системам и поставщикам, многие из которых больше не являются жизнеспособными в текущих условиях. Цель состоит в разработке архитектуры, ориентированной на данные, где мобильность и доступность данных определяют решения. Вывод: по мере роста цен на хранение данных, вам необходимо извлекать из них больше пользы. Сосредоточьтесь на подключении данных к талантам, инструментам и вычислительным ресурсам везде, где это возможно.

Шаг 4. Внедрение интеллектуальной ткани данных. Внедрите платформу, которая объединяет онпремисные и облачные среды в единое пространство имен без копирования, не жертвуя при этом контролем, согласованностью или производительностью. Эта архитектура без копирования позволяет запускать рабочие нагрузки везде, где доступны вычислительные ресурсы, без копирования данных или рефакторинга приложений.

Такая ткань без копирования также обеспечивает доступ к распределенным вычислениям в разных регионах и зонах доступности, что становится все более важным, поскольку рабочие нагрузки ИИ конкурируют за ограниченные GPU-ресурсы. Простое размещение данных в облаке может изолировать их в одной зоне доступности в одном регионе в одном облаке. С помощью правильной ткани данных вы можете проецировать данные туда, где расположены лучшие сервисы и где можно найти ускоренные вычисления, интегрируясь с облачными ИИ-сервисами без необходимости копирования данных из производственных систем.

Шаг 5. Начните с гибридной периферийной модели. Вместо того чтобы думать об онпремис или облаке, думайте об их объединении. Разверните небольшую высокопроизводительную онпремисную инфраструктуру, по сути, горячий кэш, а затем сохраните все в облаке. Вам потребуется интеллектуальный предиктивный кэш, чтобы избежать задержек, но для его реализации вам может понадобиться в 10 раз меньше флэш-памяти, и вы сможете выйти из цикла планирования/обновления мощностей.

Для приложений и пользователей все по-прежнему выглядит локально. За кулисами облако обеспечивает масштабируемость. Это минимизирует сбои и немедленно снижает нагрузку на ресурсы. Бонус: ваши данные теперь находятся в непосредственной близости от крупнейшей в мире коллекции сервисов, инструментов и моделей ИИ.

Шаг 6. Обеспечьте мгновенный доступ к вычислительным ресурсам в любом месте. Современные архитектуры должны позволять предприятиям подключать данные к любому доступному вычислительному ресурсу (в разных облаках, регионах или зонах доступности) в течение нескольких минут и без копирования. Это устраняет необходимость предварительной подготовки данных или резервирования инфраструктуры задолго до этого, что снижает как затраты, так и операционные издержки. Поиск GPU-ресурсов, даже в облаке, — это настоящий вызов. Возможность подключения данных к вычислительным ресурсам в любом месте, где они доступны, и именно тогда, когда они доступны, — это новое конкурентное преимущество.

Стратегия, ориентированная на данные: единственный путь к доступу к вычислительным ресурсам и ресурсам СХД

Возвращение в облако не означает отказ от онпремисных решений. Речь идет о беспрепятственном расширении облачных возможностей за счет мобильности данных без копирования. На рынке, где предложение инфраструктуры ограничено, а конкуренция усиливается, способность быстро переходить к облачным решениям без ущерба для бизнеса имеет первостепенное значение.