Следующий этап развития корпоративного искусственного интеллекта может определяться не столько возможностями моделей, сколько физической инфраструктурой и операционной дисциплиной, необходимыми для его поддержки. В то же время амбиции индустрии ИИ в отношении инфраструктуры начинают сталкиваться с физической реальностью, отмечают опрошенные порталом InformationWeek эксперты.

Опубликованные в последние недели многочисленные отчеты указали на задержки и ограничения, влияющие на расширение мощностей для ИИ, от проблем со строительством дата-центров до растущей обеспокоенности по поводу доступности электроэнергии. Недавний анализ JPMorgan показал растущее давление на энергетическую инфраструктуру по мере ускорения связанного с ИИ спроса на электроэнергию. Кроме того, юридические споры, задержки с получением разрешений и сложность контрактов все больше замедляют развитие новых дата-центров для ИИ-нагрузок.

В то же время крупные технологические компании продолжают увеличивать свои расходы на инфраструктуру ИИ, что подтверждает ожидания того, что спрос предприятий на вычислительные ресурсы также будет продолжать резко расти.

Для CIO эту проблему становится все труднее игнорировать. Дискуссия об ИИ сейчас в основном сосредоточена на моделях, приложениях и повышении производительности. Гораздо меньше внимания уделяется инфраструктуре, необходимой для поддержания масштабного внедрения ИИ на предприятиях, а также тому, что произойдет, если эта инфраструктура окажется ограниченной, с задержками или регионально неравномерной.

Дэвид Линтикум, основатель Linthicum Research и бывший управляющий директор Deloitte, считает, что отрасль уже сталкивается с «классическим несоответствием между объявленными инвестициями и развертываемыми мощностями».

Непосредственный риск заключается не обязательно в резком дефиците мощностей для ИИ. Более вероятен постепенный переход к более ограниченной операционной среде, где инференс становится дороже, доступ менее предсказуемым, а решения о приоритизации все более неизбежными. Эта перспектива уже побуждает некоторых технологических лидеров переосмыслить предположения, лежащие в основе их планов развития ИИ.

Разрыв между инвестициями в ИИ и операционными мощностями

Масштабы инвестиций, направляемых в инфраструктуру ИИ, остаются огромными, при этом гиперскейлеры и поставщики ИИ продолжают тратить миллиарды в погоне за будущим объемом вычислений. Но некоторые эксперты заявляют, что отрасль, возможно, недооценивает, насколько сложно преобразовать капитальные затраты в операционные мощности для ИИ. По их мнению, проблема заключается в том, что масштабирование физической инфраструктуры происходит гораздо медленнее, чем того требует ПО.

«Капиталовложения попадают в заголовки новостей, но доступность электроэнергии, получение разрешений, модернизация сетей, вопросы охлаждения, поставка специализированного оборудования и сроки строительства замедляют реальную реализацию, — отмечает Линтикум. — Деньги движутся быстрее, чем инфраструктура».

Эдвард Либиг, CEO и CISO Yoink Industries и адъюнкт-профессор Вашингтонского университета в Сент-Луисе, подчеркивает, что проблема выходит за рамки доступности вычислительных ресурсов. «Кривая спроса на инфраструктуру ИИ, похоже, опережает не только строительство дата-центров, но и доступность электроэнергии, охлаждение, масштабируемость межсоединений и операционную интеграцию, необходимые для надежного запуска этих сред», — говорит он.

Однако Либиг также предостерегает от того, чтобы рассматривать ограничения инфраструктуры исключительно как проблему ее предоставления. По его мнению, это давление выявляет слабые места в подходах самих предприятий к развертыванию ИИ. «Мы начинаем видеть, как ограничения инфраструктуры выявляют, есть ли у организаций стратегия дисциплинированной работы с ИИ или это просто совокупность разрозненных инициатив в области ИИ, конкурирующих за ресурсы», — говорит он.

Это различие может становиться все более важным по мере того, как предприятия расширяют внедрение ИИ в различных отделах. Многие организации одновременно экспериментируют с «вторыми пилотами», рабочими процессами с поддержкой ИИ, аналитическими инструментами, системами поиска и агентными системами, часто без централизованного управления или операционной приоритизации. Либиг описывает результат всего этого как «разрастание ИИ», когда спрос на инфраструктуру растет быстрее, чем измеримая бизнес-ценность. «Организации, наиболее страдающие от нехватки мощностей для ИИ, могут быть не теми, у кого меньше всего инфраструктуры, а теми, у кого меньше всего операционной дисциплины в отношении развертывания ИИ», — говорит он.

Как могут проявляться инфраструктурные ограничения

Не все эксперты считают, что предприятия столкнутся с немедленным кризисом мощностей для ИИ. Дональд Фармер, футуролог из Tranquilla AI, занимает более взвешенную позицию, утверждая, что у многих CIO может быть больше времени, чем кажется. «Мы ожидаем, что основным двигателем внедрения в корпоративной среде станет агентный ИИ, а не генеративный ИИ, — говорит он, ссылаясь на исследование TDWI, которое показывает, что только 31% компаний считают, что внедрение агентного ИИ происходит уже сейчас, тогда как 49% прогнозируют, что это займет от 1 до 5 лет. — Поэтому я подозреваю, что у производства электроэнергии еще есть время для ускорения этого процесса».

Фармер также указывает на повышение эффективности как моделей, так и оборудования, что снизит вычислительную нагрузку. Тем не менее, несколько экспертов сходятся во мнении, что ограничения, вероятно, будут возникать неравномерно, при этом средние предприятия могут столкнуться с наибольшим давлением в периоды пиковой нагрузки.

«Я подозреваю, что нагрузкам обучения ничего не грозит, — говорит Фармер. — В условиях, когда мощности ограничены, гиперскейлеры, предположительно, будут отдавать приоритет своим собственным рабочим нагрузкам ИИ и своим крупнейшим корпоративным клиентам».

Линтикум аналогично формулирует проблему не как явный дефицит, а скорее как периодическую нестабильность. «Самый большой риск заключается не в том, что ИИ не сможет работать, ​​а в том, что доступ станет дороже, будет страдать задержками или будет неравномерным в зависимости от региона и поставщика», — говорит он.

Это различие важно, поскольку многие корпоративные стратегии в области ИИ в настоящее время предполагают относительно беспрепятственный доступ к вычислительным ресурсам. Организациям, разрабатывающим планы по быстрому экспериментированию, инференсу в реальном времени и постоянно доступным сервисам ИИ, возможно, потребуется подготовиться к более ограниченной среде, чем они первоначально предполагали.

«Один из возникающих рисков заключается в том, что организации могут непреднамеренно выстроить бизнес-процессы, предполагающие бесконечную доступность ИИ и бесконечную скорость обработки инференса, — говорит Либиг. — Физическая инфраструктура может поставить под сомнение это предположение раньше, чем многие ожидают».

Управление ИИ становится инфраструктурной проблемой

Перспектива ограниченных возможностей ИИ также начинает менять дискуссии об управлении и приоритизации.

Либиг утверждает, что предприятия, ориентированные на операционную надежность и отказоустойчивость, в конечном итоге могут оказаться в более выгодном положении в периоды давления на инфраструктуру, поскольку они, как правило, более обдуманно расширяют ИИ. Эти компании, как правило, отдают приоритет критически важным для операционной деятельности сценариям использования и расширяют их постепенно после подтверждения ценности, управления и контроля.

«Ограниченное расширение создает устойчивость, поскольку организации могут расставлять приоритеты для наиболее важных функций ИИ, когда условия инфраструктуры ужесточаются», — говорит Либиг.

Такой подход также меняет то, как CIO оценивают инвестиции в ИИ внутри компании. Центральный вопрос смещается от приобретения дополнительных мощностей для ИИ к определению того, для каких рабочих нагрузок оправдан приоритетный доступ к ограниченной инфраструктуре.

Линтикум описывает аналогичную необходимость в операционной дисциплине. Он утверждает, что CIO должны начать разделять инициативы в области ИИ на уровни — критически важные, важные и экспериментальные, — чтобы распределение инфраструктуры стало целенаправленным, а не реактивным. «Предприятия без планов на случай непредвиденных обстоятельств наиболее уязвимы», — говорит он.

Этот сдвиг может также заставить организации стать более избирательными в отношении того, где действительно необходимы передовые модели ИИ. Фармер отмечает, что многие предприятия уже добиваются успеха с небольшими локальными моделями, работающими на стандартном оборудовании, особенно в средах, где вопросы управления, соответствия нормативным требованиям или стоимости делают зависимость от облачных технологий менее привлекательной. «Не все должно работать на самой последней и лучшей модели», — говорит он.

Что CIO должны спрашивать у поставщиков сейчас

По мере того, как ограничения инфраструктуры становятся все более очевидными, CIO также должны начать рассматривать возможности ИИ как вопрос устойчивости и непрерывности, а не просто как вопрос закупок, считают эксперты. Чтобы предотвратить потенциальные проблемы, ИТ-руководству нужна ясность в отношении текущих поставок.

Линтикум отмечает, что предприятиям необходима от поставщиков гораздо большая прозрачность в отношении того, как управляется дефицит мощностей. «Они должны очень прямо спрашивать о гарантиях пропускной способности, региональной доступности, приоритизации очередей, волатильности цен, вариантах резервирования и переносимости между средами», — говорит он.

Фармер также утверждает, что обсуждения должны все больше фокусироваться на операционной надежности, а не на наборе функций. Среди вопросов, которые он предложил CIO задавать поставщикам, есть следующие:

• Каковы ваши договорные обязательства по доступности пропускной способности в пиковые периоды?

• Если я беру на себя обязательства по многолетнему резервированию пропускной способности, что это дает мне с точки зрения приоритета по сравнению с клиентами, использующими ресурсы по запросу?

Либиг идет дальше, утверждая, что CIO должны требовать прозрачности в отношении того, как сами поставщики ведут себя в условиях ограниченного ресурса: «Как определяется приоритетность рабочих нагрузок в пиковые периоды спроса? Могут ли сервисы корректно снижать производительность при росте нагрузки на инфраструктуру? Какие существуют зависимости от общих пулов графических процессоров или сторонних поставщиков моделей?».

Эти вопросы отражают более широкие изменения, происходящие в стратегии корпоративного ИИ. Доступность инфраструктуры, которая когда-то рассматривалась в основном как абстрактная проблема гиперскейлеров, все чаще становится операционной зависимостью. При разработке планов развития ИИ для предприятий необходимо учитывать не только то, что они хотят видеть в системах ИИ, но и то, сможет ли базовая инфраструктура надежно поддерживать эти амбиции в масштабе.