Модернизация архитектуры предприятия — важнейший этап на пути к переходу к цифровому бизнесу, основанному на искусственном интеллекте и данных, пишет на портале Network Computing Лори Маквитти, главный технический евангелист в офисе технического директора компании F5 Networks.

В прошлые годы мы наблюдали, как компании устремлялись в облако в поисках возможностей и экономии средств, соблазненные громкими заявлениями о том, что облако изменит все. Так и произошло, но многие не учли изменений, происходящих во всех областях — от вычислений до инфраструктуры и сервисов приложений. Сегодня пение сирен ИИ привлекает многих, кто хочет оказаться «в деле» еще до того, как начнут появляться преимущества.

Но давайте на этот раз извлечем уроки из истории. Существуют навыки, технологии и практики, которые необходимо внедрить для успешного получения отдачи от инвестиций в ИИ. Технологический стек ИИ еще только формируется, но уже быстро включает в себя широкий спектр технологий и возможностей, которыми сегодня не обладают многие организации.

Существует несколько различных версий этого стека, но большинство из них имеют простую структуру и содержит практически все компоненты.

Типовой ИИ-стек

И то, на чем держится весь стек ИИ, — это, как ни удивительно, контейнеры и аппаратное обеспечение. Именно они определяют две ключевые тенденции, ускоряющие изменения, которые необходимо рассмотреть — и, вероятно, включить в свой технологический стек — прежде чем подписывать чек на инвестиции в ИИ.

#1. Вычислительная платформа

Если вы еще этого не сделали, то сейчас самое время поднять голову и внимательно посмотреть на рабочие нагрузки, развернутые в Kubernetes в ядре, облаке и на периферии.

Компания Dynatrace именно так и поступила и выяснила, что в некогда «прикладной» среде теперь размещается больше вспомогательных (63%), чем прикладных (37%) рабочих нагрузок. Что же это за вспомогательные нагрузки? Согласно Pepperdata «State of Kubernetes 2023 Report», это рабочие нагрузки, которые удовлетворяют растущие потребности в возможностях, связанных с данными: сбор, очистка и аналитика данных (61%), базы данных (59%), микросервисы (57%) и ИИ/МО (54%).

По некоторым данным, мы также наблюдаем переход от Kubernetes как инфраструктуры, ориентированной в первую очередь на приложения, к Kubernetes как вычислительной инфраструктуре на местах. С развитием Kubernetes выросла и ее способность поддерживать более устойчивый набор рабочих нагрузок, и контейнеры готовы заменить виртуальные машины в качестве платформы для предоставления современных приложений, данных и рабочих нагрузок ИИ/МО.

А как обстоят дела с контейнерами у вас? Есть ли у вас практики, процессы и навыки, необходимые для работы с контейнерами в качестве вычислительной платформы? Если нет, то, возможно, стоит направить часть ИИ-бюджета на это.

#2. Аппаратное обеспечение

Любой, кто пытался запустить большую языковую модель (LLM) локально, понимает, что требования к вычислительным ресурсам могут оказаться непомерно высокими. Потребности ИИ/МО в памяти и процессорах экспоненциально увеличили нижнюю границу вычислительных ресурсов, необходимых только для запуска ИИ/МО-модели, не говоря уже о ее обучении.

Это является отражением возросшей сложности задач, которые ставятся перед моделями, и большей доступности данных. Согласно «2023 AI Index» Стэнфордского университета, рост требований приводит к тому, что «с течением времени количество параметров вновь выпускаемых больших языковых и мультимодальных моделей массово увеличивается. Например, GPT-2, которая была первой большой языковой и мультимодальной моделью, выпущенной в 2019 г., имела всего 1,5 млрд. параметров. PaLM, запущенная Google в 2022 г., имела 540 млрд. параметров, что почти в 360 раз больше, чем у GPT-2».

Отчет Стэнфорда — самый тщательный из всех, что я читала, а вторая глава включает в себя значительные исследования и тестирование производительности. Результаты? Оказывается, закон Мура вовсе не умер. Он просто переключил свое внимание на графические процессоры: «средний показатель FLOP/s на доллар для GPU в 2022 г. в 1,4 раза выше, чем в 2021 г., и в 5600 раз выше, чем в 2003 г., что свидетельствует об удвоении производительности каждые 1,5 года».

Для предприятий это означает, что даже самые мощные серверы вряд ли «достаточно хороши» для работы с сегодняшними моделями, не говоря уже о моделях завтрашнего дня. Пришло время направить часть ИИ-бюджета на модернизацию инфраструктуры и увеличение ее вычислительных мощностей.

Верхушка айсберга

Вычислительные платформы и аппаратное обеспечение находятся в самом низу стека ИИ. Выше этого слоя есть еще много чего, требующего внимания, и если не учитывать такие вещи, как конвейеры и методы работы с данными, управление и безопасность, знакомство с векторными базами данных и хотя бы мимолетное внимание к управлению подсказками, инвестиции в ИИ не принесут той отдачи, которую ожидает 21% руководителей компаний, сообщивших KPMG, что они рассчитывают получить ROI от своих инвестиций в генеративный ИИ через 1-3 года.

При разработке плана модернизации архитектуры предприятия для цифрового бизнеса, ИИ/MО является ключевым фактором расширения области данных, а инфраструктуру и доставку приложений следует рассматривать как отдельные области. И, конечно, наблюдаемость и автоматизация являются новыми дополнениями к модели архитектуры предприятия.

Модернизация архитектуры предприятия является важнейшим этапом на пути к переходу к цифровому бизнесу, управляемому ИИ и данными. И все начинается с обеспечения прочного фундамента, который для корпоративных ИТ означает вычислительную инфраструктуру.