Получение выводов искусственного интеллекта (ИИ-инференс) быстро становится доминирующим драйвером спроса на сетевые ресурсы: для поддержки его взрывного роста и мультимодальной сложности требуется масштабируемая оптическая связь, пишет на портале Data Center Knowledge Франсиско Сант’Анна, старший консультант Ciena по маркетингу решений.

В последние годы обучение ИИ доминировало в дискуссиях о глобальной инфраструктуре ИИ. Массивные кластеры графических процессоров, развертывание новых дата-центров и энергоемкие модели стали синонимом масштабов эры ИИ. Но обучение ИИ — это только разминка. ИИ-инференс — вот настоящее испытание для современной инфраструктуры ИИ, которое ждало своего часа и теперь выходит на первый план.

По мере того, как ИИ становится все более мультимодальным и все глубже внедряется в цифровые платформы, инференс становится доминирующим драйвером будущего спроса на сетевые ресурсы. Он также коренным образом меняет принципы работы дата-центров во всем мире. Чтобы справиться с растущими нагрузками инференса, отрасль должна решить критическую, но часто упускаемую из виду проблему узкого места в сети — оптической связи, которая объединяет всю ткань сети.

Растущие нагрузки ИИ-инференса

ИИ-инференс — это фаза «действия» в жизненном цикле модели ИИ. Именно на этом этапе обученная модель может обрабатывать неизвестные данные, чтобы дать ответ, сгенерировать изображение или выполнить задачу. В отличие от обучения, которое является сильно локализованным процессом, инференс происходит повсюду — в приложениях, на корпоративном уровне и в потребительских устройствах.

И нагрузки инференса множатся по мере роста внедрения ИИ. В то время как для внедрения предыдущих технологий или цифровых платформ в повседневную жизнь требовались десятилетия, ChatGPT за два месяца набрал 100 млн. активных ежемесячных пользователей. А теперь мы также наблюдаем массовую интеграцию ИИ в существующие цифровые платформы, используемые на рабочих местах и ​​в жизни потребителей, от поиска до электронной почты, социальных сетей и многого другого. Важно отметить, что встраивание ИИ в эти инструменты и приложения не приводит к постепенному внедрению; оно создает мгновенный, взрывной масштаб.

Мультимодальный ИИ увеличивает нагрузку на сеть

Этот стресс-тест усиливается по мере того, как рабочие нагрузки инференса смещаются от простого текста к мультимодальным взаимодействиям, которые могут одновременно обрабатывать и генерировать текст, изображения, аудио и видео. Для сравнения, один поток видео высокой четкости со смартфона требует нескольких мегабит в секунду постоянной пропускной способности. При умножении на миллионы пользователей объем данных, передаваемых по сети, становится ошеломляющим.

Кроме того, модели становятся все сложнее; модели рассуждений часто декомпозируют задачи на множество внутренних шагов, при этом запросы пользователей запускают десятки фоновых запросов. Даже если запрос пользователя кажется коротким и простым, сеть может передавать мегабайты данных в фоновом режиме для получения ответа. Все это увеличивает трафик в восходящем и нисходящем направлениях между приложениями, источниками данных и моделями ИИ.

Возникновение и распространение облачных решений, ориентированных на ИИ

Опрос Ciena показал, что в ближайшие годы более 40% новых дата-центров, как ожидается, будут в первую очередь предназначены для ИИ, и сдвиг в сторону инференса еще больше ускоряет эту трансформацию. Растущий спрос на инференс стимулирует распространение центров инференса и облачных регионов, ориентированных на ИИ, которые обмениваются огромными объемами данных для снижения задержек, повышения отказоустойчивости и выполнения требований суверенитета. И по мере того, как ИИ внедряется в повседневный цифровой опыт, возможности выполнения инференса должны располагаться как можно ближе к пользователю, при сохранении доступа к централизованным данным и моделям.

Это создает потребность в двух различных, но взаимозависимых сетевых возможностях, которые теперь должны масштабироваться параллельно. Первая — это корпоративный мультиоблачный доступ, когда предприятия и приложения могут легко получать доступ к сервисам ИИ в нескольких облаках и дата-центрах. Вторая — это Data Center Interconnect (DCI), связь с низкой задержкой, которая передает данные и трафик инференса между дата-центрами ИИ и облачными регионами. По мере глобального масштабирования рабочих нагрузок инференса эти возможности должны работать вместе, чтобы сформировать связующую ткань облачных решений, ориентированных на ИИ.

Оптическая связь лежит в основе инференса

Развитие распределенного инференса также меняет подход к планированию пропускной способности сети. Как DCI, так и корпоративный мультиоблачный доступ зависят от отказоустойчивой, масштабируемой оптической инфраструктуры, способной передавать большие объемы чувствительного к задержкам трафика, требуемого для работы приложений ИИ.

Оптическая связь обеспечивает пропускную способность, охват и эффективность, необходимые для следующего этапа эволюции ИИ. Передовые оптические технологии передачи данных максимизируют пропускную способность оптоволокна, минимизируя при этом затраты, используемое пространство и энергопотребление на бит. Одновременно с этим все более важными становятся автоматизированные системы управления сетью, динамически распределяющие полосу пропускания, оптимизирующие трафик и поддерживающие надежное обслуживание по мере изменения рабочих нагрузок ИИ в режиме реального времени.

От внутриЦОДовой связи до оптоволоконных маршрутов DCI, оптические сети реализуют масштабируемую основу, которая позволяет осуществлять распределенный инференс. Без этой надежной, адаптивной инфраструктуры невозможно обеспечить стабильное предоставление ИИ-сервисов в глобальном масштабе.

ИИ-революция — это не только вычислительные мощности; это и связь. По мере того, как ИИ-инференс будет переходить от простых текстовых запросов к сложным, мультимодальным и основанным на рассуждениях взаимодействиям, коренным образом изменятся модели передачи данных в сетях и внутри дата-центров. В перспективе фокус инфраструктуры ИИ должен сместиться на связующее звено — сеть, которая заложит основы для эры ИИ.