Готова ли ваша сеть к рабочим нагрузкам и данным искусственного интеллекта? Мэри Шеклет, президент консалтинговой компании компании Transworld Data, рассказывает на портале InformationWeek о связанных с ИИ аспектах сетевого стека, которые следует учесть.

Выполнение моделей ИИ и полезная нагрузка ИИ-данных существенно отличаются от того, что происходит в традиционных сетевых рабочих процессах. Какие изменения необходимо предусмотреть, чтобы ваша сеть была готова к поддержке приложений ИИ? Это главный вопрос, стоящий перед специалистами по корпоративным сетям, потому что ИИ наступает.

В конце 2023 г. 35% компаний использовали тот или иной вид ИИ, но большинство организаций, применявших его, были богатыми ресурсами технологическими компаниями. По мере того как другие организации начнут внедрять ИИ, им потребуются новые инвестиции и пересмотр сетевой архитектуры.

Как много сетевой специалист должен знать об ИИ?

Исторически сложилось так, что сетевому персоналу не нужно было много знать о приложениях, кроме того, сколько данных они передают из точки в точку, каковы скорость и объем транзакций. Ситуация несколько изменилась с появлением в сетевом трафике большего количества неструктурированных «больших» данных, но адаптация к большим данным для видео, аналитики и т. д. все еще не стала серьезным нарушением сетевых планов.

ИИ все это изменит — и потребует от сетевого персонала больше узнать о приложениях и системах ИИ.

Это связано с тем, что не существует универсальной модели для всех стилей ИИ. В зависимости от того, что обрабатывают приложения ИИ, они будут использовать различные типы логических алгоритмов. Эти различные типы алгоритмов могут существенно повлиять на объем пропускной способности, необходимой для их поддержки.

Например, если ИИ использует алгоритм контролируемого обучения, все входные данные, поступающие в приложение, уже помечены для облегчения поиска и обработки. Кроме того, эти данные поступают из конечного репозитория данных, который можно оценить количественно. В отличие от этого, такие приложения ИИ, как генеративный ИИ, используют неконтролируемый алгоритм обучения. В таком алгоритме данные не имеют меток и поэтому требуют более тщательной обработки. Кроме того, в приложение может поступать неограниченный поток данных, который не поддается количественной оценке.

Оценить и обеспечить пропускную способность для ИИ, использующего алгоритмы контролируемого обучения, проще, поскольку многие факторы обработки и данных уже известны, а также потому, что данные предварительно маркируются для повышения производительности. Знание этих факторов, скорее всего, позволит вам выделить меньшую пропускную способность, чем для неконтролируемого алгоритма обучения.

Если система ИИ использует неконтролируемый алгоритм обучения, оценка пропускной способности сети и выделение ресурсов становятся более сложными. Вы не сможете определить, сколько пропускной способности вам понадобится, пока не наберетесь опыта работы с приложением, потому что вы не знаете, сколько данных будет поступать, какова будет скорость передачи полезной нагрузки и насколько сложно будет обрабатывать эти данные. Скорее всего, сначала вы выделите слишком много ресурсов, а затем, по мере накопления опыта, будете их уточнять.

В любом случае сетевой персонал должен взаимодействовать с группами приложений и науки о данных, чтобы сотрудники заранее понимали, какие алгоритмы обработки ИИ будут использоваться и как они могут планировать пропускную способность и другие элементы производительности сети, чтобы справиться с рабочей нагрузкой.

Кроме того, ИИ использует параллельные вычисления, которые разбивают обработку на ряд более мелких задач, выполняемых одновременно, чтобы ускорить обработку. ИИ может использовать сотни или даже тысячи процессоров одновременно на множестве различных машин. Технологические потоки, сильно связанные друг с другом, группируются в вычислительные кластеры, которые предъявляют к сетям огромные требования по пропускной способности. Перегрузка даже одного из этих потоков обработки может замедлить работу всего кластера.

Перед сетевым персоналом изначально стоит задача содействовать своевременному завершению ИИ-заданий и устранять перегрузки. Поскольку в этой области управления сетями существует мало передовых методов, сетевому персоналу придется приобретать знания на основе своего опыта и разрабатывать собственные лучшие практики.

Какие новые сетевые инвестиции необходимо сделать для ИИ?

Для поддержки интенсивной обработки неконтролируемых алгоритмов в таких приложениях, как генеративный ИИ, потребуется производительность на уровне суперкомпьютера, а сети и сетевые технологии должны быть масштабируемы, чтобы справиться с этими рабочими нагрузками.

Что касается периферийных сетевых устройств, то для машинного и глубокого обучения ИИ, возможно, будет использоваться Tensor Processing Unit от Google — ASIC, поддерживающая механизм программирования Google TensorFlow; в то время как Apple использует бионические процессоры A11 и A12.

Для поддержки этих и других технологий ИИ внутренним магистралям Ethernet потребуется больше «мяса», и это признают организации типа UEC (Ultra Ethernet Consortium). Именно поэтому члены этого консорциума работают над определением и разработкой открытого, масштабируемого и экономичного коммуникационного стека для сети, которая будет поддерживать высокопроизводительную ИИ-обработку, используя при этом стабильную базу Ethernet.

К сожалению, большая часть этой новой технологии, поддерживающей стек ИИ, еще не появилась, но она может появиться в 2025 г., поэтому сейчас самое время начать планировать и определять, как ее внедрение изменит топологии сетей.