Агенты искусственного интеллекта не заменят веб, но они изменят то, как мы его используем, пишет на портале InformationWeek Роберт Блумоф, исполнительный вице-президент и технический директор Akamai.

Вы когда-нибудь оказывались на веб-сайте, не зная, как перемещаться по страницам, ссылкам, формам и меню, чтобы сделать то, что вам нужно? Возможно, так выглядит главная страница сайта вашего медицинского учреждения. Там много всего, но, возможно, не совсем понятно, на что нужно нажать, чтобы записаться на прием.

Или, может быть, это ваш любимый развлекательный сайт. Там много фильмов, отсортированных по жанрам, и некоторые рекомендации, основанные на предыдущем просмотре, но как найти тот фильм из 1980-х, название которого вы не можете вспомнить?

Вот уже три десятилетия — с тех пор, как Тим Бернерс-Ли впервые подарил нам Всемирную паутину с ее языком гипертекстовой разметки — парадигма использования веб-сайтов в значительной степени остается неизменной. Мы читаем страницы. Мы переходим по ссылкам. Мы заполняем формы и перемещаемся по меню. Этот интерфейс определил, как мы получаем доступ к информации, покупаем товары и общаемся друг с другом. Но эта эпоха подходит к концу — не потому, что Интернет исчезает, а потому, что веб-интерфейс вот-вот будет переписан.

Теперь у нас есть нечто лучшее, и это нечто — использование агентов ИИ.

Преимущества мультимодального ИИ

Эти агенты — не полностью автономные, делающие все что угодно агенты из какого-нибудь научно-фантастического будущего. Мы не говорим о J.A.R.V.I.S. Тони Старка из «Железного человека». Мы говорим об агентах, которые легко создать с помощью современных технологий. Вместо того чтобы быть агентами, делающими все что угодно, они являются специализированными, разработанными и спроектированными для выполнения одной задачи или небольшого, связанного семейства задач. Вместо того чтобы быть полностью автономными, эти агенты оказывают помощь и ведут диалог с людьми — нами — в процессе с обратной связью.

Например, чтобы записаться на прием к врачу, вы вступите в диалог с агентом ИИ, который записывает пациентов на прием. Вы сообщите ему свои предпочтения, и он предложит доступные временные промежутки. После некоторой переписки вы согласуете дату и время, и система забронирует прием и отправит вам подтверждение.

Вместо того чтобы просматривать веб-сайт, вы будете заниматься тем, что похоже на разговор с человеком по телефону. Но это будет лучше.

Лучше, потому что, в отличие от телефонного разговора, который ограничивается голосом, ваше общение с агентом может включать графические элементы. Например, агент может показать вам календарь с выделенными доступными временными промежутками, возможно, наложенными на ваш личный календарь.

А агент по подбору фильмов — после короткого разговора, возможно, с изображениями актеров — без труда найдет для вас тот самый фильм из 1980-х, где снимались звезды «Brat Pack».

Таким образом, эти агенты будут не только помогать и общаться; они также будут мультимодальными, используя речь, текст, графику и интерактивные элементы. Они также могут быть гиперперсонализированными. Например, агент по бронированию встреч может уже знать, что вы предпочитаете назначать встречи на утро вторника.

Переосмысление интерфейса веб-сайта

Представьте себе этих агентов как ваш новый и улучшенный веб-интерфейс. Веб на основе браузеров уступает место чему-то более динамичному: интерфейсу, который вступает в диалог, понимает контекст и выполняет задачи. Эти агенты не заменят веб, но они изменят то, как мы его используем.

Этот сдвиг будет иметь серьезные последствия. В 1990-х зародилась новая индустрия, связанная с проектированием, созданием и поддержкой веб-сайтов. Разработка пользовательского опыта для веб-сайтов стала востребованным новым навыком. Сейчас мы вступаем в аналогичную фазу с агентами ИИ. Вокруг проектирования, создания и управления этими агентными интерфейсами сформируется новая экономика. Разработка отличных диалоговых интерфейсов — это совершенно новый набор навыков. Те, кто обладает этими навыками, будут очень востребованы. Компании будут конкурировать не только по контенту или продуктам, но и по качеству своих агентных интерфейсов.

Ведущие технологические компании уже занимают свою нишу. Крупнейшие поставщики базовых моделей (например, OpenAI, Anthropic и Google) разрабатывают универсальных агентов, стремящихся стать единой ИИ-платформой — ИИ-фронтендом для всего Интернета. Но создание отличных разговорных интерфейсов — непростая задача, и экспертные знания в данной области станут критически важным фактором дифференциации.

Поставщик медицинских услуг и развлекательная компания из наших примеров должны быть в состоянии предоставить своим клиентам и их сценариям использования более качественные разговорные интерфейсы, чем универсальный агент, выполняющий любые задачи. Компании, которые стремятся к тесному взаимодействию с клиентами, получат преимущество.

Для этого компаниям необходимо учитывать два аспекта: пользовательский опыт на фронтенде, а также внутреннюю инфраструктуру. На фронтенде разработчики этих агентов ИИ должны относиться к дизайну и пользовательскому опыту с таким же вниманием и тщательностью, как и при создании лучших веб-сайтов и мобильных приложений сегодня.

Что касается базовой инфраструктуры, поддерживающей этот новый Интернет, ориентированный на агентов, нам понадобится больше, чем просто графические процессоры. В то время как первая волна чат-ботов и приложений генеративного ИИ (GenAI) требовала архитектур, ориентированных на GPU, агенты ИИ представляют собой полноценные приложения со множеством компонентов. ИИ больше не будет отдельным приложением, он станет частью приложения. Это означает, что нам потребуется более сбалансированная инфраструктура: GPU для выполнения моделей, CPU для традиционных вычислений, системы хранения для контекстных и поисковых систем, таких как RAG (генерация с расширенной выборкой), и надежная сеть для подключения к удаленным API, серверам MCP, пользователям и устройствам. Для эффективной работы и масштабирования эти системы также потребуют современных возможностей оркестрации, таких как Kubernetes.

Короче говоря, технология уже существует и доступна нам, но ее необходимо продуманно применить к этой новой веб-парадигме, чтобы мы могли реализовать потенциал агентов ИИ.

Мы не движемся в мир научной фантастики с разумными машинами. Мы движемся в мир, где полезное, контекстно-ориентированное ПО станет нормой. Переход не произойдет в одночасье, но он уже начался. Веб, который мы знаем, никуда не денется, но он претерпит фундаментальные изменения. При правильном подходе эта трансформация может изменить жизнь каждого из нас к лучшему, позволив нам больше взаимодействовать с физическим миром и друг с другом, в то время как агенты будут перемещаться в цифровом мире.