Сегодня только 1% SaaS-приложений дополнены искусственным интеллектом, но ситуация быстро меняется, пишет на портале The New Stack Тайлер Джуэлл, генеральный директор компании Akka.

Агентный ИИ быстро становится преобразующей силой в сфере технологий: за последние месяцы число запросов на этот термин в поиске Google выросло на 15 000%. Лидеры отрасли называют его «пятой волной вычислений» и считают, что он кардинально изменит роль корпоративных приложений, их работу и взаимодействие с пользователями.

В то время как ИИ-помощники вроде ChatGPT понимают естественный язык и выполняют задачи по запросу, ИИ-агенты поднимают автоматизацию на новый уровень, автономно выполняя задачи и взаимодействуя с другими системами. В отличие от традиционных систем роботизации процессов (RPA), которые являются статичными и более детерминированными, современные агентные системы являются стохастическими, адаптивными и ориентированными на достижение целей.

Наиболее значительные преобразования произойдут, когда приложения Software as a Service (SaaS) интегрируются с агентными ИИ-сервисами, создав то, что Gartner называет «экосистемой приложений/ИИ». В настоящее время менее 1% SaaS-систем дополнены агентными сервисами, но, по прогнозам Gartner, в течение следующих четырех лет треть глобальных SaaS-приложений будет оснащена ИИ.

Проблемы масштаба и архитектуры

Последствия масштабирования просто ошеломляют. В современную эпоху мобильных вычислений крупномасштабные системы обычно обрабатывают около 10 тыс. транзакций в секунду (TPS). В агентную эру, когда потенциально десятки ИИ-помощников будут постоянно помогать каждому пользователю, объемы транзакций могут вырасти на два порядка и составить около 1 млн. TPS.

Агентный подход требует фундаментальных архитектурных изменений: от систем, ориентированных на транзакции, к системам, ориентированным на общение. Традиционные SaaS-приложения построены на бизнес-логике без сохранения состояния, выполняющей CRUD-операции (создание, чтение, обновление и удаление) с реляционными базами данных. В отличие от них, агентные сервисы поддерживают состояние внутри самого сервиса и хранят каждое событие, чтобы отслеживать, как сервис достиг своего текущего состояния.

Важнейшая архитектурная проблема связана с тем, что большие языковые модели (LLM) не сохраняют состояние. В отличие от баз данных, которые хранят состояние, LLM не запоминают предыдущие разговоры. Это приводит к необходимости вести журнал разговоров, в котором все предыдущие обмены должны быть включены в каждый новый запрос для обеспечения контекста. По мере роста этих журналов они в конечном итоге достигают пределов емкости токенов, что требует тщательного управления.

Мультимодальный ввод и обработка в реальном времени

Агентные системы не ограничиваются текстовыми чат-интерфейсами. Они будут все чаще включать датчики Интернета вещей (IoT), метрики, аудио- и видеовходы, создавая потоки данных реального времени, которые необходимо обрабатывать, дополнять и передавать соответствующим моделям, не перегружая систему. Обеспечить баланс между тем, что обрабатывает агентная система в режиме реального времени, и тем, что могут обработать более медленные и дорогие LLM, является сложной задачей.

Производительность и стоимость

Профиль производительности агентных приложений значительно отличается от традиционных CRUD-приложений. Если реляционные базы данных обычно имеют задержки в 10-30 мс, то LLM работают с задержками в 100 раз больше. Кроме того, стоимость одной транзакции возрастает в 10 тыс. раз по сравнению со средами, использующими только базы данных, а в самых сложных LLM стоимость одной транзакции в 850 тыс. раз выше, чем стоимость вызова базы данных.

В отношении затрат есть определенный оптимизм, поскольку за последние три года цены на LLM постоянно снижались на 90% в годовом исчислении при сохранении того же уровня точности. Эта тенденция позволяет предположить, что эффективность затрат будет продолжать повышаться, хотя и не очень стремительными темпами.

Производственные проблемы

Внедрение агентных систем в производство является сложной задачей. По данным исследования Gartner, 52% организаций не смогли успешно внедрить свои агентные системы. Причиной неудач стали экспериментальные подходы, проблемы с качеством данных, вопросы безопасности, не оправдавшие себя оценки стоимости и технологии, не приспособленные для параллелизма, управления памятью или круглосуточной работы. Многим организациям требуется более восьми месяцев, чтобы перейти от проверки концепции к производству.

Стратегии развертывания при этом различны: организации рассматривают нативные облачные платформы (62%), виртуальные частные облака (около трети) и самостоятельно развернутые среды Kubernetes (около половины). Многие организации рассматривают несколько моделей развертывания одновременно.

Будущее SaaS и агентного ИИ

Хотя сервисы агентного ИИ будут все чаще дополнять SaaS-приложения, они вряд ли полностью их заменят. Высокая латентность агентного цикла обработки данных делает его непригодным для больших объемов взаимодействий с пользователями в режиме реального времени. Это означает, что SaaS-приложениям все равно придется предоставлять необходимые API и многопользовательские параллельные интерфейсы.

Интерфейсы SaaS-приложений будут становиться все более мультимодальными, с большим количеством аудиовизуальных взаимодействий. Определенные приложения могут стать преимущественно (70-80%) агентными, причем соотношение будет зависеть от конкретного сценария использования.

Для предприятий, рассматривающих агентные сервисы, ключевыми факторами стоимости являются затраты на хостинг LLM (либо через облачные сервисы с оплатой за токен, либо самостоятельно), требования к вычислительным ресурсам и памяти, объемы векторных баз данных для семантического поиска и сама агентная платформа. Хотя операционное управление здесь аналогично традиционным системам SaaS, самая большая проблема заключается в обеспечении объяснимости и прослеживаемости по мере развития моделей ИИ.

Вступая в новую эру, организации должны тщательно взвесить производительность, стоимость и пользовательский опыт, чтобы успешно внедрить агентные системы ИИ, которые в полной мере реализуют свой преобразующий потенциал.