Блокчейн Искусственный интеллект Open Source Интернет вещей Big Data/Аналитика Цифровая трансформация Инновации	Сети/Серверы/СХД/ЦОД ПК и периферия Мобильные решения Инфраструктура	Документооборот/ECM Идеи и практики автоматизации Промышленная автоматизация ИТ-менеджмент Автоматизация	Государство и ИТ ИТ-бизнес ИТ-индустрия	Облака	Безопасность
Облака/ИТ-сервисы: Статьи Новости компаний Решения

Панорама

От ITSM до ESM: почему архитектура данных платформы определяет успех масштабирования корпоративных сервисов

Компании, внедряющие ESM-подход — то есть расширяющие практики сервисного подхода в ИТ ITSM на HR …

Как Data-инженер победил «произвол» вендоров и сэкономил компании миллионы

Георгий Андрончик, Lead Data Engineer компании Sanofi, создал универсальный семантический слой для данных, который позволяет …

Российский ИИ — реальному сектору экономики РФ

Системы, использующие искусственный интеллект, сегодня внедряют многие российские компании. Конечно, чтобы был эффект …

Как построить высокопроизводительное отказоустойчивое хранилище на недорогих компонентах

Резервное копирование данных является одним из базовых компонентов обеспечения корпоративной ИБ, который помогает …

Чем занимается Applied Scientist в Big Tech: от математического моделирования до бизнес-влияния

Кто расставляет акценты в маркетинговой реальности. Роль Applied Scientist через опыт Дмитрия Тимошенко. По данным …

Агенты искусственного интеллекта придут в стек SaaS

05.05.2025

Сегодня только 1% SaaS-приложений дополнены искусственным интеллектом, но ситуация быстро меняется, пишет на портале The New Stack Тайлер Джуэлл, генеральный директор компании Akka.

Агентный ИИ быстро становится преобразующей силой в сфере технологий: за последние месяцы число запросов на этот термин в поиске Google выросло на 15 000%. Лидеры отрасли называют его «пятой волной вычислений» и считают, что он кардинально изменит роль корпоративных приложений, их работу и взаимодействие с пользователями.

В то время как ИИ-помощники вроде ChatGPT понимают естественный язык и выполняют задачи по запросу, ИИ-агенты поднимают автоматизацию на новый уровень, автономно выполняя задачи и взаимодействуя с другими системами. В отличие от традиционных систем роботизации процессов (RPA), которые являются статичными и более детерминированными, современные агентные системы являются стохастическими, адаптивными и ориентированными на достижение целей.

Наиболее значительные преобразования произойдут, когда приложения Software as a Service (SaaS) интегрируются с агентными ИИ-сервисами, создав то, что Gartner называет «экосистемой приложений/ИИ». В настоящее время менее 1% SaaS-систем дополнены агентными сервисами, но, по прогнозам Gartner, в течение следующих четырех лет треть глобальных SaaS-приложений будет оснащена ИИ.

Проблемы масштаба и архитектуры

Последствия масштабирования просто ошеломляют. В современную эпоху мобильных вычислений крупномасштабные системы обычно обрабатывают около 10 тыс. транзакций в секунду (TPS). В агентную эру, когда потенциально десятки ИИ-помощников будут постоянно помогать каждому пользователю, объемы транзакций могут вырасти на два порядка и составить около 1 млн. TPS.

Агентный подход требует фундаментальных архитектурных изменений: от систем, ориентированных на транзакции, к системам, ориентированным на общение. Традиционные SaaS-приложения построены на бизнес-логике без сохранения состояния, выполняющей CRUD-операции (создание, чтение, обновление и удаление) с реляционными базами данных. В отличие от них, агентные сервисы поддерживают состояние внутри самого сервиса и хранят каждое событие, чтобы отслеживать, как сервис достиг своего текущего состояния.

Важнейшая архитектурная проблема связана с тем, что большие языковые модели (LLM) не сохраняют состояние. В отличие от баз данных, которые хранят состояние, LLM не запоминают предыдущие разговоры. Это приводит к необходимости вести журнал разговоров, в котором все предыдущие обмены должны быть включены в каждый новый запрос для обеспечения контекста. По мере роста этих журналов они в конечном итоге достигают пределов емкости токенов, что требует тщательного управления.

Мультимодальный ввод и обработка в реальном времени

Агентные системы не ограничиваются текстовыми чат-интерфейсами. Они будут все чаще включать датчики Интернета вещей (IoT), метрики, аудио- и видеовходы, создавая потоки данных реального времени, которые необходимо обрабатывать, дополнять и передавать соответствующим моделям, не перегружая систему. Обеспечить баланс между тем, что обрабатывает агентная система в режиме реального времени, и тем, что могут обработать более медленные и дорогие LLM, является сложной задачей.

Производительность и стоимость

Профиль производительности агентных приложений значительно отличается от традиционных CRUD-приложений. Если реляционные базы данных обычно имеют задержки в 10-30 мс, то LLM работают с задержками в 100 раз больше. Кроме того, стоимость одной транзакции возрастает в 10 тыс. раз по сравнению со средами, использующими только базы данных, а в самых сложных LLM стоимость одной транзакции в 850 тыс. раз выше, чем стоимость вызова базы данных.

В отношении затрат есть определенный оптимизм, поскольку за последние три года цены на LLM постоянно снижались на 90% в годовом исчислении при сохранении того же уровня точности. Эта тенденция позволяет предположить, что эффективность затрат будет продолжать повышаться, хотя и не очень стремительными темпами.

Производственные проблемы

Внедрение агентных систем в производство является сложной задачей. По данным исследования Gartner, 52% организаций не смогли успешно внедрить свои агентные системы. Причиной неудач стали экспериментальные подходы, проблемы с качеством данных, вопросы безопасности, не оправдавшие себя оценки стоимости и технологии, не приспособленные для параллелизма, управления памятью или круглосуточной работы. Многим организациям требуется более восьми месяцев, чтобы перейти от проверки концепции к производству.

Стратегии развертывания при этом различны: организации рассматривают нативные облачные платформы (62%), виртуальные частные облака (около трети) и самостоятельно развернутые среды Kubernetes (около половины). Многие организации рассматривают несколько моделей развертывания одновременно.

Будущее SaaS и агентного ИИ

Хотя сервисы агентного ИИ будут все чаще дополнять SaaS-приложения, они вряд ли полностью их заменят. Высокая латентность агентного цикла обработки данных делает его непригодным для больших объемов взаимодействий с пользователями в режиме реального времени. Это означает, что SaaS-приложениям все равно придется предоставлять необходимые API и многопользовательские параллельные интерфейсы.

Интерфейсы SaaS-приложений будут становиться все более мультимодальными, с большим количеством аудиовизуальных взаимодействий. Определенные приложения могут стать преимущественно (70-80%) агентными, причем соотношение будет зависеть от конкретного сценария использования.

Для предприятий, рассматривающих агентные сервисы, ключевыми факторами стоимости являются затраты на хостинг LLM (либо через облачные сервисы с оплатой за токен, либо самостоятельно), требования к вычислительным ресурсам и памяти, объемы векторных баз данных для семантического поиска и сама агентная платформа. Хотя операционное управление здесь аналогично традиционным системам SaaS, самая большая проблема заключается в обеспечении объяснимости и прослеживаемости по мере развития моделей ИИ.

Вступая в новую эру, организации должны тщательно взвесить производительность, стоимость и пользовательский опыт, чтобы успешно внедрить агентные системы ИИ, которые в полной мере реализуют свой преобразующий потенциал.

Печать

Мы используем cookie-файлы, возможности Яндекс.Метрики и SberAds для наилучшего представления нашего сайта в соответствии с Политикой обработки персональных данных. Если Вы согласны с этим, пожалуйста, нажмите кнопку «Принять». Продолжая пользоваться сайтом, Вы подтверждаете, что были проинформированы об использовании сайтом cookie-файлов, Яндекс.Метрики и SberAds, и согласны с Политикой обработки персональных данных.