Макс Лю, соучредитель и генеральный директор TiDB, разработанной компанией PingCAP распределённой базы данных SQL с открытым исходным кодом, рассказывает на портале The New Stack о том, почему агенты искусственного интеллекта становятся новыми основными пользователями баз данных и как должна развиваться архитектура, чтобы приоритизировать скорость, эластичную эфемерность и безопасность за счет изоляции.

В прошлом мы оценивали корпоративные базы данных по тому, насколько они полезны для таких людей, как мы. Мы оценивали их по тому, насколько хорошо они помогают архитекторам создавать схемы, администраторам баз данных планировать ресурсы, а аналитикам — создавать запросы.

Мы ожидали, что эти базы данных будут служить долго — вероятно, многие годы — обеспечивая отчеты о продажах и квартальные прогнозы и развиваясь вместе с организацией. Но теперь появился новый тип пользователя: ИИ-агент. У него другие потребности. Он работает в другом темпе. Он использует базы данных для выполнения своей работы; но как только его задача выполнена, базу данных можно удалить.

Мы можем представить себе базу данных, разработанную для людей, как замедленную съемку сверху формирования городского ландшафта. На протяжении всей сцены краны и бульдозеры заняты добавлением и удалением сооружений, оставляя большинство зданий нетронутыми. Детали меняются, но общая форма города и взаимосвязи между его частями остаются относительно стабильными.

База данных, разработанная с учетом потребностей агентов, выглядела бы совсем иначе. Вместо устойчивой картины взаимосвязанной сети улиц и зданий — аналогия традиционной реляционной базы данных — сцена постоянно меняется. Квартиры и городские кварталы, не связанные друг с другом, появляются и исчезают быстрее, чем глаз может это заметить. Высокоскоростная фотосъемка показывает, что сооружения имеют причудливую форму. Они не предназначены для использования людьми. Их форма, местоположение и, прежде всего, их эфемерность служат потребностям цифровых пользователей.

Все признаки указывают на то, что в ближайшем будущем агенты, а не люди, будут основными пользователями баз данных. Итак, как же должны измениться базы данных?

Базы данных должны отдавать приоритет скорости, а не удобству использования

Как и люди, агенты планируют задачи, выполняют действия, наблюдают за результатами и адаптируются на основе полученных знаний. Но в отличие от людей, агенты работают быстрее, чем можно подумать. Им не важна простота использования.

В первую очередь, ИИ-агент ценит скорость. Доступность и отзывчивость тоже. Но скорость важнее всего.

Агенты постоянно обращаются к данным. Они генерируют резкие всплески активности и свертывают свое рабочее пространство, как только работа завершена. Их рабочие «привычки» создают слишком высокую нагрузку на базы данных, оптимизированные для бесконечно более медленных и продуманных взаимодействий с человеком.

Как сказал мой коллега Эд Хуанг, «агенты не замедляются и не оптимизируются, если вы их к этому не принуждаете. Их естественное состояние — это комбинаторный взрыв».

Платформа баз данных, разработанная для ИИ-агентов, должна реагировать так же быстро, как и ИИ.

Нам придется учитывать эластичную эфемерность

Как правило, масштабирование облачной базы данных включает копирование целых кластеров данных. Это связано с ограничениями корпоративных сетей. Для поддержания высокой производительности данные должны храниться рядом с вычислительными ресурсами. Но репликация и сохранение данных требуют времени и увеличивают затраты.

В ориентированных на человека базах данных эти неэффективности нежелательны; в базах данных, ориентированных на ИИ, они неприемлемы.

Непрактично и расточительно создавать новые кластеры данных всякий раз, когда агент резко увеличивает загрузку CPU. Базам данных, ориентированным на ИИ, потребуется масштабировать вычислительные ресурсы вверх и вниз, минимизируя при этом влияние на локальное хранилище и затраты на хранение.

Архитектуры, которые разделяют вычислительные ресурсы и системы хранения, особенно использующие облачное объектное хранение в качестве своей основы, напрямую решают эту задачу. В них вычислительные ресурсы масштабируются эластично в зависимости от интенсивности и типа рабочей нагрузки. Холодные данные остаются в объектном хранилище, где затраты минимальны. Часто используемые данные кэшируются рядом с компьютером для обеспечения низкой задержки.

Такая конструкция обеспечивает быстрое масштабирование в периоды активности и быстрое уменьшение масштаба при спаде спроса — именно так работает ИИ.

И нам придётся обеспечивать безопасность за счёт изоляции

Агенты могут быть непредсказуемыми. Им нужны ограничительные механизмы. Для поддержки пользователей-агентов базы данных должны предоставлять среды, в которых агенты могут безопасно работать, не опасаясь повредить что-либо важное.

Бессерверное ветвление может быть полезным подходом. База данных с возможностью ветвления может создавать изолированные среды с копированием при записи, где агент может работать с реальными данными, не опасаясь перегрузки системы или повреждения данных.

Опыт Manus, универсальной платформы для ИИ-агентов, которая за несколько недель привлекла миллионы пользователей, хорошо это иллюстрирует. Модель «контекстного инжиниринга» Manus генерирует тысячи итераций для каждой задачи, каждая из которых сохраняет состояние по мере выполнения. Это требует исключительной производительности чтения-записи.

Более того, Manus хотела создать рои агентов, способные решать сложные задачи параллельно. Команде разработчиков необходимо было поддерживать массовую параллельность, избегая при этом конфликтов «шумных соседей». Но такой уровень параллельности был бы невозможен при архитектуре без ветвления. Именно поддержка ветвления позволяет каждому агенту — или группе агентов — независимо создавать форки базы данных, запускать эксперименты и фиксировать результаты. Это позволяет агентам Manus одновременно оценивать альтернативные подходы, сравнивать результаты и сохранять только те, которые имеют значение.

Подготовка к будущему, ориентированному на агентов

Большинство предприятий все еще находятся на ранних этапах внедрения агентного ИИ. Тем не менее, выбор инфраструктуры, который они делают сейчас, определит скорость и успех реализации их усилий.

Поскольку пользователи-люди уступают место агентам, оптимизация баз данных по надежности, прозрачности или простоте использования больше не имеет смысла. Агенты процветают в средах, оптимизированных для быстрого создания и удаления, объектного хранения и строгой изоляции. Эфемерность — новое ключевое слово. Скорость — главный приоритет.

Допуск агентов в вашу базу данных не означает отказа от контроля. Это просто означает, что контроль будет обеспечиваться посредством архитектуры и автоматизации, а не ручного вмешательства человека. Базы данных — и организации — которые придерживаются этих принципов, смогут максимально эффективно использовать своих агентов-сотрудников. Те, кто этого не сделает, неизбежно отстанут от своих конкурентов в мире, где темп задает ИИ.