Для получения достоверных результатов агентному искусственному интеллекту необходим доступ к аналитическим, контекстным неструктурированным данным — в режиме реального времени и в больших масштабах, пишет на портале The New Stack Рахул Аурадкар, исполнительный вице-президент и генеральный менеджер по унифицированным службам данных и Einstein компании Salesforce.

Два года назад в заголовках новостей доминировали ChatGPT и большие языковые модели (LLM). Но теперь разговор перешел от создания моделей генеративного ИИ к тому, как агентный ИИ может использовать их для выполнения конкретных действий с минимальным участием человека и создания реальной бизнес-ценности.

Преимущества систем агентного ИИ включают в себя способность выполнять многоэтапные задачи по решению проблем, генерировать детальные и контекстно-зависимые ответы на запросы и учиться на собственном опыте для повышения точности и удовлетворенности клиентов. Согласно опросу PwC об агентах ИИ, 79% руководителей высшего звена утверждают, что такие агенты уже внедрены в их компаниях. Две трети отмечают, что их агенты уже приносят измеримую пользу за счет повышения производительности. Девять из десяти заявляют, что агентный ИИ убедил их увеличить расходы на ИИ в течение следующих 12 месяцев.

Однако успех внедрения агентного ИИ зависит от данных. Без прочной основы в виде комплексной платформы данных организации не решаются доверять выводам и действиям ИИ и часто сомневаются в надежности его результатов. Следовательно, им не удается достичь целей, поставленных при внедрении ИИ.

Использование структурированных и неструктурированных данных в агентном ИИ

Большинство организаций успешно предоставляют приложениям и агентам ИИ доступ к структурированным данным в базах данных, электронных таблицах, веб-формах и других системах, где все представлено в стандартизированном формате. Но таким образом охватывается лишь небольшая часть общей базы знаний любого бизнеса.

Более 80% всех корпоративных данных являются неструктурированными: сообщения в социальных сетях, PDF-файлы, руководства, вводные документы, часто задаваемые вопросы, диаграммы и таблицы, записи взаимодействия с клиентами, электронные письма и мультимодальные данные, такие как аудио и видео. Без интеграции этого сокровища корпоративных знаний и опыта реализации агентного ИИ неэффективны. Им не хватает надежного фундамента данных реального времени.

Таким образом, организациям необходимо выйти за рамки хранения неструктурированных данных в озерах данных или их заточения в разрозненных информационных хранилищах. Им необходима специализированная платформа, обеспечивающая унифицированные и гармонизированные данные, уверенность в результатах ИИ, масштабируемый фундамент данных реального времени и бесперебойную интеграцию с существующей корпоративной инфраструктурой.

Унификация и гармонизация данных с использованием метаданных

Агентам ИИ необходим доступ к разнообразным источникам данных. Это должно охватывать все области и формы данных, включая структурированные и неструктурированные данные. Получив доступ ко множеству изолированных хранилищ, содержащих корпоративные знания, агенты могут извлекать контекст, который ранее был недоступен. Только объединив данные из политик, контрактов и информации о продажах с использованием метаданных, можно создать единый, гармонизированный и надежный профиль данных.

Рассмотрим пример агента ИИ, помогающего человеку принять решение об увеличении кредитного лимита. Если у агента есть доступ к ограниченному объему данных, вероятно неверное решение — либо отказ в кредите ценному клиенту, либо предоставление кредита лицу с высоким уровнем риска. Однако, когда агент имеет доступ к политике, всей необходимой информации о клиенте, его кредитной истории и кредитном рейтинге, а также к истории его контактов с отделами продаж и маркетинга, вероятность ошибки агентного ИИ резко снижается.

Большинство агентов службы поддержки клиентов имеют доступ только к пассивным данным. Агентный ИИ стремится вывести эту практику на новый уровень, переходя от пассивных данных к активной экосистеме данных, которая дополняет контекст клиента в режиме реального времени.

Уверенность в результатах ИИ и доверие к ним

Помимо учета всего доступного контекста предприятия, автономные действия, предпринимаемые агентами, должны быть надежными. Они должны соблюдать все политики конфиденциальности и управления и основываться на доступе к полным данным.

Обеспечение доверия включает в себя три отдельных аспекта:

  • Точность и релевантность для исключения ошибок и галлюцинаций.
  • Решения проблем безопасности и конфиденциальности, такие как маскировка конфиденциальных данных в режиме реального времени с помощью автоматизированной маркировки, классификации и применения политик.
  • Контроль происхождения данных путем отслеживания источников и изменений для соответствия GDPR и другим нормативным требованиям.

Фактор доверия становится все более важным по мере масштабирования систем ИИ. Если агенты должны действовать автономно при обработке миллионов транзакций, последствия ошибок будут колоссальными. Агентный ИИ повышает планку надежности. При надлежащем применении и использовании правильной платформы данных организация получает уверенность в действиях автономных агентов.

Масштабируемый фундамент данных реального времени

Контекст должен распространяться на «агентную память», то есть на контекстную осведомленность самих агентов ИИ в режиме реального времени, чтобы они запоминали предыдущие взаимодействия и реагировали соответствующим образом. Это критически важно как для системной связности, так и для текущего взаимодействия человека с агентом.

Гармонизацию, унификацию и надежность нельзя обеспечивать медленно или для небольшого количества транзакций. Они должны поддерживаться с высокой скоростью, в режиме реального времени и в больших масштабах. Независимо от того, насчитывает ли организация 1000 или более 100 млн. клиентов, фундамент данных должен быть надежным и достаточно масштабируемым для поддержки активности агентов ИИ в тот момент, когда люди, поддерживаемые агентами, обрабатывают запросы клиентов.

Надлежащая платформа данных должна бесперебойно обеспечивать как инсайты, так и действия на основе бесшовного перемещения и интеграции — в отличие от пассивного хранения данных в массиве хранения или озере данных. Масштабируемый фундамент данных реального времени означает, что данные доступны «в нужное время для нужной потребности» — от удовлетворения потребностей персонализированного веб-опыта в течение доли секунды до доставки данных в течение секунды агентам службы поддержки клиентов. Умножьте это на высокочастотные взаимодействия, и станет ясно, почему масштабируемость базовой платформы данных является критическим фактором.

Бесшовная интеграция с корпоративной инфраструктурой

Дизайн системы должно позволять агентам легко получать доступ и использовать как краткосрочный контекст, так и долгосрочные знания в широком спектре инструментов и систем. Все корпоративные приложения должны иметь возможность легко подключаться к базовой платформе данных. Однако, учитывая конфиденциальность некоторых данных, для обеспечения конфиденциальности и защиты коммерческой тайны может потребоваться фреймворк с нулевым копированием. Благодаря ему агентам можно разрешить доступ к данным организации без какого-либо их перемещения или компрометации.

Это требует платформы данных, имеющей коннекторы ко всем корпоративным приложениям и системам. Поэтому многие организации испытывают трудности при попытке создания такой платформы внутри компании. Они часто недооценивают уровень сложности и необходимое время. В результате это, как правило, отвлекает их от основной деятельности.

Надежные и мощные агенты ИИ

Развитие агентного ИИ требует платформы данных, которая выходит за рамки хранения данных и обеспечивает активное расширение возможностей автономных агентов ИИ. Она должна быть способна предоставлять им аналитические, контекстные данные из множества источников (структурированных и неструктурированных) в режиме реального времени и в больших масштабах. Используемые данные и действия агентов ИИ должны быть унифицированными, согласованными, достоверными и точными, основанными на автоматизированном управлении данными, безопасности и этических принципах.