В то время как ChatGPT предоставляет информацию, AutoGPT (под этим термином понимается целый класс агентов) стремятся автоматизировать действия пользователя с этой информацией. Пока никто не знает, чего от них ожидать, сообщает портал The New Stack.

Теперь, когда ChatGPT от OpenAI привлек внимание широких масс, сообразительные ИИ-специалисты начали размышлять о том, как можно автоматизировать чат с генеративным ИИ, и заставить ИИ просто делать что-то от вашего имени.

Их ранние прототипы грубы, если не потенциально опасны, но они достаточно перспективны, чтобы некоторые энтузиасты назвали их примитивной формой искусственного интеллекта общего назначения (AGI).

Добро пожаловать в быстро развивающийся мир AutoGPT.

По состоянию на 6 апреля три самых популярных репозитория на GitHub представляли собой проекты такого рода: JARVIS от Microsoft, Auto-GPT от Significant Gravitas и, возможно, прародитель всех этих проектов, BabyAGI от Mini Yohei.

Но что такое AutoGPT?

AutoGPT «предназначены для автоматизации задач GPT-4 путем создания агентов, которые выполняют задачи за вас без какого-либо вмешательства», — поясняет Натан Лэндс, основатель компании Lore.com, специализирующейся на генеративном ИИ.

Вызов GPT — это одна компьютерная инструкция и, таким образом, их серия может быть «объединена в программу», отмечает ученый-информатик Андрей Карпати, работающий над JARVIS.

BabyAGI, согласно странице проекта на GitHub, представляет собой скрипт на Python, который служит «системой управления задачами на основе ИИ». Имея заранее определенную цель, он создает и затем выполняет задания, причем результат каждого задания определяет следующий шаг.

Скрипт запускает бесконечный цикл со следующими шагами:

  • извлекает первую задачу из списка задач;
  • отправляет задачу агенту выполнения, который использует API OpenAI для ее выполнения на основе контекста;
  • обогащает результат и сохраняет его в Pinecone;
  • создает новые задачи и изменяет приоритеты в списке задач на основе цели и результата предыдущей задачи.

По словам Салли Омарра, который описал, как создать и запустить один из таких скриптов с помощью Auto-GPT «менее чем за 30 минут», настроить их несложно. Фокус в том, чтобы поставить правильные цели. Если сделать их слишком высокими, скрипт зависнет на стадии планирования, объясняет Омарр. Кроме того, кажется, что скрипты лучше работают с GPT-4, а не с GPT-3.5, который не обладает достаточной многословностью, чтобы скрипт AutoGPT действительно работал.

Документация по всем основным AutoGPT настоятельно не рекомендует запускать эти типы агентов в «непрерывном режиме», потому что, как говорится, кто знает, что может случиться? (Более безопасный метод заключается в том, чтобы скрипт останавливался после каждого действия и не продолжался до тех пор, пока пользователь не нажмет кнопку).

Однако такая опасность не мешает людям использовать их всевозможными способами. Лэндс указывает на то, что таких способов уже огромное количество.

Кто-то создал систему для поиска потенциальных B2B-клиентов, в которой агент может определить 50 лучших компаний, установить директоров по персоналу этих компаний, отправить им электронные письма и для тех, кто откликнулся, забронировать онлайновые встречи, и все это от имени торгового агента. Другой агент может прочитать о последних событиях в новостях и подготовить конспект подкаста. Для кодеров есть агент Test-Driven Development, который создает функции ПО, просто итеративно используя набор тестов, предоставленных разработчиком.