Салли Эпштейн, руководитель отдела стратегических технологий Cambridge Consultants, рассказывает на портале Information Age о том, как человеко-машинное понимание (Human-Machine Understanding, HMU) может помочь более естественному взаимодействию людей с технологиями.

Так что же случилось с ИИ-революцией? Искусственный интеллект, говорили нам, вызовет фундаментальные изменения в мировом порядке. Машинное обучение автоматизирует тяготы существования и освободит общество. Не поймите меня неправильно, мы каждый день становимся свидетелями умопомрачительных прорывов и достижений. Но, честно говоря, мне этого мало, я не удовлетворена и хочу большего, и чем раньше, тем лучше. Мне нужно, чтобы технологии «понимали меня» на более глубоком, эмоциональном уровне — а для этого требуется тонкая синергия человеко-машинного понимания.

HMU — это одно из направлений исследований, которое заставляет меня вставать с постели по утрам, и я уверена, что оно сформирует новую эру эмпатических технологий. В недалеком будущем мы создадим машины, которые будут понимать нас, людей, на психологическом уровне. Они будут улавливать наши внутренние состояния — эмоции, внимание, характер, здоровье и т. д. — и помогать нам принимать полезные решения.

Но давайте на мгновение отвлечемся от будущего и оценим, как далеко мы продвинулись. Еще в 2015 г. заголовки СМИ кричали о грядущей антиутопии/утопии искусственного интеллекта. С одной стороны, мы все были обречены: людям грозило вымирание от роботов или, по крайней мере, риск того, что их работу отнимут боты машинного обучения. С другой стороны, многие люди — в том числе и я — с нетерпением ждали будущего, в котором машины будут отвечать на все наши нужды. Мы понимали, что интеллектуальная автоматизация — это дополнение человеческих усилий, а не их замена.

Подготовка будущего ИИ-персонала

Прошло пять или шесть лет, и мы можем видеть значительные перемены. У нас есть множество институтов и академий, которые готовят будущих ИИ-работников, опираясь на многомиллиардные ресурсы. У нас есть большие массивы данных, мощные графические процессоры, выполняющие миллионы параллельных вычислений, большие нейронные сети (системы алгоритмов, подобные мозгу) и многое другое.

Все вышеперечисленное способствовало необычайным прорывам и весьма захватывающим заголовкам. Искусственный интеллект DeepMind компании Google победил игрока номер один в мире по игре в го, к ужасу Кэ Цзе, который был «немного огорчен», потому что считал, что играл довольно хорошо. Если вы хотите творчески отдохнуть от карантина, теперь вы можете зайти в Интернет и создать с помощью ИИ индивидуальное стихотворение. А если вы хотите немного легкого чтения на стороне, вы можете ознакомиться с мыслями языкового генератора GPT-3, который пишет эксклюзивно для The Guardian.

Статус-кво — отстой

Все это хорошо, но, по моему мнению, статус-кво — отстой. Я бы сказала, что в продуктах и услугах, с которыми мы с вами взаимодействуем в нашей личной и профессиональной жизни, наблюдается удивительно мало ощутимого прогресса. Возможно, следует перефразировать — недостаточно правильного, на мой взгляд, прогресса. Как я уже упоминала, мы добились больших успехов в создании машин с логическим интеллектом, но что насчет социального, эмоционального или даже этического интеллекта? Я уверен, что ИИ Google не обнял Кэ Цзе, чтобы утешить его в поражении.

Позвольте мне поделиться своими разочарованиями. Моя «умная» колонка с радостью не понимает меня шесть раз подряд — и не стесняется отвечать точно так же в седьмой раз. Или, допустим, я тестирую авто высшего класса. Оно может обладать всеми возможностями ИИ, когда речь идет о распознавании опасности или сохранении полосы движения, но оно не имеет ни малейшего представления о том, получаю ли я удовольствие от вождения или нет. Понимаете, к чему я веду?

Как я уже сказала в самом начале, технологии не понимают ни меня, ни вас, ни кого-либо из нас. Каждый день мне постоянно приходится подстраиваться под каждую технологию, с которой я взаимодействую. Вместо того чтобы они учитывали мое состояние и мои потребности, я трачу энергию на то, чтобы подстроиться под них. Я считаю, что все должно быть наоборот. Я верю в будущее, в котором каждая технология будет учитывать мои эмоции, поведение и желания, чтобы дать мне наилучший возможный результат. Вместо пассивного интерфейса я ожидаю, что продукты и услуги будут понимать мое состояние и принимать решения, чтобы помочь мне в моей жизни. Разве я хочу слишком многого?

Вы можете возразить, что уже существует множество продуктов и услуг, которые оценивают состояние человека — например, носимые устройства, которые помогают отслеживать качество сна, или биомаркеры, которые отслеживают уровень стресса. Это правда, и до сих пор нам удавалось решать все более сложные проблемы, рассматривая каждую из них как проблему с данными, которую можно решить с помощью более мощного ИИ. Но вот в чем дело: мы знаем, что эмпатия не определяется количеством обработанных данных. Чтобы действительно двигаться вперед, я считаю, машины должны по-настоящему понимать людей, а это может означать только одно: HMU.

HMU начинает продвигаться вперед

В настоящее время не существует единого сигнала, который можно считать с мозга или тела, чтобы достоверно сообщить компьютеру о том, что вы чувствуете. Но существует целый ряд мультисенсорных систем, с помощью которых компьютер может получить информацию о вашем эмоциональном состоянии. HMU начинает продвигаться вперед, но только чуть-чуть. И если мы продолжим нынешнюю траекторию инноваций, мы вряд ли достигнем тех рубежей, о которых я говорила. Технологии становятся когнитивно умнее, но необходим эквивалентный прогресс в разработке технологий, которые «понимают» нас и взаимодействуют с нами гораздо более бесшовно, чтобы наилучшим образом удовлетворять наши потребности. В этой области, рада сообщить, некоторые успехи уже достигнуты.

Я считаю, что для создания технологии, которая нас понимает, необходимы три жизненно важные вещи:

  • создание новой междисциплинарной области;
  • новые модели человеческого познания и поведения;
  • социально интеллектуальные системы, которые обучаются естественным образом.

Если копнуть немного глубже, позвольте мне поделиться некоторыми конкретными проблемами HMU, над которыми я сейчас работаю. Понимание контекста — одна из ключевых, и до сих пор не ясно, какой тип и количество модальностей необходимы для достижения наивысшего уровня точности в классификации аффектов (аффект — это внешнее проявление эмоционального состояния человека). По сути, предстоит еще много работы, чтобы решить проблему включения контекстной информации в процесс классификации аффектов.

Персонализация — еще одна интересная область. Существующие методы глубокого обучения демонстрируют неоднозначные результаты, когда речь заходит о распознавании человеческих эмоций. Универсальная модель машинного обучения по своей сути плохо подходит для прогнозирования таких вещей, как настроение и стресс, которые сильно варьируются из-за индивидуальных особенностей. Существуют способы оценки эмоционального состояния, включая позы, мимику, физиологические маркеры и язык. Но они должны сочетаться с уникальной обстановкой, чтобы наилучшим образом отразить каждого человека. Понимание состояния человека в реальном времени, аффекта, опять же, имеет решающее значение. Очевидно, что недостаточно просто заполнить опросник, а через день предпринять какое-либо действие. Путь к этому будет найден, возможно, путем расширения границ нейроинтерфейсов, неинвазивных измерений, носимых устройств и т. д.

Многое еще предстоит сделать, а пока, надеюсь, у вас пробудился аппетит к потенциалу HMU. Интеллектуальные системы, несомненно, будут продолжать совершенствоваться в своей способности успокаивать, утешать и умиротворять нас, завоевывать наше доверие и взаимопонимание. И это произойдет, когда нейробиологи и психологи успешно объединят свои усилия с инженерами, чтобы научить компьютеры по-настоящему понимать человека.