Куда движутся искусственный интеллект и машинное обучение? Что порождает волны и какие переломные моменты возникают на этом пути? Эти и другие вопросы на портале InformationWeek обсуждает Манодж Суварна, управляющий директор Deloitte по экосистемам искусственного интеллекта.
ИИ и МО хорошо известны как технологии, которые работают, но все еще слишком молоды, чтобы работать хорошо. Находясь где-то между диковинками и повседневными рабочими лошадками, они быстро развиваются, и сегодня основное внимание уделяется их применению для создания измеримой ценности для бизнеса.
Именно здесь «что если?» встречается с «что будет дальше». Как и в случае с предыдущими технологическими революциями, будущее распространение приложений ИИ/МО будет в меньшей степени связано с экспериментами в поисках областей применения, а в большей — с реальными бизнес-потребностями, которые новые инструменты могут удовлетворять преобразующим образом.
Например, благодаря развитию MLOps компания, которая сегодня просто «использует» МО, завтра может принять его как основной принцип работы. Разговорный ИИ, который позволяет сегодняшним ботам обучаться на определенную тему, завтра будет лишен оков и сможет следить и участвовать в любом разговоре на любую тему. Вместо сканирования розничных товаров и мониторинга дорожного движения компьютерное зрение может стать оплотом социальной справедливости и экономического роста.
От помощника к субъекту, принимающему решения
Если объединить технологические возможности решений ИИ/МО с практическими целями, ради которых они могут развиваться, потенциальные примеры их применения быстро множатся. Возьмем, скажем, работу модератора контента в социальных сетях, которая требует не только собственных суждений, но и внимания к деталям при огромной скорости и объеме работы. Сегодня боты могут проверять текст на наличие определенных терминов и выражений. Но завтра они смогут отслеживать настроения, понимать контекст, выходящий за рамки непосредственного содержания, или оценивать нетекстовые высказывания, например, видео или фотографии.
В среде контакт-центра вы можете «подставить подножку» современному боту, если попытаетесь выйти за пределы области его знаний. Это возможно потому, что сегодняшние разговорные боты учатся на примере других разговоров. Завтрашние боты будут учиться на окружающем их мире неструктурированных данных, как это делают люди, поэтому они будут идти в ногу с вами независимо от того, куда вы направляете разговор. Понимание естественного языка и большие языковые модели будут преобразовывать это в беспрепятственное взаимодействие и последующие необходимые действия, которые мгновенно и автоматически получают информацию от соответствующих данных, где бы они ни находились.
Это означает, что если нынешний бот может помочь направить вас к другим ресурсам при обсуждении сложных вопросов, то ИИ завтрашнего дня сможет управлять целыми разговорами и отношениями.
Весь визуальный мир как источник данных
Есть еще компьютерное зрение. Мы можем недооценить эту технологию, если будем думать только о камерах наблюдения, нацеленных на живые процессы. А что если вам нужно найти конкретный визуальный элемент в сотнях часов онлайн-видео? Вы можете сжечь все эти часы в режиме реального времени — или система на базе ИИ может бы просеять их таким образом, чтобы имитировать поиск в памяти человека. В других областях применения ставки, скорее всего, будут выше: безопасность на шоссе, строительной площадке или сборочном конвейере также будет зависеть от этой технологии. Ваш сканер штрихкода в супермаркете по-прежнему будет работать, но у него появятся более мощные родственники.
Иногда эти технологии обретают силу в сочетании друг с другом. Вспомните, как вам приходилось вводить персональные данные в регистрационную систему какого-либо учреждения — медицинского, туристического или финансового. Разговорный ИИ может снять часть бремени с этого процесса. Компьютерное зрение также может внести свой вклад, например, сканируя данные из паспорта или загружая соответствующую фотографию во время разговора. Одна страховая компания таким образом сократила процесс регистрации с нескольких дней до нескольких минут, получив высокую оценку потребителей.
Объединить все вместе
Что потребуется для реализации подобных идей? Пришло время мыслить шире. Например, компьютерное зрение быстро набирает мощность, и архивирование данных и архитектура хранения, необходимые для его поддержки, должны расти так же быстро. Каждая из этих технологий окружена вспомогательными возможностями, которые должны расти вместе с ней.
Пришло время предъявлять к этим инструментам более высокие требования. Как и все остальное, во что инвестирует бизнес, они должны показывать предсказуемую, измеримую отдачу. Их возможности только сейчас преодолевают порог, за которым это становится достижимым в большем количестве приложений и в больших масштабах.
Что окажется возможно, если мы достигнем этого? Скачок по сравнению с тем, к чему мы уже привыкли. Представьте себе, что система ИИ, использующая технологию для эмуляции всех человеческих чувств в сочетании со способностью принимать решения, во многих ситуациях может полностью выполнять функции работника, обслуживающего клиентов. Следующее поколение ИИ не будет привязано к конкретной задаче, а будет обобщенным, что позволит освободить ценные кадры для выполнения более сложных и приятных задач.
Мы уже давно слышим об ИИ и МО. Большинство людей имели дело с некоторыми версиями этих технологий — теми, которые мы когда-нибудь будем считать очень простыми. И их дальнейшее развитие будет идти по длинному пути, который мы не можем полностью предсказать. Что ясно сейчас, так это то, что они находятся на переломном этапе. Они доказали, что могут работать — теперь пришло время доказать их ценность.