Технология обработки естественного языка (natural language processing, NLP) — это подмножество искусственного интеллекта, на котором работают голосовые боты и текстовая аналитика. Президент консалтинговой компании Transworld Data Мэри Шеклет рассказывает на портале InformationWeek о том, где эта технология уже применяется и о ее перспективах.

NLP рассматривается как одна из составляющих ИИ, которая работает с текстовыми, голосовыми и видеоданными. В повседневной жизни она чаще всего встречается в виде автоматизированного телефонного или чат-сервиса, на другом конце которого бот по мере возможности пытается ответить на все вопросы клиента, а затем направляет его к нужному специалисту, например, при звонке в магазин товаров для дома. NLP также выступает в роли «всезнающего голоса», такого как Siri на iPhone, который может подсказать, где находится столица Мадагаскара или как найти ближайший Starbucks. Эти примеры показывают, что NLP работает как голосовая автоматизация, по сути, выступая в роли робота-помощника, который направляет нас туда, куда нам нужно.

Однако, несмотря на реальные примеры внедрения, у нее имеются свои проблемы. Например, научится ли NLP в конечном итоге отвечать на сложные вопросы или понимать более глубокий контекст? Сможет ли она ориентироваться в многообразии языковых акцентов и нюансов, которые содержат значимый контент? Сумеет ли правильно расставить знаки препинания, когда вы пытаетесь надиктовать напоминание? Помимо этого она может испытывать терпение клиентов, например, когда те неоднократно пытаются проинструктировать автоматического помощника, а тот почему-то не может понять или выполнить то, о чем его просят. Очевидно, что NLP — это развивающаяся технология. Она не работает безупречно. Но для ряда компаний она кажется достаточно эффективной, чтобы ее можно было внедрить.

В связи с этим возникает вопрос: может ли NLP стать критически важной платформой для ИТ-разработки? И где ее можно применять?

NLP как платформа разработки

Существует множество платформ NLP для разработки, и значительное их число — Open Source. Их преимущество для компаний заключается в том, что они бесплатны. Корпоративные ИТ также выигрывают от совместных усилий по их развитию, которые предпринимаются мировым сообществом разработчиков ПО. В то же время недостатком Open Source-платформ является поддержка — получить ее не всегда легко, к тому же дистрибутивы не всегда регулярно обновляются.

Платформы NLP предлагают инструменты программирования и библиотеки на языках Python и Java. Это хорошо, поскольку многие ИТ-разработчики имеют богатый опыт работы с ними. Однако для реализации успешных NLP-проектов требуется не только наличие у ИТ-специалистов необходимых навыков разработки. И им, и конечным пользователям также необходимо знать, как эффективно интегрировать технологию в свои бизнес-процессы.

Пример: телефонный голосовой помощник

Многие пользователи наверняка испытывали разочарование, попадая в автоматизированное телефонное дерево с множеством тупиковых уровней и голосовым помощником на базе ИИ, который не понимает, о чем его спрашивают. Автоматизированные телефонные деревья и маршрутизация существуют уже много лет. На самом деле они появились еще до NLP. Но эти автоматизированные процессы часто плохо продуманы и вряд ли их работу может улучшить даже ИИ. В этих случаях необходимо заново разработать весь бизнес-процесс, чтобы он учитывал опыт клиентов — и только тогда у NLP появится больше возможностей внести в него свой позитивный вклад.

Другими словами, для того чтобы внедрение технологии принесло свои плоды, компания должна полагаться не только на ИТ-специалистов с необходимыми техническими навыками, но и на специалистов бизнес-подразделений, которые понимают, как оптимизировать бизнес-процесс и как использовать NLP в рамках этого процесса с максимальной пользой. Если в какой-либо из этих областей произойдет сбой, компании не смогут добиться желаемого результата.

Где NLP уже работает

Сегодня голосовая NLP приемлемым образом работает на смартфонах и других мобильных устройствах, главным образом потому, что пользователи быстро адаптировались к ее ограничениям и приспособились подбирать вопросы таким образом, чтобы стоящий за ней ИИ мог их понять и обработать запрос. Как голосовая, так и текстовая NLP неплохо работают в приложениях технической поддержки на веб-сайтах, но и здесь ее возможности ограничены. Все сводится к тому, что она довольно быстро перенаправляет пользователей к разделу часто задаваемых вопросов (FAQ) на сайте, где те не всегда могут найти ответы на специфические вопросы.

Область, где NLP работает лучше всего, — это диктовка и анализ документов. Например, в здравоохранении существует острая потребность в том, чтобы врачи могли надиктовывать медицинские отчеты в системы электронных медицинских карт. Это гораздо проще и быстрее, чем набирать их на клавиатуре. ИИ, лежащий в основе NLP, может просматривать обширные данные о пациентах и помогать в постановке диагнозов и лечении.

«NLP умеет распознавать аббревиатуры и биомедицинские сущности, — говорит Дэвид Талби, технический директор компании John Snow Labs, которая предлагает решения на основе NLP и ИИ для здравоохранения. — ИИ может извлекать важную информацию о лекарствах, а также выявлять критические взаимосвязи между данными, которые могут иметь отношение к состоянию пациента... Анализ всей доступной информации о пациенте позволяет немедленно обнаружить, что пациент испытывает одышку только при подъеме по лестнице. Наблюдения, подобные этому, позволяют врачам получить более точную клиническую картину состояния пациента и назначить соответствующее лечение».

Чего от NLP ждать в будущем

Согласно исследованию Markets and Markets, в 2025 г. мировой рынок NLP в области здравоохранения и биологических наук вырастет до 3,7 млрд. долл., тогда как в 2020 г. его объем составил 1,5 млрд. долл. Перспективной областью применения NLP являются голосовые запросы, которые запускают аналитические исследования баз данных. В будущем, вероятно, появятся и другие NLP-запросы к движкам ИИ, например, инженеры смогут отсылать голосовой запрос к базе данных о том, какие материалы лучше всего сочетать для изготовления определенного типа проводников, а логисты будут спрашивать, каким маршрутом лучше всего доставить груз из одного города в другой. В этих случаях голосовая и текстовая NLP могут быть обучена и адаптирована к более узкому кругу пользователей. Со временем мы можем ожидать, что технология сможет работать с бóльшим количеством лингвистических нюансов и на языках всего мира.