Преобразованием голосовых сообщений в текстовые (и наоборот) сейчас никого не удивишь. Хотя качество этих преобразований, увы, далеко не всегда такое, как хотелось бы. Впрочем, иногда голосовые сообщения можно понять, не преобразуяих в текст. Об этом в рамках мартовской онлайн-конференции «День российских IT-решений», организованной OCS Distribution, рассказал руководитель направления голосовых продуктов компании BSS (Banks Soft System) Юрий Ледаков. В своем докладе «Речевая аналитика и голосовые технологии как инструменты улучшения клиентского опыта (и не только)» он отметил, что при помощи наиболее современных методов NLP/NLU, позволяющих учесть особенности живой устной речи, можно осуществить прямое распознавание намерений клиента с голоса минуя конвертацию в текст. Такой подход позволяет обеспечить естественный диалог, точность распознавания намерений более 95% и повысить удобство использования.

А затем добавил: «Встроенная системы извлечения сущностей (Named Entity Recognition) и заполнения значений переменных (Slots Filling) способствуют гладкости диалогов и позволяют следовать за логикой разговора клиента даже если он сменил тему... Собственные решения BSS по голосовой биометрии и речевой аналитике обогащают возможности голосовых ассистентов и снижают стоимость владения благодаря использованию одних и тех же моделей в разных приложениях, обеспечивая до 70% экономии затрат... Собственный движок TTS (Text-to-Speech) использует технологию предиктивного синтеза, за счет чего обеспечивает минимальную задержку при воспроизведении ответа и экономию до 50% на вычислительных мощностях. Он позволяет создавать заказной „брендированный“ голос, обеспечивая естественность речи с синтезированными фрагментами».

Извлечь выгоду от перемещения процессов купли-продажи из офлайна в онлайн (в том числе, с использованием технологий распознавания эмоций) сейчас стремятся многие предприниматели. Другое дело, что не у всех это получается. Однако цифровые показатели эффективности использования средств речевой аналитики внушают оптимизм. Юрий Ледаков называет такие цифры: «На 25% выросли продажи в телемаркетинге; с 30 до 3% уменьшилось количество слов-паразитов; на 30% увеличилась эффективность кросс-продаж; произошел 30%-ный рост соблюдения стандартов приветствия и прощания...».

Понятно, что все эти цифры весьма условны. Да и методика их получения не разглашается. Однако логично предположить, что эффект от внедрения технологий аудио- и/или видеоаналитики в процессы продаж может быть весьма велик.