В январе этого года на выставке в области потребительской электроники Consumer Electronics Show (CES 2019) компания Google представила сервис для синхронного перевода речи. Этот сервис поддерживает несколько наиболее популярных и распространенных языков, включая немецкий, французский, испанский, английский, русский, корейский, японский и китайский.

В последнее время новостей о том, что появилось новое устройство, сервис или приложение для общения с иностранным собеседником, было немало. Это говорит о большой востребованности автоматического перевода устной речи в современном мире.

Сама по себе идея перевода устной речи не нова: автоматический перевод уже давно есть на наших мобильных устройствах. Все мы прекрасно знаем мобильные приложения-переводчики и активно используем их в повседневности. Таким образом, каждый из нас может произнести что-то на родном языке, и его речь будет распознана, переведена и преобразована в речь на иностранном языке. В некоторых мобильных переводчиках даже есть специальный режим для общения на родном языке с иностранцем.

Вместе с тем в таком переводе есть свои технологические нюансы. Например, при распознавании речи возможны ошибки из-за особенностей произношения человека или из-за посторонних шумов. Кроме того, программа должна автоматически разделять речевой поток на предложения и проставлять знаки препинания, чтобы получался связный письменный текст. Устная речь по своим лингвистическим особенностям существенно отличается от текстов, которые сразу создавались в письменной форме. Таким образом, скорее всего, мы получим не 100%-но правильный текст, и уже только поэтому качество автоматического перевода распознанной живой речи будет хуже, чем автоматический перевод письменных текстов. Поэтому специализация и настройка автоматического перевода на конкретную задачу здесь будет иметь большее значение, чем в переводе текстов.

В прошлом году в России проходил Чемпионат мира по футболу, и в контексте этого международного мероприятия тема автоматического перевода в целом и распознавания устной речи в частности приобрела особую актуальность. Мало кто знает, но проводники поездов дальнего следования, чтобы общаться с иностранными пассажирами, использовали мобильное приложение, установленное на устройства проверки электронных билетов. Это приложение позволяет переводить текст и устную речь, чтобы проводникам было проще общаться с гостями мундиаля со всего мира. Интересно, что это приложение специально настроено на перевод в ситуации общения на железной дороге — например, оно может переводить речь в шумных условиях.

Возможности автоматического перевода устной речи, очевидно, нужны не только на железной дороге, но и в полиции, экстренных службах спасения, на скорой помощи, а также в сфере обслуживания и технической поддержке. Поэтому мы все чаще будем сталкиваться с новостями в этой сфере, и сами будем использовать устный автоматический перевод в разных ситуациях.

Автор статьи — директор по развитию PROMT.