НовостиСобытияКонференцииФорумыIT@Work
Мобильные решения:

Блог

Как узнать: полезен ли голосовой ввод текстов

Сергей Свинарев
02.09.2014 22:15:38

Андрей Колесов поднял интересный вопрос о полезности рукописного ввода в планшетах и ПК с сенсорным интерфейсом. Соглашусь с ним: казавшаяся когда-то чудесной перспектива ухода от тыканья одним пальцем по клавиатуре и возвращения к привычной скорописи, сегодня никакого энтузиазма не вызывает. Немного попрактиковавшись, мы печатаем гораздо быстрее, чем пишем. В связи с этим я вспомнил еще одну радужную мечту тех далеких лет: ввод текста с голоса. Тогда казалось - еще пару лет и мы будем легко надиктовывать свои статьи и публиковать интервью без расшифровки диктофонных записей. С тех пор минуло лет 15-20, а ничего похожего на массовом рынке мы не видим, а потому и не можем дать такую же окончательную оценку, как рукописному вводу.

Конечно же, речевые технологии не стояли на месте. Все помнят Siri и другие похожие приложения, позволяющие с помощью голоса искать информацию или управлять мобильным устройством. В контакт-центрах давно и успешно применяются технологии речевого диалога IVR. А вот до диктовки текстов дело так и не доходит. Почему?

Не думаю, что она не востребована вследствие массового овладения нами навыками работы на клавиатуре: применения найдутся. Полагаю, такая задача просто намного сложнее, и связано это с потенциально неограниченной широтой словаря, который должен использоваться при распознавании голоса, говорящего на произвольную тему. Если же словарь сузить (как это сделано в IVR-системах), то вариантов выбора становится не так много и в рамках ограниченного фиксированного словаря система легко отличит, скажем, слово "кабина" (содержащееся в словаре) от "камина" (которого там нет).
Итак, вопрос, полезен или нет голосовой ввод текста, пока и поставить невозможно. Такого ввода попросту нет. А вот дождемся ли?

Комментариев: 10

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии

03.09.2014 14:59:21

Преобразование голосовых записей в текст - довольно сложная и не очень востребовання штука. Но в будущем это будет.
В луччем случае - голосовое управление интерфейском (подача команд), хотя то же не очень понятно

Что касается, написания статей, то за человека этого никто не сделает (в обозримом будущем) и проблема тут не в технологиях.
Конечно, школьник хотел бы, что он рассказал своими словами о проведенном лете, а на выходе получилось бы сочинение "Как я провел летние каникулы". Но завтра этого точно не будет smile:)

03.09.2014 19:09:43

За человека никто ничего не сделает, это верно, но диктует текст (пусть и коряво) все-таки сам человек. От правки и редактирования не уйти, но это уже не рутинная а интеллектуальная работа.

03.09.2014 22:20:02

Перевод аудио записей в текст достаточно актуальная задача и сейчас она получила подспорье в виде голосового ввода. Достаточно набрать в строке поиска гугл и яндекс фразу "голосовой ввод текста" и воспользоваться первой ссылкой на речевой блокнот, где кстати есть возможность переводить также и аудио файлы и ролики с youtube.

03.09.2014 23:32:52

Алексей, спасибо за наводку. Как мне кажется, вы имеете непосредственное отношение к онлайновому сервису "Речевой блокнот". Сразу скажу: очень хорошо, что вы этим занимаетесь. Задача сложная и решить ее будет непросто. Посмотрел на сайте созданный вами обучающий видеоролик. Там все получается в целом неплохо (работает только в браузере Chrome).
У меня получилось далеко не блестяще (возможно, программе нужно привыкнуть к особенностям моей речи). Я попробовал прочитать начало расположенной выше своей заметки:

"Как узнать беременна ли голосовой ввод текста андрей кулясов интересный вопрос о полезности рукописного ввода планшетного пк сенсорный интерфейс ну все тогда чудесно перспективу куда ты ходил одним пальцем по клавиатуре возвращение в привычный сегодня дтп новости сегодня эротика в офисе печатая быстрее чем пишу смеситель с нами еще одну розу любит 2002 год текст с голоса ты мне показалось еще пару лет и у нее свои статьи и публикации интервью без расшифровки диктофонных записей сегодня новости 1521 eljur инновации в интернете не видел запятая"

Есть приложение для iPad под названием Dragon Dictation фирмы Nuance. Я его не пробовал, но отзывы людей противоречивы: одни хвалят, другие приводят примеры, подобные моему.
Короче, мы еще только в начале пути.

03.09.2014 23:52:47

Андрей колесов поднял интересный вопрос по полезности рукописного ввода в планшет и пк с сенсорным интерфейсом. Соглашусь с ним: казавшееся когда то чудесное перспектива ухода от икания одним пальцем по клавиатуре и возвращение к привычному скорописи, сегодня никакого энтузиазма не вызывает.
Composed by Speechpad.ru
Сергей, отрывок прочтен с первого раза, без правок, знаки препинания тоже голосом. Микрофон внешний (220р.). Говорить дейстительно надо внятно.

04.09.2014 00:26:10

Алексей, а есть здесь возможность самообучения программы и настройки ее на определенный голос. Может быть, она хорошо знает именно ваше произношение? Тем не менее, ваш результат впечатляет.

04.09.2014 00:35:09

Нет на голос настройки нет, работает по капотом там Google, это его прорыв. Но важно, чтобы микрофон был внешним, а не от нотбука внутренний.

04.09.2014 00:38:50

У меня внешний микрофон. smile:(

05.09.2014 23:39:22

Я давно мечтаю о такой возможности. На работу еду час и с работы - час. Много мыслей приходит в голову. Иногда упорядоченных, Иногда в виде личного "мозгового штурма". Если что-то записать, то потом можно было бы отфильтровать и отредактировать. Мощную программу распознавания можно разместить в облаке. Там же можно держать и пополнять индивидуальный словарь специфических слов и терминов.

06.09.2014 01:09:18

Судя по тому, что упомянутые выше сервисы ( "Речевой блокнот" и Dragon Dictation) требуют, чтобы пользователь был постоянно подключен к интернету, их движки работают как раз в облаке.

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии