Обзор

 

Программа распознавания речи позволяет общаться с текстовым процессором целыми фразами

 

Курсы обучения, книги и, наконец, метод проб и ошибок  -  вот способы, к которым прибегают сотрудники фирм при изучении потаенных возможностей создания документов с использованием текстового процессора Word корпорации Microsoft. Однако с помощью Kurzweil VoiceCommands многим удастся избежать всего вышеперечисленного.

Окно справки помогает пользователю перемещать объекты

 

ПО распознавания естественной слитной речи Kurzweil VoiceCommands 1.0 фирмы Lernout & Haspie Speech Products ($59,95) является первой системой подачи команд и управления текстовым процессором корпорации Microsoft, которая попала в Тестовый центр PC Week Labs. Система преобразует команды, отданные голосом, в команды Word.

 

Данная программа предназначена для тех, кто выполняет 90% работы с Word, используя 10% информации о его возможностях, а затем сталкивается с непреодолимыми трудностями, стараясь придать результатам своего труда презентабельный вид, поскольку постоянно забывает, как пользоваться остальными возможностями этого текстового процессора. VoiceCommands, безусловно, может помочь этим пользователям быстро и легко применять трудно запоминаемые возможности Word. С другой стороны, для тех, кто “живет” в Word и хорошо знаком с большинством команд, выигрыш в производительности, скорее всего, будет не столь велик.

 

В целом бета-версия VoiceCommands хорошо работала в тестах PC Week Labs. От 70 до 80% подаваемых команд распознавалось программой без тренировки. В то же время, когда команда не распознавалась, на такую тренировку уходило довольно много времени. Кроме того, система работает только с Word 97 и Word 7.0.

 

Возможности VoiceCommands по распознаванию обычной речи выделяют ее в ряду подобных систем, поскольку применяемая в ней технология позволяет подавать команды Word, используя обычные фразы (правда, на английском языке.  -  Прим. перев.), например “Перенести предложение в начало параграфа”.

 

VoiceCommands все же предполагает следование некоторым правилам при построении фразы. Мы должны были использовать предложения, которые начинаются с действия (глагола) и адресованы объекту (существительному); команды могут также содержать условия. Например, фраза “Выделить жирным эту линию” удовлетворяет требованиям программы.

 

ПО VoiceCommands достаточно интуитивно в использовании, однако мы обнаружили, что наилучшие результаты достигаются, если использовать жаргон. Например, команда “Увеличить размер шрифта на десять” более удобна, чем многократное повторение фразы “Сделать шрифт больше”, пока не будет достигнут нужный размер.

 

VoiceCommands включает несколько инструментов, помогающих пользователю достичь взаимопонимания с программой и облегчающих поиск нужной команды. В случае если команда пользователя не была распознана, окно VoiceCommands обычно отображает список близких по звучанию альтернатив. (Отмена ошибочного действия осуществляется простой командой “Отменить”.)

 

Окно справки является замечательным инструментом для тех, кто не знает, какая именно команда нужна. Если нам необходимо как-то переместить объект, мы можем выполнить поиск по всем доступным командам перемещения. Иерархически организованный список формируется исходя из того, что мы собираемся перемещать и где.

 

Обучение VoiceCommands также осуществляется с помощью справочной системы, так что ПО можно обучать непосредственно в процессе работы. Данный подход позволяет пользователю избежать длительных и порою утомительных сеансов обучения системы, использующихся в продуктах NaturallySpeaking фирмы Dragon Systems и ViaVoice корпорации IBM.

 

И все же когда после нескольких часов успешной работы мы сталкивались с командой, требующей обучения системы, это иногда вызывало раздражение. Причем это случалось даже с теми командами, которые были всего лишь более сложными производными от уже введенных ранее.

 

Требования VoiceCommands к ресурсам ПК значительно ниже, чем у систем распознавания непрерывной диктовки: необходима машина на базе 100 МГц процессора Pentium с 16 Мб ОЗУ при работе под Windows 95 или 24 Мб ОЗУ  -  под Windows NT.

 

Майкл Кейтон (PC Week Labs)

 

Резюме для руководителей

 

Программа распознавания речи Kurzweil VoiceCommands фирмы Lernout & Haspie Speech Products дает пользователям Microsoft Word быстрый доступ к трудно запоминаемым функциям текстового процессора. Хотя способность распознавания команд достаточно высока, необходимость обучения системы командам, которые она не способна распознать, может сказываться на общей продуктивности.Методика оценки: www.pcweek.com/reviews/meth.html.

 

Kurzweil VoiceCommands 1.0. Lernout & Haspie Speech Products,

 

Берлингтон, шт. Массачусетс,

 

(800) 380-1234, www.lhs.com.

 

Возможность распознавания нормально построенных фраз; распознается широкий диапазон команд Word; низкие по сравнению с другими программами распознавания речи требования к ресурсам системы.

 

Могут возникать трудности из-за особенностей произношения говорящего; обучение системы в процессе работы может оказаться обременительным; работает только с Word 97 и Word 7.0.