Обзор    

 

ViaVoice Gold позволяет разговаривать с текстовыми процессорами и электронными таблицами    

Майкл Кейтон (PC Week Labs)    

Распознавание речи еще не отменило использования клавиатуры и мыши, но продукт IBM  -  ViaVoice Gold  -  делает очередной шаг в этом направлении, позволяя выполнять речевой ввод в различные деловые приложения для Windows 95.    

 

Выпустив в декабре ViaVoice Gold ($149), IBM расширила возможности исходного варианта ПО ViaVoice ($99), добавив средства речевого ввода для нескольких типов текстовых процессоров и электронных таблиц. Корпорация также добавила средства контроля и управления пользовательским интерфейсом Windows 95. В испытаниях, проведенных Тестовым центром PC Week Labs, речевой ввод в новой версии оказался значительно удобнее, чем в старой, что, с учетом прочих дополнительных возможностей, делает версию достойной своей цены.    

 

Однако базовая функция ViaVoice, распознавание непрерывной речи, осталась без изменений: производительность по-прежнему составляет около 70 - 80 слов в минуту, как и у исходной версии, и точно так же требуется длительное обучение ПО (обзор первой версии ViaVoice см. PC Week/RE, № 38/97, с. 31).    

 

Более того, несмотря на то что ViaVoice Gold поддерживает наиболее популярные электронные таблицы и текстовые процессоры, его голосовые возможности остались ограниченными. ПО по-прежнему не может преобразовывать текст в речь и “читать” введенный документ или данные из электронных таблиц и текстовых процессоров.    

 

Возможность речевого ввода непосредственно в деловые приложения, в том числе в WordPro 97 и Lotus 1-2-3 корпорации Lotus Development, Excel 97 и Word 97 корпорации Microsoft, представляет собой небольшое, но весьма значимое расширение функций, особенно для тех, кто заинтересован в применении технологии речевого ввода.    

 

Пользователи первых программ, способных работать с непрерывной речью, ViaVoice и NaturallySpeaking фирмы Dragon Systems, могли вводить данные только в специально предназначенное для этого приложение, которому не хватало развитых средств редактирования и форматирования. В новой версии ViaVoice пользователи могут форматировать документы в процессе компоновки и сохранять их в привычных форматах.    

 

Еще одно усовершенствование в ViaVoice Gold, способствующее повышению производительности труда,  -  это возможность создания речевых макрокоманд. Например, мы подготовили макрокоманды, вставляющие в документ шаблоны параграфов по ключевому слову.    

 

Хотя ViaVoice Gold позволяет вводить информацию с голоса в текстовые процессоры, электронные таблицы и любые Windows-приложения, допускающие ввод текстовой информации, по-настоящему оно с этими приложениями не взаимодействует. Вместо подлинной интеграции ViaVoice запускает приложение переднего плана ViaVoice Direct, которое преобразует голос в текст и направляет поток текстовых данных в деловые приложения. Такая схема приводит к возникновению нескольких проблем.    

 

Во-первых, не стоит рассчитывать, что вы сможете начать диктовать информацию в свои любимые текстовые процессоры немедленно. Так же как и в первой версии ViaVoice, нам пришлось “обучать” ПО, зачитывая последовательности предложений и короткие рассказы, и продолжать это обучение уже в ходе работы, пользуясь функциями коррекции ViaVoice Direct или же SpeakPad  -  приложения, предназначенного специально для этой цели.    

ViaVoice Gold позволяет вводить в Windows-приложения данные с голоса

 

На наш взгляд, более удобно проводить обучение с помощью SpeakPad, нежели с ViaVoice Direct, несмотря на то что оба приложения работают с единым набором команд коррекции ошибок. Работать со SpeakPad оказалось проще потому, что это ПО предоставляет единый пункт управления, не требуя переключений между приложениями (например, ViaVoice Direct и текстовым процессором).    

 

Во-вторых, неудобно то, что ПО ViaVoice не может преобразовывать текст в речевую информацию непосредственно из текстовых процессоров и электронных таблиц. Популярный пример применения такой функции  -  воспроизведение вводимых данных для контроля их правильности при занесении больших массивов числовой информации в таблицу. ViaVoice может преобразовывать текст в голосовую информацию, но только в программе SpeakPad.    

 

Поговорим о быстродействии

 

Когда мы пользовались приложением SpeakPad, ViaVoice в основном удавалось поспевать за нами, помещая слово в документ, как только оно было произнесено. При речевом вводе непосредственно в офисное приложение слова появлялись на экране уже не так быстро. Это было особенно заметно при речевом вводе числовых данных в электронные таблицы, Lotus 1-2-3 и Excel. Временами программа ViaVoice Direct пропускала цифры в тех числах, которые произносились недостаточно четко и размеренно.    

 

Нас это удивило, поскольку мы тестировали ПО на ПК Vectra XU 6/200 компании Hewlett-Packard с 200 МГц процессором Pentium Pro и 32 Мб ОЗУ. Заметим, что предъявляемые ПО минимальные требования к аппаратуре представляются разумными  -  это 32 Мб ОЗУ и система на базе 150 МГц процессора Pentium MMX или 166 МГц Pentium.    

 

Предлагаемые в ПО VoiceCenter функции управления пользовательским интерфейсом Windows 95 мы считаем приятной добавкой, которая определенно окажется привлекательной для пользователей с физическими недостатками. Те же, кто любит работать с мышью или знаком с большинством “горячих клавиш” Windows 95 и Windows-приложений, обнаружат, что старые методы работают быстрее.    

 

В наших тестах VoiceCenter работал не так хорошо, как распознающее естественную речь Kurzweil VoiceCommands  -  приложение для управления Microsoft Word фирмы Lernout & Hauspie Speech Product USA. Уникальной возможностью VoiceCommands является способность к преобразованию команд на естественном языке в команды Word (обзор, посвященный VoiceCommands 1.0, см. PC Week/RE, № 43/97, с. 27).    

 

С VoiceCommands пользователям нет необходимости искать команды, запрятанные в сложных меню, и можно выполнять действия, для которых они не помнят точной команды. Что касается VoiceCenter, то в нем пользователи могут добавлять команды в список, уже достаточно полный, но при этом приходится соблюдать ряд ограничений.    

 

В ViaVoice Gold также имеется утилита, позволяющая запускать Internet Explorer 4.0 речевой командой.    

 

Резюме для руководителей

 

ViaVoice Gold    

ViaVoice Gold корпорации IBM  -  это значительный шаг вперед по сравнению с ViaVoice, первой версией этого продукта. ПО выполняет речевой ввод в популярные текстовые процессоры и электронные таблицы, а также позволяет голосом управлять пользовательским интерфейсом Windows 95. Пакет дает представление о том, как мог бы работать компьютер, управляемый только голосом, но интеграция с офисными приложениями недостаточно полна.

Работает с основными деловыми приложениями; низкая стоимость; разумные системные требования; добавлены средства управления, а также редактирования голосом.    

 

Средства управления понимают ограниченный набор команд; при речевом вводе непосредственно в приложения производительность падает по сравнению с работой со специальным промежуточным приложением; не поддерживается преобразование текста из деловых приложений в речь.

IBM, Армонк, шт. Нью-Йорк, тел. в Москве:  (095) 940-2000, www.software.ibm.com/is/voicetype.

Методика оценки:  www.pcweek.com/reviews/meth.html.

Версия для печати