Система SpeechWizard фирмы Speech Systems (Боулдер, шт. Колорадо) обеспечивает распознавание голоса без предварительного обучения, позволяя с удивительной точностью проводить операции с Windows-приложениями, не пользуясь руками. Цена программы - $795. Эта система, выпущенная в мае, сочетает в себе удобное ПО, разработанный компанией голосовой процессор Phonetic Engine 500, наушники и микрофон.
Установив плату Phonetic Engine, подключив наушники и микрофон и позволив инструменту SpeechWizard Workshop исследовать структуру меню приложения, мы, не сочиняя кода и не встраивая настроенный на говорящего фразеологический словарь, смогли заставить любое хорошо работающее Windows-приложение выполнять голосовые команды.
SpeechWizard Workshop очень похож на другие средства автоматизации приложений, входящие во многие продукты корпорации Microsoft. На экране появлялись указания, советующие нам загрузить Windows-приложение, в котором мы хотели бы работать с применением голосовых команд, а затем мы использовали специальную комбинацию кнопок, чтобы захватить контекст этого приложения из памяти.
SpeechWizard Workshop определял нужные пункты меню приложения сам, не требуя их ручного ввода, а затем позволил нам выбрать из списка команд системы Windows те, которые мы тоже хотели включить (см. рисунок). Он даже позволил нам связать несколько фраз с определенной Windows-операцией, что избавляет пользователей от необходимости помнить точные выражения.
Затем SpeechWizard Workshop генерировал (на собственном языке написания сценариев, похожем на Бейсик) код, необходимый ддя включения в приложение большого словаря голосовых команд. Это открытый процесс, его результаты можно пересматривать и модифицировать, если разработчик уже достаточно хорошо знаком с системой, но и без вмешательства он дает отличные результаты.
Используя чувствительные к состоянию приложения сценарии, SpeechWizard может сужать выбор фраз, оставляя только имеющие смысл в данной ситуации. Таким образом увеличивается точность распознавания даже при использовании модели человеческой речи "усредненный говорящий".
При работе в SpeechWizard Workshop сценарии голосовых команд не надо кодировать
SpeechWizard не является системой для диктовки, и он будет выбирать самую подходящую фразу из своего списка, даже если пользователь произносит слова, которые не имеют к списку ни малейшего отношения. Система хороша для ситуаций, в которых надо выполнять предсказуемый набор задач.
Инсталляция требует некоторых усилий: например, плата РЕ500, используя значения по умолчанию, отключила мышь на одной из тестовых машин. Но установки прерывания и базового адреса могут изменяться при помощи переключателей, к которым дается подробное описание.
Телефон фирмы Speech Systems: (303)938-1110.
ПИТЕР КОФФИ