МУЛЬТИМЕДИА

MMX корпорации Intel расширяет возможности речевой технологии

Разработчики ПО распознавания и синтеза речи предлагают новые приложения для настольных ПК, используя возможности передовых технологий, таких, как мультимедиа-технология корпорации Intel. Тем самым они доказывают, что эти технологии распознавания наконец-то достигли зрелости.

 

Среди поставщиков новых продуктов  -  корпорация IBM, которая собирается лицензировать у фирмы Eloquent Technology пакет Eloquence для преобразования текста в речь, позволяющий воспроизводить сообщения электронной почты и другой текст голосом с естественными интонациями и с правильными ударениями. Как сказал представитель компании, IBM намерена включить Eloquence в свое ПО распознавания речи VoiceType следующего поколения, выпуск которого ожидается в 1997 г.

Juggler будет использовать возможности новых MMX-микросхем

корпорации Intel

 

“Распознавание речи сегодня работает действительно довольно хорошо, но люди всегда хотят большего”,  -  сказала Эйми Уол, редактор The TrendsLetter (Нарберт, шт. Пенсильвания).

 

Компания PureSpeech (Кеймбридж, шт. Массачусетс) вступит в конкурентную борьбу в I кв. 1997 г., представив Juggler  -  клиентский пакет, поддерживающий передачу голосовых сообщений на основе технологии MMX (расширение мультимедиа) корпорации Intel.

 

Функционируя как универсальный входной почтовый ящик для голосовой почты, электронной почты и факсов, Juggler может идентифицировать различные голоса, предоставляя 10 пользователям частные почтовые ящики с голосовым доступом.

 

Продукт включает также элементарные функции преобразования текста в речь и дает пользователям возможность прослушивать сообщения электронной почты по телефону.

 

Фирма Speech Systems (Болдер, шт. Колорадо) готовится представить комплект Phonetic Engine 1000 ($595) на базе PC-карты, обеспечивающий поддержку программ распознавания речи на портативных ПК и переносных устройствах.

 

Кроме того, в октябре компания NEC Computer Systems и фирма Kurzweil Applied Intelligence (Уолтем, шт. Массачусетс) объявили о включении в комплект поставки Pentium Pro-систем Ready Office компании NEC приложения VoicePad фирмы Kurzweil для голосовой обработки текстов. VoicePad позволяет форматировать текст, управлять меню, изменять установки приложения и диктовать числовые данные в документ. Как сообщил представитель Kurzweil, это ПО не требуется обучать голосу.

 

Начинающая компания Nuance Communications (Менло-Парк, шт. Калифорния) также разработала ПО распознавания речи под названием VoiceBroker, которое дает возможность владельцам ценных бумаг узнавать в реальном времени котировки акций по телефону. ПО было внедрено фирмой Charles Schwab (Сан-Франциско). Выход новой версии со словарем увеличенного объема и пониженными требованиями к памяти ожидается в ноябре.

 

Фирма Dragon Systems (Ньютон, шт. Массачусетс) готовит к выпуску в конце года инструментарий Dragon Speech Tool, который позволит пользователям разрабатывать собственные словари для приложений распознавания речи. Цена ПО пока не объявлена.

 

Телефоны и адреса компаний: IBM  -  (095) 940-2000 (в Москве),

 

(800) 426-3333 (в США), http://www. ibm.com; Eloquent Technology  -

 

(607) 266-7025, http://www.eloq.com; PureSpeech  -  (617) 441-0000, http://www.purespeech.com; Speech Systems  -  (303) 938-1110, http://www.speechsys.com; Kurzweil  -  (617) 893-5151, http://www.kurzweil. com; Nuance  -  (415) 462-8200, http://www.nuancecom.com; Dragon  -  (800) 825-5897, http://www.dragonsys.com.

 

Скотт Беринато