Центр перспективных разработок компании Ectaco объявил о выпуске трех речевых корпусов, предназначенных для разработки систем распознавания речи:

  • русский речевой корпус (Russian Acoustic-Phonetic Continuous Speech Corpus);

  • польский речевой корпус (Polish Acoustic-Phonetic Continuous Speech Corpus);

  • речевой корпус для распознавания букв польского алфавита (Isolated spoken polish alphabet letters).

Для создания речевых корпусов привлекалось порядка 250 дикторов. В наговоренных ими предложениях были учтены все возможные фонетические сочетания, которые могут встречаться в естественной речи: каждое из предложений корпуса содержит приблизительно 70 фонем. Общая же продолжительность наговоренной речи составляет около 20 часов.

“Мы создали данные речевые корпуса не для академических целей, а для решения конкретной коммерческой задачи, — сказал Антон Епифанов, генеральный директор Центра перспективных разработок Ectaco. — На их основе могут быть выпущены автоматические справочные службы, системы голосового доступа к электронной почте, системы голосового набора номеров телефона и другие”.

Д. У.

Версия для печати