Центр перспективных разработок компании Ectaco объявил о выпуске трех речевых корпусов, предназначенных для разработки систем распознавания речи:
- русский речевой корпус (Russian Acoustic-Phonetic Continuous Speech Corpus);
- польский речевой корпус (Polish Acoustic-Phonetic Continuous Speech Corpus);
- речевой корпус для распознавания букв польского алфавита (Isolated spoken polish alphabet letters).
Для создания речевых корпусов привлекалось порядка 250 дикторов. В наговоренных ими предложениях были учтены все возможные фонетические сочетания, которые могут встречаться в естественной речи: каждое из предложений корпуса содержит приблизительно 70 фонем. Общая же продолжительность наговоренной речи составляет около 20 часов.
“Мы создали данные речевые корпуса не для академических целей, а для решения конкретной коммерческой задачи, — сказал Антон Епифанов, генеральный директор Центра перспективных разработок Ectaco. — На их основе могут быть выпущены автоматические справочные службы, системы голосового доступа к электронной почте, системы голосового набора номеров телефона и другие”.
Д. У.