В октябре НТЦ “Поиск-ИТ”, входящий в группу INLINE Technologies, объявил о предоставлении новой для российского рынка услуги — аналитической обработки больших объёмов речевой информации. Директор НТЦ “Поиск-ИТ” Алексей Любимов предполагает, что этот сервис найдет своего потребителя в первую очередь среди компаний и организаций, работа которых связана с широкой клиентской аудиторией и высокой интенсивностью телефонных переговоров (службы телемаркетинга и контакт-центры, страховые компании, банки и кредитные организации, маркетинговые и PR-агентства), а также среди тех, кто работает с мультимедийной информацией (информационные агентства и телерадиокомпании).
Сервис предоставляется по схеме аутсорсинга на базе программного комплекса анализа речевой информации, разработанного НТЦ “Поиск-ИТ”. При этом анализ речевой информации может производиться на 19 языках (включая русский, английский, китайский, арабский и другие). Утверждается, что комплекс способен идентифицировать говорящего по голосу и в то же время устойчив к акценту, плохому произношению диктора или зашумлённой записи. При этом поиск может осуществляться по любым терминам, именам собственным или даже произвольным наборам фонем.
Исходные аудиофайлы, представленные в форматах PCM, mu-law, A-law, ADPCM, MP3, QuickTime, WMA, g.723.1, g.729, g.726, Dialogic VOX, TrueSpeech или GSM, подвергаются предварительной обработке, затем на основе акустической модели языка создаются файлы индексов, и по ним в дальнейшем осуществляется поиск. Разработчики утверждают, что создание индекса происходит в 100-300 раз быстрее времени звучания записи, а время поиска в индексе в среднем в 1 000 000 раз короче времени звучания записи. Результатом поиска может являться время начала фразы, время её окончания или вероятность появления.