Блокчейн Искусственный интеллект Open Source Интернет вещей Big Data/Аналитика Цифровая трансформация Инновации	Сети/Серверы/СХД/ЦОД ПК и периферия Мобильные решения Инфраструктура	Документооборот/ECM Идеи и практики автоматизации Промышленная автоматизация ИТ-менеджмент Автоматизация	ИТ-индустрия Государство и ИТ ИТ-индустрия	Облака	Безопасность
Искусственный интеллект: Статьи Новости компаний Решения

Панорама

HWall от Крайон: WAF-решение в Реестре отечественного ПО

Крайон объявляет о запуске HWall — решения, которое помогает компаниям быстро закрыть ключевые риски веб-безопасности …

Облачная защита от DDoS: альтернатива возможна, но в редких случаях

DDoS-атаки развиваются не по принципу замены старых методов новыми, а по принципу накопления. Техники …

Состояние и перспективы развития российских систем управления идентификацией и доступом. Часть 2

Российское vs иностранное Сравнивая функционал отечественных решений для управления идентификацией и доступом …

Трансформация ИТ-инфраструктуры в промышленном секторе: опыт Антона Пирогова

DevOps-инженер крупной компании радиоэлектроники рассказал о том, как превратить рутинную эксплуатацию системы …

Сергей Кузнецов о техническом долге в критических системах: «Никто не планировал 3,5 миллиона записей — именно так и возникает технический долг»

Инженер-программист рассказывает о том, почему накопленные «кодовые упрощения» становятся серьезной угрозой для приложений …

Группа «Т-Технологии» выложила в открытый доступ потоковую модель распознавания речи на русском языке

Пресс-релиз | 22.07.2025

Центр искусственного интеллекта группы «Т-Технологии» выложил в открытый доступ модель распознавания речи T-one. Это потоковая ASR-модель при сравнительно небольшом размере в 70 млн параметров лидирует среди других открытых моделей по качеству распознавания на русском языке на шумных и сжатых записях из колл-центров — именно там, где бизнес теряет деньги из-за ошибок распознавания.

Открытие доступа «Т-Технологиями» к качественной потоковой модели распознавания речи Т-one позволит ускорить развитие экосистемы речевых технологий в России.

Потоковое распознавание речи позволяет обрабатывать звонки в реальном времени, повышать скорость и качество обслуживания, а также снижать нагрузку на операторов и затраты на персонал. Модель изначально спроектирована для работы в реальном времени с аудиопотоком произвольной длины и обеспечивает низкую задержку, что критично для голосовых ассистентов, автоматизации колл-центров и аналитики звонков.

Эта модель уже успешно используется во внутренних продуктах «Т-Технологий», включая службу поддержки Т-Банка, мобильного секретаря в Т-Мобайле, инструментах защиты от спам-звонков и др.

Общепринятых валидационных датасетов для телефонии на русском в открытом доступе с должным качеством разметки не существует, но по внутренним бенчмаркам по качеству распознавания на русском в телефонии Т-one обгоняет большие открытые ASR-модели: GigaAM v2 на 242-243 млн параметров и Whisper Large-v3 на 1,5 млрд параметров.

Компактный размер T-one позволяет запускать эту модель без необходимости закупать дорогостоящее оборудование, что снижает инфраструктурные затраты.

T-one снижает порог входа в технологии распознавания речи, позволяя компаниям развернуть качественное решение на собственных серверах без необходимости приобретать дорогие лицензии или зависеть от облачных провайдеров.

Теперь даже небольшие команды без мощной инфраструктуры могут использовать технологии крупного бизнеса для автоматизации колл-центров и аналитики звонков.

В открытый доступ на GitHub и Hugging Face выложены не только веса модели, но и код для запуска в высоконагруженной среде и адаптации под собственные задачи. Исследователи и разработчики могут использовать модель как сильный и легковесный базис для экспериментов в области речевых технологий. Инструмент позволяет быстро интегрировать решение в продукты, а также кастомизировать под специфику бизнеса. T-one распространяется по лицензии Apache 2.0, разрешающей свободное коммерческое использование и модификацию.

Печать

Мы используем cookie-файлы, возможности Яндекс.Метрики и SberAds для наилучшего представления нашего сайта в соответствии с Политикой обработки персональных данных. Если Вы согласны с этим, пожалуйста, нажмите кнопку «Принять». Продолжая пользоваться сайтом, Вы подтверждаете, что были проинформированы об использовании сайтом cookie-файлов, Яндекс.Метрики и SberAds, и согласны с Политикой обработки персональных данных.

Группа «Т-Технологии» выложила в открытый доступ потоковую модель распознавания речи на русском языке

Комментарии