MWS AI (входит в МТС Web Services) объявила о выпуске Cotype Light 3 — мультимодальной языковой модели, предназначенной для встраивания в ИИ-агентов для бизнеса. Модель одинаково точно работает с текстом и визуальными данными в едином контексте: договоры, технические чертежи, формы, изображения. Это позволяет ИИ-агентам и мультиагентным системам обрабатывать разнородные корпоративные материалы без переключения между специализированными системами и самостоятельно решать многоэтапные задачи, освобождая сотрудников от необходимости писать сложные инструкции а на каждом этапе.

Cotype Light 3 содержит 9 млрд параметров. Модели такого размера на специализированных задачах работают сопоставимо с более крупными аналогами, но требуют значительно меньше ресурсов: работают на стандартном корпоративном оборудовании и быстрее обучаются под конкретную задачу. Для бизнеса это означает меньше инфраструктурных затрат, возможность быстрого тестирования гипотез и сокращённый путь от пилота до рабочей системы. Следующие версии семейства получат увеличенное число параметров для высоконагруженных сценариев; приоритет при разработке сохраняется за задачами, актуальными для корпоративных развёртываний. MWS AI планирует расширять линейку в течение года по мере завершения тестирования новых моделей в ключевых отраслевых сценариях.

По данным независимого бенчмарка MERA (разработан Альянсом в сфере ИИ, оценивает языковые модели по широкому спектру задач на русском языке), Cotype Light 3 стала первой компактной моделью в топ-3 за всю историю рейтинга, набрав 0,792 балла из 1,0. Это лучше большинства моделей, работающих с русским языком, — в том числе тех, которые содержат 100+ миллиардов параметров и требуют кратно больше вычислительных мощностей. В задачах на математику и «знания о мире» — географию, историю, науку, культуру — точность модели превышает 99%.

«Финансовый эффект от внедрения ИИ становится главным критерием для бизнеса во всех отраслях, а стоимость инференса (обработки каждого запроса к модели) — одна из ключевых статей в экономике любого ИИ-проекта. Компактная специализированная модель здесь имеет двойное преимущество: она дешевле в эксплуатации и точнее работает в конкретном домене, чем универсальная система с избыточным числом параметров. Cotype Light 3 создавалась с учётом этой логики: девять миллиардов параметров, единая архитектура для текста и изображений, возможность дообучения под отраслевую специфику и развёртывания в закрытом контуре — без специализированного оборудования. Это позволяет конкурировать с моделями значительно большего размера при принципиально иных затратах», — отметил генеральный директор MWS AI Денис Филиппов.

Модель на 9 млрд параметров в стандартной точности (FP16/BF16) занимает около 18 ГБ видеопамяти. Это позволяет запускать инференс на одном серверном ускорителе — без многокарточных конфигураций и специализированных кластеров. Для развёртывания подходит стандартное серверное оборудование с одним GPU: NVIDIA A100 (40 или 80 ГБ), A10 (24 ГБ), L4 (24 ГБ) или аналогами. В ходе тестирования MWS AI также подтвердила полную технологическую совместимость моделей семейства Cotype со всеми компонентами отечественных программно-аппаратного комплексов, включая ПАК Скала^р Машина ИИ (продукт Группы Rubytech).

MWS AI обучает Cotype Light 3 и другие модели на облачных мощностях MWS Cloud.