«ТехноИнтеллект», входящий в группу компаний «АТОЛЛис», выполняющий инновационную разработку сервисов искусственного интеллекта (роботов) для управления данными (ПО «ДатиУм») в Сколково, выпустил первого в серии программного робота «ДатиУм.Смарт Файл» по цифровизации неструктурированных источников данных.
Назначение робота класса RPA (Robotic process automation) — автоматическая обработка, идентификация и классификация файловых архивов разных отраслей по элементам онтологической модели под управлением обученной нейросети.
Результатом работы робота является оцифрованный источник неструктурированных данных в виде реестра цифровых паспортов документов с заполненными атрибутами из содержимого файлов и распределенными файлами по структурам цифровых паспортов без изменения физической схемы хранения файлов.
По исследованиям корпорации Microfocus, компании в течение
При регламентном применении робот минимизирует время специалистов по классификации вновь появляющихся файлов и по поиску бизнес-значимых данных в файловых архивах.
Вместе с «ДатиУм.Смарт Файл» выпущена обученная нейросеть для предприятий ТЭК, позволяющая автоматически обрабатывать более 90% типовых документов в файловых архивах. Оставшиеся 10% выполняются в автоматизированном режиме, дообучая модель на варианты классификации, специфичные для каждого предприятия. Для иных отраслей первоначальное обучение нейросети может занимать несколько месяцев.
Обучение нейросети выполнялось бизнес-экспертами компании «От-Ойл», входящей в группу «АТОЛЛис», на более чем 1Тб файлов по недропользованию из источников в свободном доступе Росгефонда. В процессе 23 итерации на 188 узлах онтологической модели было обработано 2348 объектов. Использование предоставленного компанией IBM высокопроизводительного стенда (в рамках технологического партнерства) позволило сократить время каждой итерации полного обучения модели с 2,5 месяцев до 10 суток.
Первые применения робота успешно выполнялись компанией «От-Ойл» при реализации проектов управления проектной документацией на предприятиях нефтяной отрасли.
В настоящее время ТехноИнтеллект ведет разработку сразу нескольких роботов из серии управления данными:
- робот когнитивного поиска по структурированным и неструктурированным источникам данных на основе онтологической модели;
- робот по унификации данных, позволяющий автоматически формировать перекодировочные таблицы справочных значений, имеющих разные коды в разных системах;
- робот-помощник, поддерживающий выполнение регламентных задач сотрудников при работе в процессных ИТ-решениях.