Компания "Гарант-Парк-Интернет" (www.rco.ru) выпустила новую версию программного продукта RCO Semantic Network 3.0, который предназначен для аналитической обработки текста на русском языке.

Особое внимание в новинке уделено разбору текста, связанного с персонами и организациями, которые наиболее часто являются объектами мониторинга в задачах конкурентной разведки. Новый класс алгоритмов обеспечивает не только точное распознавание в тексте заранее неизвестных персон и организаций, но и отождествление их различных обозначений, включая полные, краткие и косвенные наименования. Можно выделять элементы смысла текста и их взаимосвязи, строить различного вида дайджесты.

Продукт, служащий для построения систем мониторинга активности целевых объектов и автоматизированного сбора информации к досье, поставляется в виде динамически подключаемой библиотеки (.dll) для Windows и позволяет разработчикам включать анализ текста в собственные приложения. Отследить и классифицировать все упоминания об объектах в информационном поле, установить их связи с другими объектами и событиями, получить различные виды дайджестов по объектам и связям - вот базовый набор функций, которые предоставляет RCO Semantic Network для обеспечения аналитической деятельности. Помимо этого библиотека незаменима в тех задачах, где требуется построение информационного портрета документа: при автоматической классификации и рубрицировании документов, экспресс-анализе и визуализации больших информационных массивов.

В новой версии продукта, по словам руководителя группы компьютерной лингвистики "Гарант-Парк-Интернета" Александра Ермакова, были решены сразу три взаимосвязанные задачи: "Во-первых, это хорошее бессловарное выделение в тексте обозначений персон и организаций, число которых потенциально неисчислимо; писаться эти обозначения могут самыми разнообразными способами. Во-вторых, это выделение объектов, заданных подробными описаниями, что позволяет даже различать персоны с одинаковыми ФИО, должностями и т.п. В-третьих, это отождествление различных наименований одного и того же объекта, иногда даже местоимений - проблема взаимной референтности. Для решения этих задач потребовалось привлечь всю мощь ранее разработанных алгоритмов: словарного и бессловарного морфологического анализа, синтаксического анализа, снятия омонимии".