НовостиОбзорыСобытияIT@WorkРеклама
Документооборот/ECM:

Блог

Information Governance - технологические примочки

В предыдущих двух заметках по теме Information Governance (Information Governance - современная замена делопроизводству и Information Governance - модель зрелости) я рассказывал по большей части о ее организационной составляющей. Сегодня же хочется поговорить на более интересную для меня лично тему, а именно, применяемых в IG технологиях. [spoiler]

Как уже было сказано, IG - это комплексная дисциплина, которая пытается втиснуть в себя все, что касается вопросов правильного управления информацией предприятия. Однако, тему Information Governance совершено невозможно представить себе без самых продвинутых информационных технологий. В этой заметке я всего лишь перечислю и кратко охарактеризую главные их них.
Конечно же, основой IG должна быть современная продвинутая система управления контентом (ECM). Но для полноценного ее применения в рамках Information Governance она должна содержать или уметь интегрироваться с такими вещами, как:

1. Системы захвата информации.
Много сказано о неудачном переводе английского "capture", как "захват". Однако, термин прижился, благодаря,  видимо, свой краткости. Под захватом подразумевается включение информации в систему. Обычно здесь говорят о сканировании документов, а конкретнее о системах потокового сканирования. Но это еще не все. Системы захвата должны также иметь возможность включения в систему информации из других источников. Например из смежных информационных систем, электронной почты, цифровых факсов, информации из интернета, например из социальных сетей и т.д.
Стоит упомянуть также о возможности распознавания текста документов.

2. Автоматическое извлечение.
По сути это часть системы захвата,  связанная с распознаванием текста документов. Распознанную информацию можно использовать для индексирования и последующего быстрого поиска по тексту. Система извлечения информации делает шаг вперед по сравнению с простым индексированием. Она позволяет выделить (извлечь) некоторые смысловые части документа. Например, исходящий номер и дату, наименование корреспондента, фамилию и должность подписанта. Если сканируется договор, составленный на стандартном банке, такая система может найти в тексте наименования сторон, дату заключения, сумму контракта и другие составляющие документа. Извлеченная таким образом информация может быть использована, например, для автоматического заполнения карточки документа, или для его классификации, о чем дальше.

3. Автоклассификация.
Это также часть системы захвата. Используя технологию извлечения информации, описанную выше, можно научить систему самостоятельно определять вид документа, например отличать письмо от телеграммы или протокола и т.д. Классифицировать документы подобным образом можно не только по виду, а, например, по адресату или любым другим извлеченым данным. Можно отдельно собрать все отчеты, поданные по определенной форме, письма, имеющие похожую тему и т.д. Как в дальнейшем использовать полученную классификацию, целиком вопрос используемых политик Information Governance. Где-то можно использовать ее для определения сроков хранения информации, где-то для ограничения доступа, где-то для продвинутой аналитики. В любом случае,  придание неструктурированной информации некоторой структуры путем классификации документов пойдет ей только на пользу.

4. E-discovery.
Эта тема достаточно популярна за рубежом. Именно e-discovery обычно вспоминают в первую очередь, когда речь заходит об Information Governance.
По сути, это отбор электронной информации для использования в качестве доказательств по делу. Такой отбор можно делать и вручную. Но с точки зрения информационных технологий, это автоматический поиск в массиве неструктурированных документов информации, связанной с какой-то определенной темой. Для этого используются перечисленные выше распознавание, извлечение данных и автоклассификация, плюс какой-то интеллектуальный анализатор полученной информации. Существуют отдельные системы, которые могут анализировать большие объемы разноформатных документов, например папку или архив с файлами, содержимое сервера электронной почты и выхватывать документы, содержащие нужную информацию. Интеграция этих возможностей в ECM систему позволяет, например, исключить риск уничтожения документа, отобранного для e-discovery, по окончании срока его хранения. Расширенные возможности e-discovery движка по анализу содержимого документов могут также использоваться для автоклассификации в рамках ECM.

5. Аналитика и BigData.
Продвинутая аналитика (Big Data, Business Intelligence) также является неотъемлимой частью технологического фреймворка IG. Ведь главная суть Information Governance - это помочь организациям выжить в условиях все нарастающих объемов данных. И не просто выжить, а продолжать эффективно работать, не нарушая закон и нормативные требования, за счет применения правильных средств обработки информации в необходимом сочетании между собой и с внутренними регламентами повышать эффективность работы организации. Правильная аналитика будет незаменима при принятии решений и может существенно повысить эффективность.

Здесь перечислено далеко не все, что касается темы IG в плане информационных технологий. Но, думаю, что основные вещи я назвал. Буду рад услышать дополнения, замечания, возражения, да и любые другие комментарии.
Вадим Малых
Это собственно самая популярная тема статей про IG :) Чем IG отличается от ... (нужное вставить)
Чаще сравнивают с Records Management, хотя мне попадались и сравнения с e-discovery, Information Management и, конечно, ECM.
Вадим Малых
Евгений, спасибо, интересный взгляд! Думаю одно из отличий - неструктурированность информации, обрабатываемой в рамках IG. И, если можно так выразиться, ее произвольность.
Колесов Андрей
И чем же, интересно отличаются IG от ECM? Тем, что используется аморфный термин Information вместо более конкретного Content?
и Governance вместо management? Я считаю, что это - игра слов, не более того.

Чем отличается IG (ECM) от RM? Понятно чем: RM - только часть ECM. Раньше, 15 лет назад RM составляла основную часть ECM, если угодно, это была целевая, конечная задача ECM - поддержка архива. А сегодня это 10-15% ECM.