НовостиОбзорыСобытияIT@WorkРеклама
Документооборот/ECM:

Блог

Новая алхимия (продолжение)

Продолжение разговора с М.Романовым об аналитической лингвистике.

3. Перейдем теперь к семантическому анализу закрытых корпоративных хранилищ контента. Это то, чего А.Рылов непосредственно не касался.

«А что у нас в корпоративном контенте? В основном документы, львиная доля которых - фиксация фактов, касающихся хозяйственной деятельности компании.
Этот контент не содержит никакой полезной для анализа информации. Если что-то важное там было (сроки, суммы, контрагенты, ...) - оно давно вынесено в метаданные, с которыми идет совсем другая работа, а текст самого документа никому уже не интересен.»


Вы правы, Михаил, в том, что основная масса корпоративного контента состоит из рутинной переписки. Но [spoiler]то, что она не представляет никакого интереса – тут вопрос более сложный. Например, представьте себе, что одна компания получила вдруг доступ к почтовому хранилищу (или хранилищу СЭД, не так важно) своего конкурента. Наверное, она испытает какой-то интерес, не обязательно даже меркантильный. Люди любят подглядывать, на этом, в частности, в значительной степени базируется популярность социальных сетей. Люди любят сравнивать себя с другими. И корпорации, заметим, тоже. Корпорации (Enterprises) – субъекты довольно скрытные. Отчасти этот их недостаток (и то, только для публичных компаний) преодолевается требованиями регуляторов (центральных банков, комиссий по ценным бумагам и т.п.). Такие требования имеют тенденцию к ужесточению (см. принятый в 2002 году закон Сарбейнса-Оксли, вызвавший большие подвижки в индустрии ECM/СЭД). Но за исключением оговоренного законами типа SOX, корпорация как объект вглядывания/наблюдения/измерения – очень-очень черный ящик. Причем не только для посторонних дядь, но и для самой себя.

Начнем конструировать примеры.

3.1 Весьма часто письмо, направленное по электронной почте, представляет собой некий вопрос. А получивший вопрос через некоторое время пишет на него ответ. Отвечает, как может, или говорит «Не знаю». И все. Никаких других формальностей. Если бы семантический робот могли разметить социальный граф числами, отражающими количество полученных/заданных в каждой вершине (персоне) вопросов и отправленных ею содержательных ответов, то было бы видно, что внутри компании существует подмножество внутренних консультантов (экспертов). Как с этой информацией поступить – вопрос отдельный. Ясно, что в ближайшем окружении эксперта о его способностях давать ответы знают (иначе бы вопросов не задавали), но, может быть, имеет смысл проинформировать о достоинствах этого сотрудника более широкий круг сослуживцев и, тем самым, повысить его КПД (а заодно и зарплату  ;) )? Это частный случай приложения (инструментария) класса expert locator, которое уже предлагается на нашем рынке компанией АйТи.

3.2 Всякий сотрудник компании характеризуется некоторым индивидуальным уровнем: изобретательности (креативности), исполнительности (аккуратности) и оперативности (реактивности). Все эти качества можно измерять по некоторым шкалам, а индивидуальные оценки по ним можно получить как экспертным методом (спросив у коллег), так и пытаться вычислить посредством программного робота на основе обработки содержания электронной переписки и публикаций в корпоративной ECM/СЭД. Всякое задание предъявляет исполнителю определенные требования в части изобретательности, исполнительности и оперативности, причем различные задания характеризуются различными требованиями к достоинствам исполнителя. Направление сотруднику наиболее подходящего ему по характеру задания повышает шансы на успех и способствует росту субъективной удовлетворенности сотрудника своей работой. Напротив, систематическое рассогласование индивидуальных качеств реального исполнителя и требований, предъявляемых ему направляемыми заданиями, чревато переживаниями, неудачами, взаимными разочарованиями и другими осложнениями.

Ну и что, спросит читатель. Чем это лучше того, о чем говорил на Docflow А.Рылов? Тянет, может быть, на не самую плохую маркетологическую сказку. И читатель будет прав: ничем не лучше. Более того, примеры А.Рылова более, если так можно выразиться, бизнесо-ориентированы. Если получится – выйдет экономический эффект. А призывать корпорации к бескорыстному самопознанию – занятие во всех смыслах неблагодарное. Так кажется сейчас.

Приведем, однако, ряд косвенных соображений в пользу намечаемых подходов. Исторически самый ранний и наиболее простой способ описания предприятия (корпорации, Enterprise) – структурно-функциональный. Более поздний и более сложный – процессный. Это соответствует стадиям усвоения врачами анатомии и физиологии. Анатомия – наука древняя, строение тела (скелет и внутренние органы) можно было изучать на мертвых. Физиология стала выделяться в отдельную область знания где-то с 17-го века (труды У.Гарвея по теории кровообращения). Основные трудности получения нового знания о физиологических процессах связаны с невозможностью прямого наблюдения за деятельностью органов живого организма и невозможностью при постановке экспериментов на живых организмах обойтись без вмешательства (иногда, разрушающего) в ход этих самых процессов. В силу этого физиология остается по сей день наукой не вполне завершенной, сохраняющей потенциал развития. BPM – дисциплина, с некоторым опозданием представленная в этом году на Docflow (был проведен 30-минутный круглый стол) является эдакой своеобразной (конструктивной) физиологией предприятий. Однако, физиологией процесс познания человека как сложной системы не заканчивается. Далее (в направлении усложнения описания предмета) идет, например, психология («наука» о «душе»), имеющая давнюю (во многом, донаучную) историю, но обретшая второе дыхание в 20-м веке. Аналогом психологии (и как бы психоанализом предприятий) выступает как раз обсуждаемая дисциплина – Content Analytics, аналитическая лингвистика (в части, применяемой к закрытым хранилищам контента), etc. Полного размежевания психологии и физиологии до сих пор не произошло. Аналогично, нет полной дифференциации предметов BPM и BI (в значении Content Analytics, см., например, выражения законодателей прогностической ИТ-моды «historical pattern analysis» и «emotion detection»  в относящемся к BPM прогнозу - перевод-изложение  на русском ). Здесь мы на время остановим органико-психологическую аналогию, которую, если будет интерес, можно развивать далее.

Современность ставит перед людьми и сообществами множество новых задач. Новых по существу. Так, когда в 60-е годы на американском рынке появилась масса высокотехнологичных и, главное, высококачественных, японских товаров, американские менеджеры поначалу не осознавали масштаб бедствия и схематизировали ситуацию в привычных для себя терминах. Однако, попытки заимствовать напрямую методы управления (в частности, управления качеством) применявшиеся японскими начальниками, в американской практике (да даже еще и на дальних подступах к ней) столкнулись с затруднениями. Ничто, конечно, не мешало ввести в американских компаниях систему пожизненного найма. Соответствующий эксперимент занял бы несколько десятилетий. Внутренний голос, однако, подсказывал, что на американской почве ничего из этого не выйдет. В результате конкурентная ситуация простимулировала в думающем слое специфический цикл самопознания и кросс-культурных исследований (см., например, образцы этого жанра и, ближе к теме ИТ ). В наши дни хранилища корпоративного контента (включая, конечно же почту и публикации в социальных сетях) являют собой колоссальный материал для самоанализа корпораций. Но нужно переменить отношение к самоанализу как к тормозящему и бесцельному процессу. В свое время, в период становления индустриальных производств, интерес к элементарной физиологии и психологии труда был и высок и продуктивен (см. Тейлор и Гастев ), но тогда было единобожие – все поклонялись богу производительности. Сегодня в эпоху постиндустриализма такого единства взглядов нет и не смотря на обилие исходных данных для анализа (вот они, пресловутые Большие Данные) менеджмент может чувствовать растерянность – критериев и параметров много, а с общим видением целей анализа есть проблемы.

Пока к практическому применению аналитической лингвистики приступили (похоже) лишь спецслужбы, при этом несколько расширяя пределы дозволенного) и одновременно используя авторитет пребывающей еще в пеленках  расширяя пределы дозволенного). Ничего необычного в этом нет – практически все достижения современных ИТ – родом из холодной (да и горячей тоже) войны.    
Александр Сапожников
Спасибо, Сергей.

Аналитика социальных графов и циркулирующего над ними контента - по моему видению - очень перспективная тема. См, например, полушутливую иллюстрацию http://www.bonkersworld.net/organizational-charts/

Этим делом активно и неброско занимаются по меньшей мере Google, Facebook и спецслужбы, причем последние как бы вместе с первыми. Это и понятно, так как у всех таких исследований есть сложности с экспериментальным материалом и его приходится добывать с применением не совсем приятно пахнущих приемов. С корпоративными данными дело обстоит не лучше чем с персональными, хоть и несколько по иной причине.

В некоторых вопросах корпорации (журналисты это отлично знают) проявляют часто прямо-таки изумительную стыдливость. Обращаясь снова к историко-медицинской параллели, можно заметить, что основной причиной нехватки медицинских знаний были религиозные предрассудки. Это сейчас врач может смело сказать больному (больной) "Разденьтесь", а в средние века можно было за такое огрести по полной. Особенно, если пациентка - супруга монарха (а ведь услуги врачей долгое время были доступны исключительно этой (или близкой к ней) категории населения). Применительно к нашей теме - корпоративный мир сейчас находится в эпохе перехода от средних веков к новому времени (и на соответствующем уровне находятся его культура самоанализа и знание собственной физиологии). Кто может сказать корпорации "Разденьтесь, пожалуйста"? Консультанты-аналитики. Под подписку о неразглашении, при том что все знают, что знания, вынесенные из обследования одной корпорации они используют при работе с другой. Так развивалась и медицина.

Тут же заметим, что многие "предрассудки", сдерживавшие наблюдения над персонами и корпорациями (включая такую специфическую корпорацию как государство), сегодня отступают (не будем здесь оценивать, хорошо это или плохо). На этой магистрали располагаются меры по ограничению банковской тайны, сокращение оффшоров, законы типа SOX, инициативы "открытые данные" и т.п.

Кстати, тут уместно будет вспомнить корпорацию Enron, сыгравшую большую роль в развитии ECM/СЭД/Content Analytics. После истории с Enron был принят уже упоминавшийся закон SOX и, кроме того, почтовое хранилище Enron было открыто для всеобщего доступа и было использовано многочисленными исследовательскими группами для обкатки алгоритмов анализа коммуникационных графов и содержания э-переписки (так сказать, исследователям был предоставлен эталонный корпоративный труп - см. снова обсуждаемую BPM-физиологическую аналогию)  
Александр Сапожников
чаще всего за забором секретности, на самом деле скрывается "пустышка".

Например, диктофон.

Вы всерьез думаете, что портативные устройства для записи речи изначально изобрели для журналистов, а не для коллег Рихарда Зорге?
Свинарев Сергей
Да, просто удивительно, насколько много верных аналогий с медициной (вот уже и патологоанатомия засветилась). :)
А картинка на BonkersWorld забавная. Хоть все это похоже на графы, но по смыслу ближе к оргструктуре и манере управления в разных известных компаниях. Картинка про Apple, по видимому отражает ситуацию при живом Стиве Джобсе.