НовостиСобытияКонференцииФорумыIT@Work
Документооборот/ECM:

Блог

Почему корпативный поиск не находит применения в России?

Андрей Колесов
26.05.2011 22:16:14

На DOCFLOW 2011 прошла дискуссионная панель по теме корпоративного поиска. С довольно энергичным докладом выступил Михаил Козлов (он сейчас пребывает в статусе "независимого консультанта"). Надеюсь, что его презентацию будет доступна для свободного ознакомления (а пока могу дать ссылку – на обзор по теме, опубликованный в начале года) - а потом последовало обсуждение (с участием наиболее активных поставщиков средств поиска), которое в значительной степени крутилось вокруг как раз вопроса, обозначенного в заголовке поста.

Было высказано немало разных соображений, но все же, как мне кажется, в целом нашли главное звено: российские предприятия не сильно борятся за эффективность своей работы, а потому и не спешать заниматься проблемами повышения производительности труда сотрудников. Понятно, что это относится не только к средствам корпоративного поиска.

Но кроме этой "магистральной" причины, были озвучено еще одно очень любопытное, и как мне видится, точное, замечание, высказанное Дмитрием Романовым ("АйТи"). А именно то, что представление заказчиков о проблеме "испорчено" наличием бесплатных средств Интернет-поиска. Когда клиенты узнают, что проект по внедрению корпоративного поиска будет стоить для них "круглую сумму" (а счет тут идет как минимум на десятки тысяч долларов), они просто недоумевают: как же так – во всем гигантском Интернете можно искать бесплатно, а у себя "дома" – за такие деньги.

Очень верное замечание. Как говорил мой начальник лаборатории давно-давно: "быстро хорошее не бывает".

Комментариев: 20

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии

27.05.2011 11:26:10

Цитата
российские предприятия не сильно борятся за эффективность своей работы


Вспомним великого Лобановского. Победа с минимальным перевесом - вот самая эффективная стратегия. И три очка заработал, и устал по минимуму.
Нет никакой абстрактной эффективности. Задача бизнеса - чуть-чуть опережать конкурента. Именно чуть-чуть, иначе "сильно устанешь" и в конечном счете проиграешь. Поэтому российские предприятия действуют как раз весьма эффективно.

Дмитрий Романов
27.05.2011 12:26:43

>в конечном счете проиграешь

Страна. в которой производительность труда в разы меньше, чем у других и которая будет пытаться устранять этот разрыв, двигаясь по "чуть-чуть", в конечном счете проиграет...

27.05.2011 12:51:32

А наши компании где-то конкурируют с западными?

29.05.2011 20:16:01

Есть несколько уровней системы. В нижнем ценовом уровне у наших что-то есть.

27.05.2011 14:11:38

1. Мне показалось, что в результате дискуссии среди экспертов был достигнут известный консенсус (даже Microsoft не заявил о каком-то особом мнении). Суть его такова: несмотря на то, что корпоративный поиск подается как готовая к использованию из коробки, мощная (я бы сказал даже, брутальная) технология, резко способствующая ускорению (вот, ведь, волшебное слово, непонятно только, ускорению чего именно?), на деле, его внедрение сопряжено с массой интеллектуальной аналитической работы. К которой заказчики пока не готовы. Как водится, западные заказчики не готовы меньше, а наши больше, тем не менее, широкое (массовое, сколько ни будь сопоставимое по масштабам с распространением MS Office и Google) распространение этих технологий – дело будущего. Основным методом обеспечения практической доступности («findability») электронных (как и бумажных) документов сегодня остается – «класть на место и искать там, куда положил», а если на место не положил, то не взыщи, можешь и не найти. А разбрасывать, где попало, а потом искать полнотекстовым поиском по воспоминаниям – это не метод.

2. Интересная история, поведанная уважаемым М.Козловым, на мой взгляд, доказывает прямо противоположное тому, что хотел доказать оратор.
Перескажу вкратце. В некий банк пришло электронное письмо такого приблизительно содержания. «На рекламном щите написано, что по такому-то адресу стоит ваш банкомат. А его там нет. Примите, пожалуйста, меры. <Подпись разборчиво>». Банк ответил гражданину электронным же письмом где-то через 200 с лишним дней (!), что, мол, меры приняты, все теперь в порядке. В электронном ответе была удержана вся история переписки сотрудников банка по данному поводу. На основании этой истории некие аналитики (подозреваю, что не профессиональные аналитики банковских бизнес-процессов, а аналитиканствующие (copyright А.С.) продавцы корпоративного поиска), умозаключили, что сотрудники банка потратили N часов оплаченного работодателем времени. И это, с учетом средних почасовых ставок, обошлось якобы банку в М долларов, где М оценивалось уже где-то в 200000 (короче, банк простым e-mail-ом ввели в расход на 200 тыс. долл., за цифры не отвечаю, отвечаю по памяти за порядок цифр). Мораль предлагалась такая: если бы банк заблаговременно потратился на заветное окошечко поиска (от Microsoft Fast, для примера), то набрав в нем «рекламный щит», он разом бы окупил все затраты с коэффициентом 400% (цифры М.Козлова, воспроизвожу по памяти порядок).
Случившийся тут среди экспертов мой коллега А.Громов (ВШЭ) резонно указал на то, что корпоративный поиск хорош и эффективен не вообще, а в контексте конкретных бизнес-процессов (см. мое замечание насчет брутальности и интеллектуальности), и что вбрасывать в регулярный бизнес-процесс нерегулярный казус – значит гарантированно потерять время. Это все равно как на конвейер, расфасовывающий молоко в литровые картонные пакеты, поставить пустую поллитровую стеклянную пивную бутылку. В лучшем случае конвейер придется не надолго остановить. Причем, чем выше уровень автоматизации процесса, тем выше риски потерь из-за втягивания в него какого-нибудь нестандарта. Думаю, что в рассказанной истории сотрудники банка потому и задержались с ответом, что не тратили на письмо свое ценное время, так как справедливо оценили риски, связанные, с таким письмом, как незначительные (если не совсем нулевые). Заводить дорогостоящие инструменты для обслуживания нерегулярных случаев – расточительно. Поэтому мораль басни совсем в другом: нужно как можно раньше дискриминировать (различать) различные типы контента, обрабатывать каждый тип сообразно положенному ему регламенту, и не замусоривать свои процессы и документные хранилища в надежде на спасительный корпоративный поиск.

3. Замечания другого моего коллеги Д.Романова (АйТи) я бы тоже интерпретировал несколько иначе, чем А.Колесов. Один из участников дискуссионной панели (правда другой панели, на которой обсуждалась электронизация госуслуг) справедливо заметил, что электронное государство превратилось в разновидность футбола или, допустим, воспитания детей – тут все специалисты. Интернет вообще и Google, в частности, сильно способствовали попсизации темы поиска. Пожелание бесплатности – лишь один из ликов этого многоликого явления. Требования к корпоративному поиску принципиально отличаются от требований к интернет-поиску, в части, например, полноты, но не только. Как правило, при поиске корпоративный пользователь наряду с полнотекстовой частью запроса, формулирует, или подразумевает довольно много условий в терминах корпоративных онтологий и тезаурусов, редко когда он ищет документ исключительно по воспоминаниям о словах из текста документа. Не случайно, практически все ECM/СЭД предлагают комбинированный поиск (по элементам профайла (метаданных) + элементам текста).
Собственно, такой усложненный полнотекстовый поиск, распространяющийся не на все на свете файлы, а на более конкретизированные и систематизированные источники корпоративного контента (например, на корпоративные CMS, CRM и т.п.), является сейчас основным конкурентом «поверхностных» (поверх различных ИС) поисковиков. Этот вид поиска не образует (для конечного пользователя) отдельной брэндированной рыночной позиции и заказчик, обычно, не интересуется, чьей разработки будет полнотекстовый поисковый движок, за который он платит при внедрении системы управления тем или иным видом контента. Возвращаясь к заголовку блога, я бы сказал, что не находит применения (и не только в России) не корпоративный поиск, а слишком широкозахватный федеративный поиск как отдельно продаваемый универсальный общекорпоративный сервис.

27.05.2011 20:13:57

+10 !

Михаил Козлов
19.06.2011 15:07:22

Александр, спасибо за комментарий. ИМХО Вы не вполне точны в плане пересказа моих тезисов smile:)
Если посмотреть на 16 слайд моей презентации (http://www.slideshare.net/mkozloff/ss-8079711), то можно заметить, что основное время было потрачено не на поиск щита, а на поиск объектов и субъектов ряда казалось бы типовых процессов smile:) Проблема в том, что в реальной жизни structured task workers свои регламенты знают плохо, а о существовании других даже не подозревают. Кроме того масса времени уходит на поиск информации для решения задач, которые возникают на стыке процессов, для чего регламентов нет и быть не может. Иначе вам придется озаботится регламентом для каждой потенциальной задачи, которую могут когда-либо решать сотрудники smile:)

Кроме того Вы, опять таки ИМХО, делаете странный вывод из собственной рекомендации: "Заводить дорогостоящие инструменты для обслуживания нерегулярных случаев – расточительно". Корпоративный поиск -- это как раз дешевый инструмент для обслуживания всех случаев - регулярных и нерегулярных, т.к. эта технология инвариантна к контенту. А вот: "как можно раньше дискриминировать (различать) различные типы контента, обрабатывать каждый тип сообразно положенному ему регламенту, и не замусоривать свои процессы и документные хранилища" -- это дорого и не всегда понятно насколько эффективно (недаром сделать бизнес-кейс и посчитать ROI для специализированных ECM систем -- довольно сложно, т.к. не всегда ясно что же в итоге улучшается). Представьте себе, что Гугл будет "обрабатывать каждый тип сообразно положенному ему регламенту" smile:D
Отсюда, кстати, проистекает успех SharePoint как относительно недорогой "горизонтальной" платформы для поиска и управления корпоративной информацией.

Так что пока остаюсь при своем мнении.

19.06.2011 18:45:01

Спасибо, Михаил за ссылку.

Глядя на слайд, я позволю себе усомниться, что дело было именно так. Какие такие совещания? Какой бюджет на демонтаж? Где такой бюджет - в банке? Кто-то думает, что банк сам силами своих хозяйственников ставит щиты? Просто у аутдоринговой компании никто не купил это место после окончания договора с банком и она сэкономила на демонтаже. Нужно было найти копию договора с этой компанией в службе маркетинга банка (а это не тысячи документов, а много меньше) и позвонить по указанному там телефону. И спустилось это письмо прямо в службу маркетинга, а не обсуждалось на совете директоров. Сознайтесь, Михаил, что вы рассказываете вымышленную историю и сразу всем полегчает.

Мы как-то рассматривали затею корпоративного поиска в очень крупной компании (более 2 тыс аппаратных серверов и примерно столько же локальных станций). Подключались к рассмотрению и технические службы и аналитики. Ничего практичного в затее не обнаружилось. Дорого (просто даже инфраструктура хранения индекса затратна до безобразия) и без ясно видимой цели.

Google - это поиск "чужих" незнакомых файлов. У пользователя нет ясной цели поиска, если 250-й документ в списке явно лучше согласуется с его целями, чем 1-й и 2-й, он об этом никогда не узнает. Он о нем не знал раньше, не узнал и теперь, проведя поиск. Нет и требования полноты поиска. Собственно, каждый может получить представление о поиске "своих" файлов, установив Google Desktop или какой-нибудь его аналог. Если проиндексировать все файлы за 20 лет (а это достаточно типичный возраст личного архива), вы будете получать минимум 3-4 экрана ссылок в ответ на любой "исторический" запрос (а свежие файлы вы и сами найдете). Умножьте теперь эту картину на несколько тысяч.

Я, собственно, не мечтал переубедить вас, Михаил, а просто объяснил эффект наблюдаемый на рынке.

С тем, что полнотекстовый поиск весьма полезен в любой прикладной системе не спорил и не спорю.

Михаил Козлов
20.06.2011 11:42:36

История, как говорят, не вымышленная smile:)

> Мы как-то рассматривали затею корпоративного поиска в очень крупной компании... Ничего практичного в затее не обнаружилось.

А какие были прогнозируемые NPV и ROI для данного проекта? При каком значении hurdle rate?

Вот 9 примеров задач, для которых можно построить бизнес-кейс по внедрению корпоративного поиска (для финансовой сферы, но для любой другой тоже подойдет): http://www.slideshare.net/mkozloff/9-ways-to-make-financial-organizations-more-effective-with-fast-search

А вот ROI калькулятор для корпоративного поиска (на пример FAST Search, но можно заменить на любой другой) http://www.devbusiness.ru/mkozloff/files/2011/02/Microsoft-FAST-Search-ROI-Calculator-MKozloff.xlsx

Исходя из этого ИМХО для любого конкретного случая можно с цифрами в руках сказать полезен ли данный КП для данной задачи или нет.

> Google - это поиск "чужих" незнакомых файлов. У пользователя нет ясной цели поиска
В большинстве случаев проблемы вызывает как раз поиск чужих "файлов". Своих люди плодят сильно меньше чем используют чужих, да и структурируют свое гораздо лучше чем чужое. А то, что конкретный Google не решает проблему поиска не означает, что не нужен поиск, в чем мы, по видимому, с Вами и не спорим smile:)

20.06.2011 15:37:09

Вы, Михаил, собственно, и перешли к более тонким моментам, о которых я и написал в своем первом посте. ("его внедрение сопряжено с массой интеллектуальной аналитической работы."). Т.е. от идеи бури и натиска мы уже отказались. Появился ROI. Который, заметим, целиком и исключительно зависит от заветной цифры 57 в заклинании "служащие тратят 57 дней в году на поиск". Это кто подсчитал-сказал? А откуда это узнать, если не фиксировать скрупулезно все (как?) запросы на поиск? Строго говоря, пока не завели обсуждаемый сервис, эту цифру и узнать неоткуда. Да и экономия выйдет, только если поиск будет давать осмысленные результаты. Как известно, полнотекстовый поиск выкладывает перед вами некую кучу. Дальше копайтесь сами. Возможно, 56 дней в году. А если есть средства уточнения (в каких терминах?), то мы и возвращаемся опять к исходному его внедрение сопряжено с массой интеллектуальной аналитической работы.".

Конкретно, в том случае, который я припомнил, ROI выходил всяко ниже плинтуса. Были проведены эксперименты, взяли продукт в trial и проиндексировали 1% от общей массы. Стали задавать осмысленные вопросы, получать бессмысленные ответы. Подсчитали затраты дискового пространства, затраты на интеллектуальную аналитическую работу. Прослезились.

Михаил Козлов
20.06.2011 17:15:59

Ну, тогда мы на одной волне smile:) С ROI я собственно начал, т.к. это заметная часть моего доклада. Любой расчет ROI в ИТ предполагает наличие входных показателей, значения которых можно улучшить при помощи использования технологии. Если нет показателей или их значения не известны то ROI посчитать нельзя и пользы во внедрении, как правило, нет. Все просто smile:)

Михаил Козлов
20.06.2011 17:18:57

А насчет массы интеллектуальной работы соглашусь, но только отчасти. Тот же FAST, например, умеет автоматически извлекать метаданные из индексируемых текстов и использовать их для построения навигаторов, уточняющих запросы

29.05.2011 20:10:44

Я считаю, что данная дискуссия по КорпПоиску и доклад - это лишь первый шаг в начале обсуждения темы (или возрождения темы).

Тема же эт называется "управление знаниями", Поиск - это лищь один из компонентов этой темы и потому, рассматривать поиск в отрыве от УЗ просто нельзя. Но делается.

Хочу напомнить, что тема УЗ активно начала обсуждаться в России ровно 10 (или 11?) лет назад, но продержалась не более 1 года и сникла.

Но в любом случае сводить тему КорпПоиска в теме поиска в СЭД - это резкое сужение вопроса. По той просто причине, что наши СЭД имеют дело с ОЧЕНЬ НЕБОЛЬШОЙ долей электронных корпоративных активов. А во многих случаях -- вообще, фактически не имеют дело, так как на практике обсуживают лишь бумажные документы.

И для начала я хочу отметить, что было бы полезно обсудить - как использовуется в реальности поиск в СЭД. И хочу обратить внимание на то, что "в президиуме эксперотов" на КС (да и на КС по госуслугам)представителей СЭД-поставщиков не было. И совсем не потому, что их туда не звали. Звалли, но...

Михаил Козлов
19.06.2011 15:17:55

Я хорошо помню время популярности термина "Управление знаниями" и согласен, что оно очень быстро прошло. На мой взгляд пролема в сложности, неоднозначности и, как следствие, отсутствии очевидной прикладной пользы. Бизнес, в массе своей, не интересуется управлением знаниями. Это в малой части прерогатива служб HR, которые сами являются поддерживающим процессом с не до конца ясной добавленной стоимостью smile:) То же самое в полной мере относится и к корпоративному поиску, но для него гораздо легче обосновать бизнес-кейс и он продается либо в составе корпоративных порталов/ECM систем либо как отдельно стоящее, по сути интеграционное, решение.

Максим Смирнов
19.06.2011 12:33:29

Как всегда виноват заказчик smile:D
Я думаю, что дело не только в этом. Идея корпоративного поиска, по сути своей, перечеркивает идею структурирования информации, на которой построены современные КИС. Если все можно найти, то зачем нужны все эти базы данных, ERP, CRM, специализированные отраслевые системы и т.д. Перед началом проекта по внедрению системы корпоративного поиска ИТ-отделы компаний должны расписаться в своей неспособности управлять информацией предприятия, организовать гармоничный информационный ландшафт, в котором данные четко распределены по системам, всегда понятно куда что положить и откуда забрать. Более подробно в моем блоге http://wp.me/pRljZ-e1

19.06.2011 13:44:57

Максим!
Спасибо, что подключились к разговору. Я привел ваш комментарий в отдельном новом посте (http://www.pcweek.ru/ecm/blog/ecm/1292.php) со своими комментариями.

К сожалению, на вашем сайте не нашел, вашего профайла и потому не знал, как вас правильно представть.

Михаил Козлов
19.06.2011 15:28:49

"все эти базы данных, ERP, CRM, специализированные отраслевые системы и т.д." нужны, конечно, не только для поиска smile:) КП никаким образом не перечеркивает идею структурирования информации, а служит "одним окном" к разным ее частям. Представьте, что вы агент колл-центра и вам нужна ВСЯ информация о клиенте во время разговора. Часть ее находится в CRM, часть в ERP, часть в файлах... Поиск -- единственная технология, которая может дать интегрированный взгляд. И уж точно самый дешевый smile:)

19.06.2011 15:39:48

Я предллагаю продолжить обсуждние темы в "свежем посте", который лучше виден читателям:http://www.pcweek.ru/ecm/blog/ecm/1292.php

Максим Смирнов
19.06.2011 19:41:07

Михаил, а разве в используемой вами ERP системе нет RESTful веб-сервиса предоставляющего информацию о клиенте по гиперссылке типа http://erp/clients/ClientID? smile8)

Михаил Козлов
20.06.2011 11:47:52

А мне как пользователю это ничего не дает smile:) Возможно, кто-то напишет обработчик и встроит его в какой-то бизнес-процесс. Но не факт, что я имею к нему доступ. ИМХО корпоративный поиск должен присутствовать в ИТ архитектуре как базовый интегрирующий сервис с отдельным "единым окном" для доступа ко всей корпоративной информации, + его нужно встраивать в LOB там где поиск проходит отдельным требованием.

Только зарегистрированные и авторизованные пользователи могут добавлять комментарии