НовостиОбзорыСобытияIT@WorkРеклама
Идеи и практики автоматизации:

Блог

Что мешает использованию в бизнес-аналитике внешних данных?

Издавна для бизнес-анализа компании использовали, в основном, данные, накопленные ими самими в ходе выполнения тех или иных бизнес-процессов. Сегодня все чаще, особенно в контексте Big Data, делаются попытки включить в аналитические процедуры еще и данные из внешних источников. Выгоды от этого довольно очевидны, но почему использование для указанной цели внешних данных не носит массового характера? Свои ответы на этот вопрос дал на сайте InformationWeek CTO компании Knoema Vladimir Bougay.[spoiler] Погуглив, я обнаружил, что Knoema - компания со штаб-квартирой в Перми, с 2011 г. занимающаяся как раз сбором данных из доступных мировых источников и их предоставлением как бесплатно, так и за деньги. У компании есть подразделение в Индии, где трудится половина ее штата (около 30 человек).

Итак, о каких препятствиях говорит Владимир Бугай:

1. Цена данных. Внутренние - для предприятия бесплатны, а за внешние иногда нужно платить, да и после этого, нередко, поставщик информации накладывает определенные ограничения. Отсутствуют также недорогие BI-инструменты, заточенные под обработку как внутренних, так и внешних данных.

2. Недостаток специализированных средств поиска в массивах внешних данных и их предварительного обследования.

3. Сложность работы с множеством поставщиков и агрегированием в корпоративном хранилище получаемой от них информации (DataStream - по глобальным финансам, Experian и Dun & Bradstreet - по кредитным отчетам, Acxiom - по демографии и т.д.).

4. Трудность подключения внешних источников к используемым в компании СУБД и BI-системам. Отдельные поставщики данных предоставляют API-интерфейсы для автоматизированного доступа к своим массивам, но определенные шаги в этом направлении должны сделать и вендоры СУБД и BI-систем.

Как мне кажется, мы стоим на пороге рождения нового рынка - рынка данных. Рынка, на котором данные станут не уникальным, как сегодня, а commodity товаром со стандартными механизмами и правилами его продвижения и потребления.
Митин Владимир
Цена данных. Внутренние - для предприятия бесплатны...
Ну это как сказать... Хранение данных (с защитой этих данных от утечек) требует определенных затрат. Маленькие данные -- маленькие затраты. Большие данные -- большие затраты... Ещё возникает проблема отбора данных для хранения. Ведь если собирать и хранить все подряд, то недолго и в IT-Плюшкина превратиться ... :)