Большинство руководителей компаний знают, как важно иметь стратегию в области больших данных, но не всегда понимают, насколько быстро совершенствуется и развивается эта область.

Становится все более очевидным, что данные — это капитал цифровой эпохи. Они дают ответы на вопросы, обеспечивают понимание процессов и помогают организациям находить контакт с клиентами, бизнес-партнерами и т. д. новыми и подчас весьма важными способами.

Хотя большинство руководителей предприятий признают, насколько важно иметь стратегию в области больших данных, им не всегда очевидно, как быстро эта область совершенствуется и развивается. «Эта среда очень сильно отличается от той, какой она была всего несколько лет назад», — считает директор по аналитике консалтинговой ИТ-фирмы Cognizant Digital Business Скотт Шлесинджер.

С одной стороны, объем, разнообразие и скорость больших данных («три V» — volume, variety, velocity) теперь дополнены достоверностью (veracity) и ценностью (value). Но независимо от того, как вы определяете концепцию, совершенно очевиден основополагающий факт: большие данные становятся все больше благодаря Интернету вещей (IoT), достижению облаками зрелости, совершенствованию ИТ-систем и появлению сервисов обработки больших данных.

«Крупные игроки, такие как Amazon, Google и Microsoft, расширяют обработку больших данных и раздвигают их границы», — утверждает вице-президент консалтинговой фирмы Capgemini по данным и аналитике Гоуртам Беллиаппа.

Как CIO успешно внедрить систему обработки больших данных и максимизировать результаты? Как трансформировать миллиарды данных в результаты? И как организациям не ограничиваться основами, а использовать передовой опыт?

«Цель состоит в том, чтобы не ограничиваться тактическими соображениями и создать систему стратегического значения, — рекомендует Шлесинджер. — Инициативы в области больших данных должны решать реальные проблемы бизнеса. Это требует фундаментального переосмысления вопросов, кому принадлежат данные в организации и как их использовать для получения максимальной пользы и прибыли».

Источники глубоких изменений в области больших данных

Несколько ключевых факторов вызывают глубокие изменения в области больших данных. Во-первых, IoT приводит к появлению бесконечного множества новых данных и возможностей. Сенсоры, машинные данные, смартфоны, торговые автоматы, потоки социальной информации и другие виды структурированных и неструктурированных данных дают понимание событий, которые всего несколько лет назад невозможно было отследить или понять.

Во-вторых, достижение облаками зрелости привело к появлению мгновенных и высокоавтоматизированных, работающих почти в реальном времени систем обработки данных. Как выразился Беллиаппа, «обработка больших данных как сервис создает среду, в которой проблемы конфигурирования, управления и обслуживания в значительной мере исчезают».

Сегодня необходимое для сложного анализа данных ПО часто является недорогим или вовсе бесплатным, говорит он. «Провайдеры предоставляют такие контейнеры по очень низкой цене. И она продолжает снижаться. Вы не только избавляетесь от лицензирования ПО, но можете также снизить общую стоимость владения как оборудованием, так и ПО, — добавляет Беллиаппа. — В конечном итоге вы можете вкладывать деньги не в операции, а в разработку. Вы можете двигаться к созданию более быстрой и гибкой системы, в рамках которой возможно максимальное использование наборов данных, и быстро двигаться в иных, новых направлениях».

Одним из преимуществ использования облачной системы для обработки больших данных является возможность изолировать логику манипулирования данными от текущего базового процесса. ETL-инструменты (Extract, Transform, Load) абстрагирования подключают источники данных независимо от сервис-провайдера. Это позволяет организации менять сервис-провайдеров и при этом применять одну и ту же базовую бизнес-логику.

Кроме того, обычно эти инструменты доступны с оплатой фактического использования, что делает их экономичными и мощными. «Они меняют формулу скорости создания ценности», — отмечает Беллиаппа.

Другим преимуществом облаков, говорит Шлесинджер, является переход к сфокусированным решениям, которые удовлетворяют специфические потребности клиента и при этом гармонично вписываются в более широкую систему обработки данных. В качестве примера он приводит Cloudera Navigator, потому что это решение предоставляет среду управления данными и способно помочь соблюдению требований регуляторов к данным, предъявляемых такими инициативами как General Data Protection Regulation (GDPR), которая вступит в силу в мае 2018 г.

«Мы видим продолжающийся рост и переход к зрелости в области больших данных, — поясняет он. — Сейчас многие решения предназначены не только для базового управления данными и аналитики».

Понимать большие данные и способы их использования

Подвижная, гибкая облачная система — это только часть дела. Другим ключом к созданию эффективной стратегии в области больших данных является более глубокое и широкое понимание больших данных и способов их использования. Это требует не только привлечения специалистов по данным и аналитиков, но и нового мышления руководителей бизнеса и ИТ.

«CIO и другие руководители высшего звена должны гораздо более тесно сотрудничать, чтобы определить источники прибыли и полностью использовать потенциал данных, — говорит Шлесинджер. — Правильное сочетание данных дает конкурентное преимущество». Это означает знание областей применения, процессов обратного инжиниринга и того, в чем заключается ценность данных, а также как можно превратить ее в новые, улучшенные продукты и услуги.

Это совсем другие подход и менталитет, нежели те, с которыми организации относились к большим данным и аналитике в прошлом. «Вместо того, чтобы начинать с ИТ и говорить „ладно, давайте сохраним эти данные, а потом посмотрим, какую пользу мы сможем из них извлечь“, бизнес говорит: „Вот проблема бизнеса, которую мы пытаемся решить“», — отмечает он.

Шлесинджер считает также, что важно следить за разработками и усовершенствованиями в области искусственного интеллекта, особенно машинного обучения, которые предоставляют мощные способы перемалывания данных и извлечения из них пользы. Наконец, он полагает, что важно следить за тем, что делают конкуренты и компании в других отраслях. «Цель заключается в выявлении возможностей снизить издержки, повысить операционную эффективность и создать новые продукты и услуги», — говорит он.

Беллиаппа утверждает, что в конечном итоге важно понять, что затраты на сбор данных и управление ими достигли исторического минимума. «Все это меняет правила игры», — делает он вывод.

Тем не менее, трансформация данных в информационную основу действий, в знания и результаты, относящиеся к реальному миру, остается проблемой. «Вы должны посмотреть, как вы можете создать нужный набор параметров для получения ценности, — советует Беллиаппа. — Вы должны создать аналитическую систему и аналитический движок, который сфокусирован на ключевых факторах».

Все это подразумевает нечто большее, чем технология и просто данные. «Речь идет о понимании бизнеса, чтобы специалисты по данным, аналитики и руководители направлений бизнеса могли координировать свои действия для получения практических результатов», — заключает Беллиаппа.

Версия для печати