Для реализации важных аналитических инициатив совсем не обязательно иметь хранилище данных. Ганес Кесари, сооснователь компании Gramener, где он возглавляет отдел консультаций и инноваций в области науки о данных, представляет на портале Enterprisers Project четыре возможности получить ценные инсайты, используя ограниченные данные.

Слишком часто ИТ-руководители откладывают свои инициативы в области науки о данных до тех пор, пока не смогут создать надежный уровень инженерии данных. Они ждут, пока появится хранилище данных, прежде чем планировать проекты по анализу данных, полагая, что передовая аналитика необходима для трансформации ценности бизнеса и что большие объемы аккуратно организованных данных являются необходимым условием для этого.

Ничто не может быть дальше от истины.

Вот четыре вещи, которые следует иметь в виду, если у вас нет больших данных, но вы хотите реализовать инициативы в области науки о данных.

1. Бизнес-проблемы должны определять тип аналитики, которая вам нужна

По оценкам Gartner, около 80% проектов в области науки о данных не приносят бизнес-результатов. Ключевой причиной этого является то, что руководители не выбирают правильные бизнес-проблемы для решения. Большинство проектов по анализу данных выбираются на основе имеющихся данных, имеющихся навыков или доступных наборов инструментов. Это рецепты провала; проект по анализу данных никогда не должен начинаться ни с данных, ни с аналитики.

Лучший способ начать путешествие в науку о данных — это проанализировать стратегию организации. Выясните наиболее важные проблемы, которые вы хотите решить с помощью целевых пользователей, и проверьте, принесет ли их решение желаемый эффект для бизнеса. Выбранные бизнес-задачи будут определять подход к аналитике и, следовательно, необходимые данные.

Отсутствие данных для начала может быть даже преимуществом: когда вы начинаете с чистого листа, вы не обременены унаследованным багажом. К тому же организации с гораздо более длительной историей часто сталкиваются с проблемой более дорогостоящих цифровых преобразований.

Рассмотрим компанию Moderna, которая приняла цифровую культуру с момента своего основания в 2010 г. Она построила платформу данных и аналитики для обслуживания своих бизнес-приоритетов, которые были связаны с разработкой лекарств на основе мРНК. Этот целенаправленный подход помог компании разработать проект создания вакцины от COVID-19 всего за два дня.

2. Ваш подход к аналитике диктует источники данных

Организации могут потратить месяцы на создание хранилищ данных, а потом обнаружить, что собранные ими данные недостаточно хороши для проведения необходимого анализа. Алгоритмам машинного обучения часто требуются данные определенного типа, объема или гранулярности. Попытка создать идеальный уровень инженерии данных без четкого понимания того, как он будет использоваться, — это напрасные усилия.

Когда у вас есть представление об организационной стратегии и бизнес-проблемах, которые необходимо решить, следующим шагом будет окончательное определение подхода к аналитике. Выясните, нужна ли вам описательная, диагностическая или прогностическая аналитика и как будут использоваться полученные инсайты. Это позволит уточнить, какие данные вам следует собирать. Если получение данных является сложной задачей, ведите процесс их сбора поэтапно, чтобы обеспечить итерационный прогресс аналитического решения.

Например, руководители одного крупного производителя компьютеров хотели понять, что способствует удовлетворенности клиентов, поэтому они разработали программу анализа клиентского опыта, которая началась с прямой обратной связи посредством опросов. Описательные инсайты, представленные в виде историй данных, помогли улучшить индекс потребительской лояльности во время следующего опроса.

В течение следующих нескольких кварталов они расширили аналитику, включив в нее отзывы в социальных сетях и данные о работе конкурентов, используя такие источники, как Twitter, дискуссионные форумы и двойные слепые опросы рынка. Для анализа этих данных они использовали передовые методы машинного обучения. Это решение помогло за год увеличить доходы, получаемые от клиентов, на 50 млн. долл.

3. Сбор данных начинается с легкодоступных малых данных

Когда мы думаем о предпосылках для машинного обучения, на ум часто приходят большие данные. Но это заблуждение, что для получения преобразующей бизнес ценности необходимы именно большие объемы данных. Многие руководители ошибочно полагают, что необходимо собрать миллионы точек данных, чтобы обнаружить скрытые бизнес-инсайты.

Как только вы определились с целями, бизнес-проблемами и аналитическим подходом, следующим шагом будет сбор данных для анализа. Многие бизнес-задачи можно решить с помощью простой описательной аналитики на небольших электронных таблицах данных. Снизив входной барьер для данных до нескольких сотен строк, вы можете вручную собрать данные из систем, оцифровать бумажные записи или установить простые системы для сбора необходимых данных.

Другой пример: производитель матрасов хотел использовать аналитические данные для повышения производительности. Будучи предприятием среднего размера, находящимся в начале пути к данным, компания располагала небольшим массивом данных, состоящим в основном из электронных таблиц, подготовленных вручную. Вместо того чтобы откладывать внедрение аналитики, компания предприняла проект диагностической аналитики для оптимизации производительности.

Она оцифровала имеющиеся на бумаге машинные данные, объединила их с данными, подготовленными вручную в нескольких электронных таблицах, а затем использовала простые статистические методы для анализа сотен строк и выявления рычагов для оптимизации. Благодаря выявлению таких инсайтов, как оптимизация настроек температуры и влажности, предприятию удалось повысить потенциальный выход продукции на 2,3%, что в сумме дало дополнительный годовой доход в размере 400 тыс. долл.

4. Применяйте инкрементальный подход для получения трансформационной ценности данных

Ключевой момент здесь — не откладывайте свои инициативы в области науки о данных на потом из-за ограниченного объема данных. Применяйте подход дизайн-мышления для определения правильных бизнес-проблем, которые необходимо решить. Используйте гибкую методологию для разработки правильного аналитического подхода к решению проблем. Наконец, разработайте итеративный процесс для получения необходимых данных на пошаговой основе.

В большинстве сценариев невозможно заранее продумать все потенциальные источники необходимых данных. Не стоит тратить ресурсы на оценку передовых методов аналитики, когда вы только начинаете свой путь в области анализа данных — это приводит к чрезмерной инженерии и параличу анализа. Помните, что только выполнение проектов по анализу данных может помочь вам построить надежную дорожную карту инженерии данных.

Такой итерационный процесс более эффективен и результативен, и он обеспечит трансформационную ценность. Набирайте обороты, добиваясь быстрых побед с помощью небольших решений для анализа данных. Сосредоточьтесь на принятии аналитики пользователями, чтобы помочь преобразовать инсайты в бизнес-решения и, в конечном счете, вернуть инвестиции.