НовостиОбзорыСобытияIT@WorkРеклама
Идеи и практики автоматизации:

Блог

Традиционные данные справляются лишь с богатыми 50-летними женщинами

Многолетне используемые РСУБД доказали свою эффективность в неисчислимом множестве корпоративных решений, однако дотянуться до уровня Больших данных им вряд ли удастся.

[spoiler]Одна из главных проблем РСУБД -- это ориентация, по большому счету, на довольно узкий спектр учётных задач, где данные хорошо нормализованы, структурированы, и напрашиваются на представление в виде таблиц. При этом желательно, чтобы объем этих данных рос не слишком быстро, иначе придётся раскошеливаться на программно-аппаратные хранилища данных.
Ну а сегодняшние облачные системы нуждаются в быстрой обработке стремительно увеличивающихся объёмов «безсхемной», неструктурированной информации, причём в разных форматах и из разных источников -- и главное, по разумным ценам. Что же реально они могут дать бизнесу?
1. Понимание причин ухода клиентов. Для этого требуется анализировать Big Data, описывающие поведение огромного числа пользователей, дабы понять-предсказать, когда они начинают менее активно покупать продукт, и предпринять профилактические меры.
2. Помимо классических рисков компьютерной безопасности, регулярно мучающих крупные организации (прежде всего финансовые), возникают и иные, скрытые риски, которые не удаётся выявить типовыми подходами. Это, например, мошенническая деятельность инсайдеров, мелкие утери данных из-за багов в софте, хитроумная деятельность хакеров, почти не оставляющих следов -- подобные моменты можно отследить лишь по едва заметным противоречиям в огромных массивах информации, глубоко проанализировать которые РСУБД за разумное время не способны.
3. Поиск инновационных фич. Правило 80/20 действует практически всегда. В многих случаях, связанных с Большими данными, это может быть даже 99,8%/0.2% -- когда надо выпустить сложный неайтишный продукт (например, лекарство), но для этого надо перемолоть огромные объёмы тестовых испытаний, дабы найти те 0.2% успешных комбинаций.
4. Маркетологи продолжают вырабатывать свои рекомендации на базе примитивнейшего анализа единичных предпочтений пользователей, выдавая очевидные советы, для которых и компьютер не нужен: скорее всего, новые элитные духи с нежным цветочным запахом будут покупать женщины среднего возраста с хорошим доходом. Ну и что? Хороший аналитический движок для маркетинга будет учитывать вообще всё, что можно: от тематики постов платёжеспособного клиента в твиттере до частоты просмотра им котиков на инстаграмме, выявляя паттерны подсознательных интересов и на их основе формируя точечные индивидуальные предложения.
5. Тренды самих продаж точно так же могут зависеть от огромного числа факторов: от количества тематических постов конкурентов и текущих событий в стране до выхода нового айфона и фаз Луны. Причём Big Data смогут выявлять все нужные и динамически меняющиеся паттерны по каждому продукту.
Ну а реализация каждого из этих пунктов возможна уже сегодня -- и лучшей открытой платформой пока представляется Hadoop.