Возможности централизованного хранения и управления отстают от растущих в геометрической прогрессии данных, преодолеть эту проблему организациям может помочь периферийная аналитика (edge analytics), пишет на портале Information Age Йенс Граупманн, старший вице-президент по продуктам и инновациям компании Exasol.

Мир продолжает становиться все более взаимосвязанным, и количество интеллектуальных устройств, способных собирать и анализировать данные, становится как никогда большим. Современные автомобили генерируют большое количество данных от встроенных датчиков и компьютеров. Розничные магазины собирают данные обо всем — от запасов и поставок до покупок клиентов. Ветряные турбины, вырабатывающие возобновляемую электроэнергию, оснащены сотнями датчиков и генерируют миллионы точек данных в минуту.

Объем информации, необходимой для обеспечения этих повседневных явлений, растет быстрее, чем доступная пропускная способность сетей. Передача всех генерируемых данных в центральное место, где их можно организовать и проанализировать обычными средствами, уже невозможна.

Поэтому встречайте периферийную аналитику — вид децентрализованной аналитики данных, когда данные анализируются у их источника — на «периферии» информационной сети.

В традиционных системах данные передаются с места их сбора в центральное хранилище, где они могут быть проанализированы. Но даже самые мощные современные сети не обладают достаточной пропускной способностью для передачи всех данных, генерируемых в большинстве случаев, поэтому необходимо принимать решения о том, что оставить за кадром.

Позволяя анализировать необработанные данные в месте их получения, периферийная аналитика избавляет от необходимости передавать их в центральную систему, но при этом собирает воедино все инсайты для централизованного принятия решений. Это значительно повышает скорость проведения анализа без ущерба для качества результатов.

Почему следует внедрять периферийную аналитику

Учитывая потенциальную ценность аналитики для улучшения процессов принятия решений и результатов бизнеса, компании не могут позволить себе не изучить свои возможности в этой области. Периферийная аналитика обладает широким спектром преимуществ с точки зрения охвата анализом большего количества данных, более быстрого и потенциально более дешевого анализа.

Использование базы данных in-memory усиливает преимущества аналитики на периферии, поскольку организации могут анализировать «сырые» данные по мере их поступления. Это дает им возможность получать результаты в реальном времени, чтобы быстро вносить изменения и корректировки.

Периферийная аналитика также может помочь избавить современные компании от одной из самых распространенных головных болей, связанных с цифровизацией — расходов на облако. Хранение данных в облаке стоит денег, как и передача данных между облаком и локальным хранилищем или между поставщиками облачных услуг. Эти расходы быстро растут по мере расширения использования облака, поэтому, проводя больше аналитики на периферии, компании могут сократить расходы на облачное хранение и передачу данных.

Безопасность — еще одно преимущество периферийной аналитики, особенно если организации имеют дело с конфиденциальными данными, такими как персональные. Сосредоточение всех необработанных данных компании в одном центральном месте может быть рискованным по своей сути. Используя периферийную аналитику, организации могут хранить конфиденциальные данные там, где они получены, и передавать в центральное хранилище только предварительно агрегированные данные, что означает, что им не нужно размещать и защищать там конфиденциальную информацию.

Отраслевое применение

Итак, где применимы эти преимущества? Где мы можем увидеть компании, получающие выгоду от периферийной аналитики?

Одним из наиболее важных примеров является сектор возобновляемой энергетики, который быстро внедряет периферийную аналитику. Например, в ветряные турбины встроены сотни датчиков, которые обеспечивают правильное функционирование каждой части турбины и ее адаптацию к внешним условиям. Если аналитика данных может проводиться на каждой отдельной турбине, то возможно предиктивное обслуживание, упреждающее выявление и изоляция любых проблем для каждой из них, что минимизирует воздействие на всю группу в случае аварии.

Еще одной областью, в которой периферийная аналитика будет набирать обороты, является управление цепочками поставок в силу их сложности. Цепочки поставок часто состоят из сотен отдельных движущихся частей, включая поиск и отслеживание сырья, которое должно быть доставлено в несколько мест для производства, управление складскими помещениями и мониторинг тысяч устройств IoT, таких как RFID-чипы, которые отслеживают доставляемые товары.

В такой ситуации у менеджеров цепочки поставок может быть централизованное место, где контролируется перемещение продукции по всему миру, а «периферией» могут служить складские помещения с товарами, оснащенными RFID-метками. Анализ данных непосредственно на этих складах в режиме, близком к реальному времени, с помощью периферийной аналитики полезен для координации всей цепочки. Менеджерам цепочек поставок также необходимо, например, учитывать погодные условия, и здесь на помощь могут прийти более продвинутые аналитические технологии, такие как ИИ- и MО-моделирование, которые также могут выполняться на периферии.

Полезные интеграции

Внедрение периферийной аналитики не обязательно должно осуществляться за счет традиционных центральных баз данных — на самом деле, их лучше использовать вместе. Необработанные данные можно анализировать на периферии, а затем агрегировать и отправлять в центральную базу данных или хранилище для хранения и более глубокой аналитики по мере необходимости.

Настройка периферийной аналитики начинается с выбора правильной базы данных in-memory. Для анализа больших объемов данных на периферии в режиме реального времени необходимо высокопроизводительное аналитическое решение, способное интегрировать инфраструктуру на периферии и инфраструктуру центрального хранилища данных. Правильно подобранная база данных позволяет построить сеть, состоящую из централизованной системы и периферии, при этом платформа выступает в качестве канала, помогающего направлять данные туда, куда нужно.

По мере того, как мир IoT продолжает расширяться, а организации начинают добавлять в периферийные системы все больше интеграций ИИ и MО для автоматической оптимизации анализа данных в реальном времени во имя достижения лучших и быстрых результатов, аналитика на периферии становится все более важной, поскольку позволяет избежать огромного количества данных, которые необходимо обрабатывать и анализировать централизованно. Можно сказать, что ключ к лучшей аналитике данных — это развертывание на периферии.