Когда речь заходит о неструктурированных данных, компании сталкиваются с определенным парадоксом, пишет на портале TechBeacon Кришна Субраманиан, соучредитель, президент и операционный директор Komprise.

С одной стороны, неструктурированных данных стало больше — и, соответственно, больше, чем когда-либо прежде, возможностей для получения критически важных инсайтов. С другой стороны, ИТ-руководители отмечают целый ряд проблем в использовании всех этих неструктурированных данных.

По данным недавнего исследования Komprise «2022 State of Unstructured Data Management», распространенными препятствиями на пути оптимизации управления неструктурированными данными являются такие проблемы, как поиск путей перемещения неструктурированных данных без ущерба для пользователей, недостаточная видимость неструктурированных данных и юридические ограничения.

Чтобы преодолеть эти препятствия, ИТ-организациям нужны способы извлечения пользы из неструктурированных данных при одновременном решении таких приоритетных задач, как обеспечение безопасности данных, снижение затрат на их хранение и обеспечение данных для будущих потребностей бизнеса. Этот круг можно замкнуть, но только при правильном подходе к управлению неструктурированными данными.

Чтобы дать практическое руководство, мы рассмотрим пять лучших практик для максимизации ценности неструктурированных данных — то есть любого типа данных, которые не хранятся в базе данных, электронных таблицах или других структурированных форматах. Как вы узнаете, независимо от того, с каким количеством неструктурированных данных приходится работать бизнесу, эти данные можно превратить в выгоду, соблюдая при этом требования безопасности, управления затратами и гибкости.

1. Не обращайтесь с неструктурированными данными вслепую

Эффективное управление неструктурированными данными начинается со знания своих данных и понимания основных показателей, связанных с ними. Для начала вам необходимо получить представление о следующих вещах:

  • сколько у вас данных;
  • сколько лет вашим данным;
  • где хранятся данные;
  • какие типы информации содержат ваши данные;
  • типы и размеры файлов ваших данных;
  • кто владеет данными;
  • кто может получить доступ к данным;
  • как выглядят схемы доступа;
  • сколько стоит хранение данных.

Такая видимость очень важна, поскольку в большинстве случаев неструктурированные данные рождаются в изолированных «бункерах». Каждый отдел вашего предприятия, скорее всего, хранит свои собственные наборы документов, видео, аудио, данные приложений (например, геномика, медицинские изображения или данные автономных автомобилей), отчеты и т. д. Во многих случаях эти данные могут быть не централизованы даже в отделах, не говоря уже о предприятии в целом. И если вы не знаете, какие неструктурированные данные у вас есть, вы не сможете принять обоснованные решения о том, как лучше ими управлять.

2. Планируйте постоянную мобильность данных

Предприятия склонны относиться к миграции данных как к нечастому, периодическому событию. Например, когда они планируют перенос данных из локальной системы в облако, они могут предположить, что миграция закончится после того, как данные будут перенесены в облако.

В действительности жизненный цикл данных более сложен. Во многих случаях неструктурированные данные постоянно находятся в движении. После переноса в облако они, скорее всего, будут перемещаться на различные уровни облачного хранения или из одного типа облачных сервисов (например, объектного хранилища) в другой (например, платформу для аналитики данных).

По этой причине ИТ-руководителям необходим систематический способ управления перемещением данных на постоянной основе. Они должны рассматривать миграцию облачных данных как непрерывный процесс и по возможности поддерживать его автоматизацией на основе политик. Только так можно гарантировать, что данные всегда будут находиться в нужном месте, когда они проходят жизненный цикл от активного использования до холодного хранения или архива, а затем, иногда, снова возвращаются к активному использованию.

3. Постоянно повышайте ценность неструктурированных данных

ИТ-лидеры уже в определенной степени думают о том, как повысить ценность неструктурированных данных. Например, согласно исследованию Komprise, 65% организаций стремятся передавать неструктурированные данные аналитическим платформам больших данных, чтобы извлекать из них пользу.

Это один из способов повышения ценности неструктурированных данных. Но интеллектуальные ИТ-лидеры думают более комплексно и целостно о получении максимальной отдачи от своих данных. Они индексируют неструктурированные данные в рамках процессов миграции и консолидации данных, чтобы их было легче находить и использовать. И они используют облако не только как недорогое решение для хранения данных, но и как способ создания озера данных, где они могут легко использовать облачные вычислительные сервисы для аналитики своих данных.

Суть в том, что ИТ-лидеры должны постоянно искать способы упростить использование неструктурированных данных всеми сотрудниками компании. Аналитика больших данных является частью этого уравнения, но, конечно, не единственным компонентом.

4. Обеспечьте безопасное самообслуживание для ваших данных

Аналогичным образом, предоставление бизнес-пользователям доступа к неструктурированным данным в режиме самообслуживания должно стать приоритетом для ИТ-лидеров.

Причина в том, что ни перенос данных в облако, ни создание озера данных сами по себе не являются достаточными для того, чтобы гарантировать реальную ценность этих данных для бизнеса. Чтобы добиться этого, пользователи должны иметь возможность легко находить данные и интегрировать их в свои рабочие процессы с помощью беспрепятственных процессов самообслуживания.

Систематическая маркировка неструктурированных данных — это ключ к созданию возможностей для самообслуживания. Когда данные хорошо маркированы, пользователи в масштабах всего предприятия могут легко искать и находить нужные им документы, фотографии, видео и другие типы информации — независимо от количества активов данных, которыми владеет предприятие, и от его организационной структуры. Разумеется, механизмы поиска и доступа должны обеспечивать безопасность и контроль доступа, чтобы каждый пользователь видел только те данные, к которым он имеет право доступа.

5. Внедряйте управление данными на основе стандартов

Ваши данные принадлежат вам. Не позволяйте поставщикам диктовать, где вы можете их хранить и что вы можете с ними делать.

Для этого выбирайте инструменты управления неструктурированными данными, основанные на стандартах. Это гарантирует, что вы сможете перемещать данные на любую платформу или использовать любой тип сервиса данных, который также основан на стандартах, не завися от конкретного поставщика для обеспечения этой функциональности.

Управление неструктурированными данными на основе стандартов особенно важно, учитывая, что мир постоянно развивается. Даже если вас устраивают платформы данных и инструменты, которые вы используете сегодня, завтра они могут вас не устроить. Инструменты на основе стандартов гарантируют, что вы никогда не окажетесь в затруднительном положении из-за невозможности миграции данных.

Кроме того, такие инструменты позволяют предприятиям делать все необходимое с данными без лицензионных санкций и затрат, например, на использование сторонних облачных файловых систем или ненужных сборов за переход в облако. Используя решения для управления данными, которые хранят данные в родном формате на каждом уровне, вы можете напрямую обращаться к данным и использовать все облачные сервисы для данных без необходимости платить поставщикам услуг по управлению или хранению данных. Избежать этих расходов — приоритет для 42% ИТ-руководителей, опрошенных Komprise.

Решение проблемы неструктурированных данных

Объем неструктурированных данных, которыми приходится управлять предприятиям, будет постоянно расти в обозримом будущем. Согласно опросу Komprise, 87% ИТ-руководителей хотят эффективно управлять неструктурированными данными по мере их дальнейшего роста. Вместо того чтобы рассматривать неструктурированные данные как помеху или проблему, ИТ-лидеры должны искать способы извлечения из них большей пользы.

Это начинается с понимания данных и внедрения автоматизированного управления данными. После этого компании могут включить обогащение данных в свои процессы управления, предложить доступ к данным в режиме самообслуживания и внедрить операции на основе стандартов, чтобы получить максимальную отдачу от генерируемых неструктурированных данных.