Корпорация EMC обнародовала результаты исследования «Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East», проведенного IDC при поддержке компании EMC. Это исследование демонстрирует беспрецедентный рост информации в мире, только 0,4% которой, по оценкам IDC, анализируется.

Повсеместное распространение технологий и доступа к интернету привели к удвоению объема информации за последние 2 года. Исследование оценило объем сгенерированных данных в 2012 году в 2,8 Зб и прогнозирует к 2020 г. увеличение объема до 40 Зб, что превосходит прежние прогнозы на 14%.

Основные прогнозы исследования:

  • объемы информации будут удваиваться каждые два года в течение следующих восьми лет. Одним из основных факторов этого роста является увеличение доли автоматически генерируемых данных: с 11% от общего объема в 2005 г. до более 40% в 2020 г.;
  • большие объемы полезных данных теряются. На сегодняшний день используется менее 3% из 23% потенциально полезных данных, которые могли бы найти применение с технологиями Big Data;
  • большая часть информации плохо защищена;
  • в 2010 г. в защите нуждалось менее трети информации, а к 2020 г. доля такой информации может превысить 40%;
  • уровень защиты варьируется в зависимости от региона — для развивающихся рынков он гораздо ниже;
  • развивающиеся рынки будут генерировать все большую долю информации в общем объеме: в 2010 г. их доля была 23% Цифровой Вселенной, но уже к 2012 г. их доля выросла до 36%. По прогнозам IDC, к 2020 г. 62% данных будет связвано с развивающимися рынками.

Другие важные результаты:

  • продолжает расти роль облачных вычислений в управлении Большими Данными (Big Data): количество серверов в мире должно вырасти в 10 раз, объем данных, управляемых напрямую корпоративными ЦОД — в 14 раз;
  • в последующие несколько лет радикально изменятся типы хранящихся в облаках данных. По прогнозам IDC, к 2020 г. 46,7% данных в облаках будут относиться не к корпоративной информации, а к сфере развлечений. Остальная часть — данные систем видеонаблюдения, встроенных и медицинских систем, информация с компьютеров, телефонов, бытовой электроники;
  • объем информации об отдельно взятом пользователе, хранящейся в цифровой вселенной, станет больше, чем объем данных, создаваемый этим пользователем;
  • основная часть инвестиций в управление цифровой вселенной сейчас приходится на Западную Европу — 2,49 долл. на гигабайт данных. На втором месте США с инвестициями в $1,77 на 1 Гб, за которыми следуют Китай ($1,31 на 1 Гб) и Индия ($0,87 на 1 Гб);
  • инфраструктура цифровой вселенной становится все более взаимосвязанной: информация уже не концентрируется в регионе, где с ней работают, да и необходимости в этом нет. По оценкам IDC, к 2020 г. облачными вычислениями будет «затронуто» почти 40% данных: в промежутке между созданием байта и его и использованием они будут храниться или обрабатываться в облаке.