Корпорация EMC обнародовала результаты исследования «Big Data, Bigger Digital Shadows, and Biggest Growth in the Far East», проведенного IDC при поддержке компании EMC. Это исследование демонстрирует беспрецедентный рост информации в мире, только 0,4% которой, по оценкам IDC, анализируется.
Повсеместное распространение технологий и доступа к интернету привели к удвоению объема информации за последние 2 года. Исследование оценило объем сгенерированных данных в 2012 году в 2,8 Зб и прогнозирует к 2020 г. увеличение объема до 40 Зб, что превосходит прежние прогнозы на 14%.
Основные прогнозы исследования:
- объемы информации будут удваиваться каждые два года в течение следующих восьми лет. Одним из основных факторов этого роста является увеличение доли автоматически генерируемых данных: с 11% от общего объема в 2005 г. до более 40% в 2020 г.;
- большие объемы полезных данных теряются. На сегодняшний день используется менее 3% из 23% потенциально полезных данных, которые могли бы найти применение с технологиями Big Data;
- большая часть информации плохо защищена;
- в 2010 г. в защите нуждалось менее трети информации, а к 2020 г. доля такой информации может превысить 40%;
- уровень защиты варьируется в зависимости от региона — для развивающихся рынков он гораздо ниже;
- развивающиеся рынки будут генерировать все большую долю информации в общем объеме: в 2010 г. их доля была 23% Цифровой Вселенной, но уже к 2012 г. их доля выросла до 36%. По прогнозам IDC, к 2020 г. 62% данных будет связвано с развивающимися рынками.
Другие важные результаты:
- продолжает расти роль облачных вычислений в управлении Большими Данными (Big Data): количество серверов в мире должно вырасти в 10 раз, объем данных, управляемых напрямую корпоративными ЦОД — в 14 раз;
- в последующие несколько лет радикально изменятся типы хранящихся в облаках данных. По прогнозам IDC, к 2020 г. 46,7% данных в облаках будут относиться не к корпоративной информации, а к сфере развлечений. Остальная часть — данные систем видеонаблюдения, встроенных и медицинских систем, информация с компьютеров, телефонов, бытовой электроники;
- объем информации об отдельно взятом пользователе, хранящейся в цифровой вселенной, станет больше, чем объем данных, создаваемый этим пользователем;
- основная часть инвестиций в управление цифровой вселенной сейчас приходится на Западную Европу — 2,49 долл. на гигабайт данных. На втором месте США с инвестициями в $1,77 на 1 Гб, за которыми следуют Китай ($1,31 на 1 Гб) и Индия ($0,87 на 1 Гб);
- инфраструктура цифровой вселенной становится все более взаимосвязанной: информация уже не концентрируется в регионе, где с ней работают, да и необходимости в этом нет. По оценкам IDC, к 2020 г. облачными вычислениями будет «затронуто» почти 40% данных: в промежутке между созданием байта и его и использованием они будут храниться или обрабатываться в облаке.