При растущем ажиотаже вокруг анализа больших данных и обострении конкуренции в этом сегменте сегодняшние исследователи данных имеют в своем распоряжении широкий спектр инструментов и технологий. Далеко не все знают, что многие из этих инструментов имеют одну общую черту — в них задействованы решения с открытым исходным кодом и разработки сообществ. Не только сообщество Hadoop, но и другие поставщики решений для больших данных, например, SAP HANA, Hortonworks, WANdisco Cloudera, Intel, InterSystems и Teradata, используют в качестве базовой платформы для своих продуктов Linux. Почему это должно волновать специалиста по данным? Каждый исследователь имеет узкоспециализированные нужды, требующие наличия открытой и мощной среды. Для анализа больших данных необходимы масштабируемые, гибкие и надежные вычисления — причем не оказывающие непомерную нагрузку на ИТ-бюджеты. Именно это важное сочетание давно сделало Linux лидером в области высокопроизводительных вычислений и отказоустойчивых систем. Под управлением Linux работают не только 94% из пятисот мощнейших в мире суперкомпьютеров, но также самый быстрый из них Titan и самый знаменитый IBM Watson. Проконсультировавшись с SUSE, издание eWeek излагает 10 причин, почему Linux должен быть предпочтительной ОС для сред обработки больших данных

.