Опрошенные порталом BigDataWire эксперты обсуждают, как устранение пробелов в готовности предприятий к работе с данными изменят сферу корпоративных данных в 2026 г.

К концу 2025 г. большинство предприятий смирились с неприятной правдой: внедрение искусственного интеллекта оказалось не таким простым, как обещали демонстрации. Затормозило ли это прогресс? Не совсем.

Предприятия выделяют значительные ресурсы на дальнейшее развитие ИИ, и в некоторых местах ИИ стал частью повседневных рабочих процессов. Однако за этим прогрессом начала формироваться критическая проблема. Это было растущее осознание того, что большая часть данных, поступающих в эти системы, просто не подходит для автономного принятия решений. Именно к этому движется отрасль, но у нее нет всего необходимого для достижения этой цели.

Стратегии корпоративных данных часто оптимизированы для их накопления. Больше источников, больше конвейеров, больше хранилищ, больше средств контроля. Такой подход имел смысл, когда основными потребителями были люди. В 2026 г. это предположение больше не актуально. Требования систем, в большей степени управляемым ИИ, значительно отличаются.

Именно поэтому давние недостатки данных начинают создавать новые препятствия. Агенты не сглаживают пробелы так, как это делают люди. Они следуют тому, что им предоставляется. Когда контекст скуден или смысл неясен, система не кажется такой умной. Да, некоторые разработчики ИИ могут с этим не согласиться, и, конечно, есть исключения. Однако это фундаментальный недостаток, и он становится очевидным довольно ясно (и быстро), как только агенты начинают принимать решения в рамках рабочих процессов в реальном времени.

Анализируя прогнозы на 2026 г., можно выделить пробелы в готовности предприятий к работе с данными. Далее мы рассмотрим, как устранение этих пробелов, вероятно, изменят сферу корпоративных данных в новом году.

Контекстный капитализм

В 2026-м предприятия начнут рассматривать стратегию работы с данными как конкурентную дисциплину, а не как внутреннюю оптимизацию. Это означает, что данные создают преимущество, когда они используют контекст, который конкурентам нелегко воспроизвести. По мере того, как предприятия продолжают совершенствовать свои возможности в области ИИ, дифференциация смещается от доступа к моделям к тому, насколько точно системы понимают свою операционную среду.

Общие данные будут все больше терять свою способность к накоплению ценности. Это касается общедоступных наборов данных, собранных с помощью веб-скрейпинга контента и широко доступных корпусов данных. Хотя они остаются полезными, их влияние стабилизируется. Преимущество концентрируется вокруг данных, которые отражают операционные нюансы и ситуационные детали, существующие только внутри конкретных организаций.

Это меняет рынок данных. Мы видим, что компании стремятся к приобретениям, которые обеспечивают дифференцированный контекст, а не постепенное увеличение масштаба. Данные ценятся за их влияние на производительность ИИ и качество принятия решений. Мощность инфраструктуры все больше зависит от того, можно ли ее сочетать с данными, которые оправдывают ее экономическую стоимость.

«В 2025 г. мы наблюдали несколько громких приобретений игроков рынка данных, поскольку ведущие предприятия стремятся к конкурентному преимуществу. 2026-й еще больше подстегнет консолидацию в индустрии данных, поскольку организации, инвестировавшие в крупные инфраструктурные проекты, стремятся заполнить свои центры обработки данных высококачественными, насыщенными контекстом данными для развития своего ИИ», — говорит Джош Роджерс, генеральный директор Precisely.

Ещё одна тема, которая часто встречается в прогнозах, заключается в том, что неструктурированные данные займут центральное место в стратегии предприятий. В 2026 г. организации, которые не смогут использовать эти данные, ограничат глубину анализа своих систем ИИ. Те, кто добьётся успеха, получат такую ​​плотность информации, которой конкурентам будет трудно достичь, даже если модели кажутся сопоставимыми.

Ник Берлинг, директор по продуктам Nasuni, ожидает, что неструктурированные данные станут важной составной частью успеха корпоративного ИИ. «В 2026-м неструктурированные данные станут основой инноваций в области ИИ, переопределяя то, как предприятия используют интеллект в своих организациях... Учитывая, что, по оценкам, 80-90% корпоративных данных являются неструктурированными — от документов и электронных писем до изображений, видео и файлов дизайна, — потенциал раскрытия их ценности никогда не был таким большим», — говорит он.

Также известен ряд прогнозов о том, что геопространственные данные усилят это преимущество. Информация о местоположении связывает корпоративные данные с физическими условиями и внешними ограничениями. Поскольку системы ИИ влияют на финансовые решения и планирование инфраструктуры, эта связь напрямую сказывается на результатах. Влияние глубины контекста становится очевидным в плане производительности.

Эксперты отрасли прогнозируют, что к концу этого года предприятия будут оценивать данные с другой экономической точки зрения. Данные создают ценность, когда они меняют то, как системы понимают условия и принимают решения о дальнейших действиях. Это преимущество сейчас очень востребовано. Владение контекстом становится надежным защитным барьером для предприятий. Это контекстный капитализм на практике.

Слой смысла

Одна из особенностей, которая бросается в глаза во многих прогнозах развития предприятий в 2026 г., заключается в том, что сбои часто объясняются чем-то фундаментальным. Дело не в моделях. Не в графических процессорах. Даже не в качестве данных в традиционном смысле. Дело в смысле.

Корпоративные системы не согласуются друг с другом. Они никогда по-настоящему и не согласовывались. Мы это знаем. Один и тот же термин может означать разные вещи в зависимости от команды, системы или момента. Люди ориентируются в этом хаосе инстинктивно. Это часть нашей ДНК. Мы можем задавать уточняющие вопросы, а затем выносить суждения. Однако агенты ИИ делают именно то, что им говорят, используя предоставленную им интерпретацию. Мы наделяем их тем смыслом, который хотим им придать.

Когда агенты начинают взаимодействовать с реальными рабочими процессами, этот разрыв быстро проявляется. Система выбирает правильный документ, но применяет неправильное правило. Отсюда неправильный смысл. Она следует политике, но упускает намерение. Опять же, неправильный смысл. Хотя ничего может не сломаться, результат будет некорректным. Это самые сложные для диагностики сбои, и ряд прогнозов указывает на то, что в 2026-м они станут более распространенными. Это означает, что предприятия, желающие успешно управлять данными, должны соответствующим образом реагировать.

Именно здесь вступает в игру слой смысла. Не как модное словосочетание, а как ответ на проблему. Предприятия вынуждены делать свою внутреннюю логику явной. Что считается исключением. Как связаны сущности. Какие определения имеют приоритет над другими. Какой контекст важен в каких ситуациях.

Многие знакомые инструменты вовлекаются в этот сдвиг. Это включает в себя графы знаний и онтологии. Разница заключается в том, как они используются. Скорее как ограничители, чем справочные материалы. Это меняет то, как агенты понимают ситуации, прежде чем действовать.

«В 2026 г. семантика станет самым важным ограничителем при управлении ИИ, — говорит Дейв Шуман, директор по цифровым технологиям Precisely. — Обучение ИИ сродни управлению стажерами с благими намерениями. Модели ИИ могут быть „умными“ и способными, но, как и любой агент — человек или что-либо еще — они все равно требуют четкого руководства, контроля и постоянной оценки. Добавление семантического слоя преобразует сложные данные в удобный для бизнеса формат, который легче усваивается, помогая ИИ интерпретировать и переводить данные в надежный результат».

Это также объясняет, почему простые стратегии поиска исчерпывают себя. Найти информацию — это не то же самое, что знать, как ее применить. RAG (генерация с расширенной выборкой) помогает с доступом. Однако она не разрешает разночтения. Это делает смысл.

Отраслевые эксперты прогнозируют, что этот слой незаметно станет механизмом управления. Предприятия, которые инвестируют в него, легче доверяют своим системам по мере повышения автономности. Те, кто его пропускает, в итоге дольше, чем планировалось, держат людей в процессе.

Сдвиг в сторону активации данных

Еще одна тема, проходящая через прогнозы по корпоративным данным на 2026 г., — это давление. Не давление в плане сбора большего количества данных, а давление в плане доказательства того, что существующие данные действительно что-то делают. По мере приближения систем ИИ к этапу выполнения, разрыв между пониманием и действием становится все труднее игнорировать.

Многие предприятия создали стеки данных, оптимизированные для масштабируемости и гибкости. Они хорошо справляются с перемещением информации. Однако они оказались менее эффективны в замыкании цикла. Исследования показывают, что рабочие процессы, управляемые моделями, быстро выявляют этот недостаток. Системы, работающие непрерывно, не могут ждать, пока люди будут контролировать процесс. Они не могут ждать, когда люди интерпретируют отчеты или согласуют данные на панелях мониторинга.

Реакцией является активация. Она отражает сдвиг в сторону данных, тесно связанных с результатами. Вместо того чтобы спрашивать, что показывают данные, предприятия все чаще спрашивают, к чему приводят данные. Это изменение распространяется по архитектуре и всей организации.

Прогнозы указывают на рост числа ориентированных на принятие решений продуктов данных, разработанных для конкретных операционных моментов. Эти продукты не предназначены для исследования. Они созданы для использования системами с четкими ожиданиями в отношении надежности и поведения на последующих этапах.

Еще одна проблемная точка проявляется в чувствительности ко времени. Пакетные конвейеры, которые когда-то казались достаточными, испытывают трудности в условиях быстро меняющейся обстановки. В условиях, когда предприятия внедряют агентов, которые отслеживают данные и реагируют практически в режиме реального времени, устаревшие данные становятся источником проблем. Это стимулирует интерес к потоковой передаче данных, обработке событий и непрерывным циклам обратной связи.

Активация также усиливает контроль за затратами. Данные, которые никогда не влияют на поведение, теперь видятся как накладные расходы. Прогнозы предполагают, что в 2026 г. произойдет более агрессивное сокращение неиспользуемых конвейеров, заброшенных панелей мониторинга и аналитических проектов без четкой стратегии действий. К концу года разница между программами применения описательных и операционных данных станет очевидной.