По мере того как объем данных продолжает расти, растет и потенциал продвинутой аналитики (advanced analytics), позволяющей осмыслить все эти данные. По мнению опрошенных порталом Datanami экспертов, в 2024 г. в этой сфере будет достигнут огромный прогресс.

Трудно устоять перед зовом генеративного ИИ. Однако успешная стратегия GenAI зависит от данных и аналитики, которые, по мнению Forrester, будут играть ведущую роль. «Если генеративный ИИ — главный актер в мюзикле „Бизнес-технологии-2024“, то лидеры в области данных и аналитики — это режиссеры-постановщики, — пишут аналитики. — Согласно опросу Forrester „July 2023 Artificial Intelligence Pulse Survey“, 89% руководителей, принимающих решения в области ИИ, говорят, что их организации расширяют, экспериментируют или изучают возможности использования GenAI. Но прежде чем эта звездная технология сможет принести пользу аудитории из заинтересованных сторон и клиентов, руководители в области данных и аналитики должны обеспечить кадры, процессы и платформы, чтобы создать основу для успеха».

В 2024 г. естественный язык заменит SQL в качестве лингва франка бизнес-аналитиков, утверждает Нима Негахбан, генеральный директор и соучредитель компании Kinetica. «Мы можем ожидать значительного распространения технологии преобразования естественного языка в SQL (language-to-SQL, lang2sql) после успешных усилий по устранению проблем с точностью, производительностью и безопасностью, — говорит он. — Более того, большие языковые модели (LLM), используемые для lang2sql, будут перемещаться в базы данных для защиты конфиденциальных данных при использовании этих LLM, что решит одну из основных проблем, связанных с конфиденциальностью и безопасностью данных. Развитие технологии lang2sql откроет двери для более широкой аудитории, демократизируя доступ к данным и инструментам управления базами данных, а также способствуя интеграции обработки естественного языка (NLP) в повседневные задачи, связанные с данными».

«Не так быстро», — возражает Дэйв Стоукс, технологический евангелист компании Percona, который утверждает, что SQL останется. «Каждые несколько лет SQL объявляют слишком старомодным, и в 2024 г. предложения использовать LLM для создания запросов к базам данных привлекут большое внимание, — говорит он. — Но одна из причин, по которой SQL — единственный язык программирования 1970-х, который и сегодня широко используется, — это его мощь в запросах к данным. Вам может не нравиться синтаксис. Вы можете счесть его правила несколько произвольными. Вам может не обрадовать изучение такого старого языка. Но на протяжении десятилетий SQL снова и снова доказывает, что является главным инструментом для работы с данными. В ближайшее время он не выйдет из моды».

Открытые форматы данных нанесут смертельный удар по традиционным хранилищам данных, считает Джастин Боргман, соучредитель и генеральный директор компании Starburst. «Хотя многие ожидают, что модель озера-хранилища (lakehouse) данных вытеснит хранилища, настоящими разрушителями являются открытые форматы и стеки данных, — говорит он. — Они освобождают компании от привязки к поставщикам — ограничения, которое затрагивает как архитектуры озер-хранилищ, так и хранилищ».

С этим согласна Келли Коллеффель, старший директор по развитию партнерских продаж компании Fivetran. «С распространением LLM и приложений GenAI, требующих структурированных, полуструктурированных, а теперь и неструктурированных данных, в 2024 г. „обязательными“, „правильными“ станут рабочие нагрузки на озерах данных, а не облачных хранилищах», — считает она.

По словам Джеффа Холлана, директора по управлению продуктами компании Snowflake, в 2024 г. привычный рабочий процесс BI и аналитики данных будет разрушен благодаря ИИ и NLP. «Сегодня бизнес-аналитики обычно создают и представляют готовые отчеты, — говорит он. — В следующем году руководители будут ожидать, что они смогут напрямую взаимодействовать с данными и получать такие обзорные отчеты, используя естественный язык». Такое самообслуживание освободит аналитиков для работы над более глубокими вопросами, где они смогут привносить свой собственный опыт в то, что организация действительно должна анализировать, и в конечном итоге повышать свою роль в решении некоторых задач, которые ИИ не может решить«.

По словам Васу Саттенапалли, генерального директора RightData, аналитика на базе NLP станет основой следующей волны самообслуживания не только руководителей, но и клиентов. «Аналитика застряла в приборных панелях, но они больше не будут единственным способом получения бизнес-инсайтов, — говорит он. — Голос и генеративный ИИ придут в аналитическое пространство, и вы сможете формулировать запросы к своим данным в устной форме и получать ответы в течение нескольких минут, а то и секунд. Представьте себе, что вы достаете телефон с приложением, настроенным на данные вашей организации, и получаете доступ к целому миру инсайтов. Это уже близко!»

Аналитик Forrester Майкл Гуалтьери считает, что каждый хочет, чтобы к нему в Интернете относились как к знаменитости первой величины. По словам Нарена Нарендрана, главного научного сотрудника компании Aerospike, эта мечта станет реальностью в 2024 г. благодаря технологиям, которые делают возможным гиперперсонализированный опыт электронной коммерции.

«Вместо предоставления контента на основе совокупной статистики или поведения покупателя за последние шесть месяцев, например, платформы будут реагировать на поиск трехчасовой давности или даже на клик двухминутной давности, — говорит он. — По мере того как системы машинного обучения будут получать все больше и больше данных для повышения производительности приложений, мы увидим, как обобщенные статистические прогнозы перейдут в гиперперсонализированные на индивидуальном уровне для более адаптированного пользовательского опыта в розничной торговле и электронной коммерции».

В прошлом данные называли новой нефтью. Но в 2024 г. данные, которым можно доверять, станут самым важным активом в мире, считает Сатьен Сангани, генеральный директор и соучредитель компании Alation. «Критическая роль доверенных данных в системах ИИ становится краеугольным камнем для будущего технологии, — говорит он. — Обеспечение достоверности информации и данных, которые поступают из системы ИИ, не менее важно. В мире, который все ближе и ближе подбирается к общему ИИ (AGI), знание того, чему и кому можно доверять, будет иметь решающее значение для всего, что мы узнаем, и всего, что, как нам кажется, мы знаем».

По словам Сангани, эти достоверные данные будут иметь решающее значение для систем ИИ, которые, по прогнозам Forrester, будут выполнять каждую десятую оперативную задачу. Это повышает важность доверия к данным.

«В результате администрирование ИИ будет быстро приобретать все большее значение, — говорит он. — Оно включает в себя не только управление данными, но и понимание всего жизненного цикла информации и моделей. Аналогия данных с новой нефтью теперь кажется недостаточной в эпоху генеративного ИИ и тех проблем, которые порождают галлюцинации. Простое накопление и анализ больших массивов данных больше не является достаточным в современной бизнес-среде».

Еще один сторонник администрирования больших данных, способствующего успеху аналитики, — Четна Махаджан, директор по цифровым технологиям и информации компании Amplitude. «В 2024 г. организации будут уделять первостепенное внимание выделению ресурсов на совершенствование управления и администрирования данных, — говорит он. — Этот стратегический акцент направлен на создание надежных репозиториев данных, которые послужат фундаментальной основой для реализации возможностей науки о данных, ИИ и MО по получению действенных инсайтов. Отсутствие эффективного администрирования приведет к тому, что команды не будут уверены в своих данных, что негативно скажется на их способности принимать решения».

По словам Шона Донегана, президента и генерального директора Satelytics, если развивающаяся волна Эль-Ниньо окажется настолько сильной, как предполагают некоторые, и приведет к неблагоприятным погодным явлениям, то 2024-й может стать большим годом для геопространственной аналитики. «Экстремальные погодные условия, включая ураганы, наводнения и засуху, вызванные Эль-Ниньо и другими климатическими/погодными явлениями, будут продолжать угрожать инфраструктуре коммунальных компаний, включая линии электропередач, опоры и многое другое, — говорит он. — Геопространственная аналитика, использующая спутниковые снимки высокого разрешения и алгоритмы ИИ, дает возможность точно определять места возникновения проблем, таких как заросли деревьев вокруг линий электропередач, последствия лесных пожаров и любые другие повреждения инфраструктуры. Такая возможность позволяет коммунальным компаниям оперативно найти проблему и устранить ее до того, как она усугубится».