Как разобраться в больших данных, когда в едином хранилище перемешаны сведения самых разных типов, геопространственных и графических, телеметрических и метеорологических? На апрельском семинаре в университете Буффало разбиралась тема информационной интеграции на базе онтологий (формального представления знаний по конкретной предметной области), а организатором семинара выступили Пентагон и Национальный центр онтологических исследований США. Этот центр активно выполняет заказы МО США, которое заинтересовано в эффективной работе своих систем, собирающих данные самых разных форматов от огромного количества разнотипных датчиков. В частности, облачная армейская DCGS-A призвана объединить гетерогенные БД, и хотя схемы данных в них более-менее определены, различия между этими схемами столь велики, что эффективная интеграция “снизу”, на техническом уровне, практически невозможна. Так, DCGS-A накапливает сведения о перемещениях афганских террористов, сводки о времени и местах встреч боевиков, погоде, используемом оружии и ещё множестве вещей, которые традиционными подходами практически невозможно объединить в удобную систему с эффективно действующим поиском. Учёные обещают решить эти проблемы формированием минимально необходимого набора тэгов и метаданных с привлечением технологий Семантического веба, и собираются построить детальные онтологии террористической активности, на базе которых удастся быстро “откапывать” данные из гетерогенных БД и проводить качественный анализ.

Версия для печати