НовостиОбзорыСобытияIT@WorkРеклама
Идеи и практики автоматизации:

Блог

Кто плетет “семантические паутины”?

Лично мне такие паутины не известны. А вам?[spoiler]

Вопрос связан вот с чем. Вчера в Петрозаводском государственном университете (ПетрГУ) открылась 4-я Международная научная конференция "Информационные технологии и письменное наследие". В ней принимают участие около 80 человек из разных стран (Австрия Белоруссия, Болгария, Нидерланды, Россия, Финляндия, Франция): исследователи, преподаватели, работники библиотек, музеев и архивов, а также разработчики ПО и гуманитарных ресурсов в Интернете.

Декан математического факультета ПетрГУ, председатель оргкомитета конференции Алексей Геннадьевич Варфоломеев отметил: “Проводить такие конференции нужно. Кроме статей, монографий должно быть еще живое общение. Именно оно является стимулом для новых идей, работ, открытий, достижений”.  Полностью с этим мнением согласен. Ведь Интернет не заменяет жизнь, а лишь отображает её.

Интересно отметить, что в обширном перечне докладов этой (казалось бы, в значительной степени “документооборотной”) конференции термины СЭД, ECM и электронный документооборот не встречаются.



В то же время компьютерные технологии в программе конференции упоминаются достаточно часто. К примеру, название одного из мероприятий (Лекция + практикум,  ведущие: А. Г. Варфоломеев, А. С. Иванов, И. В. Кравцов ) звучит так: “Технологии Semantic Web в публикациях памятников письменности и исторических источников”

Термин Semantic Web (семантическая паутина) Википедия определяет как “направление развития Всемирной паутины, целью которого является представление информации в виде, пригодном для машинной обработки”.

Разница здесь вот в чем. “В обычной Паутине, основанной на HTML-страницах, информация заложена в тексте страниц и извлекается человеком с помощью браузера. Семантическая же паутина предполагает запись информации в виде семантической сети с помощью онтологий. Таким образом программа-клиент может непосредственно извлекать из паутины факты и делать из них логические заключения”.

В Википедии также отмечается, что "термин “семантическая паутина” был впервые введён сэром Тимом Бернерсом-Ли (изобретателем Всемирной паутины) в мае 2001 г. в журнале Scientific American". Однако многие авторы высказывают сомнения в возможности полной реализации концепции “семантической паутины”.

“Ведь известно – отмечает Википедия --  что основное финансирование современных интернет-ресурсов (за исключением строго некоммерческих проектов) обеспечивают рекламодатели. Главный критерий, от которого зависит стоимость рекламного места — посещаемость сайта. Однако в случае реализации семантических поисковых систем, которые будут сами отбирать и сразу предоставлять нужную пользователю информацию, отпадает необходимость посещать сайт -- источник материала, а значит пользователь не увидит рекламу, и как следствие прекратится финансирование интернет-проектов”.

Печально это. Хотя сама идея выглядит заманчиво. Может, вы где встречали уже сплетенные “семантические паутины”?  

К слову. Вышеупомянутая конференция продлится до 8 сентября 2012 г. Её материалы будут опубликованы в сборнике трудов конференции и на сайте сообщества “Письменное наследие” (Textual heritage). Не исключено, что в этих материалах что-то будет сказано и о практической реализации “семантических паутин”.
Александр Сапожников
Интересно отметить, что в обширном перечне докладов этой (казалось бы, в значительной степени “документооборотной”) конференции термины СЭД, ECM и электронный документооборот не встречаются.

Несмотря на то, что технологическое ядро ИТ-решений ECM/СЭД и digital archives на практике это одно и то же, термин "документооборот" загадочным образом уже много лет загоняет отечественную ИТ-индустрию в специфическое бюрократическое гетто. Со своими весьма плоскими мифами и утопиями типа "контроля исполнения" и "юридически-значимых документов". Постепенно бюрократизируется и термин "документ". Почему-то служебная записка о закупке канцпринадлежностей удостоилась этого почетного звания, а документный статус электронных копий бумажных рукописей стал предметом дискуссий.

Слово "контент", которое давно уже принято повсеместно, позволяет смотреть на вещи шире. Конференция была посвящена вопросам управления определенным видом контента. Это "контентная' проблематика, а не "документооборотная". И не ECM (так как Enterprise закрепилось в общественном сознании как "предприятие").

Замечание википедии в отношении финансирования интернет-ресурсов применительно к сравнительно узкой проблематике digital archives представляются спорными. Сегодня я бы структурировал модели и источники финансирования разработок по управлению контентом следующим образом:

Управление корпоративным контентом (ECM), электронный документооборот - традиционные бизнес-модели, инвесторы получают доход от продажи коммерческих продуктов. Потребители - предприятия и учреждения (в частности, в госсекторе).

Управление публикуемым контентом, защищенным копирайтом - современные бизнес-модели характерные для интернет-предпринимательства (транзакционная модель, электронная торговля, рекламная модель и т.п.). Потребители - частные лица, бизнес.    

Управление публикуемым общедоступным контентом - государственное финансирование, спонсорство (компенсация инвестору поступает либо в виде нематериальных активов (репутационного капитала), либо в виде доходов от рекламы, либо в виде доходов от продажи вспомогательных сервисов). Потребители - частные лица.

Собственно, распространение семантического веб могло бы быть актуально во всех трех сферах, но на практике затруднено крайней трудоемкостью (и, как следствие, проблематичной окупаемостью) разработки (достаточно качественной) соответствующих детализированных онтологий.

Хрестоматийный пример семантического web - http://www.gopubmed.com/web/gopubmed/16?WEB04mgv7p21tdu1I7IbI00h0010009000000000000. Обратите внимание на тематическую рекламу справа и прямую просьбу денег по центру страницы.