Подходи за използване на технологиите на семантичния уеб



Дата19.01.2018
Размер109.56 Kb.
#48619

ПОДХОДИ ЗА ИЗПОЛЗВАНЕ НА ТЕХНОЛОГИИТЕ

НА СЕМАНТИЧНИЯ УЕБ

ЗА ПРЕДСТАВЯНЕ НА СЕМАНТИКАТА

НА ОБЕКТИ И КОЛЕКЦИИ

ОТ БЪЛГАРСКОТО ФОЛКЛОРНО НАСЛЕДСТВО



Детелин Лучев, Десислава Панева, Константин Рангочев

До края на ХХ век в България са създадени няколко десетки архива, които относително цялостно представят българската фолклорна култура. Един от най-големите архиви се намира в Националния център за събиране и съхранение на българския фолклор към Института за фолклор – БАН, който съдържа около един милион и половина страници. Изследванията през последните години показаха, че традиционните средства за извличане на информация от създадените съвкупности от текстове и архиви не са кой знае колко успешни. Най-общо съществуват два начина за систематизиране на фолклорната информация – чрез основно два типа архиви: поселищен архив и тематичен архив (съществуващите още архив на информаторите и архив на записвачите в случая имат само дистрибутивно значение). Поселищният архив е конституиран на основата на мястото (махалата, селото, квартала, града ...), където е събрана информацията за народната култура. В случая се изхожда от теоретичното допускане, че фолклорната информация, както и всяка друга културна информация, има относително завършен и цялостен вид на ниво обособени поселищни формирования. Важно е да се подчертае, че това теоретично предположение има по-скоро емпиричен, отколкото теоретичен характер – т.е. то е толкова очевидно за учените - етнолози, че не са необходими никакви доказателствени стратегии. Тематичният архив е построен на базата на отделните теми в народната култура. Темата най-общо е теоретичен конструкт, който дефинира относително обособени части от българската народна култура и поема ролята на инварианта в нея (раждане, сватба, Гергьовден, Пеперуда ...). Тъй като се отчита задължително (или почти винаги) мястото и датата на запис, то може да се предположи, че тематичният архив не е антипод, а вариант в инварианта фолклорен архив. От друга страна вътрешното разделяне в поселищния архив на фолклорните материали по теми означава, че поселищният архив и тематичният архив винаги са пресичащи се множества като процентът на съвпадението е значителен. Освен това двата вида архив не съществуват никъде в чист вид, тъй като тогава задължително биха натежали техните недостатъци, а не предимства.

Фундаменталният проблем е в това, че не съществува ясно, точно и непротиворечиво определение какво е това тема – т. е. между отделните теми не съществува точна и рязка граница. Темите обикновено са много, но краен брой на набор от единици, които представляват множество, съставено от взаимно пресичащи се множества. И това е така, защото от системна гледна точка фолклорната култура (както на българския, така и на всеки друг етнос) е дифузна система. Ясно е, че при дифузните системи могат да бъдат създадени един, два и повече модели, които обаче са еднакво адекватни на изследваната система. А развитието на фолклористичните изследвания от първите десетилетия на ХХ век до днес очертават едно засилващо се желание у изследователите да дефинират все по-точни и еднозначни (относително) предметни области. Изработват се различни технологии, които да позволяват сегментация на фолклорния текст до прости и неделими структурни единици и след това тези единици да бъдат еднозначно описани, класифицирани, подредени (Пропп 1969; Дандис 1985; Веселовский 1987; БФП 1994). Така или иначе до този момент опитите в тази посока не са блестящи или поне никога не са строго еднозначни. Важно е да се подчертае, че всички класификационни схеми, предложени до този момент, на практика са пресичащи се множества. И затова създаването на онтология на дигитална библиотека на българския фолклор поражда възможността този конституентен недостатък да бъде минимизиран – т.е. целта на онтологията е чрез използване на еднозначно структурирани връзки да бъде сведен огромният брой (на този етап – клони към безкрайност) на фолклорните обекти до голям, но краен брой онтологични единици. В последващ етап нараства ролята на концептуалната възможност да бъде експлицирано знание чрез дефинирането на различни връзки между фолклорните обекти на семантично ниво, което до този момент е останало скрито за изследователите.
Проблемът за етноложкото познание и опитите за създаване на онтологии за дигитална библиотека на българския фолклор

Безспорно е, че етноложкото познание, а от тук и етноложките изследвания, имат системен характер. От зората на българската етнология до най-ново време изследователите описват, изследват, анализират различни подсистеми на това познание. Изследва се определена област от знанието в конкретен топос от българската етническа територия, получава се алгоритъм (там, където има процесуалност) или структурно описание, след това процедурата се повтаря за друг топос и т.н. Накрая - получава се обобщен алгоритъм или структурно описание, което всъщност е една изследователска абстракция. Например, “пълното” описание на “Българското коледуване” е алгоритъм по принцип, който обаче не съвпада с нито един от неговите локални варианти. Всичко това означава, че етноложките изследвания са йерархично организирани. Откъсвайки се от конкретния топос (напр. село) и отивайки към по-големи цялости (район - етнографска област - етническа територия), след началното ниво (село/град), изследователят борави с модел на изследваната област от етноложкото познание. Съществена опасност при този йерархичен подход (моделиране) е потенциалната възможност да бъдат изпуснати важни системни връзки на познанието. Например, ако бъдат разгледани някои фолклорни парадигми на родство може да окаже, че един и същи човек влиза в поне няколко системи на родство: 1. Кръвно-родствена: внук-син-брат-вуйчо; 2. Обредно родство: девер; 3. Професионално родство: кираджия и т.н. Друга съществена опасност идва от спецификата на теренните изследвания. Най-често изследователят извлича части от етноложкото познание чрез разговор-интервю на четири очи с информатора. С други думи - изучават се явления, които по принцип са надличностни, създадени от определена (често пъти малка) селищна общност, а информация за тях се получава от отделна личност, при това под формата на лични спомени.

Важен проблем още е спецификата на етноложките изследвания: те съдържат огромен процент на абстрактност – по ред исторически, обективни и субективни причини (технологии на запис, морални, идеологически, научни и пр. предразсъдъци) записите на образците от българския фолклор, с които боравят изследователите, на практика съдържат частична и непълна информация – няколко примера: често липсва мелодията при записите на песните; естествената среда при запис на прозаичните форми липсва; в над 90% от случаите записите са направени чрез структурирано интервю, а не чрез включено наблюдение и пр. От тук изводите, които правят изследователите най-често са на базата на недостатъчна или липсваща информация.

Всички тези проблеми могат да бъдат частично решени дори и с един единствен опит за създаване на онтология на българският фолклор. Самото коректно представяне на проблема, както и опитите за дигитализация на фолклорния архив очертават проблеми, които фолклористите (етнолози и етнографи, които по правило имат хуманитарно образование) не са и подозирали, че съществуват. Още повече, че работейки с дифузната система на българския фолклор те създават размити и взаимнопресичащи се класификационни схеми, които не са подходящи за представяне в онтологиите на дигиталните библиотеки и семантичния WEB. От тази гледна точка опитите за създаване на онтологии за дигитална библиотека на българския фолклор дават и една неочаквана и немаловажна полза – налагат точност, яснота, коректност и пр. в класификационните схеми на фолклористиката.


Работата по „Онтология на българския фолклор”


Целта на първия етап на модул 3 „Създаване на дигитални библиотеки и информационна артерия с виртуални експозиции за БФН" на проекта „Технологии, основани на знания за създаване на дигитални ресурси и виртуално представяне на значими колекции от българското фолклорно наследство” (FolkKnow)1 e конструирането на базисна онтология на българския фолклор, описваща знанието за българските фолклорни артефакти, техните характеристики, техническа информация или контекст. Използвайки тази онтология анотаторите ще описват семантично и ще индексират суровото аудиовизуално фолклорно съдържание, за да го превърнат в многократно използваеми дигитални обекти. Онтологията ще бъде използвана за реализиране на семантично-базиран достъп до конкретни дигитални обекти в цифровата библиотека, представящи фолклорно знание.

Процесът на изграждане на онтологията на българския фолклор по необходимост е итеративен. Първата дейност на фолклористи и специалистите по технологии за обработка на знания е определяне на целите и обхвата на онтологията. След няколко дискусии се сформираха групи от свързани понятия, но възникнаха различни проблеми по време на тези сесии при опитите за откриване на краен брой еднозначни понятия и релациите между тях.

Класове от понятия в разработваната онтология се свързаха с понятие-корен за онтологията - „Понятие от онтологията на българския фолклор”. Всички негови подкласове се групираха в две основни тематични множества:


  • „Идентификация и описание” – съдържащо главно описателни критерии (класове) като заглавие, език, архивен номер, период, местонахождение, тип, анотация и др. на даден фолклорен обект;

  • „Техническа информация” – включва информация, свързана с разкриването на технологиите, използвани за заснемане и записване на фолклорния обект, ситуация на записа, място и дата на записа, основни участници в процеса на запис (осведомител и записвач) и др.

Разработи се таксономия на класовете от понятия, за да се изгради онтологична структура на фолклорното знание и да се определят обобщени и специализирани връзки, както и простите и сложни наследявания. В допълнение се добавиха краен брой релации (свойства) за взаимодействие между индивидите на отделни класове.

Онтологията на българския фолклор е съставена от над 650 понятия и свойства.

Фигура 2 изобразява основните понятия и връзки между тях в онтологичния модел на българския фолклор.



Фигура 2: Част от основните понятия и свойства в онтологията на българския фолклор
За ефективното представяне на фолклорната анотираща рамка и интегриране на информационното представяне в стандартизирана спецификация бе използван специален формат (език). Целта е да се улесни процеса на семантичен достъп и разсъжденията върху анотираните фолклорни обекти чрез използването на алгебрата на семантичните заявки. Тези мотиви за представянето на онтологичния модел на българския фолклор посочиха използването на Web Ontology Language вместо XML, RDF/RDF Scheme или DAML+OIL. OWL е динамичен и богато изразителен език, позволява добро класифициране, съгласуване, правене на заявки, изводи и разсъждения. Тези му характеристики позволиха да бъде заснето точно фолклорното знание, богатата йерархия от понятия и тяхната взаимосвързаност. За OWL реализацията на описваната онтология и експериментите с нея бе използван Protégé-OWL Plug-in.

Следващият OWL сорс код представя дефинирането на клас “Песен”, и част от неговите подкласове – “Обредни”, “Семейни”, “На сватба, Сватбарски”, “При правене сватбено дърво”:




>Рубрика на фолклорния обект.












































Свойствата (релациите) представят семантичните връзки между индивидите на съответни класове от онтологията. По-долу е включен OWL сорс код от онтологията на българския фолклор дефиниращ свойството „е_място_за_запис_на” и съответното му транзитивно „има_място_на_запис”.










Посочва че класа „Място_на_запис” е свързан със класа „Фолклорен_обект” посредством релацията „е_място_на_запис_на”.















Посочва че класа Фолклорен_обект” е свързан със класа „Място_на_запис” посредство релацията „има_място_на_запис”).






На фигура 3 е представен прост фолклорен обект и връзката му с класа „Място на запис”.


Фигура 3: Схема на връзките между индивиди на класове в онтологията на българския фолклор

Описание на семантиката на сложни фолклорни обекти

Част от фолклорните обекти във фондовете на Института по фолклор при БАН са прости по своята същност – “Песен”, “Обредност”, “Mагия” и др. Наличието във фонда и на обекти, които съобразно тяхното информационно съдържание могат да бъдат класифицирани едновременно към различни Folklore Object Types за една фондова единица, породи необходимостта от създаването на възможности за описание на такива комплексни фолклорни обекти. Такъв обект е например A1_146_2-14, които представлява интервю, съдържащо информация за католическата общност в с. Ореш, Свищовско. Акцентът е обредния, празничния и всекидневния живот в селището, народна вяра и знание. Комплексният фолклорен обект A1_146_2-14 попада едновременно в категориите – „Обредност”: „календарна обредност”, „семейна обредност”, „трудова обредност” и „обреди за дъжд”; „Сънища”: „тълкувания” „Храна и хранене” – „обредна”; „Вяра и знание”: „за демонологични персонажи”. Освен това, семантичното описание на обекта се усложнява с посочването на допълнителни подкатегории на дадените четири - „Благовещение”, „Великден”, „сватбена обредност”, „погребална обредност”, „седянка”, „преденки” и „други практики” за „Обредност”; „За самодиви” за „Вяра и знание”; и т.н.

Фигура 4 представя семантичното описание на обект A1_146_2-14.


Фигура 4: Семантичното описание на комплексен фолклорен

обект A1_146_2-14


При анотирането на комплексният фолклорен обект A1_146_2-14 според онтологията на българския фолклор той има 4 типа - “Обредност”, “Вяра и знание”, “Сънища” и “Храна и хранене”. В първото ниво на описание попадат подкласовете съответно „Календарна обредност”, „Семейна обредност”, „Трудова обредност” и „Обреди за дъжд” на класа „Обредност”, „За демонологични персонажи” за класа „Вяра и знание”, „Тълкувания” за класа „Сънища”, „Обредна” за класа „Храна и хранене”. На второ ниво на описание комплексният фолклорен обект семантично се представя чрез подкласовете „Благовещение”, „Великден”, „Сватбена обредност”, „Погребална обредност”, „Седянка”, „Преденки” и „Други практики”, „За самодиви” и т.н.

Приложеният подход за описанието на семантиката на комплексните фолклорни обекти е разработен съобразно изикванията на Националния център за събиране и съхранение на българския фолклор при Института за фолклор при БАН и класификационните категории за описание на фолклорен обект в неговия архив.

Това многопластово семантично описание дава възможност за цялостно, многопосочно и дълбочинно описание на всеки един фолклорен обект (прост и/или комплексен) в архива без загуба на семантика.

Разгледаните подходи за използване на технологиите на Семантичния уеб за представяне на семантиката на обекти и колекции от българското фолклорно наследство биха могли да намерят своето приложение и при работата на специалистите с архивите и фондовете на други сходни по своята насоченост институции.


Литература

БФП 1994: Български фолклорни приказки. Каталог. София, АИ “М. Дринов”.

Веселовский А.Н. 1987: Историческая поэтика. Москва. изд. “Высшая школа”.

Дандис, А., 1985: Структурная типология индейских сказок Северной Америки” – В: Зарубежные исследования по семиотике фольклора”, Москва, изд. “Наука”.

Пропп, В.Я. 1969: Морфология сказки. Москва, изд. „Наука”.

APPROACHES FOR USING OF SEMANTIC WEB TECHNOLOGIES

FOR DESCRIPTION OF THE SEMANTICS

OF THE BULGARIAN FOLKLORE HERITAGE

OBJECTS AND COLLECTIONS
BY DETELIN LUCHEV, DESISLAVA PANEVA, KONSTANTIN RANGOCHEV,
Abstract

Preserving and presenting the Bulgarian folklore heritage is a long-term commitment of scholars and researchers working in many areas. The article describes the scope, conceptions, relations and implementation of an ontological model of the knowledge about Bulgarian folklore artefacts, exploring the use of knowledge technologies for presenting the semantics of valuable phenomena of the traditional culture. This model is a step to the development of the digital library for the “Bulgarian Folklore Heritage” virtual exposition which is a part of the “Knowledge Technologies for Creation of Digital Presentation and Significant Repositories of Folklore Heritage” project.



1 Работата по проект „Технологии, основани на знания за създаване на дигитални ресурси и виртуално представяне на значими колекции от българското фолклорно наследство” се осъществява със съдействието на Фонд „Научни изследвания” на МОН съгласно договор ИО-03-03/06.




Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница