Климент охридски” факултет по математика и информатика

Адаптивност и персонализация. Методи, подходи и средства за реализиране на адаптивно търсене

Изтегляне 1.01 Mb.

страница	2/8
Дата	27.03.2017
Размер	1.01 Mb.
	#17861
Тип	Автореферат

1 2 3 4 5 6 7 8

2. Адаптивност и персонализация. Методи, подходи и средства за реализиране на адаптивно търсене

Технологии на Семантичния уеб – езици, протоколи и стандарти

Технологиите на Семантичния уеб стоят в основата на редица системи, които доставят персонализирано и адаптивно съдържание. Технологиите на Семантичния уеб намират приложение за описание на информационни ресурси в дигиталните библиотеки по систематичен и универсален начин и задават средства за обработване и обобщаване на големи количества от разнородна мултимедийна информация. На базата на тези технологии е възможно изграждането на потребителски модел от ново поколение, който точно, бързо и ефективно да моделира интересите на потребител. Такива модели стоят в основата на различни персонализационни услуги, сред които и адаптивно търсене [31]. Техниките и методите на Семантичния уеб намират приложение при: анотиране на информационни ресурси, представяне на факти по формален начин и извършване на извод над тях, семантичен анализ, разпознаване на обекти и тяхното индексиране, при взаимодействието човек-компютър, описание на дадена област от знание чрез онтология, създаване на модел на потребител и др. Понятието Семантичен уеб е въведено за първи път от Тим Бърнърс-Лий, директор на World Wide Web Consortium (W3C) като с него се означава следващото поколение на WWW при което се добавят машинно-обработваеми семантики към ресурсите. Тим Бърнърс-Лий разработва модел на Семантичният уеб, който обхваща набор от езици и стандарти.

Адаптивност и персонализация – понятия и дефиниции. Адаптивни системи

Адаптивността е свързана с цялостната способност на системата да се адаптира към потребител. Адаптивността може да бъде контролирана явно от потребител, или да бъде осигурявана имплицитно от системата, чрез анализиране на поведението на потребител и неговото взаимодействие със системата [86]. Адаптивността се реализира чрез набор от методи и подходи, свързани със събиране и анализиране на знание за потребителя и прилагане на адаптивни стратегии. Това се осъществява чрез: (1) събиране на статистика за потребителя, (2) изграждане на потребителски модел, (3) анализиране на знанието за потребителя от модела, (4) определяне на това, как системата да се адаптира максимално добре към потребителя, (5) самия процес на адаптивност.

Груповата адаптивност е адаптивност, която засяга взаимодействието с определен потребител, но е повлияна от взаимодействията на много потребители. Груповата адаптивност е свързана с разделяне на потребителите на групи, въз основа на една или няколко характеристики. Груповата адаптивност се реализира посредством използването на изрични (експлицитни) или косвени (имплицитни) стереотипни групи.

В общия случай адптивността се постига, като се прилагат адаптивни методи и стратегии над модел на потребител. Съществуват различни подходи за моделиране на потребител, главните от които са: (1) класифициране на потребител към стереотипни групи (стереотипи); (2) използване на техники за научаване на модела на потребителя от неговото поведение в системата; (3) изследване на приликите между нов потребител и съществуващи потребители в системата и др. Aдаптивността намира приложение в различни типове системи, като например в системите за интелигентно обучение, в системите за достъп до информационно съдържание, в електронните каталози, в системите за здравна помощ, препоръчващите системи и др. В хипермедийните системи адаптивността се изразява в адаптиране на съдържанието, адаптиране на представянето на резултатите или адаптиране на структурата [52]. Двата главни подхода за реализиране на персонализация са базирани на измерване на сходството между потребител и съдържание (content-based) или между отделните потребители в системата (collaborative-based). Процесът на адаптивност и персонализация в средите доставящи знания цели откриването и представянето пред потребителя на тези информационни ресурси, които са най-подходящи за него [96].

В средите за електронно обучение адаптивността е насочена към идентифицирането на учебни ресурси от ключово значение за обучаемия. В тези среди персонализацията се разбира главно като персонализиран достъп до учебни единици. Сред системите, за които адаптивността и персонализацията са от съществено значение, са дигиталните библиотеки. Адаптивостта и персонализацията в дигиталните библиотеки се осъществява в следните направления:

• Адаптивно търсене на информационни ресурси, на базата на индивидуалността на потребителя.

• Персонализирано представяне на съдържанието и на графичния интерфейс на средата.

• Препоръчване на съдържание според характеристиките на потребителя.

• Персонализиране и адаптиране на представеното съдържание, както и на услугите, предлагани от системата, в съответствие с характеристиките на потребителя.

• Персонализирано групиране и обобщаване на информационните ресурси, като това групиране може да се осъществи въз основа на различни признаци [88].

• Адаптиране според използваните от потребителя устройства – настолен компютър, мобилни устройства и т.н.

• Адаптиране според местоположението на потребителя и близостта до обекти с по-особено значение, като паметници на изкуството, архитектурата и т.н. С това се цели добавяне на допълнителен контекст към предлаганото съдържание.

• Адаптиране според характеристики на околната среда, като климат, час от деня и др.

• Адаптиране въз основа на създадената или разгледаната от потребителя информация.

Модел на потребител – видове и характеристики

Различните видове персонализирани и адаптивни системи прилагат различен похват при моделирането на потребител – системите за уеб персонализация използват проследяващи алгоритми, за да следват потребителя в неговото сърфиране из мрежата, докато адаптивните хипермедийни системи създават потребителски модел на базата на взаимодействието на потребителя със системата. Потребителските модели могат да се групират въз основа на различни критерии, като: вид на модела, начин на представяне, структура на модела, методи за конструиране на модела, целева група на модела, изменяемост на модела във времето, времеви обхват на модела, начин на събиране на данни за попълване на модела и др. Това позволява моделите да бъдат категоризирани като: персонални или групови, изрични (експлицитни) или косвени (имплицитни), динамични или статични, дългосрочни или краткосрочни и др. От съществено значение при създаване на модел е да се определи как ще се представя този модел, какви техники за конструиране ще използва, дали и какъв извод ще се извършва над него и др.

Стереотипът се смята за агрегиран модел на група от потребители. Това означава, че ако два потребителя принадлежат към един и същ стереотип, то те принадлежат към обща група, държат се сходно и имат подобни интереси. Стереотипите представят група от характеристики, за които се приема, че дадена група притежава.

Процесът на моделиране на потребител е свързан с избирането на съществени негови характеристики и атрибути, които да го представят в модела. Към тях спадат: демографски данни, като възраст и пол, ниво на познание в определена област, когнитивни и мисловни особености, начина на възприемане и учене и др. Съществуват различни подходи за подбор на тези характеристики на потребител, като широко известна е класификацията на Brusilovsky [10]. В системите за адаптивно електронно обучение и интелигентните обучаващи системи за съществени се приемат характеристиките на потребител, свързани с лекотата на усвояване на учебно съдържание, начина на учене, когнитивните особености и др. Съществуват два главни стандарта за моделиране на обучаем - IEEE PAPI Learner [28] и IMS LIP [30]. Тези стандарти служат за създаване на унифицирани модели на представяне на обучаем, които да осигуряват съвместимост и многократна използваемост на моделите в различни системи за електронно обучение.

В САПТ в редица случаи при моделиране на потребител се използва историята на неговото търсене. В този случай моделът на потребител се попълва с индиректно събрани данни, състоящи се от въведените от потребителя термини за търсене. В други системи освен тях се анализират и резултатите от търсенето и/или разгледаните от потребителя документи. Съществуват подходи, които използват експлицитни данни, предоставени от потребителя в системата. Възможно е комбинирането на тези два подхода. Главните видове модели на потребител в АПС са:

Модел, представен като вектор от ключови думи
Онтологичен модел
Модел, представен като семантична мрежа/и [37]

Най-простото представяне на модел на потребител в САПТ е като n-мерен вектор, съставен от термини. При този подход областта се разделя на n елемента (от които се интересува системата) и всеки се описва от един компонент на вектора. В този тип модел в общия случай термините се характеризират с дадена тежест, която указва значимостта на даден термин за описанието и представянето на потребителя. Векторният модел използва проста структура за представяне на знанието за потребител, в която няма смислови релации между отделните термини от вектора или отношения между тях. Най-простата реализация на този модел използва само един вектор, в който се съдържат всички термини, съществени за описанието потребителя. В по-сложните реализации отделни аспекти, интереси и характеристики на потребителя се представят чрез отделни вектори.

Таблица 1 представя сравнително съпоставяне на модели – вектори от термини, заедно с техни характеристики в няколко различни системи.

Таблица 1 Сравнение на модели – вектори от термини, адаптирано от [37] и допълнено

Система

Представяне на модела

Методи за събиране на данни

Техники на конструиране на модела

Amalthaea [65]

Единичен вектор от термини с тегла

Индиректно

Извличане на ключовите думи с най-голяма тежест

WebMate [16]

Отделен вектор за всеки интерес

Директно

Създаване на вектор от документ

Сравняване на векторите на интересите

Сливане на най-сходните вектори на интереси

Alipes [102]

Набор от вектори за всеки интерес

Директно

Създаване на вектор от документ

Сравняване с векторите на интересите

Добавяне към най-близкото съвпадние

MiSearch [89]

Вектор, съставен от класове с дадена тежест

Индиректно

Извличане на термини от заявките за търсене

Сравняване с векторите на документите в колекцията

Всички системи, представени в Таблица 1, използват като източник на данни уеб страници и като метод за оценяване на сходството – косинусовото сходство (Cosine similarity).

Предимство на модела вектор от термини, в сравнение с други видове модели, е неговата простота, изчислителна ефективност и доказана резултатност. Представянето на модела на потребител като вектор от термини е тясно свързано с Модела вектор-пространство. В този модел всеки документ се представя като множество от термини или като n-мерен вектор [81]. Тази форма на представяне служи като основа за измерване на сходството между векторите на ресурсите и на модела на потребител. Ако сходството между векторите е в рамките на дадена граница, то се приема, че те са сходни. Моделът вектор-пространство намира широко приложение за измерване на сходството между заявка за търсене и наличните документи в дадена колекция от ресурси. Един от най-популярните методи за измерване на сходството между два вектора в областта извличане на информация е т.нар косинусово сходство (Cosine similarity) [90].

Семантичната мрежа е абстрактна структура, която изразява семантични релации между понятия. Тя се реализира посредством възли и дъги, свързващи възлите. Възможно е задаването на тежести на възлите и на дъгите за числово изразяване на тяхната значимост в модела. Най-простата реализация на модел на потребител, базиран на семантична мрежа е посредством единична семантична мрежа, съдържаща възли, представящи конкретни термини. В по-сложните реализации във възлите на мрежата могат да стоят класове и към тях да бъдат свързани термини. Съществуват системи, в които всеки отделен интерес на потребител се представя с отделна семантична мрежа.

Съществена част от системите, доставящи адаптивност и персонализация, са базирани на някаква референтна понятийна йерархия или таксономия, която задава понятията и взаимовръзките в съответната предметна област. Онтологичните модели използват онтология за представяне на знанието за областта, както и за потребителя. Съществена технология за достигане до семантика в рамките на Семантичния уеб са онтологиите. Според известната дефиниция на Грубер [31] онтологията е „формална експлицитна спецификация на споделена концептуализация”. Онтологията задава стандартизирано представяне, което дава възможност за разбирането и споделянето на фактите от дадена област между хора и компютърни системи. Онтологичните модели са способни да изразяват сложни отношения и да позволяват извършване на извод над съществуващите факти. Онтологичните модели, подобно на моделите тип семантична мрежа позволяват извеждането на нови факти от колекцията налични факти [26]. Тяхното предимство е това, че тъй като се основават на предварително дефинирани понятия и отношения те са устойчиви на терминологични вариации. Онтологичните модели могат да се представят като вектор, чиито елементи са класове от дадена йерархия.

Използване на стереотипи за реализиране на адаптивност и персонализация

Стереотипите са въведени и развити първоначално от Rich [78, 79] и впоследствие широко използвани за моделиране на потребител в разнородни типове системи. Стереотипът може да се разглежда като колекция от характеристики, създадена за да представи описание на често възникващи ситуации. Rich [78] уподобява стереотипите на скриптовете на Schank et al [82] и фреймовете на Minsky [62]. Използването на стереотипи е често срещано в системите за информационно филтриране, като метод за разделяне на потребителите на групи, въз основа на техни общи характеристики. В мнозинството от случаите моделирането на потребител с помощта на стереотипи се използва, когато в системата няма достатъчно данни за потребителя, например когато той е нов в системата. В други случаи стереотипите се използват за разделяне на потребителите на групи, върху които се прилагат общи правила за адаптивност. Съществуват два базови подхода за определяне на стереотипите и техните характеристики – поведенчески и математически. При поведенческия подход стереотипите се определят от експерти, запознати с областта и нейните особености. Поведенческият подход се използва широко в системите за обучение, които адаптират нивото на взаимодействие човек-система към нивото на знанията на потребител [15, 17, 32]. При математическия подход определянето на стереотипните групи се извършва посредством някаква форма на изчисление, като клъстеризиране. Въпреки, че този подход може да дава точни резултати, той изисква дълго време за събиране, анализиране и агрегиране на данните в системата. Стереотипните групи, които се формират чрез този подход, са изкуствени и не винаги отразяват реалното разпределение на групите от потребители. Поради това, мнозинството от системите, които използват стереотипи отхвърлят математическия подход в полза на поведенческия [64, 80]. Друг важен момент е класифицирането на потребител към стереотип, което се осъществява посредством един от двата метода: (1) метод на тригерите и (2) метод на пълното сходство. При метода на тригерите наличието на определена характеристика в модела на потребител се явяват задействащ механизъм (тригер) за неговото класифициране към стереотип. При метода на пълното сходство най-сходният стереотип за даден потребител се определя въз основа на всички характеристики в модела на потребител, без да се отдава предпочитание на конкретна характеристика.

В Таблица 2 е представен сравнителен анализ на шест системи, използващи стереотипи, съпоставени въз основа на признаците: (1) тип на системата; (2) дали стереотипите са единствен или допълващ метод за описание на потребител; (3) подход за определяне на стереотипите - поведенчески или математически; (4) метод на класифициране на потребител към стереотип - метод на тригерите или на пълното сходство; (5) структурата на стереотипите; (6) представяне на стереотипите в системата; (7) метод/ стратегия на адаптивност.

Таблица 2 Сравнение на системи, използващи стереотипи, въз основа на техни признаци и характеристики

Система	Тип на системата	Модели в системата	Метод за определяне на стереотипните групи	Класифици-ране на потребител към стереотип	Структура на стереотипите	Представяне на стереотипите и Модел на адаптивност	Метод /стратегия/ на адаптивност
GRUNDY [78 ,79, 80]	Експертна система за препоръчване на книги	Индивидуален модел + стереотипи	Поведенчески	Метод на Тригерите	Йерархична структура	Стереотипите се състоят от набор от тройките (фасет, стойност, рейтинг)	Препоръки на базата на вероятностен извод
GUMS [32]	Модул за моделиране на потребител в експертни системи	Индивидуален модел + стереотипи	Поведенчески	Метод на Тригерите	Йерархична структура	Стереотипите се състоят от набор от факти и правила.	Извеждане на нови факти за потребител чрез правила в база данни. Използва се предикатна логика.
KNOME [17]	Модул за моделиране на потребител в консултираща система за UNIX	Индивидуален модел + стереотипи	Поведенчески	Метод на пълното сходство	Таблична структура	Стереотипите представляват категории в системата за представяне на знания KODIAK	Двойно стериотипизиране. Дедукция на базата на правила.
Share.TEC [7]	Модул за групова адаптивност в дигиталната библиотека Share.TEC	Виртуални стереотипи	Поведенчески	Метод на пълното сходство	Стереотипите не са постоянни и не са структурирани	Клъстери или „кръгове“ от потребители	Създаване на агрегиран модел, който афектира персоналния модел на патрона на кръга
SeAN [1]	Уеб адаптивна система за персонализиран достъп до новини	Индивидуален модел + стереотипи	Поведенчески	Метод на пълното сходство	Четири независими фамилии от стереотипи.	Всеки стереотип се състои от две групи слотове. Всеки слот съдържа вероятностна стойност	Правила, изчисляващи вероятността за интерес към съдържание
Система на Radde et al. [76]	Модул за моделиране на потребител в системи за препоръчване	Стереотипи	Поведенчески	Метод на пълното сходство	Таблично представяне (вектори)	Стереотипите са случайни променливи в трислойна Бейсова мрежа	Модифициране на SQL заявка към база с данни

Адаптивно търсене – дефиниции и характеристики

Адаптивното търсене е свързано с изграждане на системи, способни да осигуряват индивидуална колекция от резултати за различни потребители. В основата на тези системи стои модел, описващ знанието за потребител. Адаптивното търсене е процес на селекция на най-подходящите резултати и тяхното класиране в зависимост от конкретен потребител, група от потребители или всички потребители на системата. То се реализира посредством набор от подходи, включващи: адаптиране на заявката, преподреждане на резултатите и оценяване на резултатите. Адаптивното търсене се базира на набор от методи, техники и стратегии, като: история на търсенето, потребителски модели, колаборативни подходи, клъстеризиране на резултатите, хипертекстово съдържание, текущ контекст [61].

Съществуват различни типове системи, в които адаптивното търсенето намира приложение, като те се различават в зависимост от областта на приложение, вида на услугата, която предоставят, и езика, на който функционират. Такива системи са средите за електронно обучение, мултимедийните дигитални библиотеки, системите за новини, търсещите машини (търсачки) и др. АПС за извличане на информация могат да бъдат класифицирани въз основа на различни признаци, сред които са: (1) тип на системата; (2) обхват на персонализацията и (3) подходи за осъществяване на персонализацията.

Адаптивността и персонализацията в системата може да има различен обхват и да бъде насочена към отделен потребител, към група от потребители или към всички потребители на системата. В първия случай адаптивността се реализира на базата на индивидуален (персонален) модел, във втория - с помощта на групов модел (стереотип) и в третия - на основата на колективните данни, събрани от всички потребители при използване на системата. Главните методи за реализиране на адаптивно търсене са свързани с (1) адаптиране на заявката; (2) адаптиране на върнатите резултати или (3) с двете заедно. Процесите на адаптивност и персонализация в многоезичните системи са допълнени с превод на заявката и резултата между различни езици [68].

Адаптирането на заявката води до нова заявка, за която се приема, че представя по-пълно нуждите и интересите на потребител. Адаптирането на заявката решава редица проблеми, свързани с недостатъчно познаване на предметната област от потребителя.

Главните методи за адаптиране на заявката са: (1) модифициране на заявката, (2) разширяване на заявката с нови термини и (3) задаване на тежести на термините от заявката. Модифицирането на заявката е свързано със замяна на оригиналните термини за търсене с други, за които се приема, че представят по-точно интересите на потребител. При разширяване на заявката се добавят нови термини към оригиналните термини от заявката. По този начин късите заявки, състоящи се от един термин, могат да бъдат допълнени с нови термини, които конкретизират търсенето. Адаптиране на заявката може да се реализира както с термини, така и с понятия или категории от областта. В най-общия случай термините и категориите за модифициране или разширяване на заявката се взимат от потребителски модел. В други случаи термините се взимат от референтни речници, таксономии или онтологии на областта. Заявката може да се разширява и посредством методите на „псевдо-уместна обратна връзка“ и „уместна обратна връзка“ или като се използват данни, получени при интерактивна сесия с потребител [38]. Друг подход се базира на идентифициране на локалния контекст в заявката, което се реализира като се анализират документите, класирани най-високо в списъка с резултати. Тези документи се подлагат на обработка, в резултат на която се извеждат ключовите категории в тях. Изведените категории се използват за разширяване на заявката, с която се извършва повторно търсене [103].

Адаптиране на върнатите резултати от търсенето е процес на селекция на най-подходящите за потребител резултати и тяхното преподреждане. При този процес се цели поставянето на резултати, смятани за по-значими за даден потребител, на по-предно място в списъка с резултати от търсенето. По този начин класирането на резултатите е строго индивидуален за даден потребител и следва неговите предпочитания. Главните методи за адаптиране на върнатите резултати са: (1) преподреждане на резултатите; (2) филтриране на резултатите и (3) оценяване на резултатите [61].

Преподреждането и филтрирането на резултатите е свързано с допълнителен процес на обработка над изведения в резултат на търсенето списък. Този подход се смята за относително бавен, поради времето, нужно за връзка със съответната търсеща машина, която да извлече списък с документи. При филтриране на резултатите от първоначалния списък част от тях се елиминират, тъй като те се приемат за „неинтересни“ за потребителя. За разлика от филтрирането, при преподреждането на резултатите всички първоначално изведени резултати се представят, но редът на тяхното класиране е променен. Целта на тази промяна е поставянето на „интересните“ резултати на по-предна позиция в списъка. Възможно е комбинирането на тези два метода, при което резултатите първо се филтрират и след това се преподреждат. Оценяване на резултатите е метод, при който персонализацията се осъществява едновременно с процеса на извличане на информация и поради това има най-голяма вероятност да осигури бърз резултат в сравнение с останалите методи.

Адаптивното търсене в дигитална библиотека в основата си следва методите, подходите и средствата приложени в останалите типове системи. Поради това при него намират приложение разгледаните подходи - адаптиране на заявката, адаптиране на върнатите резултати и оценяване на резултатите. Адаптивното търсене в дигитална библиотека е насочено към разработване на адаптивни стратегии за откриване на подходящо съдържание за даден потребител. Съществуват адаптивни стратегии в дигитална библиотека, които се базират на използването на цитати (citation-based) за откриване на връзки между ресурсите в една колекция. Тази свързаност може да се използва за откриване на сходни ресурси, които да бъдат препоръчани на потребител.

Каталог: index.php -> bul -> content -> download
download -> Литература на народите на Европа, Азия, Африка, Америка и Австралия
download -> Дипломна работа за придобиване на образователно-квалификационна степен " "
download -> Рентгенографски и други изследвания на полиестери, техни смеси и желатин’’ за получаване на научната степен „Доктор на науките”
download -> Св. Климент Охридски
download -> Акад. Илчо иванов димитров (1931 – 2002) фонд 20 опис 1
download -> Азбучен списък на преподавателите
download -> Климент охридски” университетски архив
download -> График за провеждане на семтемврийската (поправителна) изпитна сесия на магистърска програма „политическа социология учебна 2014/2015 г. Поправителна сесия от 24 август до 11 септември 2015 г
download -> Обявява прием на студенти

Изтегляне 1.01 Mb.

Сподели с приятели:

1 2 3 4 5 6 7 8