Климент охридски” факултет по математика и информатика

Изследвания и експерименти

Изтегляне 1.01 Mb.

страница	6/8
Дата	27.03.2017
Размер	1.01 Mb.
	#17861
Тип	Автореферат

1 2 3 4 5 6 7 8

6. Изследвания и експерименти

Изследванията и експериментите са проведени на три главни етапа, като постигнатите резултати от всеки етап се явяват необходимо условие за началото на следващия етап. Тези етапи са:

Валидиране на разработения набор от стереотипи и оценяване на тяхната способност да описват групите от потребители на системата
Оценяване на ефективността на предложения метод за класифициране на потребителите към стереотипите
Оценяване на ефекта от прилагане на адаптивност при търсене, посредством адаптиране на заявката. В тази група спадат и експериментите, проведени с Модела, имащи за цел да валидират неговите възможности да достави данни (атрибути), в съответствие с първоначалните очаквания и изисквания. Проведени са и набор от експерименти, целящи да оптимизират Модела и да настроят неговите параметри.

Първи етап на изследването: Валидиране на разработения набор от стереотипи

Изследванията и експериментите на този етап бяха насочени към откриване дали разработеният набор от стереотипи е способен да представи и обхване потребителите на системата. При разработката на стереотипите следвахме подход, свързан със: (1) събирането на данни за създаване на стереотипите; (2) анализ на събраните данни; (3) дизайн и (4) оценяване и валидиране.

Разработката на стереотипи е свързана с предварителна работа по събиране на данни, относно профила на потенциалните потребители. В настоящата работа, част от предварителната работа беше спестена, тъй като ние имахме преимуществото да работим с вече изградена система, в чийто център се намира разработена онтология. Съществуващите данни за потребителите и данните, закодирани в онтологията ТЕО, под формата на класове, инстанции и анотации, послужиха като първоначални данни при създаване на стереотипите. В онтологията ТЕО са въведени данни за повече от 58 образователни институции и агенции, 15 типа роли, 4 цели, набор от езици и области/предмети на интерес.

Представените в онтологията институци и агенции (списъкът не е пълен):

Centros de formación de adultos

Centro Territoriale Permanente per l'Istruzione e la Formazione in età adulta

Agenzia Nazionale Sviluppo Autonomia Scolastica

Centro Iniziativa Democratica Insegnanti

Ministerio de Ciencia e Innovación

Ministerio de Educación, Política Social y Deportes

…

Представените в онтологията роли са:

Разработчик на съдържание

Библиотекар

Издател

Доставчик на услуга

Университетски преподавател

Обучител на обучители

…

Целите, зададени в онтологията са: Обучителна цел, Образователна цел, Наблюдателна цел и Визуализационна цел.

Дефинираните езици включват: английски, испански, италиански и български и др.

Тези първоначални данни, послужиха като изходна точка на изследването, като впоследствие беше проведено допълнително проучване, състоящо се в он-лайн събиране на информация за отделните институции и роли в тях, разговори с преподаватели, целящи да задълбочат и конкретизират събраното знание и запознаване с други примерни системи. Следващият етап в работата, след събирането на данните, беше логичното им обединяване в шаблони (стереотипи), способни да групират потребителите въз основа на значими техни прилики. Пряко свързани с дефинирането на стереотипите стояха идентифицирането и задаването на типичните нужди за всяка от стереотипните групи.

Например за дефиниране на стереотипа „Български Инструктор от CISCO мрежова академия“ се запознахме с начина на работа в академията, което включваше разговори с преподаватели и он-лайн проучване на платформите за обучение в академията (сайтът cisco.netacad.com). Това ни позволи да идентифицираме езика на преподаване, ролята на инструктура и темите на преподаване, и оттам да дефинираме нуждите на този стереотип, а именно: (1) Управление на курс в платформата за електронно обучение на български език и (2) Подготвяне на присъствен урок за български курсисти в област компютърни мрежи.

Във фазата на анализ беше осъзнато, че е възможно с течение на времето да има промяна в състава на потребителите, която да доведе до отпадане на част от стереотипите и необходимост от създаване на нови. Тъй като стереотипите са създадени „статично“, а не динамично те остават в системата, независимо дали се „използват“ или не и се изисква администраторска намеса за тяхната промяна (добавяне или премахване). Поради това е запланувано провеждането на периодични тестове и изследвания, които да установят дали има съществени изменения в състава на потребителите, изискващи предефиниране на набора от стереотипи.

Въз основа на предварителните проучвания и събраните данни бяха дефинирани 50 (петдесет стереотипа). На по късен етап от изследването попаднахме на потребители, който не могат да бъдат класифицирани към нито един от наличните стереотипи. Вследствие на това осъзнахме, че е нужно създаването на допълнителен стереотип „по подразбиране“, който да обхваща потребителите, не спадащи към нито един от наличните стереотипи. Този стереотип „по подразбиране“ послужи за оценяване на ефективността на създадения набор от стереотипи да групира потребителите. Методът, който използвахме се основава на оценка на това, какъв процент от потребителите попадат в стереотипа „по подразбиране“. Ако този процент е твърде висок, това ще е доказателство, че наборът не е достатъчен да обхване потребителите и трябва да се създадат допълнителни стереотипи. Ние приехме за начална допустима стойност 20% от потребителите да бъдат класифицирани към стереотипа „по подразбиране“, без да се налага добавяне на нови стереотипи или промяна в съществуващите.

Друг момент от изследването беше да установим дали някой от стереотипите не е „излишен“, като това е свързано с оценяване на минималната утилизация на стереотип. Това налага дефинирането на минимален брой потребители, които да бъдат класифицирани към стереотип. Ако този брой е под определен минимум, то тогава този стереотип не е нужен в системата. След така, направената постановка на очакванията и изискванията към системата, пристъпихме към оценяване на резултатите. Вследствие на проведените експерименти се оказа, че на този етап създаденият набор от стереотипи удовлетворява поставените цели и изисквания.

Втори етап на изследването: Оценяване на ефективността на метода за класифициране на потребител към стереотип

Този етап е свързан с оценяване дали потребителя бива класифициран към най-подходящия за него стереотип. Валидиране на ефективността на метода се осъществява, като се съпоставят резултатите, получени от автоматичното класифициране на потребител към стереотип/и с лично избрания от самия потребител стереотип/и.

Предложеният метод за класифициране се базира на създаване на вектор на потребител от въведените от него данни и сравняване на този вектор с предварително дефинираните вектори на стереотипите в системата. Резултат от това сравнение е получаване на числена стойност между нула и сто процента. При този процес е възможно получаването на стойност за сходство, което обаче е твърде малко и поради това от несъществено значение. Това налага необходимостта от дефиниране на стойност на сходствота, която да се приеме за значима (съществена) и да води до класифицирането на потребител към вектор. Изчисляването на сходството между потребител и всички стереотипи в системата води до извеждане на набор от стереотипи, с които потребителят е сходен в някаква степен.

Цел на експеримента: Оценяване на класифицирането на потребител към стереотип.

Постановката на експеримента: Извършва се автоматично класифициране на потребител към стереотип. Този резултат се сравнява с лично избран от същия потребител стереотип. Методът за класифициране се основава на следното: потребителят предоставя данни за себе си, свързани с неговия език, целта му в системата, институцията му, изпълняваната от него роля и областта му на интерес. Тези данни се представят в онтологията ТЕО с онтологичните класове Language, ActorGoal, Role, (EducationalInstitution U InformationalCulturalAgency) и KnowledgeAreaElement. От тези данни се конструира един или повече вектори на потребителя. В първоначалната версия на метода, беше планирано всеки потребител да се представя точно от един вектор. Впоследствие, това беше променено, тъй като се срещаха потребители, които задават повече от една стойност за всяка от възможностите (език, роля…).
Примерен експеримент: Потребителят X е инструктор в Сиско академията на Софийски университет. При регистриране той задава следните данни за себе си: български език, обучителна цел, инструктор, Сиско академия, компютърни науки. От тези данни се създава векторът, чиито елементи съответстват на избрани онтологични класове и техните инстанции: [BG(1), TeachingGoal(1), Trainer(1), TrainingInstitutionBG_1(1), ComputerScience(1)]. Фиг. 20 показва процеса на конструиране на вектор на потребителя X от зададени от него данни.

Фиг.20 Конструиране на вектор на потребителя X от зададени от него данни

Конструираният вектор се сравнява с векторите на всички стереотипи в системата, използвайки метода на косинусовото сходство. Методът е демонстриран по-долу, като е изчислено сходството между вектора на потребителя X и два от стереотипите.

Таблица 18 показва използване на модела вектор-пространство за изчисление на сходство между вектор на потребител и два стереотипа - Stereotype15 и Stereotype19 с цел изчисляване на тяхното сходство. В таблицата са показани теглата на елементите на векторите. Всеки уникален елемент от векторите е координата в Евклидовото пространство и се използва като измерение в модела вектор-пространство.

Вектор на потребителя:

= [BG(1), TeachingGoal(1), Trainer(1), TrainingInstitutionBG_1(1), ComputerScience(1)]

Вектор на Stereotype15:

= [EN(1), TeachingGoal(1), StudentTeacher(1), UndergraduateIE_2(1), TrainingInMusic(1)]

Вектор на Stereotype19:

= [BG(1), TeachingGoal(1), Trainer(1), TrainingInstitutionBG_1(1), ComputerScience(1)]
Таблица 18 Представяне на вектор на потребител и стереотипи в модела вектор-пространство

Елементи Вектор	BG	TeachingGoal	Trainer	TrainingInstitutionBG_1	Computer Science
Потребител	1	1	1	1	1
(Stereotype15)	0	1	0	0	0
(Stereotype19)	1	1	1	1	1

За изчисляване на сходството между вектор на потребител и стереотип, използваме формулата за косинусово сходство.

Изчисляване на сходство между потребителя и стереотипа Stereotype15

sim( , ) = cos�� = ~0,31

Изчисляване на сходство между потребителя и стереотипа Stereotype19

sim( , ) = cos�� = = 1

Изчисленията показват, че е налице пълно сходство от 100% между потребителя и стереотипа Stereotype19 и едва 31% между потребителя и стереотипа Stereotype15. Вследствие на изчисляване на сходството и при дефинирана гранична стойност от 80% за приемливо сходство, потребителят X е класифициран към Stereotype19.

В последния етап на експеримента на потребителят X е представен списък със всички стереотипи, от който той да избере този който приема за най-сходен със себе си. Резултатите между изчисления и избрания стереотип съвпадат.

Очаквани резултати: Очакваните резултати са да има съвпадение между автоматичното класифициране на потребителя и избрания от него стереотип в мнозинството от случаите.

Получени резултати: Получените резултати показват съвпадение между изчисления по предложения метод стереотип и стереотипа, избран лично от потребителя.

Изводи: Проведените експерименти показват недвусмислено, че предложеният метод за изчисляване на сходство между потребител и стереотип е изключително надежден и ефективен. Благодарение на предвиденият стереотип „по подразбиране“ е възможно класифицирането на всички потребители на системата.

Трети етап в изследването: Оценяване на адаптивността при търсене; експерименти с Модела

Третият етап в изследването е свързан с набор от експерименти, които от една страна целят да валидират операциите, реализирани от Модела и от друга - да оценят предложения метод за адаптивно търсене. Тези експерименти се групират в две групи: експерименти с параметрите на Модела и експерименти с адаптиране на заявката.

Валидирането на първата серия от експерименти се реализира, като се съпоставят прогнозируемите, очаквани резултати от действието на Модела с реално получените. Валидирането на втората серия от експерименти се осъществява, като на потребител, преминал през процес на класифициране към стереотип се представят резултатите от адаптивно търсене и той оцени тази адаптация като положителна.

Първа серия от експерименти: експерименти с Модела

Експерименти с априорните вероятности и задаването на доказателства на възлите от най-горния слой

Цел на експеримента: Експериментиране със стойностите на априорните вероятности на възлите от най-горния слой с цел избор на подходящи стойности. изследваме как промените в априорните вероятности ще се отразят на разпределението на вероятностите при останалите възли от Модела. Изследване поведението на Модела при задаване на доказателства на възлите от най-горния слой.

Постановка на експеримента: Задаваме еднакви стойности на априорните вероятности на всички възли от най-горния слой на Модела в даден момент. Извършва се извод и се отчитат стойностите на вероятностите при възлите от останалите два слоя в Модела. Задаваме доказателства истина или лъжа на всички възли от най-горния слой. Отчитаме резултатите при останалите два слоя. В следваща серия от експерименти, променяме априорните вероятности, но така че отново да са еднакви за всички възли. Отново се извършва извод и се отчитат стойностите на вероятностите на възлите от долните два слоя. Задаваме същите доказателства истина или лъжа на всички възли от най-горния слой, както в предходната постановка. Отчитаме резултатите при останалите два слоя. Сравняваме получените резултати от двата етапа на експеримента.

Примерен експеримент: задаваме стойности на априорните вероятности 0,2 за истина и 0,8 за лъжа или p(x = true) = 0,2 и p(x = false) = 0,8. Извършва се извод с Модела, в резултат на който се обновяват вероятностите на възлите от долните два слоя. В следващия етап на експеримента задаваме доказателства истина на възел Stereotype1 и лъжа на всички останали възли от най-горния слой. Повтаряме експеримента, с променени стойности на априорните вероятности - p(x = true) = 0,5 и p(x = false) = 0,5 и отчитаме резултатите за същите възли. На следващия етап задаваме доказателство истина на възел Stereotype1 и лъжа на всички останали възли от най-горния слой. Сравняваме получени резултати от различните етапи на експеримента.

Очаквани резултати: Очакваните резултати са при задаване на доказателства, те да надграждат стойностите на априорните вероятности, като последните губят своето значение.

Получени резултати: Получени са резултатите за избрани възли от Модела, при задаване на различни. Стойностите на вероятностите на избраните възли съвпадат при задаване на едни и същи доказателства на възлите от най-горния слой, без значение, че дефинираните априорни вероятности се различават.

Изводи: Задаването на стойности на априорните вероятности рефлектира върху разпределението на вероятностите на свързаните възли, като колкото по-високи са тези стойности, толкова по-високи вероятностите на свързаните възли. Задаването на доказателства надгражда априорните вероятности.

Експерименти с разпространяването на доказателства към възлите от долните два слоя

Зададените стойности на стереотипите – истина или лъжа се разпространяват до възлите от останалите два слоя, чиито вероятности се обновяват в съответствие със стойностите на предшестващите ги възли. В резултат на този процес можем да идентифицираме възлите от най-долния слой (атрибути), които да бъдат изведени от модела и подадени на Модул за прилагане на адаптивност при търсене и използвани за адаптиране на заявката. Това са тези атрибути, които имат стойност, различна от лъжа.

Експеримент 1

Цел на експеримента: Идентифициране на поведението на Модела при разпространението на доказателствата от най-горния слой към останалите два слоя от Модела. Валидиране на правилното разпространение на доказателствата, при зададената постановка на задачата.

Постановка на експеримента: Задаваме доказателство лъжа на всички възли от най-горния слой и изследваме разпространението на тези доказателства към останалите възли.

Очаквани резултати: Очакваните резултати са всички останали възли от Модела, също да получат стойност лъжа. Ако това не е така, то това ще означава, че Моделът не е изграден правилно и не отговаря на очакванията.

Наблюдавани резултати: Наблюдаваните резултати, потвърждават предварителните очаквания, а именно че при задаване на доказателство лъжа на всички възли от най-горния слой, тези доказателства се разпространяват към свързаните възли и като резултат всички останали възли от Модела също получават стойност лъжа. Резултата от експеримента може да се проследи на Фиг.22, където възлите маркирани с жълто квадратче, показват резултатна стойност лъжа.

Фиг.22 Резултат от задаване на доказателство лъжа на всички възли от най-горния слой

Експеримент 2

Цел на експеримента: Идентифициране на поведението на Модела, при разпространението на доказателствата. Валидиране на правилното разпространение на доказателствата, при зададената постановка на задачата.

Постановка на експеримента: Задаваме доказателство истина на избран възел от най-горния слой и лъжа на всички останали възли от този слой и изследваме разпространението на тези доказателства.

Примерен експеримент: Възелът на Stereotype16 получава доказателство истина, а всички останали възли на стереотипи – доказателство лъжа.

Очаквани резултати: Очакваните резултати са потока от доказателства да се разпространи към възлите от останалите два слоя от Модела, при което свързаните възли към възела със доказателство истина да получат вероятности за истина и лъжа, а всички останали възли – само стойност лъжа. Ако това не е така, то това ще означава, че Моделът не е изграден правилно и не отговаря на очакванията.

Наблюдавани резултати: Вследствие на разпространение на доказателствата към възлите от другите два слоя, наблюдаваме следното: възлите от средния слой - Need0, Need18 и Need19 са със стойност, различна от лъжа, а от най-долния слой, това са възлите: EN, LessonPlan, NonPedagogicallyStructured, LearningDesignUnit и Religion.

Валидиране на експеримента: Установяваме, че възлите Need0, Need18 и Need19 са единствените възли от средния слой, които са директно свързани с възела Stereotype16, а възлите: EN, LessonPlan, NonPedagogicallyStructured, LearningDesignUnit и Religion – с някой от възлите Need0, Need18 и Need19. Тези резултати са доказателство, че поведението на Модела е в съответствие с очакванията. Фиг.23 показва Моделът при зададени доказателства истина на Stereotype16 и доказателства лъжа за всички останали стереотипи.

Фиг.23 Mоделът при зададени доказателства истина на Stereotype16 и доказателства лъжа за всички останали стереотипи

Изводи: Задаването на доказателства е ефективен метод за идентифициране на възлите от най-долния слой (атрибути), които притежават вероятност, различна от лъжа.

Втора серия от експерименти: експерименти с адаптиране на заявката

Адаптивност на търсенето е процес, посредством който отделните потребители получават резултати, съобразени с личните им предпочитания. Следствие от този процес е извеждането на различни резултати от една и съща заявка, тогава когато тези потребители се различават помежду си.

Цел на експеримента: Идентифициране на успешно реализирана адаптивност на търсене.

Постановка на експеримента: Потребител, класифициран към даден стереотип и вследствие на това, системата подава атрибути за адаптиране на заявката. Замяна на оригиналната заявка на потребител с адаптирана заявка. Съпоставяне на резултатите при два различни потребители, които първоначално са извършили търсене с една и съща ключова дума.

Примерен експеримент: Потребителят X е класифициран към Stereotype19 „Български Инструктор от CISCO мрежова академия“, а потребителят Y - към Stereotype7 „Италиански Обучител на обучители в област Физическо възпитание и спорт“. Двамата потребители извършват търсене с ключовата дума „lesson”.

Вследствие на извод с Модела, което в случая с потребителя X е свързано със задаване на доказателство истина на Stereotype19 и лъжа на всички останали стереотипи, се извеждат атрибутите: BG, LessonPlan, LearningDesignUnit, ComputerScience.

Подобен процес протича за потребителя Y, който е класифициран към стереотип Stereotype7. След извършване на извод, Моделът извежда атрибутите за потребител Y, които са: IT, LessonPlan и TeacherTraining-PhisicalTraining.

Изведените атрибути от Модела се използват за адаптиране на заявката, при което простата заявка за търсене по ключова дума се преобразува в разширена. Това се реализира, като се зарежда формата за разширено търсене в портала на Share.TEC и нейните полета се попълват със съответните за потребителя атрибути, според методът:

1. Въведените от потребителя ключови думи попълват полето - With all of the words.

2. Изведените атрибути от Бейсов модел за адаптиране и персонализиране попълват следните полета:

Атрибутите от тип „Език“ попълват полето Resource language
Атрибутите от тип „Тип на дигиталното съдържание“ попълват полето DigitalContentType
Атрибутите от тип „Област на знание“ попълват полето KnowledgeAreaElement

Адаптираната заявка за търсене се изпраща в хранилището с ресурси. Разширената по този начин заявка ще бъде подобна на формата за Разширено търсене в Share.TEC, в която полетата: Resource language, DigitalContent Type и KnowledgeAreaElement са попълнени автоматично със стойности, получени от Бейсов модел за адаптиране и персонализиране. Фиг.25 показва как се модифицира оригиналната заявка в разширена.

Ф
иг.25 Адаптиране на заявката с формата за разширено търсене в Share.TEC

Адаптираната заявка за потребител X ще има формата:

With all of the words: lesson

Resource language: BG

DigitalContent Type: LessonPlan, LearningDesignUnit

KnowledgeAreaElement: ComputerScience
Адаптираната заявка за потребител Y ще има формата:

With all of the words: lesson

Resource language: IT

DigitalContent Type: LessonPlan

KnowledgeAreaElement: TeacherTraining-PhisicalTraining

Адаптираните заявки за двата потребителя се изпращат към хранилището с информационни ресурси. Получените резултати се представят на потребителите.

Резултати от експеримента: Представяне на адаптиране резултати на поребителите, според техния стереотипен профил.

Валидиране на експеримента: Валидирането на успеха на реализираната адаптация може да се осъществи по два начина: или лично от потребителите X и Y или автоматично от системата. За автоматично валидиране е предложен метод, който се основава на свойството на БМ да извършват извод както в диагностична, така и в прогностична посока. Първата стъпка е свързана със събирането и обобщаването на съдържанието, разгледано от потребителя в резултат на търсенето му в системата. Информационните ресурси в дигиталната библиотека Share.TEC са анотирани с метаданни, представени в модела за метаданни СММ, който е базиран на стандарта LOM и онтологията ТЕО. В тези метаданни влизат аргументи на полетата: language, DigitalContent Type и KnowledgeAreaElement. Тези аргументи се използват като възли от най-долния слой (атрибути) на Бейсовия модел за адаптиране и персонализиране. Като втора стъпка трябва да се изведат метаданните на разгледаните от потребителя ресурси. От тези метаданни се извеждат тези, които са от групите language, DigitalContent Type и KnowledgeAreaElement. В третата стъпка, възлите от Модела, които съответстват на изведените метаданни, получават доказателство истина, а всички останали възли от най-долния слой на Модела – доказателство лъжа. Следващата стъпка е свързана с активиране на алгоритъма за извод над Модела, в резултат на който се изчисляват постериорните вероятности на възлите от най-горния слой (стереотипи). Идентифицират се стереотипите за даден потребител – това са тези, които притежават най-голяма постериорна вероятност. Чрез съпоставяне на изведените по този начин стереотипи с изчислените на базата на векторно сходство стереотипи ще може числово да се измери, дали и до каква степен реализираната адаптивност е била успешна.

Каталог: index.php -> bul -> content -> download
download -> Литература на народите на Европа, Азия, Африка, Америка и Австралия
download -> Дипломна работа за придобиване на образователно-квалификационна степен " "
download -> Рентгенографски и други изследвания на полиестери, техни смеси и желатин’’ за получаване на научната степен „Доктор на науките”
download -> Св. Климент Охридски
download -> Акад. Илчо иванов димитров (1931 – 2002) фонд 20 опис 1
download -> Азбучен списък на преподавателите
download -> Климент охридски” университетски архив
download -> График за провеждане на семтемврийската (поправителна) изпитна сесия на магистърска програма „политическа социология учебна 2014/2015 г. Поправителна сесия от 24 август до 11 септември 2015 г
download -> Обявява прием на студенти

Изтегляне 1.01 Mb.

Сподели с приятели:

1 2 3 4 5 6 7 8