Извличане на знания



Дата11.02.2018
Размер92.39 Kb.
#58137

ИЗВЛИЧАНЕ НА ЗНАНИЯ




  1. СЪЩНОСТ НА ИЗВЛИЧАНЕТО НА ЗНАНИЯ

Създаването на базата от знания на една експертна система е тежък и трудоемък процес, при който се извършва трансфер на компетентността на експертите в предметната област през инженерите на знанията (специалистите по обработка на знания) към базата от знания. В литературата този процес се именува с два разпространени термина: knowledge acquisition (придобиване на знания) и knowledge elicitation (извличане на знания). Терминът “придобиване на знания” обикновено се интерпретира или съвсем широко (тогава той включва целия процес на предаване на знания от експерта към базата от знания на системата), или тясно (като начин за автоматизирано построяване на базата от знания чрез диалог на експерта със специална програма. При това в такъв случай структурата на знанията е определена предварително и е “заложена” в съответната програма).

И при двете интерпретации с термина “придобиване на знания” се означава не самата процедура на екстрахиране на структурата и съдържанието на знанията от потока на информация за предметната област. Тази дейност се означава с термина “извличане на знания”. Повечето автори смятат този термин за по-точно означение на смисъла на преноса на компетентността на експерта чрез инженера на знанията към базата от знания на системата.

Понастоящем повечето специалисти отбелязват, че процесът на извличането на знания е най-тясното място при създаването на ЕС. При това често се налага да се разработват собствени, предназначени за определен конкретeн случай методи за извличане на знания. На практика обикновено се налага да се преодоляват различни затруднения, например:



  • организационни неуредици;

  • неудачно избран метод за извличане на знания, който не съответства на структурата на знанията в областта;

  • неадекватен модел (език) за представяне на знанията;

  • неумение да се води диалог с експерта;

  • терминологичен разнобой;

  • отсъствие на цялостна система от знания в резултат на извличането само на фрагменти;

  • опростяване на “картината на света” на експерта.

Извличането на знания е продължителна и трудоемка процедура, при която инженерът на знанията, въоръжен със специални знания по когнитивна психология, системен анализ, математическа логика и др., трябва да пресъздаде модела на предметната област, който се използва от експертите за вземане на решения. Често начинаещите разработчици на ЕС, желаейки да опростят тази процедура, се опитват да заменят инженера на знанията със самия експерт. По много причини това е нежелателно.

Терминът “придобиване на знания” най-често се използва за означаване на процеса на използване на специални инструментални програмни средства, предназначени за пряко общуване с експерта. При това общуване действително се придобиват вече готови фрагменти от знания в съответствие със структури, предварително определени от инженера на знанията и “заложени” в съответната програмна система. Повечето от тези инструментални средства са специално ориентирани към конкретни ЕС, предназначени за работа в тесни предметни области с предварително определени модели на представянето на знанията, т.е. като правило те не са универсални.





  1. МЕТОДИ ЗА ПРАКТИЧЕСКО ИЗВЛИЧАНЕ НА ЗНАНИЯ

На следващата фигура е представена класификация на методите за практическо извличане на знания, в която класификационен признак е използваният източник на знанията.






Извличане на знания


Комуникативни Текстологични



методи методи




Пасивни Активни

Анализ

Наблюдение Групови Индивидуални на учебници




Протокол на “Мозъчен Анкетиране Анализ

“мислене на щурм” на литература

глас” Интервю

Кръгла Анализ

Лекции маса Диалог на документи


Ролеви Експертни



игри игри
Комуникативните методи за извличане на знания обхващат методи и процедури за контакти на инженера на знанията с непосредствения източник на знанията – експерта, а текстологичните методи за извличане на знания включват методи за извличане на знания от документи (методики, пособия, ръководства) и специализирана литература (статии, монографии, учебници).

Обикновено инженерът на знанията комбинира различни типове методи, например отначало изучава литература и след това беседва с експертите или обратно.

Комуникативните методи могат да бъдат разделени на две групи: активни и пасивни. Пасивните методи предполагат, че водещата рола в процеса на извличане на знания се играе по някакъв начин от експерта, а инженерът на знанията само протоколира разсъжденията на експерта по време на реалната му работа по вземането на решения или записва това, което експертът счита за необходимо да разкаже по времето на отделни лекции. Обратно, при активните методи инициативата напълно е в ръцете на инженера на знанията, който активно контактува с експерта по различни начини – чрез игри, диалози, беседи и т.н.

Възможно е активните и пасивните методи да бъдат редувани дори в рамките на един сеанс на извличане на знания. Например, ако инженерът на знанията е стеснителен и няма голям опит, в началото може да използва пасивни методи, а постепенно, запознавайки се по-добре с експерта и предметната област, да поеме инициативата и да премине “в настъпление”.

Пасивните методи на пръв поглед са достатъчно прости, но в действителност те изискват от инженера на знанията да анализира потока на мислите на експерта и да отделя от тях значимите фрагменти на знания за предметната област. Отсъствието на обратна връзка (пасивността на инженера на знанията) значително отслабва ефективността на тези методи, с което се обяснява и обстоятелството, че те често играят спомагателна роля в процеса на извличане на знания.

Активните методи могат да бъдат разделени на две групи в зависимост от броя на експертите, които предават своите знания. Ако броят на експертите е повече от един, то е целесъобразно освен серията от индивидуални контакти с всеки от тях да се използват и методи за групово обсъждане на предметната област. Груповите методи обикновено активизират мисленето на участниците в дискусиите и позволяват да бъдат извлечени някои нетривиални аспекти на техните знания. Индивидуалните методи понастоящем остават водещи, тъй като деликатната процедура на извличане на индивидуалните знания на експертите като правило не търпи излишни свидетели.

Игровите методи се използват широко в социологията, икономиката, мениджмента, педагогиката и др. за подготовка на ръководни кадри, учители, лекари и други специалисти. Играта е особена форма на дейност и творчество, при която човек се разкрепостява и се чувства много по-свободен, отколкото при обичайната си трудова дейност.

На избора на метод влияят три фактора: личностните особености на инженера на знанията, личностните особености на експерта и характеристиките на предметната област.

Една от възможните класификации на хората по техните психологически характеристики ги дели на три типа: мислител (познавателен тип), събеседник (емоционално-комуникативен тип) и практик (практически тип). Мислителите са ориентирани към интелектуална дейност, учене, теоретични обобщения и притежават типичните за стила на учените качества аналитичност и рефлексивност. Събеседниците са общителни и открити хора, готови за сътрудничество. Практиците предпочитат действието пред разговорите, добре реализират замислите на другите и са насочени към резултатността на работата.

За характеризиране на предметните области може да се използва следната класификация: добре документирани, средно документирани, слабо документирани. Освен това, предметните области могат да бъдат разграничени на базата на степента на тяхната структурираност. Според степента на структурираност на знанията предметните области могат да бъдат: добре структурирани (с ясна аксиоматика, широко прилагане на математически апарат и установена терминология), средно структурирани (с определяща се терминология, развиваща се теория и ясни взаимни връзки между явленията), слабо структурирани (с размити определения, скрити взаимни връзки и голямо количество “бели петна”).

Въведените тук класификации на методите и предметните области могат да помогнат на инженера на знанията при първоначалния избор на метод или група методи за извличане на знания. Възможно е обаче по време на конкретната работа да се окаже, че първоначалните преценки са частично или дори напълно погрешни и в такъв смисъл да се наложи преоценка и промяна на избраните методи.



  1. ЕТАПИ НА ПРОЦЕСА НА ИЗВЛИЧАНЕ НА ЗНАНИЯ

Бюкянън анализира процеса на извличане на знания и създава процесуален модел на конструирането на експертни системи. Основните етапи в този модел са:



  • Идентификация. Формулират се основните цели на проекта. Определят се класът от задачи, които ще решава системата, включително данните, с които ще работи тя, и критериите за коректност на решенията. Определят се наличните ресурси за изпълнението на проекта, експертите и категориите потребители на системата;

  • Концептуализация. Извършва се съдържателен анализ на предметната област. Установяват се ключовите понятия от предметната област и връзките между тях. Определят се характеристиките на различните видове данни и типовете връзки между понятията в областта (причинно-следствени връзки, пространствено-времеви връзки, връзки от вида част-цяло, родово-видови връзки и т.н.). Определят се методите за решаване на основните задачи от областта;

  • Формализация. Формализират се основните понятия от областта, определят се начините за представяне на всички видове знания, определят се начините за интерпретация на знанията. Моделира се работата на системата, оценява се съответствието между избраните проектни решения и целите на системата;

  • Реализация. Осъществява се запълване на базата от знания на системата (от експерта с активното участие на инженера на знанията). Реализира се програмно интерпретаторът на знанията;

  • Тестване. Експертът и инженерът на знанията проверяват работоспособността на системата. Все още оценяването на ЕС не е точна наука, но е ясно, че тази задача се решава по-лесно, ако сме в състояние да тестваме системата върху многобройни представителни тестови примери. Тестването продължава, докато системата достигне необходимата степен на компетентност;

  • Опитна експлоатация. Проверява се пригодността на експертната система за крайните й потребители.

Главното внимание при проектирането на една ЕС трябва да се отдели на анализа на класа от задачи, които искаме тя да решава. Погрешно е да се започне с концептуален анализ на областта или с предварително определяне на организацията на знанията в базата от знания на системата. Това е така, защото се предполага, че начинът, по който организираме собствените си понятия и идеи, зависи до голяма степен от нашите нужди и цели.



  1. НИВА НА АНАЛИЗА НА ЗНАНИЯ

Уелинга и Брюкер различават пет нива на анализ на знанията, които съответстват на процесите на идентификация, концептуализация и формализация при изграждането на ЕС: идентификация на знания, концептуализация на знания, епистемологичен анализ, логически анализ и анализ на реализацията.



  • Идентификацията на знания се отнася до записване на знанията, отразени (включени) в докладите на един или повече експерти. Това се прави на етапа на задълбочено интервю, по време на което специалистите по обработка на знания (инженерите на знанията) окуражават експертите да говорят за това, какво правят и как го правят. Резултатът обикновено се записва на естествен език, макар че може да бъдат използвани специални означения от математиката, физиката и др.

  • Концептуализацията на знания подпомага формалното описание на знанията чрез примитивни понятия и концептуални връзки. На това ниво се навлиза по-дълбоко в съдържанието на протоколите от интервюто. Целта е да се елиминират неизбежните излишъци на информация и неточностите при описанията на естествен език.

  • Епистемологичният анализ установява структурните свойства на концептуалните знания, например таксономичните релации между отделни понятия и др. Тези свойства до голяма степен определят организацията на базата от знания на системата. Епистемологичният анализ трябва да покаже също връзките между специализираните знания от областта и общоприетите или всекидневните знания, които всеки човек притежава.

  • Логическият анализ има за цел установяване на начина, по който се извършват разсъждения в областта. Така някои задачи може да изискват само дедукция – например разсъждения от известни причини към техните следствия, докато за други да са необходими схеми с абдукция – например разсъждения от наблюдавани факти към възможните причини. При някои приложения могат да се използват специални правила за извод, например разсъждения за времето или пространството.

  • Анализът на реализацията третира механизмите, които са основа за други нива на анализ: съпоставяне с образци, попълване на слотове и др. Това ниво е подходящо за експерименти и други форми на емпиричен анализ като потребителски планове или експертни оценки.

Друг вид анализ на знания при създаването на експертни системи е т. нар. онтологичен анализ. Използването му изисква описание на системите чрез единици, връзки между тях и трансформации помежду им по време на решаването на дадена задача. За структуриране на знанията за областта авторите използват три основни категории:

  • статична онтология, която се състои от концептуални единици от областта заедно с техните свойства и релации;

  • динамична онтология, която дефинира състоянията, възникващи при решаването на задачи от областта, и начините, по които едно състояние може да бъде трансформирано в друго;

  • епистемична онтология, описваща знанията, които управляват и ограничават трансформацията на състоянията.

Има известно припокриване между нивата на концептуализация на знанията и епистемологичния анализ на Уелинга и Брюкер. По-малко припокриване има при нивата на логическия анализ и анализа на реализацията. Онтологичният анализ предполага, че разглежданата задача може да бъде сведена до задача за търсене, без да се спира на конкретните методи за търсене.


Сподели с приятели:




©obuch.info 2024
отнасят до администрацията

    Начална страница