Климент охридски” факултет по математика и информатика


Бейсови (вероятностни) мрежи. Методи, подходи и стратегии за изграждане на Бейсови модели



страница3/8
Дата27.03.2017
Размер1.01 Mb.
#17861
ТипАвтореферат
1   2   3   4   5   6   7   8

3. Бейсови (вероятностни) мрежи. Методи, подходи и стратегии за изграждане на Бейсови модели


Бейсовите мрежи са способни да изразят отношение между състояние и неговите симптоми, или да предскажат най-вероятния изход на ситуация или събитие. Една вероятностна мрежа може да се разглежда като база от знания, представени във вид на правила от съждителното смятане, която е допълнена с локални таблици на Съвместно вероятностно разпределение (СВР) [104]. СВР е функция, която съпоставя на всяко атомарно събитие някаква вероятност. СВР може да бъде представена чрез таблица от четири стойности или посредством алгебричен израз.

БМ се дефинира като насочен ацикличен граф, представен от наредената двойка (V,E), където V е множество от възли, а E е множество от дъги, съединяващи възлите. Всеки възел от V съдържа име на променлива и таблица на условно СВР, която показва зависимостта на тази променлива от нейните предшественици. Съществуват дъги само между възли, съответстващи на променливи, които не са условно независими [104]. Според дефиницията на Pearl [74] БМ е насочен ацикличен граф, в който всеки възел представя случайна променлива и всяка дъга представя насочена вероятностна зависимост между две променливи. Ако съществува дъга между два възела, това означава, че има зависимост между съответните две променливи, което би било изразено чрез подходяща импликация в съждителното смятане. Бейсовите мрежи са разработени през осемдесетте години от Pearl [73] и оттогава се наблюдава силен интерес към тях и съществен напредък в развитието на нови техники и алгоритми за тяхното приложение. БМ е вероятностен модел с причинно-следствена връзка, който осигурява графично представяне, при което всеки възел представлява променлива и всяка дъга представлява причинно-следствено влияние. В момента те се считат за една от най-добрите съществуващи техники за решаването на диагностични и класификационни проблеми. Основните типове съждение в БМ са диагностично съждение, прогностично съждение, както и съждение от смесен тип.

БМ е способна да изчисли постериорните вероятности на несигурни променливи въз основа на доказателства, получени от свързани към тях променливи. Този процес е известен като разпространение на доказателства или обновяване на вероятностите. Това свойство, наред със способността на БМ да моделира комплексни отношения между несигурни променливи я правят много подходяща за изграждане на диагностични модели.

Съществуват два главни типа от алгоритми за вероятностно съждение – точни алгоритми и приблизителни алгоритми. Точните алгоритми използват особеностите на графа на вероятностната мрежа, за да изчисляват направо търсените условни вероятности, без да преминават през таблицата на СВР. Приблизителните алгоритми се основават на идеята за стохастична симулация на вероятностното съждение.



Модели за представяне на причинна независимост

При моделиране на ситуации от реалния свят, често се срещат положения, при които множество причини, предизвикват един и същи ефект [40]. Това взаимодействие не отразява причиннa независимост между променливите на причините. За преодоляване на тази непълнота Henrion [41, 42] предлага модел, в който освен променливите на ефекта Y и на причините {X1, X2, . . . , Xn} се използват междинни променливи {I1, I2, , In}, представящи независимия принос на всяка от причините върху ефекта. По този начин ефектът Y се представя като детерминистична функция от тези междинни променливи. За всяка причина Xi се обозначава инстанция от съответстващата и променлива, която да бъде изтъкната. Тази инстанция представлява състояние на причината Xi, в която тя няма влияние върху ефекта Y или обозначава “изключено” състояние.

В БМ размерът на СВР таблиците нараства експоненциално на броя предшестващи променливи на дадената променлива. Поради това са разработени модели на канонично взаимодействие, които апроксимират СВР таблиците и изискват по-малко параметри. Комплексността на съждението се избягва, като се използват канонични взаимодействия като NoisyOR, NoisyMAX и NoisyAdder, които ограничават изразителната сила на модела [74]. Този шлюз е представен за първи път от Good [39]. По-късно той се прилага в контекста на БМ от Pearl [73]. Шлюзът NoisyOR може да се използва само при бинарни променливи, като за променливи, приемащи множество стойности е разработен шлюза NoisyMAX от Henrion [42] и Diez [24]. Henrion [42] предлага разширение на NoisyOR за моделиране на случаите, в които ефектът Y може да се случи, при условие, че всички възможни причини са отсъстващи. Това разширение се нарича LEAK и представя феномена, че ефекта може да възникне спонтанно, при отсъствие на извънредна причина.

Друг модел, представящ взаимодействието причина-следствие е NoisyAdder. Този модел се състои от бинарни променливи {X1, X2, . . . , Xn} и целочислени променливи {I1, I2… , In}, като всяко Ij може да приема стойности от – l до +l. Dagum и Galper [21] дефинират т.нар. адитивни вероятностни модели (ABNM), които се използват за апроксимиране на вероятностни мрежи. Те предлагат метод за изчисляване на условните вероятности при ABNM модели с техники за приближение на параметрите. Radde et al [82] представят метод за изчисляване на условните вероятности, базиран на NoisyAdder.Те изчисляват условното вероятностно разпределение за даден възел от мрежата като средната тежест на предшестващи възли. За тази цел те сумират теглата на всички входящи дъги към възела и разделят на сумата от всички тежести.



Бейсови модели – структура и параметризация. Сравнителен анализ на модели с канонично взаимодействие

Съществуват Бейсови модели с различна степен на сложност. При диагностичните модели, най-простият модел е базиран на предположението, че само една повреда може да се случи в едно и също време, и че наблюденията са условно независими. По-реалистични Бейсови модели са тези, в които има повече от една променлива за представяне на повреди. Моделът QMR-DT [87] е двуслоен каноничен NoisyOR модел, който се състои от два типа бинарни случайни променливи, представящи болести и събития. Променливите на събитията представят симптоми на болести, резултати от тестове, демографски данни и др. Събитията, които не са бинарни (могат да притежават повече от две стойности), се представят с набор от бинарни променливи. Променливите на болестите влияят върху променливите на събитията, с които са свързани чрез дъги. Променливите от всеки слой са независими помежду си и между тях няма дъги. Бейсови модели имащи същия тип структура и параметризация като модела QMR-DT се наричат бинарни двуслойни NoisyOR (BN2O) мрежи. Фиг. 4 представя структурата на модела QMR-DT [87].



Фиг.4 Структура на модела QMR-DT [87]

Възможно е към BN2O мрежите да се добави трети слой от променливи за моделиране на междинен слой от отношения.

Kraijeveld et al [51] представят каноничния NoisyMAX модел BN3M, който е трислойна мрежа на Бейс, като всеки слой се заема от различен тип променливи. Моделът BN3M е изграден на предположението, че променливите от всеки слой са независими помежду си, и поради това не са свързани с дъги. Променливите, използвани в модела могат да приемат множество от стойности и по това се различават от бинарните променливи в QMR-DT модела. Фиг.5 представя структурата на модела BN3M [51].



Фиг.5 Структура на модела BN3M [51]

Radde et al [76] представя каноничен NoisyOR модел, който е трислойна мрежа на Бейс, като всеки слой се заема от различен тип бинарни случайни променливи. Техния модел е подобен на BN3M модела и e сходен с QMR-DT модела. В този модел дъгите притежават „тип“, който е положителен за представяне на позитивните влияния и отрицателен, за представяне на негативните влияния. Положителния тип дъги в модела се представят с непрекъснати линии, а отрицателните – с пунктирани линии. Фиг.6 представя структура на модела на Radde et al [76].

Фиг.6 Структура на модела на Radde et al [76]

В Таблица 3 е представено сравнение на каноничните модели на базата на техни съществени характеристики.

Таблица 3 Сравнение между канонични Бейсови модели




Модел

Тип

Променливи



Слоеве

Посока на дъгите

Метод за редуциране на СВР

Тип Извод/Съждение

QMR-DT [87]

Булеви

Двуслойна мрежа

Каузална

NoisyOR

диагностичен

BN3M

Модел на Kraaijeveld et al [51]



Множество стойности

Трислойна мрежа

Каузална

NoisyMAX

диагностичен

Модел на Radde et al [76]

Булеви

Трислойна мрежа

Каузална

NoisyOR

прогностичен

Теоретично няма ограничение за добавяне на още слоеве от променливи, например четвърти слой и нагоре, но Provan [75] твърди, че това не би довело до подобряване на съждителните възможности на модела.



Каталог: index.php -> bul -> content -> download
download -> Литература на народите на Европа, Азия, Африка, Америка и Австралия
download -> Дипломна работа за придобиване на образователно-квалификационна степен " "
download -> Рентгенографски и други изследвания на полиестери, техни смеси и желатин’’ за получаване на научната степен „Доктор на науките”
download -> Св. Климент Охридски
download -> Акад. Илчо иванов димитров (1931 – 2002) фонд 20 опис 1
download -> Азбучен списък на преподавателите
download -> Климент охридски” университетски архив
download -> График за провеждане на семтемврийската (поправителна) изпитна сесия на магистърска програма „политическа социология учебна 2014/2015 г. Поправителна сесия от 24 август до 11 септември 2015 г
download -> Обявява прием на студенти


Сподели с приятели:
1   2   3   4   5   6   7   8




©obuch.info 2024
отнасят до администрацията

    Начална страница