41
При тези две предположения вероятността от грешки на класифициране при използване на правилото на близкия съсед превишава два пъти
Байсовската вероятност за грешки (Bayes probability error) (Байсовската вероятност за грешки е минималната вероятност за грешки на множеството на всички правила приети за решение).
Фиг. 2.2. Областта заета от
окръжността съдържа две точки, принадлежащи към клас 1, и една принадлежаща към класа 0. Точка d съответства на тествания вектор
. При к = 3 класификатора на к-близкия съсед ще отнесе точка d към класа 1, въпреки че тя може да е по-близка към „избора”, отнасящ се към класа 0.
Вариации на класификация основани на близкия съсед се явява
класификатор на к-близкия съсед (k-nearest neighbor classifier). Той се описва по следният начин:
Намираме
к-класифициран съсед близък на вектора
, където
к е някое цяло число.
Вектора отнасяме към този клас (хипотеза) който по често от другите среща к – близкия съсед на тествания вектор. Така класифицирането основано на
к–
близкият съсед работи подобно на устройството на осреднения. Например може да се отчете единично „изхвърляне”, както е показано на фиг. 2.2. за к = 3
изхвърляне (outlier). Това изхвърляне е наблюдение, което се отличава от номиналния модел.
Сподели с приятели: