107
Според равенство (
3.1), изходът на перцептрона е нула, когато
s е отрицателно или равно на едно, когато
s е положително. Във
фиг. 3.6 е дадено геометричното представяне на входната област от стойности. За
константата θ
, изходът на перцептрона е равен на едно от едната страна на разделящата права, която се дефинира чрез:
1 1 2
2
xxω
ω
θ
+
= −
(
3.18) и равно на нула от другата страна на тази линия.
Фигура 3.6: Геометрично представяне на входното пространство
За да се убедим, че такова решение не
може да бъде намерено, ще разгледаме
фиг. 3.6.
Входното пространство се състои от четири точки: две тъмни кръгчета (1, −1) и
(−1, 1) не могат да бъдат разделени от право ребро от двете светли кръгчета на (−1, −1) и (1, 1). Очевидно е задаването на въпроса: Как може този проблем да бъде преодолян?
Мински и Пепърт доказват в тяхната книга, че при двоични входове, всяка промяна може да бъде изпълнена чрез
добавяне на слой от твърдения, които са свързани с всички входове.
Специфичната XOR задача (изключващото или) ще покажем геометрично, че при въвеждането на
скрити възли, по този начин мрежата се разширява към
многослоен перцептрон, задачата може да бъде решена.
Фиг. 3.7а показва, че четирите входни точки сега са поставени в 3-мерно
пространство, дефинирано чрез две входни точки плюс един
108
Фигура 3.7: Решение на задачата XOR
а) Перцептронът на фиг. 3.1 с допълнителен скрит възел. С означените стойности на теглата
ω
ij
(до свързващите линии) и
прагове θ
i(в кръгчетата) този перцептрон решава задачата XOR.
b)Той е осъществен чрез начертаването на четири точки от фиг. 3.6 върху четирите точки тук; очевидно разделянето сега (чрез линейно разнообразие) в необходимите групи е възможно скрит възел. Сега тези четири точки лесно се разделят чрез линейно многообразие
(равнина) в две групи, както искахме.
Този прост пример демонстрира, че добавянето на скрити възли увеличава класа от проблеми, които са разрешими за правите мрежи като перцептрона. Обаче, чрез това пораждане на базови архитектури, се получават сериозни загуби: не съществуват други обучаващи правила за определяне на оптимални тегла.
Сподели с приятели: