Start Sieci jednokierunkowe Sieci rekurencyjne Słowniczek Linki O autorach

Sieci hybrydowe

Zasada działania

Sieć hybrydowa typu CP (ang. Counter - Propagation) zawiera w sobie dwie poznane już wcześniej struktury i uczona jest bez nadzoru jedynie częściowo. Pierwsza warstwa przetwarzająca sieci jest typową warstwą konkurencyjną, której każdy element połączony jest z każdym elementem wejściowym. Druga warstwa przetwarzająca (tzw. warstwa Grossberga) składa się z liniowych elementów o połączeniach wstępujących od wszystkich elementów warstwy konkurencyjnej.

Pierwsza warstwa sieci CP, jako typowa warstwa konkurencyjna, klasyfikuje obraz wejściowy u do jednej z wcześniej wyznaczonych klas. Po nauczeniu warstwy konkurencyjnej, wektor wag w_i i-tego elementu przetwarzającego reprezentującego daną klasę jest równy najbardziej typowemu, uśrednionemu po wszystkich wzorcach tej klasy, wektorowi u_i. Prezentacja obrazu wejściowego u uaktywnia jedynie ten element, którego potencjał membranowy j_i przyjmuje największą wartość. Potencjał membranowy jest miarą podobieństwa obrazu u i wektora wag u_i, a zatem podobieństwa obrazu wejściowego do najbardziej typowego wektora u_i klasy reprezentowane przez i-ty element warstwy.

Aby uniknąć przekłamań w fazie rywalizacji pomiędzy elementami warstwy konkurencyjnej, wagi połączeń wstępujących do tych elementów oraz wektory wejściowe powinny być unormowane. O zwycięstwie danego elementu decyduje wówczas stopień zbieżności kierunków wektorów wag i obrazu wejściowego w przestrzeni wejść, a nie długość tych wektorów.

Po rozpoznaniu klasy, do której należy obraz wejściowy, zadaniem warstwy Grossberga jest wygenerowanie odpowiedniej dla tej klasy odpowiedzi. Ponieważ po prezentacji obrazu uaktywnia się tylko jeden element warstwy konkurencyjnej, np. i-ty, to odpowiedź sieci x_i jest równa wektorowi wag v_i połączeń wychodzących z tego elementu. Sieć CP jest więc siecią heteroasocjacyjną, tzn. dokonuje odwzorowania typu:

które dzieli przestrzeń obrazów wejściowych na rozłączne klasy. Każdej klasie przypisuje się jeden wektor reakcji z przestrzeni obrazów wyjściowych. Odpowiednikiem biologicznym tego typu odwzorowania jest recepcja bodźca zewnętrznego, jego rozpoznanie przez układ nerwowy i generacja odpowiedniej reakcji (odruchu). Szczególnym przypadkiem heteroasocjacji jest autoasocjacja, która polega na odwzorowaniu rozłącznych klas obrazów wejściowych w zbiór najbardziej typowych elementów tych klas, czyli j(u) = u_i.

W niektórych zastosowaniach ważne jest uwzględnienie modeli asocjacyjnych z równoczesną interpolacją pomiędzy wzorcowymi wektorami wyjściowymi. W tym celu "łagodzi" się zasadę "zwycięzca bierze wszystko" w pierwszej warstwie sieci, pozwalając na aktywność kilku elementów jednocześnie. Pierwszej warstwę sieci nie stanowi wówczas zwykła warstwa konkurencyjna, lecz zmodyfikowana warstwa Kohonena, o elementach aktywnych w pewnym otoczeniu elementu zwycięzcy.

Sieci hybrydowe typu CP mogą spełniać podobne zadania, jak perceptron wielowarstwowy lub Madaline. Posiadają jednak szczególną zaletę: są efektywniejsze w działaniu oraz pozwalają uniknąć stosowania złożonego i pracochłonnego procesu uczenia według metody propagacji wstecznej.

Proces uczenia

Struktura heteroasocjacyjna sieci typu CP determinuje metodę jej uczenia. Warstwa konkurencyjna jest uczona bez nadzoru, zgodnie z klasycznymi regułami dla sieci konkurencyjnych.

Uczenie warstwy Grossberga jest nadzorowane i zgodne z regułą Widrowa - Hoffa dla liniowego elementu przetwarzającego:

gdzie x_j^z oznacza żądane wyjście, z_i - aktywność i-tego elementu warstwy konkurencyjnej, h - parametr uczenia.

Naciśnij strzałkę aby wrócić do spisu treści.

Start Sieci jednokierunkowe Sieci rekurencyjne Słowniczek Linki O autorach

Darmowy hosting zapewnia PRV.PL