Strona początkowa
Start Sieci jednokierunkowe Sieci rekurencyjne Słowniczek Linki O autorach

Sieci hybrydowe

Zasada działania

Sieć hybrydowa typu CP (ang. Counter - Propagation) zawiera w sobie dwie poznane już wcześniej struktury i uczona jest bez nadzoru jedynie częściowo. Pierwsza warstwa przetwarzająca sieci jest typową warstwą konkurencyjną, której każdy element połączony jest z każdym elementem wejściowym. Druga warstwa przetwarzająca (tzw. warstwa Grossberga) składa się z liniowych elementów o połączeniach wstępujących od wszystkich elementów warstwy konkurencyjnej.

Rozmiar: 7426 bajtów

Pierwsza warstwa sieci CP, jako typowa warstwa konkurencyjna, klasyfikuje obraz wejściowy u do jednej z wcześniej wyznaczonych klas. Po nauczeniu warstwy konkurencyjnej, wektor wag wi i-tego elementu przetwarzającego reprezentującego daną klasę jest równy najbardziej typowemu, uśrednionemu po wszystkich wzorcach tej klasy, wektorowi ui. Prezentacja obrazu wejściowego u uaktywnia jedynie ten element, którego potencjał membranowy ji przyjmuje największą wartość. Potencjał membranowy jest miarą podobieństwa obrazu u i wektora wag ui, a zatem podobieństwa obrazu wejściowego do najbardziej typowego wektora ui klasy reprezentowane przez i-ty element warstwy.

Aby uniknąć przekłamań w fazie rywalizacji pomiędzy elementami warstwy konkurencyjnej, wagi połączeń wstępujących do tych elementów oraz wektory wejściowe powinny być unormowane. O zwycięstwie danego elementu decyduje wówczas stopień zbieżności kierunków wektorów wag i obrazu wejściowego w przestrzeni wejść, a nie długość tych wektorów.

Po rozpoznaniu klasy, do której należy obraz wejściowy, zadaniem warstwy Grossberga jest wygenerowanie odpowiedniej dla tej klasy odpowiedzi. Ponieważ po prezentacji obrazu uaktywnia się tylko jeden element warstwy konkurencyjnej, np. i-ty, to odpowiedź sieci xi jest równa wektorowi wag vi połączeń wychodzących z tego elementu. Sieć CP jest więc siecią heteroasocjacyjną, tzn. dokonuje odwzorowania typu:

Rozmiar: 1588 bajtów

które dzieli przestrzeń obrazów wejściowych na rozłączne klasy. Każdej klasie przypisuje się jeden wektor reakcji z przestrzeni obrazów wyjściowych. Odpowiednikiem biologicznym tego typu odwzorowania jest recepcja bodźca zewnętrznego, jego rozpoznanie przez układ nerwowy i generacja odpowiedniej reakcji (odruchu). Szczególnym przypadkiem heteroasocjacji jest autoasocjacja, która polega na odwzorowaniu rozłącznych klas obrazów wejściowych w zbiór najbardziej typowych elementów tych klas, czyli j(u) = ui.

W niektórych zastosowaniach ważne jest uwzględnienie modeli asocjacyjnych z równoczesną interpolacją pomiędzy wzorcowymi wektorami wyjściowymi. W tym celu "łagodzi" się zasadę "zwycięzca bierze wszystko" w pierwszej warstwie sieci, pozwalając na aktywność kilku elementów jednocześnie. Pierwszej warstwę sieci nie stanowi wówczas zwykła warstwa konkurencyjna, lecz zmodyfikowana warstwa Kohonena, o elementach aktywnych w pewnym otoczeniu elementu zwycięzcy.

Sieci hybrydowe typu CP mogą spełniać podobne zadania, jak perceptron wielowarstwowy lub Madaline. Posiadają jednak szczególną zaletę: są efektywniejsze w działaniu oraz pozwalają uniknąć stosowania złożonego i pracochłonnego procesu uczenia według metody propagacji wstecznej.

Proces uczenia

Struktura heteroasocjacyjna sieci typu CP determinuje metodę jej uczenia. Warstwa konkurencyjna jest uczona bez nadzoru, zgodnie z klasycznymi regułami dla sieci konkurencyjnych.

Rozmiar: 7355 bajtów

Uczenie warstwy Grossberga jest nadzorowane i zgodne z regułą Widrowa - Hoffa dla liniowego elementu przetwarzającego:

Rozmiar: 1856 bajtów

gdzie xjz oznacza żądane wyjście, zi - aktywność i-tego elementu warstwy konkurencyjnej, h - parametr uczenia.

Naciśnij strzałkę aby wrócić do spisu treści.

Kliknij aby przejść dalej
Start Sieci jednokierunkowe Sieci rekurencyjne Słowniczek Linki O autorach