50
Ausgangswerts zugelassen. Die Bildung einer Karte entspricht dann dem Erlernen einer
Steuerungsaufgabe. Bei der Art des Ausgangswertes kann es sich z.B. um eine skalare Größe
oder um einen Vektor handeln. Im selben Maße, in dem die Karten gelernt werden oder
adaptiv veränderlich sind, muß auch die Zuordnung von Ausgangs werten zu Gitterplätzen
plastisch sein. Daher ist für die Ausgangswerte ebenfalls ein Lernalgorithmus erforderlich.
Das Lernen der Ausgangswerte kann bei geeignetem Lernalgorithmus von der nachbarschafts-
und damit stetigkeitserhaltenden räumlichen Anordnung wesentlich profitieren.
Zusätzlich gehört also im Falle von Karten, die für den Einsatz von Steuerungsaufgaben
bestimmt sind, zu jedem Neuron r ein Ausgangswert w r (aus) . Da die bisher mit w bezeichneten
Synapsenstärken die Zuordnung zwischen Eingangssignalen und Neuronen festlegen, werden
sie zur besseren Unterscheidung von den gerade eingeführten Ausgangswerten mit w (em)
bezeichnet. Im Fall der Steuerung von Bewegungen stellt v den gegenwärtigen Zustand des
zu steuernden Systems dar, und u bestimmt die erforderliche Steuerungsreaktion. Dabei kann
es sich z.B. um eine Auslenkung, eine Kraft oder ein Drehmoment handeln.
Im einfachsten Fall ist für die vorgegebene Steuerungsaufgabe eine Sequenz korrekter
Wertepaare (v,u) aus Systemzustand v und jeweilig richtiger Steuerungsaktion u verfügbar.
Diese Situation entspricht einem "Lernen durch Unterweisung" (überwachtes Lernverfahren)
und erfordert Gelegenheit zur längeren Beobachtung der korrekten Steuerung durch einen
"Lehrer". Anfangszustand ist eine Belegung der Synapsenstärken w r und der Ausgangswerte
w r taus) mit Werten ohne a-priori-Information, z.B. mit Zufallswerten. Ziel des Lernvorgangs
ist es, die Aktionen des Lehrers besser und besser zu imitieren. Dies kann durch folgenden
Algorithmus bewirkt werden:
0. Initialisierung: Zufällige Wahl der Anfangswerte der Synapsenstärken w r /" n) und derAus-
gangswerte wj alis) .
1. Stimuluswahl: Wahl der nächsten Steuerungsaktion (v, u).
2. Response: Bestimmung des Erregungszentrums r’, d.h. des „bestmatch“ Neurons, das nur
dem aktuellen Systemzustand v in der Karte allein zugeordnet ist.
3. Adaptionsschritt: Veränderung der Synapsenstärken H' r kln) gemäß
(ein, neu) _ ^ (ein, all) _ ^(ein, alt)^
4. Adaptionsschritt: Veränderung der Ausgangswerte wj aus1 gemäß
w (aus, neu) _ ^(aus, all) + _ yy^faus, alt))
und Fortfahren mit Schritt 1. (3.8)
Schritte 0.-3. entsprechen Kohonens ursprünglichem Algorithmus zur Bildung der topologie
erhaltenden Karte auf das Neuronengitter. Der neu hinzugekommene Schritt 4. verändert die
Belegung des Gitters mit den Ausgangswerten w r (aus) . Diese Veränderung erfolgt völlig analog
zum Lernschritt für die Synapsenstärken w r (em) , jedoch mit gegebenenfalls eigener Lern
schrittweite e’ und Wechselwirkungs- bzw. Nachbarschaftsfunktion h’ rr . mit entsprechender
Reichweite g’. Das vorgeschlagene Verfahren erzeugt im Verlaufe der Lernphase eine
Wertetabelle für die Abbildung des Systemzustands auf die Steuerung. Der besondere Vorteil
des Verfahrens liegt dabei in der hohen Adaptivität der Tabellenstruktur. Die Zuordnung zwi
schen Tabelleneinträgen und Eingangswerten ist nicht von Anfang an starr vorgegeben,
sondern sie entwickelt sich erst im Laufe einer Lernphase zusammen mit der Belegung der
Tabelle. Dies geschieht so, daß die Tabelleneinträge (w r (em) , w r (aus) ) entsprechend der Dichte
der benötigten Steuerungsaktionen im Raum der Abbildung der \v r lem ’ auf die w r (aus) verteilt
werden. Regionen in diesem Raum, aus denen häufig Steuerungsaktionen erforderlich sind,
erhalten entsprechend mehr Tabelleneinträge zugewiesen, so daß dort automatisch eine höhere