101
4. Steuerung der Zirkulation:
wennp<t-G, erhöhegum(G-l),
wennp-t-G, setzep = 0,
wennp> t-G, subtrahiere (r-G) vonp und
wenn dann i’ <p, subtrahiere 1 von p.
Subtrahiere 1 von t.
Ist t = n, so breche ab, sonst gehe zu Schritt 1.
Als Ergebnis erhält man Lernvektoren x i5 i=l,... n, deren mittlere euklidische Distanz d mit
d =
2
M/ürt)
% d ‘>
(4.7b)
in Abhängigkeit von der frei wählbaren Gruppengröße G maximiert ist. Je größer G gewählt
wird, desto größer ist die mittlere euklidische Distanz und desto besser ist die Näherung an
das Verfahren mit einer einzigen großen Matrix auf Basis der geordneten Menge aller
Zeitmustervektoren. Mit G = N, der Gesamtzahl aller Zeitmustervektoren, wäre somit die
größtmögliche Gruppe erreicht und die Näherung perfekt. Der kritische Faktor des Selektions
verfahrens der zirkularen Gruppenreduktion ist die Zeit, die das Verfahren zur Elimination
eines Vektors braucht. Sie ist quadratisch proportional zur Gruppengröße. Weniger bedeutend
im Vergleich dazu ist der Platzbedarf der jeweiligen Gruppenmatrix. Über die Gruppengröße
kann das Verfahren an die Schnelligkeit des verfügbaren Rechners angepaßt werden. Die
Genauigkeit der Näherung ist somit abhängig vom Rechner und der Zeit, die man zu
investieren bereit ist.
Die Kohonen-Netze, deren Lernvektoren mit Hilfe dieses Selektionsverfahrens auf Basis
des neuen Informationsmaßes und der neuen Strategie trainiert wurden, erbrachten einen ent
sprechend kleineren Vorhersagefehler als Netze mit Lernvektoren, die mit Hilfe des Korrela
tionsverfahrens selektiert wurden. Somit holte die euklidische Distanz als Informationsmaß
die relevante Information aus der geordneten Menge aller Zeitmustervektoren besser heraus
als die Korrelation (der Pearson’sche Korrelationskoeffizient). Der Vorhersagefehler der
Netze war aber nach wie vor größer als der des Wasserstandsvorhersagedienstes. Um den
Vorhersagefehler der Netze weiterhin zu senken, wurde nach neuen Wegen der Selektion
gesucht.
Bisher stand das Ziel vor Augen, einen Datensatz zu schaffen, in dem die gesamte
relevante Information der geordneten Menge aller Zeitmustervektoren berücksichtigt wird.
Dieses Ziel war zwar erreicht worden, aber das Ergebnis war nicht der Erwartung entspre
chend. Darum wurde dieses Ziel etwas genauer gefaßt. Die "Berücksichtigung sämtlicher
relevanter Information" läuft im Endeffekt auf das Konzept der "Repräsentativität" hinaus.
Der Begriff "repräsentativ" wird im Sinne von "typisch" verwendet. Mit "repräsentativen"
Vorhersagesituationen, die mit Hilfe verschiedener Zeitmuster modelliert werden, sind
"Standard"-Situationen gemeint. Doch gerade dieses Ziel der Repräsentativität ist durch das
Selektionsverfahren der zirkularen Gruppenreduktion nicht erreicht worden. Es stellte sich
sogar das Gegenteil heraus. Mit diesem Verfahren, das die mittlere euklidische Distanz der
selektierten Vektoren maximiert, werden nicht repräsentative, sondern extreme Vektoren
selektiert (Kap.4.3.3). Sie sind um so extremer, je größer die Gruppe gewählt wird. Da sich
diese Arbeit vornehmlich auf die Vorhersage von Standardsituationen konzentriert, schien das