102
Verfahren der zirkularen Gruppenreduktion für eine Selektion von Lernvektoren ungeeignet.
Um Lernvektoren zu selektieren, die für die geordnete Menge aller Zeitmustervektoren
repräsentativ sind, wurde auf andere Verfahren hingewiesen, die schon existieren. Diese
geordnete Menge mit Zeitmustervektoren der Gesamtlänge L kann als ein L-dimensionaler
Vektorraum aufgefaßt werden, in dem die Vektoren unregelmäßig verteilt sind. Die Suche
nach Repräsentanten dieses Raums kann als ein Multizentrumsproblem aufgefaßt werden.
Innerhalb des Raums werden L-dimensionale Kugeln, die sämtliche Vektoren beinhalten, auf
solche Weise gesucht, daß der Kugelradius minimal wird. Die Vektoren an den Mittelpunkten
dieser Kugeln sind dann die gesuchten Repräsentanten. Mit dieser groben Beschreibung wird
ein Beispiel für die prinzipielle Verfahrensweise der automatischen Klassifikation bzw. Clu
steranalyse gegeben [Bandelt, tel. Komm.]. Aus diesem Spezialgebiet der Mathematik wurde
ein Verfahren ausgewählt, etwas modifiziert und für die Selektion der Lernvektoren einge
setzt.
Mit Hilfe dieses Verfahrens konnten Lernvektoren selektiert und von Kohonen-Netzen
angelernt werden, deren Vorhersagefehler dadurch weiter gesenkt werden konnte. Der
Vorhersagefehler des Wasserstandsvorhersagedienstes war aber damit immer noch nicht
erreicht worden. Um den Vorhersagefehler der Netze weiterhin zu senken, wurden andere
Modellparameter getestet (Kap.5.3 und Kap.5.5). Erst durch Variation dieser Modellparameter
war es möglich geworden, den Vorhersagefehler des Dienstes zu erreichen. Dabei wurde nur
mit Hilfe des Verfahrens der Clusteranalyse selektiert. Das Selektionsverfahren der zirkularen
Gruppenreduktion kann aber mit diesem Verfahren kombiniert werden. D.h. ein Teil der ge
wünschten Lernvektoren kann mittels des Verfahrens der zirkularen Gruppenreduktion und
der restliche Teil mittels des Verfahrens der Clusteranalyse selektiert werden. Erst als beide
Verfahren zusammen auf diese Weise für die Selektion verwendet worden waren, war es
sogar möglich geworden, den Vorhersagefehler des Dienstes zu unterschreiten (Kap.5.5). Aus
diesem Grunde wurde das zirkulare Gruppenreduktionsverfahren nicht vergessen und bereits
oben quantitativ beschrieben. Das Verfahren der Clusteranalyse wird im nächsten Abschnitt
quantitativ beschrieben (Kap.4.3.2). Der Erfolg, der erst durch die Kombination beider Ver
fahren möglich wurde, hing aber sehr stark vom gewählten Zeitmuster ab. D.h. in Abhängig
keit vom Zeitmuster reichte das Konzept der Repräsentativität für die Selektion aus oder auch
nicht. Anders herum kann in Abhängigkeit vom Zeitmuster das Verfahren der zirkularen
Gruppenreduktion das Clusteranalyse-Verfahren ergänzen oder auch nicht. Warum das so ist,
wird in der vorliegenden Arbeit nicht behandelt. In Kap.5 und zum Teil auch in Kap.4
werden nur die Ergebnisse dargestellt, die sich in Abhängigkeit vom Zeitmuster ergeben
haben.
4.3.2. Minimaldistanz-Verfahren
Neuronale Netze können klassifizieren. Doch bevor die Netze als Verfahren, die nach neu
artigen Prinzipien klassifizieren, praktische Bedeutung erlangten, existierte schon eine große
Menge an herkömmlichen statistischen Verfahren zur automatischen Klassifikation bzw.
Clusteranalyse. In der Art und Weise, wie die neuronalen Netze auf die Wasserstandsvorher-
sage angewandt werden, stellt die Selektion von Lernvektoren mittels solch eines herkömm
lichen Verfahrens somit eine Art "Vorklassifikation" dar, bevor die eigentliche Klassifikation
mittels neuronaler Netze beginnt.
Es wäre natürlich denkbar, auf die Selektion der Lernvektoren, d.h. auf die Reduktion des
Datensatzes selbst auch neuronale Netze anzuwenden. Es existiert ein Spezialfall der selbst
organisierenden Merkmalskarten bzw. Kohonen-Netze, mit dessen Hilfe die Vektoren