59
4. Daten
In diesem Kapitel werden die Daten beschrieben, die für das Training der Kohonen-Netze
verwendet wurden. Zuerst folgt eine Beschreibung der Zeitreihen der verschiedenen meteoro-
logisch/ozeanographischen Größen, die für das Training ausgewählt wurden (Kap.4.1).
Aufgrund ihrer Wirkungsweise und ihres Algorithmus’ stellen die Kohonen-Netze bestimmte
Anfordungen an die Trainingsdaten. Um diese Voraussetzungen zu erfüllen, müssen die
Daten auf besondere Weise vorbereitet werden. Zu dieser Vorbereitung zählen eine gründli
che Datensäuberung (Kap.4.2.2), eine Trendelimination (Kap.4.2.3) und eine besondere Form
von Vorbereitung, die Vorverarbeitung genannt wird (Kap.4.2.4). In der Einleitung zu
Kap.4.2 wird begründet, warum der darauf folgende Abschnitt der Selektion (Kap.4.3) erst
nach Kap.4.2 folgt. Dabei wird auf das Wechselspiel mit Kap.5 hingewiesen, das in engem
Zusammenhang mit den Kap.4.2 und 4.3 steht. Dadurch ließ es sich nicht vermeiden, daß
manche Ergebnisse der vorliegenden Arbeit bereits in Kap.4 vorgestellt werden. Die Reihen
folge der Kap.4.1, 4.2 und 4.3 entspricht genau der Reihenfolge der bei der Datenbehandlung
durchgeführten Schritte.
4.1. Basis
Werden neuronale Netze auf Gebiete angewandt, wo nicht klar ist, welche Meßgrößen auf die
Prognosegröße eine Wirkung haben, müssen zuerst die zur Verfügung stehenden Zeitreihen
verschiedener Meßgrößen durch statistische Verfahren auf ihre Eignung als Indikationszeitrei
hen hin geprüft werden. In dem Fall der Anwendung auf die Wasserstandsvorhersage wurden
diese Verfahren bereits in der Vergangenheit durchgeführt [Annutsch 77]. Die resultierenden
Indikationsgrößen werden übernommen in dem Glauben, daß die Ergebnisse statistisch
haltbar und wissenschaftlich fundiert sind (Kap.2.1.3). Die Größen sind für den Operationellen
Dienst des BSH (d.h. für den Forecastmodus) verfügbar.
In Kap.2.1.4 wurde der Gesamtansatz als ein statistisches Verfahren vorgestellt, das die
Indikationsgrößen mit der Prognosegröße auf multiregressive Weise miteinander verknüpft.
Aus sechs Eingabegrößen wird eine Ausgabegröße erzeugt. Um für den Gesamtansatz einen
Vorhersagefehler im Hindcastmodus zu berechnen, sind nicht nur die sechs Indikations
zeitreihen erforderlich, sondern auch eine Prognosezeitreihe. Neuronale Netze weisen eine
sehr viel größere Verwandtschaft mit statistischen als mit hydrodynamischen Modellen auf
(Kap.2.2). Daher liegt es als ein erster Ansatz nahe, für die neuronalen Modelle, d.h. für die
Verknüpfung von Zeitmustern mit den neuronalen Netzen (Kap.2.2.3), die gleichen Eingabe
daten wie für den Gesamtansatz zu verwenden. Für die Berechnung des Vorhersagefehlers im
Hindcastmodus werden für die neuronalen Netze dann ebenfalls Ausgabedaten benötigt. An
ders formuliert kann ein neuronales Modell auf Basis eines multiregressiven Zeitmusters
erstellt werden, das die gleichen Zeitreihen wie der Gesamtansatz als Ein- und Ausgabe
benötigt. Als Ausgabe bzw. als Prognosezeitreihe sind daher Messungen des Pegelstandes bei
Cuxhaven erforderlich. Diese Zeitreihe und die astronomischen Vorausberechnungen für
diesen Ort werden in Kap.4.1.1 beschrieben. Als Eingaben bzw. als Indikationszeitreihen
werden entsprechend Messungen des Windes, des Luftdrucks und der Temperatur (von Luft
und Wasser) an bestimmten Meßorten gebraucht. Diese Zeitreihen werden in Kap.4.1.2 be
schrieben.
Im Gegensatz zu den hydrodynamischen Modellen, die als Ein- und Ausgabe Zeitreihen
zwei- und dreidimensionaler Felder benötigen, können in den Gesamtansatz und in das
entsprechende multiregressive neuronale Modell nur Zeitreihen von Skalaren eingegeben