195
wie möglich verringert werden. Dazu dient das Programm "p_v.c" (unter "annu") (Pegel/Vor
ausberechnung). Auch in diesem Fall müssen die Messungen wieder mit Hilfe von "utc.c"
(unter "annu") von MEZ auf UTC verschoben werden. Es müssen die Zeiten und damit die
Zeilen in diesem Standardformat gesucht werden, wenn der Pegel ausgefallen ist und daher
keine Messungen vorhegen (z.B. mit Hilfe des "grep"-Kommandos). Es wird empfohlen, die
Lücken mit Hilfe des Gesamtansatzes, d.h. des Polynoms [2.1] zu füllen. Er wurde im
Programm "ges.c” implementiert. Wie die Daten für dies Programm aufbereitet werden, wird
im nächsten Abschnitt erklärt.
Datenvorverarbeitung und Selektion: Das C-Programm für die Datenvorverarbeitung und
Selektion heißt "sel.c" (unter "ges"). Es ist das größte von allen und kann mit Hilfe der
Option eine Liste aller verfügbaren Optionen ausgeben. Um dieses Programm zu steuern,
sind mehrere Steuerdateien erforderlich. Das Programm sucht nach Dateinamen, die aus zwei
Teilen bestehen. Im ersten Teil wird der Name des Programms selbst verwendet (z.B. "sei").
D.h. wird das Programm umbenannt, müssen auch die Steuerdateien entsprechend umbenannt
werden. Der zweite Teil der Dateinamen wird vom ersten Teil durch einen Punkt getrennt.
Dabei werden drei Arten von Steuerdateien unterschieden. Die erste ist eine Kontrolldatei
("ctl"), z.B. "sel.ctl". In dieser Datei stehen vier Angaben pro Zeile. Die Anzahl Zeilen ist
beliebig. An erster Stelle steht ein Kürzel. An zweiter Stelle folgt die Anzahl Zeitpunkte des
Indikationszeitraums des jeweiligen Zeitmusters (d.h. "18" für das autoregressive und "1" für
das multiregressive Zeitmuster). An dritter Stelle steht der entsprechende Zeitversatz ab
züglich einer eins. Und an vierter Stelle folgt die Anzahl Zeitpunkte des Prognosezeitraums
des jeweiligen Zeitmusters (s.o.). Für die neuronalen Netze, die stündliche Stauwerte bei
Cuxhaven Vorhersagen, sieht die Kontrolldatei folgendermaßen aus:
C 2 0 18.
Für die neuronalen Netze, die den Stau bei Cuxhaven zu Hoch- und Niedrigwasserzeitpunk
ten Vorhersagen, wird jeweils die gleiche Kontrolldatei verwendet. Sie lautet:
g14715 1 2 0
r14715 1 2 0
T 13 0
C 0 0 1.
In der zweiten Steuerdatei sind die Methoden zur Steuerung der Selektionsverfahren angege
ben ("meth"), z.B. "sel.meth". Im ersten Teil stehen die Angaben für die Trainingsvektoren
und im zweiten Teil die für die Validationsvektoren. Durch die Einführung des Standardver
gleichsjahres sind die Angaben für die Validationsvektoren zwar hinfällig, müssen aber aus
historischen Gründen in dieser Datei mitgeführt werden. Es sei denn, "sel.c" wird entspre
chend geändert. In der ersten Zeile von "sel.meth" steht die Gesamtzahl der gewünschten
Anzahl Trainingsvektoren. In den nächsten Zeilen stehen die Anzahlen, die durch das
jeweilige Verfahren selektiert werden sollen. Nach den Anzahlen steht jeweils eine Nummer
für das entsprechende Verfahren. Es wird unterschieden zwischen einer "3" für das Minimal
distanzverfahren (MD) und einer "2" für das zirkulare Gruppenreduktionsverfahren (ZGR).
Bei diesem Verfahren steht nach der "2" auch noch die Gruppengröße. Beispielsweise wurde
für das optimale neuronale Netz, das den Stau zu Hochwasserzeitpunkten vorhersagt,
folgende Methodendatei verwendet: