18
wurde in Anlehnung an Kap.2.1.4 gewählt, um die Verwendung von Messungen von der
Verwendung von Vorhersagen abzugrenzen.
Im Sinne der Terminologie der Hydrodynamik lassen sich die meteorologischen Größen
als "prognostische" Variablen auffassen und der Stau als eine "diagnostische", der aus den
vorhergesagten meteorologischen Größen mit Hilfe des multiregressiven Zusammenhangs
berechnet wird. Für die Vorhersage des Staus wird somit eine Zusatzprognose benötigt,
nämlich die Vorhersage der meteorologischen Größen. Das Problem der Vorhersage an sich
wird dabei aber nur verlagert. Die Vorhersage des Staus wird auf die Vorhersage der
meteorologischen Größen (hauptsächlich des Windes) geschoben. In Kap.2.1.7 wurde die
Annahme erwähnt, daß der Zusammenhang zwischen Wind und Stau nun genau genug
bekannt sei. Das hieße, daß für eine Verbesserung der Stauvorhersage nur noch eine Verbes
serung der Windprognose als Eingabe für das multiregressive Modell nötig sei. Es soll aber
in dieser Arbeit u.a. getestet werden, ob neuronale Netze den multiregressiven Zusammen
hang zwischen Wind und Stau nicht doch noch verbessern können.
Um sowohl den Darstellungs- als auch den Vorhersagefehler zu berechnen, muß der Stau,
der für die Bildung der Residuen nötig ist, bereits gemessen sein. Das ist nur möglich, wenn
Vorhersagen von einem bereits vergangenen Zeitpunkt aus in die schon bekannte Zukunft
hinein erstellt werden. Dieser Vorhersagemodus wird mit Hindcast bezeichnet. Dagegen
beschreibt der Begriff Forecast den Modus, Vorhersagen von der aktuellen Gegenwart aus in
die noch unbekannte Zukunft hinein zu treffen. Forecast ist das, was Tag für Tag im Wasser
standsvorhersagedienst abläuft. Der Vorhersagefehler wird aber im Hindcast berechnet, um
den Vorhersagefehler im Forecast im voraus etwas abzuschätzen. Es sei darauf hingewiesen,
daß beide Vorhersagemodi (Hindcast und Forecast) in dieser Arbeit eine "out of sample"-
Vorhersage beschreiben im Gegensatz zu anderen Definitionen, in denen der Hindcastmodus
als eine "within sample"-Vorhersage definiert wird [Ziehmann-Schlumbohm 94]. Eine "out
of sample"-Vorhersage bedeutet, daß die Validations- und Vorhersagedatensätze nicht Teil
des Trainingsdatensatzes sind.
2.2.2. Zeitreihen und Zeitfenster
Bei statistischen Verfahren spielen Zeitreihen von beliebigen meßbaren Größen und Zeitfen
ster eine wesentliche Rolle. Es kann zwischen zwei Arten von Zeitreihen unterschieden
werden. Mit Prognosezeitreihen werden in dieser Arbeit diejenigen Zeitreihen bezeichnet, die
verlängert werden sollen. D.h. die über die Zeit immer wieder gemessene Größe soll vorher
gesagt werden. Diese Größe wird entsprechend als Prognosegröße bezeichnet. Mit Indika
tionszeitreihen werden diejenigen Zeitreihen bezeichnet, die auf die Prognosezeitreihen einen
Einfluß haben. Im Anschluß an das obige Beispiel (Kap.2.2.1) wird die Zeitreihe des Staus
zur einzigen Prognosezeitreihe, und die Zeitreihen des vektoriellen Windes (je eine Zeitreihe
für Richtung und Geschwindigkeit) werden zu Indikationszeitreihen. Der Wind ist in diesem
Beispiel entsprechend eine Indikationsgröße. Leider beißt sich diese Terminologie mit der
Terminologie der Hydrodynamik (Prognosegröße - prognostische Variable) (Kap.2.2.1).
Trotzdem wird die erstere beibehalten und auf die Terminologie der Hydrodynamik ver
zichtet. Verglichen mit den Begriffen der multiplen Regression in der Statistik entsprechen
die Indikationsgrößen den Regressoren oder den exogenen Variablen und die Prognosegröße
dem Regressanden oder der endogenen Variable [Hartung et al. 92]. Neuronale Netze können
auf multiregressive Weise angewandt werden (siehe z.B. [Masters 93]).
Die multiple Regression verarbeitet Zeitreihen von verschiedenen Größen gleichzeitig. In
dies Verfahren gehen Messungen ein, die aus den Zeitreihen mittels eines verschiebbaren