75
4.2.2. Ausreißer und Lücken
Bei der Vorstellung der meteorologischen Zeitreihen in Kap.4.1 wurden Prozeduren beschrie
ben, mit denen Ausreißer auf allgemeine Weise beseitigt werden. Diese Prozeduren grenzen
im wesentlichen den Meßbereich auf einen akzeptablen Wertebereich ein und eliminieren
somit alle Ausreißer, die außerhalb dieser Grenzen liegen. In diesem Abschnitt werden über
diese allgemeine Behandlung hinaus Verfahren vorgestellt, mit denen Ausreißer individuell
behandelt werden. Sie werden aus den Zeitreihen herausgesucht und anschließend beurteilt.
Ausreißer zu finden und zu beurteilen, d.h. sie als reale Beobachtung oder als Fehler zu
identifizieren, ist eine sehr schwierige und aufwendige Angelegenheit. Prinzipiell können
zwei Wege beschritten werden: ein statistischer und ein dynamischer Weg. Wird nur der
statistische Weg beschritten, können Ausreißer durch einen Vergleich der Datenverteilung mit
einer vermuteten theoretischen Verteilung beurteilt werden. Dabei ist die Ausreißererkennung
einfacher, wenn die Datenverteilung symmetrisch ist. Wenn sie es nicht ist, muß sie zuerst
durch geeignete Datentransformationen in eine symmetrische Verteilung (in der Regel in die
Normalverteilung) überführt werden [Schlittgen 91]. Ausreißer befinden sich in den beiden
asymptotischen Enden bzw. "Schwänzen" der Datenverteilung und können daher mit den
Schwänzen der theoretischen glockenförmigen Normalverteilung verglichen und beurteilt
werden. Damit kann auch gesagt werden, daß die Schwänze einer Datenverteilung, in denen
sich die Ausreißer befinden, eine beträchtliche Wirkung auf den Kohonen-Algorithmus haben
(siehe die Diskussion der Windrichtung in Kap.4.2.5). Da aber Ausreißer manchmal nur
durch den zeitlichen Kontext beurteilt werden können und das rein statistische Verfahren der
Ausreißeranalyse diesen Kontext nicht berücksichtigt, wurden stattdessen Verfahren benutzt,
die sowohl den statistischen als auch den dynamischen Weg in Kombination beschreiten.
Im Gegensatz zum statistischen wird beim dynamischen Weg Rücksicht auf physikalische
Plausibilität innerhalb der Zeitreihe einer Größe und zusätzlich auf die dynamische Wechsel
wirkung mit anderen Größen genommen. Allerdings blieb die Rücksichtnahme auf die
dynamische Wechselwirkung mit anderen Größen aufgrund des Aufwands nur auf einen Fall
beschränkt. In diesem Fall wurde die Plausibilität des Verhaltens der Lufttemperatur bei einer
Wetterstation für einen kurzen Abschnitt der Zeitreihe geprüft. Das Verhalten der Lufttem
peratur war plausibel, da ein Tiefdruckgebiet hindurchgezogen war. In allen anderen Fällen
wurde nur die physikalische Plausibilität innerhalb der Zeitreihe einer Größe geprüft.
Als Plausibilitätskriterien wurden vor allem eine gewisse Glätte des zeitlichen Verhaltens
unterstellt und im Falle der Pegeldaten besonders die harmonische Monotonie. Mit Hilfe des
ersten Kriteriums ließen sich z.B. Verrutscher im Synop-Format erkennen. Die Angaben für
die Temperatur standen zum Teil da, wo normalerweise diejenigen des Windes stehen.
Außerdem war die Windgeschwindigkeit teilweise in ihrer Einheit inkonsistent eingetragen.
Unter Berücksichtigung solcher Fehler wurden aufgrund des Glättekriteriums weitere Unge
reimtheiten entdeckt. Als ein Beispiel sei wieder die Windgeschwindigkeit angeführt. In
einem kurzen Abschnitt der Zeitreihe schnellte die Geschwindigkeit innerhalb von zwei
Stunden von 30 kn auf 60 kn und wieder auf 30 kn zurück. Dieser Fall wurde als sehr
unplausibel betrachtet, d.h. als Fehler behandelt. Es sei aber bemerkt, daß das Seewetteramt
aufgrund seiner Erfahrung in letzter Zeit dazu neigt, dem Beobachter mehr zu glauben
[Knuth. tel. Komm.]. Das hieße, daß evtl, auch solche Sprünge wirklich geschehen sein
könnten. Es wurde aber an dem Glättekriterium festgehalten, da es in dieser Arbeit mehr auf
die Standardfälle und weniger auf die Extremfälle ankommt.
Zusätzlich zum Glättekriterium wurde bei der Säuberung der Pegeldaten das Kriterium der
harmonischen Monotonie angewandt, d.h. der Monotonie relativ zu den regelmäßigen