76
Schwingungen der Gezeiten. Da die Bewegungen des Wassers im Verhältnis zur Luft recht
träge sind, kann es bei Standardwettersituationen nicht innerhalb von zwei bis drei Stunden
zwei Hochwasser geben. Außerdem kann das Wasser in solchen Situationen nicht zwei Meter
pro Stunde steigen oder sinken. Durch diese Kriterien konnten "Meterfehler" ausfindig
gemacht werden. D.h. bei der manuellen Eingabe (beim "Eintippen") des dreistelligen
Pegelstandes in Zentimeter über Pegel Null, der vom BSH-internen Pegelschreiber abgelesen
wurde, war es durchaus möglich, daß falsche Tasten erwischt worden waren. Aufgrund der
Kriterien ließen sich aber nur "Meterfehler", d.h. Fehler in der ersten der drei Ziffern
erkennen, aber keine kleineren wie z.B. "Dezimeterfehler", d.h. Fehler in der zweiten der drei
Ziffern. In Extremwettersituationen allerdings ist es möglich, daß das Wasser zwei Meter pro
Stunde steigen kann. Als Beispiel sei die Sturmflut vom 13./14.01.1993 erwähnt. Während
dieser Zeit stieg das Wasser bei Cuxhaven innerhalb von zwei Stunden um vier Meter. Diese
Messungen waren keine Meterfehler, sondern sind physikalisch plausibel.
Um die Plausibilitätskriterien anwenden zu können, war es nötig, daß die Ausreißer zur
Beurteilung ihrer realen Relevanz zuerst in den Zeitreihen gefunden werden mußten. Dies
geschah mit Hilfe von statistischen Methoden. Um den zeitlichen Zusammenhang zu wahren,
wurden die Zeitreihen tageweise untersucht. Das bot sich an, da sämtliche Zeitreihen auf ein
einheitliches Format gebracht wurden: Ein Tag, d.h. 24 Stunden pro Datensatz. Aus den 24
Werten eines Tages zuzüglich des letzten Wertes des vorigen Tages und des ersten Wertes
des folgenden Tages wurden jeweils absolute Differenzen von zwei direkt aufeinander folgen
den Werten gebildet. Aus den Differenzen wurden anschließend Mittelwert und Standard
abweichung berechnet. Sämtliche Differenzen wurden mit dem Mittelwert plus eines frei
wählbaren Vielfachen der Standardabweichung verglichen. Lag mindestens eine Differenz
darüber, wurde der Datensatz zur Beurteilung extrahiert. Innerhalb dieses Datensatzes ließen
sich dann die Plausibilitätskriterien anwenden. Dabei ist das frei wählbare Vielfache abhängig
von dem zeitlichen Aufwand, den man bereit ist zu investieren. Je kleiner das Vielfache
gewählt wird, desto größer ist die Wahrscheinlichkeit, plausible Messungen zu extrahieren.
Um das Verhältnis von plausiblen zu nicht plausiblen Messungen zu beleuchten, seien als
Beispiel die Messungen des Pegels bei Cuxhaven angeführt. Bei einem Vielfachen von drei,
d.h. bei einem Vergleich der absoluten Differenzen mit dem Mittelwert plus dreifacher
Standardabweichung wurden 16 Fälle extrahiert. Davon waren neun Fälle plausible Messun
gen und sieben Fälle "Meterfehler". Dieses tageweise Verfahren wurde auf alle vorgestellten
meteorologischen Zeitreihen und auf die des Pegels bei Cuxhaven angewandt.
Da die zuletzt genannte Zeitreihe für alle beschriebenen Zeitmuster gebraucht wird, wurde
sie gründlicher auf Ausreißer hin untersucht als die anderen Zeitreihen. Dazu wurde ein
weiteres statistisches Verfahren zur Suche nach Ausreißern entwickelt. Dieses Verfahren
wurde aber nicht speziell für diesen Zweck entwickelt, sondern ergab sich als Nebenprodukt
während der Entwicklung eines Verfahrens für die Datenreduktion bzw. Datenselektion, die
in Kap.4.3 beschrieben wird. Auch wenn dieses Verfahren nur ein Schritt während der
Entwicklung des Selektionsverfahrens war, so wird es dennoch hier beschrieben, da mit
seiner Hilfe weitere Meterfehler in den Pegeldaten erkannt wurden.
Es wird vorausgesetzt, daß die Pegelzeitreihe als Zeitmustervektormenge organisiert
vorliegt. Da nur eine einzige Zeitreihe betrachtet wird, besitzen die Zeitmustervektoren die
Gestalt von univariaten Zeitmustern. Dabei sind die effektive Musterlänge m und die
Vektorlänge gleich. Aus der Pegelzeitreihe werden somit Zeitfenster mit der Länge m ausge
schnitten, die sich überlappen, wenn m > 1. Wird aus den Werten von zwei z.B. direkt
aufeinander folgenden Zeitfenstern eine Korrelation (Korrelationskoeffizient nach Pearson)
ausgerechnet, wird die Korrelation aufgrund der harmonischen Monotonie recht hoch sein