79
4.2.3. Trendelimination
Verschiedene Gründe führen zu der Notwendigkeit einer Trendanalyse. Will man z.B. die
Abhängigkeiten zwischen den Zeitpunkten einer Zeitreihe untersuchen, muß gegebenenfalls
eine Trendbereinigung vorgenommen werden. Bei Zeitreihen, die einen Trend aufweisen, ist
die Autokorrelationsfunktion nicht geeignet, die Abhängigkeiten zwischen den Zeitpunkten
zu beschreiben [Schlittgen et ah 94]. Über diesen statistischen Grund hinaus existieren auch
Gründe für eine Trendbereinigung, die speziell durch die neuronalen Netze bedingt sind.
Netze, die trendhafte Daten lernen, nehmen an, daß der Trend eine wichtige Information sei
und versuchen, ihn für die Vorhersage anzulernen. Allerdings geschieht das Lernen in diesem
Fall auf Kosten der feineren Details, so daß die Vorhersagegenauigkeit darunter leidet.
Warum beides nicht gleichermaßen angelernt werden kann, liegt daran, daß die neuronalen
Netze nichtlinear sind. Wenn die Netze einen Trend in den Daten mitlernen, der die Größen
ordnung der feineren Details übersteigt, wird der Lernprozeß der Netze dazu tendieren, die
Variationen in den Daten herunter zu skalieren. Auf diese Weise werden die Feinheiten in
den Daten der Vorzüge der Nichtlinearität beraubt und die Vorhersagegenauigkeit der Netze
nimmt ab. Der Trend kann mit Verfahren vorhergesagt werden, die im Vergleich zu neurona
len Netzen wesentlich einfacher sind. Damit die Netze sich auf die feineren Details "konzen
trieren" können, muß daher vor dem Lernen eine Trendbereinigung vorgenommen werden.
Nach dem Lernen können die Prognosen der einfacheren Verfahren auf die Vorhersagen der
Netze aufaddiert werden [Masters 93].
Diese Gründe für eine Trendbereinigung wurden zwar im Zusammenhang mit Back-
propagation-Netzen geäußert, können aber genausogut auf Kohonen-Netze übertragen werden.
Außerdem kann das, was speziell über Trends ausgesagt wurde, verallgemeinert werden.
Trends sind lineare Komponenten in den Daten, doch nicht nur sie, sondern z.B. auch
harmonische Schwingungen. Sie sind z.B. als Gezeiten in den Pegelmessungen vorhanden
und können durch Subtraktion der Gezeitenvorausberechnungen eliminiert werden.
Ein Trend, der in der Regel polynomial ist, kann mit Hilfe eines linearen Regressions
modells aus den Daten berechnet werden. Dazu werden die entsprechenden Koeffizienten des
Modells mit Hilfe der kleinsten quadratischen Abweichung an die Daten angepaßt. Es wurden
Koeffizienten angepaßt, die dem Modell einer Geraden entsprechen (linearer Trend). Eine
Gerade im Raum der Zeitreihe (ozeanographisch/meteorologische Größe gegen die Zeit) wird
durch die beiden Koeffizienten Offset (Einheit der entsprechenden Meßgröße) und Steigung
bestimmt (Maßeinheit pro Zeiteinheit). Solch eine Gerade wurde nicht nur an die Zeitreihen
der meteorologischen Größen, sondern auch an die Zeitreihe des Staus bei Cuxhaven ange
paßt.
Die mit Hilfe des linearen Regressionsmodells pro Zeitreihe berechneten Geraden wurden
jeweils von den Reihen subtrahiert, d.h. der Trend wurde jeweils eliminiert. Bei den Größen,
die an unterschiedichen Orten gemessen wurden (statischer Luftdruck und seine Änderung in
Nordwest-Europa), wurden zuerst die Geraden berechnet, ihre Koeffizienten gemittelt und
erst dann die so gemittelte "globale" Gerade von den entsprechend beteiligten Zeitreihen
abgezogen. Auf diese Weise blieben lokale Unterschiede erhalten. Im folgenden ist mit
"Trend" teilweise nur die Steigung der Regressionsgeraden gemeint. Solche Trends sind in
Tab.4.1 aufgelistet.