70
gangenheit gelernt werden kann (Kap.3.2), ausreichende Gültigkeit hat. Aus den beschriebe
nen Gründen wird zuerst die Vorbereitung inkl. Vorverarbeitung der Daten, d.h. der Zeitrei
hen, vorgestellt (in diesem Abschnitt: Kap.4.2) und erst dann die Selektion der Daten (im
nächsten Abschnitt: Kap.4.3).
In Kap.2.1.4 wurde darauf hingewiesen, daß sich das Verhalten chaotischer Systeme in
einem Frequenzspektrum äußert, das bei allen Wellenlängen Energien aufweist (Breitband
spektrum). Aufgrund dessen werden in Kap.4.2.1 Spektren der in Kap.4.1.1 und Kap.4.1.2
vorgestellten Zeitreihen gezeigt. Ein breitbandiges Spektrum ist ein erster Hinweis auf einen
zugrundeliegenden stochastischen Prozeß. Ein zweiter Hinweis folgt aus den Voraussetzun
gen, die für das Training von Kohonen-Netzen nötig sind. Bei der Vorstellung der sensori
schen Karten wurde erwähnt, daß für das neuronale Modell von Kohonen die Eingangssignale
v als voneinander unabhängige Zufallsvariable aus einem Vektorraum V behandelt werden,
deren Auftreten durch eine Wahrscheinlichkeit P(v) bestimmt wird (Kap.3.6.1). Der zentrale
Grenzwertsatz besagt, daß eine resultierende Zufallsvariable, die sich additiv aus unabhängi
gen Einzelwirkungen zusammensetzt, als angenähert normalverteilt angenommen werden
kann. Aus diesem Grunde wird zusätzlich zum Spektrum auch die Verteilung der Original
zeitreihen betrachtet. Ist die Verteilung normal, ist der zugrundeliegende Prozeß stochasti
scher Natur und man erhält eine Gauß'sche Zufallsvariable. Diese Verteilung wurde erst von
Francis Galton (1822-1911) um 1880 als Normalverteilung bezeichnet. Heute nennt man sie
zu Ehren von Carl Friedrich Gauß (1777-1855) manchmal auch Gaußverteilung [Hartung et
al. 82], [Bronstein et al. 81]. Beide Namen werden in austauschbarer Weise im folgenden
verwendet. Somit wird eine Überprüfung auf Gauß’sche Zufälligkeit der Daten bzw. Zeitrei
hen anhand ihrer Spektren und Verteilungen vorgenommen (Kap.4.2.1).
Die Bedeutung der Normalverteilung für die Statistik hat über den zentralen Grenzwertsatz
hinaus noch weitere Gründe. Die statistische Theorie normal verteilter Beobachtungen ist am
weitesten entwickelt. Beobachtungen, die keiner normalverteilten Grundgesamtheit ent
stammen, lassen sich in vielen Fällen durch geeignete Transformation in Daten aus einer
Normalverteilung überführen. Außerdem lassen sich Daten einer Normalverteilung, die durch
die beiden Momente Mittelwert und Standardabweichung eindeutig festgelegt ist, stets in
Daten einer Standardnormalverteilung transformieren (Mittelwert=0, Standardabweichung=l)
[Hartung et al. 82].
Die wichtigste Rolle aber spielt die Normalverteilung im Zusammenhang mit dem
Algorithmus der Kohonen-Netze. In dem Lernalgorithmus der sensorischen und motorischen
Karten wird als Metrik die euklidische Distanz verwendet [3.10]. Die Metrik wurde zwar aus
bestimmten Gründen erweitert [3.9], entspricht aber noch im wesentlichen der euklidischen
Distanz (Kap.3.6.4). Diese Distanz wird auch als L 2 -Norm bezeichnet (die 2 bezieht sich auf
das Quadrat der Differenzen und die Quadratwurzel). In der Inverslheorie haben Nonnen
große Bedeutung. In dieser Theorie wird versucht, Parameter von Modellen auf gemessene
Daten hin anzupassen. Dabei können verschiedene Normen verwendet werden. Die Modell
parameter werden mit Hilfe der L 2 -Norm dann am besten approximiert, wenn die gemessenen
Daten normal- bzw. Gaußverteilt sind. Mit Hilfe der L,-Norm (Betrag der Differenzen und
keine Wurzel) z.B. dagegen werden die Modellparameter am besten approximiert, wenn die
Daten der Laplace-Fehlerverteilung gehorchen [Hajagos et al. 91].
In die Metrik des Kohonen-Algorithmus’, die im wesentlichen der L 2 -Norm entspricht,
gehen die Differenzen zwischen den Komponenten zweier Vektoren quadratisch ein. Wenn
eine Differenz gegenüber den anderen heraussticht, dominiert sie durch die Quadrierung die
gesamte euklidische Distanz. Somit reagiert die L 2 -Norm sehr empfindlich u.a. auf Ausreißer
in den Zeitreihen. Kohonen-Netze verlieren ihre Generalisierungsfähigkeit, wenn in den