86
teilungen gleich schief sind (analog zu bimodalen Verteilungen, siehe oben). Damit ist jedoch
noch die Voraussetzung verletzt, daß die Daten einen möglichst zufälligen Prozeß im Sinne
einer Gauß’sehen Zufallsvariablen widerspiegeln müssen. Daraus folgt, daß die Daten Ver
teilungen alle möglichst der Normal Verteilung gehorchen müssen. Dazu muß eine evtl,
vorhandene Schiefe in den Daten so weit wie möglich reduziert werden.
Eine Möglichkeit, die Schiefe zu erfassen, bieten die Begriffe und Methoden der explorati-
ven Datenanalyse und der robusten Verfahren. Die robuste Statistik hat den Vorteil, daß sie
Ausreißern gegenüber unempfindlich ist [Hartung et al. 86]. Grob erklärt beruhen die für die
Beschreibung von Verteilungen wuchtigen Kenngrößen nicht auf der Summation von Meß
werten (Erwartungswert und Varianz), sondern auf ihrem Rang. D.h. die Meßwerte werden
vorab nach ihrer Größe sortiert. Jedem Wert in dieser Rangfolge kann eine Zahl a e R mit
a e (0,1] zugeordnet werden, die sich aus ihrer relativen Stellung in der geordneten Reihe
(ihrem Rang) und der Gesamtzahl aller Werte ergibt. Der Wert selbst wird dann mit a-
Quantil bezeichnet. Das Quantil mit a = 0.5 entspricht dem Erwartungswert und wird als
"Median" bezeichnet. Bei symmetrischen Verteilungen (z.B. bei der Normalverteilung) sind
Erwartungswert und Median gleich. Bei Verteilungen, deren Maximum der Wahrschein
lichkeitsdichte nach "links" verschoben ist ("rechtsschiefe" Verteilung), ist der Median größer
als der Erwartungswert. Bei linksschiefen Verteilungen ist der Median kleiner als der Erwar
tungswert [Schlittgen 91].
Die Schiefe kann mit Hilfe von nichtlinearen Transformationen der Daten reduziert
werden. Nichtlineare Transformationen sind im wesentlichen Potenztransformationen. Die
Werte x, (i=l,...n) einer Zeitreihe der Länge n werden einzeln mit einem bestimmten Expo
nenten p e R potenziert. Eine Potenztransformation mit p=0 würde die gesamte Zeitreihe
vernichten. Darum wird bei p=0 stattdessen der natürliche Logarithmus verwendet:
(4.1)
Für p < 1 bewirken die Potenztransformationen, daß große Werte stärker zusammengedrückt
werden. Die logarithmische Transformation spielt insofern eine Sonderrolle, als Werte nahe
bei Null zusätzlich entzerrt werden. Negative Exponenten haben qualitativ dieselbe Wirkung
wie der Logarithmus. Rechtsschiefe Verteilungen werden also tendenziell durch Anwenden
einer Potenztransformation mit p < 1 symmetrischer. Für p > 1 ergibt sich der umgekehrte
Effekt. Werte, die im oberen Bereich liegen, werden stärker auseinandergezerrt als Werte, die
näher bei Null liegen. Solche Transformationen sind geeigneter, um linksschiefe Verteilungen
in symmetrische zu transformieren [Schlittgen 91].
Die Transformationen unterscheiden sich in der Stärke des besprochenen Effektes. Je nach
Ausprägung der Schiefe muß dann ein größeres bzw. kleineres p gewählt werden, um die
gewünschte Symmetrie zu erreichen. Die bisherigen Ausführungen zeigen zwar in die
Richtung, in der eine geeignete, symmetrie-herstellende Transformation gesucht werden muß,
geben damit aber noch keine Transformation direkt an. Um den Wert p der geeigneten
Potenztransformation zu finden, wird eine "Leiter der Transformation" ("ladder of power")
konstruiert [Schlittgen 91]. Es wird ein Exponent als optimal definiert, wenn er die Schiefe
am besten reduziert. Man kann solch einen optimalen Exponenten auf zwei Wegen finden.
Der erste Weg wird führt über eine Simulation von Daten. Es werden Daten mit Hilfe
eines Zufallsgenerators erzeugt, die symmetrisch verteilt sind. Die Daten werden durch die
Umkehrung der oben beschriebenen Transformationen (x, 1/p für p^O und e xl für p=0, i=l,...n)