Skip to main content

Full text: 15: Wasserstandsvorhersage mittels neuronaler Netze

86 
teilungen gleich schief sind (analog zu bimodalen Verteilungen, siehe oben). Damit ist jedoch 
noch die Voraussetzung verletzt, daß die Daten einen möglichst zufälligen Prozeß im Sinne 
einer Gauß’sehen Zufallsvariablen widerspiegeln müssen. Daraus folgt, daß die Daten Ver 
teilungen alle möglichst der Normal Verteilung gehorchen müssen. Dazu muß eine evtl, 
vorhandene Schiefe in den Daten so weit wie möglich reduziert werden. 
Eine Möglichkeit, die Schiefe zu erfassen, bieten die Begriffe und Methoden der explorati- 
ven Datenanalyse und der robusten Verfahren. Die robuste Statistik hat den Vorteil, daß sie 
Ausreißern gegenüber unempfindlich ist [Hartung et al. 86]. Grob erklärt beruhen die für die 
Beschreibung von Verteilungen wuchtigen Kenngrößen nicht auf der Summation von Meß 
werten (Erwartungswert und Varianz), sondern auf ihrem Rang. D.h. die Meßwerte werden 
vorab nach ihrer Größe sortiert. Jedem Wert in dieser Rangfolge kann eine Zahl a e R mit 
a e (0,1] zugeordnet werden, die sich aus ihrer relativen Stellung in der geordneten Reihe 
(ihrem Rang) und der Gesamtzahl aller Werte ergibt. Der Wert selbst wird dann mit a- 
Quantil bezeichnet. Das Quantil mit a = 0.5 entspricht dem Erwartungswert und wird als 
"Median" bezeichnet. Bei symmetrischen Verteilungen (z.B. bei der Normalverteilung) sind 
Erwartungswert und Median gleich. Bei Verteilungen, deren Maximum der Wahrschein 
lichkeitsdichte nach "links" verschoben ist ("rechtsschiefe" Verteilung), ist der Median größer 
als der Erwartungswert. Bei linksschiefen Verteilungen ist der Median kleiner als der Erwar 
tungswert [Schlittgen 91]. 
Die Schiefe kann mit Hilfe von nichtlinearen Transformationen der Daten reduziert 
werden. Nichtlineare Transformationen sind im wesentlichen Potenztransformationen. Die 
Werte x, (i=l,...n) einer Zeitreihe der Länge n werden einzeln mit einem bestimmten Expo 
nenten p e R potenziert. Eine Potenztransformation mit p=0 würde die gesamte Zeitreihe 
vernichten. Darum wird bei p=0 stattdessen der natürliche Logarithmus verwendet: 
(4.1) 
Für p < 1 bewirken die Potenztransformationen, daß große Werte stärker zusammengedrückt 
werden. Die logarithmische Transformation spielt insofern eine Sonderrolle, als Werte nahe 
bei Null zusätzlich entzerrt werden. Negative Exponenten haben qualitativ dieselbe Wirkung 
wie der Logarithmus. Rechtsschiefe Verteilungen werden also tendenziell durch Anwenden 
einer Potenztransformation mit p < 1 symmetrischer. Für p > 1 ergibt sich der umgekehrte 
Effekt. Werte, die im oberen Bereich liegen, werden stärker auseinandergezerrt als Werte, die 
näher bei Null liegen. Solche Transformationen sind geeigneter, um linksschiefe Verteilungen 
in symmetrische zu transformieren [Schlittgen 91]. 
Die Transformationen unterscheiden sich in der Stärke des besprochenen Effektes. Je nach 
Ausprägung der Schiefe muß dann ein größeres bzw. kleineres p gewählt werden, um die 
gewünschte Symmetrie zu erreichen. Die bisherigen Ausführungen zeigen zwar in die 
Richtung, in der eine geeignete, symmetrie-herstellende Transformation gesucht werden muß, 
geben damit aber noch keine Transformation direkt an. Um den Wert p der geeigneten 
Potenztransformation zu finden, wird eine "Leiter der Transformation" ("ladder of power") 
konstruiert [Schlittgen 91]. Es wird ein Exponent als optimal definiert, wenn er die Schiefe 
am besten reduziert. Man kann solch einen optimalen Exponenten auf zwei Wegen finden. 
Der erste Weg wird führt über eine Simulation von Daten. Es werden Daten mit Hilfe 
eines Zufallsgenerators erzeugt, die symmetrisch verteilt sind. Die Daten werden durch die 
Umkehrung der oben beschriebenen Transformationen (x, 1/p für p^O und e xl für p=0, i=l,...n)
	        
Waiting...

Note to user

Dear user,

In response to current developments in the web technology used by the Goobi viewer, the software no longer supports your browser.

Please use one of the following browsers to display this page correctly.

Thank you.