dc.contributor.author
Deutschländer, Thomas
dc.date.accessioned
2018-06-07T21:53:07Z
dc.date.available
2003-07-11T00:00:00.649Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/8564
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-12763
dc.description
Titel und Inhalt
1\. Einführung 1
1.1 Quellen der atmosphärischen Vorhersagbarkeit 3
1.2 Methoden zur langfristigen Witterungsvorhersage 5
1.2.1 Statistische Verfahren 5
1.2.2 Dynamische Verfahren 11
1.3 Verifikation operationeller Langfristprognosen 14
1.4 Langfristige Temperaturprognosen für Berlin 15
1.5 Zu dieser Arbeit 16
2\. Daten 17
2.1 Temperatur 17
2.2 Niederschlag 17
2.3 Feldverteilungen des Bodendrucks und des 500-hPa-Geopotentials 18
3\. Anpassung der Niederschlagsdaten 23
4\. Abschätzung der Prognosengüte 27
4.1 Cross-Validation 27
4.2 Lineare Trendbereinigung 29
5\. Verifikation 31
5.1 Skalare Maße 31
5.2 "Diagnostische Verifikation" - "Conditional Quantile Plots" 32
6\. Spektralanalyse 37
6.1 Autokorrelations-Spektralanalyse 37
6.1.1 Vorgehensweise 42
6.1.2 Ergebnisse 45
6.2 Kreuzspektrumanalyse 50
6.2.1 Vorgehensweise 52
6.2.2 Ergebnisse 54
7\. Multiple lineare Regression 59
7.1 Mathematisch-statistische Grundlagen 59
7.2 Screening-Verfahren 61
7.3 Vorgehensweise 62
7.4 Vorselektion der potentiellen Prediktoren 64
7.5 Ergebnisse 66
8\. Analogverfahren 77
8.1 Vergleich einiger Auswahlkriterien 77
8.2 Analoge Fälle und Regression (AFREG) 81
8.2.1 Methodik und Vorgehensweise 81
8.2.2 Ergebnisse 82
8.3 Ensemble-Modell 85
8.3.1 Methodik und Vorgehensweise 85
8.3.2 Ergebnisse 86
8.4 "Mehrfach-Analog-Modell" 86
8.4.1 Methodik und Vorgehensweise 86
8.4.2 Ergebnisse 87
8.5 "Vielfach-Analog-Modell" 87
8.5.1 Methodik und Vorgehensweise 87
8.5.2 Ergebnisse 89
9\. EOF-Analyse und "principal-components regression" 91
9.1 Mathematisch-statistische Grundlagen 91
9.2 Beschneidung der Hauptkomponenten 94
9.3 Vorgehensweise 95
9.4 Ergebnisse 96
9.4.1 EOF-Analyse 96
9.4.2 PCR 97
10\. Clusteranalyse 107
10.1 Mathematisch-statistische Grundlagen 108
10.2 Anzahl der Cluster 110
10.3 Vorgehensweise 111
10.4 Ergebnisse 113
11\. Schlußbetrachtung und Ausblick 115
Literatur 117
Anhang A: Feldverteilungen der empirischen Orthogonalfunktionen 127
Januar
Februar
März
April
Mai
Juni
Juli
August
September
Oktober
November
Dezember
Anhang B: Zusammensetzung der Cluster 173
Nachwort 185
Lebenslauf 187
dc.description.abstract
Mittels unterschiedlicher statistischer Analysemethoden wurde das
Vorhersagepotential für langfristige Witterungsprognosen an der Station
Berlin-Dahlem abgeschätzt. Als Prediktoren dienten dabei die großräumigen
Feldverteilungen des Bodendrucks sowie des 500-hPa-Geopotentials, d.h. der
Momentanzustand der atmosphärischen Zirkulation. Prediktand war i.a. die
Klimamitteltemperatur der Folgemonate, die in einigen Fällen noch durch die
Anzahl der Tage mit meßbarem Niederschlag ergänzt wurde. Zur Bestimmung der
Vorhersageleistung wurden die Cross-Validation bzw. ein Examinationskollektiv
eingesetzt. Die ermittelten RV-Werte deuten darauf hin, daß die als
"principal-components regression (PCR)" bezeichnete Methode den anderen
getesteten Verfahren überlegen ist. Zu diesen gehören mehrere Varianten
sogenannter Analogverfahren, die Clusteranalyse sowie die multiple lineare
Regression. Der vermutliche Grund für die Überlegenheit der PCR ist die in der
Methode enthaltene Glättung der Eingangsvariablen, die zu einer Verminderung
des Rauschanteils führt. Zusätzlich konnte die Anzahl der zur Beschreibung des
aktuellen Systemzustands notwendigen Variablen aufgrund der hohen
Interkorrelationen der Originaldaten merklich reduziert werden, wodurch die
Wahrscheinlichkeit einer rein zufällig guten Anpassung deutlich verringert
wird. Trotz dieser methodischen Vorteile zeigte es sich, daß erfolgreiche
Langfristvorhersagen für die betrachtete geographische Region äußerst
schwierig zu realisieren sind. Im Falle der Temperatur konnte ein RV-Wert von
ca. 0,1 als maximal mögliche Obergrenze der Vorhersageleistung bestimmt
werden, im Falle des Niederschlags liegt der Wert noch darunter. Dabei ist
erstaunlich, daß die Vorhersagequalität weder von der Vorlaufzeit noch von der
Jahreszeit eindeutig abhängt. Da die ermittelten Resultate klassischen
Hypothesentests zufolge erst bei einem weit über 1000 Fälle umfassenden
Kollektiv unabhängiger Prognosen statistisch signifikant von Null verschieden
wären (hier ca. 160), wurde ein anderer Weg beschritten, um dennoch Aussagen
zur Signifikanz machen zu können. Mit Hilfe von insgesamt 1000
?bootstrap?-Realisierungen konnte nachgewiesen werden, daß die aufgedeckten
Zusammenhänge zwischen der großräumigen Vorzirkulation und den
Folgetemperaturen Berlins mit hoher statistischer Sicherheit als überzufällig
betrachtet werden können. Im Falle der Niederschlagsprognosen konnte hingegen
nicht ausgeschlossen werden, daß es sich bei den ermittelten positiven RV-
Werten um reine Scheingüte handelt.
de
dc.description.abstract
By use of several different statistical methods the atmospherical long-range
predictability was estimated for Berlin. As predictors northern hemisphere
monthly-mean sea-level pressure and 500-hPa height fields were used, i.e. the
present state of the atmospherical circulation. Usually the mean temperatures
of the following months were predicted, in some cases supplemented by the
number of days with measurable precipitation (>0.0 mm) during an individual
month. Skill scores were calculated either in a cross-validation framework or
by use of a totally independent batch of data. Compared to the other methods
the so-called principal-components regression (PCR) performed superiorly.
These are multiple linear regression, cluster analysis and several variants of
analog prediction methods. The reason for the superiority of the PCR probably
is the implicit smoothing of the original data, which leads to a reduction of
noise. Furthermore, because the original grid points are mutually correlated
extensively, it was possible to lower the number of variables needed to
describe the system substantially. Therefore the problem of multiplicity lost
some of its importance. Even though PCR seems to bear some methodical
advantages, it still is rather troublesome to produce long-range forecasts
with a reasonable amount of success in this specific region. For temperature
forecats a skill score of approximately 0.1 was estimated as an upper bound,
in the case of precipitation forecats the value lies well below that. It also
is remarkable that forecast quality neither depends on the lead-time nor on
the time in the year. To evaluate the statistical significance of the results
at hand, the bootstrap method was used. Thereby it was possible to prove that
the discovered relations between the preceding atmospherical circulations and
the following temperatures are of high significance, albeit small. In case of
the precipitation forecats such a testimony can not be given. Here it is still
possible that only artificial skill was found.
en
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
statistical long-range forecasting
dc.subject
cross-validation
dc.subject
cluster analysis
dc.subject
analog-prediction
dc.subject.ddc
500 Naturwissenschaften und Mathematik::550 Geowissenschaften, Geologie::550 Geowissenschaften
dc.title
Über Möglichkeiten und Grenzen der statistischen Langfristprognose
dc.contributor.firstReferee
Prof. Dr. Horst Malberg
dc.contributor.furtherReferee
Prof. Dr. Werner Wehry
dc.date.accepted
2003-06-10
dc.date.embargoEnd
2003-07-24
dc.identifier.urn
urn:nbn:de:kobv:188-2003001677
dc.title.translated
About the feasibility of statistical long-range forecasting
en
refubium.affiliation
Geowissenschaften
de
refubium.mycore.fudocsId
FUDISS_thesis_000000001018
refubium.mycore.transfer
http://www.diss.fu-berlin.de/2003/167/
refubium.mycore.derivateId
FUDISS_derivate_000000001018
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access