dc.contributor.author
Flemming, Johannes David
dc.date.accessioned
2018-06-07T16:08:07Z
dc.date.available
2003-03-18T00:00:00.649Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/2099
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-6301
dc.description
Titel & Inhalt
1 Einführung 5
1.1 Motivation 5
1.2 Inhaltsübersicht 6
1.3 Vorstellung der betrachteten Spurenstoffe 7
1.4 Datenquellen 9
1.4.1 Die Beobachtungen 9
1.4.2 Modellierung 11
1.4.3 Statistische Parameter von Immissionszeitreihen 13
1.5 Exkurs: Repräsentativität der Immissionsbeobachtung 15
2 Die Klassifikation von Immissionsregimes 17
2.1 Methodik der Klassifikation von Immissionsmessstationen 17
2.2 Bisherige Klassifikationen der Immissionsregimes in Deutschland 18
2.2.1 Vergleich der verschiedenen Klassifikationen 19
2.2.2 Notwendigkeit einer neuen Klassifikation 20
2.3 Ein Clusterverfahren zur Kategorisierung des Immissionsregimes 21
2.3.1 Clusterverfahren 21
2.3.1.1 Hierarchische Clusterbildung 22
2.3.1.2 Clusterbildungsmethode 23
2.3.1.3 Zugehörigkeitsfunktion und deren nachträgliche Bestimmung 24
2.3.2 Strategie der Clusterung von Parametern der Immission 25
2.3.2.1 Definition der Objekte und Auswahl der Variablen 26
2.3.2.2 Anzahl der Cluster bzw. der Regimes 28
2.3.2.3 Skalierung, Transformation und Clusterbildungsmethode 29
2.3.2.4 Test von Stabilität und Homogenität 30
2.3.2.5 Einheitliche Klassifikation und Methodik des Vergleichs 32
3 Klimatologie der Immissionsregimes von Beobachtung und Modellierung 34
3.1 Methodik der Darstellung 34
3.2 Regimes der Ozonimmission 35
3.3 Vergleich mit der UBA-Klassifikation für die Ozon-Regimes 38
3.4 Regimes der NO2-Immission 39
3.5 Regimes der NO-Immission 42
3.6 Regimes der SO2-Immission 46
3.7 Regimes der PM10-Immission 49
3.8 Vergleich der Regimes und Mediane verschiedener Stoffe 51
3.9 Zeitliche Variabilität 56
3.9.1 Tages-, Wochen- und Jahresgang 57
3.9.2 Zwischenjährliche Variabilität 64
4 Methodik der Analyse und Datenassimilation 67
4.1 Problemstellung 67
4.2 Zielstellung 69
4.3 Literaturüberblick 69
4.3.1 Anwendungsgebiete 70
4.3.2 Interpolation von Messwerten 70
4.3.2.1 Homogene statistische Ansätze 71
4.3.2.2 Raum-Zeit-Zusammenhänge 71
4.3.2.3 Inhomogene Kovarianzmodellierung 72
4.3.3 Datenassimilation 73
4.3.3.1 Einfache Ansätze 74
4.3.3.2 Variationsansätze 75
4.3.3.3 Kalman-Filter-Ansätze 76
4.4 Räumliche Zufallsprozesse 77
4.4.1 Beschreibung räumlicher Zufallsprozesse 78
4.4.1.1 Statistisch motivierte Skalentrennung 79
4.4.1.2 Homogenität und Isotropie 80
4.4.1.3 Interpolation 81
4.4.2 Raum-Zeit-Prozesse 82
4.4.2.1 Schätzung der räumlichen Momente aus Zeitreihen 83
4.4.2.2 Ergodozität von Zeitreihen 84
4.5 Theorie der statistischen Analyse und Datenassimilation 85
4.5.1 Grundprinzip 85
4.5.2 Definition der Fehlermaße 86
4.5.3 Beobachtungsoperator 88
4.5.4 Analyse durch Varianzminimierung - Optimale Interpolation 89
4.5.5 Vereinfachung und Diskussion der Analysegleichungen 90
4.5.6 Variationsansätze 92
4.5.7 Kalman-Filter 93
4.5.8 RRSQRT-Ansatz für Kalman-Filter 95
5 Kovarianzmodellierung der Immissionsfelder 98
5.1 Kovarianzmodelle für räumliche Prozesse 98
5.1.1 Besonderheiten der Kovarianzmodellierung von Immissionsdaten 101
5.1.2 Datenbasis für die empirischen Kovarianzmodelle 105
5.1.3 Drei Kovarianzmodelle (A, B und C) für Immissionsdaten 106
5.2 Die Schätzung der empirischen Kovarianzmodelle 107
5.2.1 Schätzung homogener terminbezogener Kovarianzwerte 107
5.2.2 Schätzung klimatischer Kovarianzwerte 109
5.2.2.1 Filterung der zeitlichen Periodizität und Persistenz 109
5.2.2.2 Diskussion der Filterung am Beispiel 110
5.2.2.3 Schätzung stationspaarbezogener Kovarianzwerte 112
5.2.3 Analytische Form des parametrischen Kovarianzmodells 112
5.2.4 Approximation des parametrischen Kovarianzmodells 114
5.2.5 Nichtparametrisches inhomogenes Kovarianzmodell aus EOFs 115
5.2.5.1 Matrixapproximation durch SVD 116
5.2.5.2 Auf SVD basierendes inhomogenes Kovarianzmodell C 116
5.2.5.3 SVD für numerische Stabilität 118
5.2.6 Schätzung der Beobachtungsfehlervarianz 118
5.3 Diskussion der Ergebnisse der Kovarianzmodellierung 120
5.3.1 Der Beobachtungsfehler 121
5.3.1.1 Der stationsbezogene Beobachtungsfehler 121
5.3.1.2 Der homogene terminbezogene Beobachtungsfehler 124
5.3.2 Der Bias 126
5.3.3 Die Varianz des "glatten" Feldes 131
5.3.3.1 Varianz von Modell, Beobachtung und Beobachtungsinkrement 131
5.3.3.2 Rausch-Signal-Verhältnis 132
5.3.4 Räumliche Strukturen der Kovarianzmodelle A, B und C 134
5.3.4.1 Homogene Anisotropie (KM A) 134
5.3.4.2 Kovarianz für verschiedene Immissionsregimes (KM B) 137
5.3.4.3 Die Eigenvektoren der Kovarianzmatrix (KM C) 138
5.3.5 Alternative dynamische Kovarianzmodelle 142
6 Analyse und Datenassimilation der Immissionsfelder 145
6.1 Verschiedene statistische Analyseverfahren der Immission 145
6.1.1 Transformation der Variablen 146
6.1.2 Biaskorrektur 147
6.1.3 Beobachtungsfehler und räumliche Kovarianz 147
6.1.4 Auflösung, Interpolation von Gitterboxmittelwerten 148
6.1.5 Auswahl der beeinflussenden Stationen 148
6.1.6 Iterative Analyse 149
6.1.7 Aktive Datenassimilation mit Optimaler Interpolation 149
6.2 Methoden zur Beurteilung der Verfahrensgüte 150
6.2.1 Die theoretische Analysefehlervarianz 150
6.2.2 Der cross-validation-Analysefehler 151
6.3 Die analysierten Immissionsfelder aus Beobachtung und Modellrechnung für
2001 153
6.4 Aktive Datenassimilation mit Optimaler Interpolation 162
7 Zusammenfassung und Ausblick 164
7.1 Was wurde gemacht? 164
7.2 Was ist neu? 166
7.3 Was sind praktische Schlussfolgerungen? 167
7.4 Was bleibt zu tun? 168
Symbole 170
Literaturverzeichnis 173
Danksagung & Lebenslauf 183
dc.description.abstract
Gegenstand der Arbeit sind die Felder der bodennahen Spurenstoffimmissionen
von Ozon, NO2, NO, SO2 und Feinstaub (PM10) in Deutschland. Die hier
betrachteten Immissionswerte stammen zum einen aus den operationellen
Luftgütemessnetzen der Bundesländer, zum anderen wurden sie mit dem Eulerschen
Chemie-Transport-Modell REM/Calgrid simuliert. Die horizontale Auflösung der
Modellfelder beträgt 0.5° geo-grafische Länge mal 0.25° Breite (ca. 25*25
km2). Der grundlegende methodische Ansatz der Arbeit ist die Gegenüberstellung
und die Kombination beider Informationsquellen zum Zweck der klimatologischen
Zusammen-schau, der Modellevaluierung und der Analyse bzw. der
Datenassimilation. Unter dem Begriff "Analyse" versteht man eine räumliche
Interpolation der Beobachtung durch die Kombination mit einem bereits
vorgegebenen Feld. Im Fall dieser Arbeit ist das immer ein vom Modell
REM/Calgrid berechnetes Feld. Die Analyse ist ein wichtiger Bestandteil der
Datenassimilation, da sie die Beobachtungen in das Modellfeld einfügt. Man
spricht von "passiver Datenassimilation", wenn die analysierten Felder nicht
aktiv in der Modellrechnung weiterverwendet werden. In Kapitel 2 wurde eine
Klassifikation von stoffspezifischen Immissionsregimes erarbeitet, die auf den
mittleren Werten und den typischen Tagesschwankungen der Beobachtungen beruht.
Die Klassifikation erfolgte mit Hilfe eines robusten hierarchischen
Clusterverfahrens. Je nach Stoff werden dabei die Regimes "Berg", "Land",
"Vorstadt", "Stadt", "belastete Stadt", "Straße", "Straße extrem" oder fünf
unterschiedliche Belastungsstufen unterschieden. Die gewonnene Klassifikation
stimmt für Ozon gut mit der offiziellen Umweltbundesamt-Klassifikation
überein, die auf der Ozonimmission der Jahre 1990-96 beruht, und verfeinert
diese. Die Klassifikationen der Messstationen für die anderen Stoffe stellen
ein neues Ergebnis dar. Die Klassifikation der Regimes wurde auf die
Modellrechnung übertragen, so dass für jede modellierte Jahreszeitreihe ein
Regime angegeben werden kann. Für eine angemessene Modellevaluierung ist die
Kenntnis der Regimes von Beobachtung und Modellrechnung unerlässlich, aufgrund
der unterschiedlichen Skalen und der überproporti-onal hohen Anzahl von
Beobachtungen in städtischen und verkehrsnahen Regimes. Kapitel 3 enthält eine
regimeorientierte Klimatologie von Beobachtungen und Modelldaten. Durch sie
werden Unterschiede und Übereinstimmungen hinsichtlich der mittleren
Belastung, der chemischen Kopplung und der Periodizität im Tages-, Wochen- und
Jahresgang sowie der zwischenjährlichen Variabilität im Zeitraum 1995-2001
aufgezeigt. Das Modell und die Beobachtungen stimmen in ihrer zeitlichen
Variabilität gut überein. Das Modell überschätzt etwas den Tagesgang und
Jahresgang und unterschätzt den Wochengang. Das Kapitel 4 befasst sich mit der
Methodik von Analyse und Datenassimilation unter dem Blickwinkel der
statistischen Besonderheiten der Immissionsdaten. Ein umfangreicher
Literaturüberblick stellt wichtige Arbeiten zur Kartierung von
Immissionsdaten, zur inhomogenen Kovarianzmodellierung und zur Assimilation
von Immissionsmessungen in Chemie-Transport-Modelle vor. In einem
theoretischen Teil wird auf die Beschreibung von räumlichen Zufallsprozessen
und die Schätzung seiner Momente aus Raum-Zeit-Daten eingegangen. Weiterhin
werden die Gleichungen der statistischen Analyse und verschiedener Formen der
Datenassimilation diskutiert. Das Grundproblem der statistischen Analyse ist
die Bereitstellung der räumlichen Momente der Beobachtungen, der
Modellrechnung bzw. die von deren Differenz (Beobachtungsinkremente). Diesem
Problem ist das Kapitel 5 gewidmet. Für die Schätzung der Momente aus einer
Stichprobe sind vereinfachende Annahmen zur Bildung eines Kovarianzmodells
erforderlich. In der Arbeit werden ein homogenes terminbezogenes (A) und zwei
inhomogene klimatische Kovarianzmodelle (B, C) entwickelt und miteinander
verglichen. Das homogene Kovarianzmodell A beruht auf den Beobachtungen eines
Termins und liefert eine abstandsabhängige homogene Kovarianzfunktion für
verschiedene Richtungssektoren. Es kann gut die zeitliche Variabilität der
räumlichen Kovarianz abbil-den, da es für jeden Termin neu ermittelt wird. Die
inhomogenen Ansätze werden separat für jede Tagesstunde gewonnen; sie können
jedoch die über den Tagesgang hinausgehende zeitliche Variabilität nicht
erfassen. Sie beruhen auf stationspaarbezogenen Kovarianzwerten, die aus
gefilterten Zeitreihendaten geschätzt werden. Das Kovarianzmodell B greift auf
die abgeleiteten Regimes zurück und setzt sich aus homogenen
Kovarianzfunktionen für jede Kombination von Regimes zusammen. Das inhomogene
Kovarianzmodell C beruht auf einer Interpolation der Eigenvektoren der
empirischen Kovarianzmatrix. Wichtigstes praktisches Ergebnis der
Kovarianzmodellierung ist die Quantifizierung der Standardabweichung eines
unkorrelierten biasfreien Beobachtungsfehlers für alle Stationen. Der
Beobachtungsfehler ist neben dem Messinstrumentenfehler ein Maß für die
räumliche Repräsentativität der Messung. Der Betrag der Varianz des
klimatischen Beobachtungsfehlers macht von ca. 20% für Ozon bis zu ca. 60% für
NO der Gesamtvarianz der Beobachtungsinkremente aus. Der Bias zwischen Modell
und Beobachtung wurde klimatisch stationsbezogen oder homogen für alle
Stationen zu einem Termin ermittelt. Er zeichnet sich durch einen ausgeprägten
Tagesgang aus, der auf einen zu schwachen vertikalen Austausch in der Nacht
und zu starken Austausch während des Tages durch die Modellierung schließen
lässt. Weiterhin werden die mit Hilfe der Kovarianzmodelle erfassten
räumlichen Strukturen und deren Anisotropie diskutiert. Die festgestellte
Anisotropie der Kovarianz geht eher auf die Lage der Emissionszentren und der
Messnetzanordnung als auf meteorologische Einflussfaktoren zurück. Für eine
Testanwendung eines Kalman-Filters für REM/Calgrid wurde dessen dynamische
Kovarianzmodellierung mit der hier durchgeführten empirischen verglichen.
Damit wurde eine Möglichkeit zur gezielten Verbesserung der
Assimilationsleistung mit dem Kalman-Filter aufgezeigt. Das 6. und letzte
Kapitel widmet sich der Analyse von stündlichen Immissionsfeldern auf der
Basis von Beobachtungen und Modellrechnungen. Die angestrebte horizontale
Auflösung beträgt dabei ca. 15 km. Es werden verschiedene technische
Fragestellungen der Implementierung, wie z. B. die Anzahl der beeinflussenden
Stationen, die Biaskorrektur bzw. die Log-Transformation, diskutiert. Die
Analyse erfolgt unter Verwendung der Kovarianzmodelle A, B und C und
zusätzlich mit Kovarianzmodell A für die logarithmisch transformierten Werte.
Um die Güte der Analyseleistung zu ermittelt, wurde ein cross-validation-
Ansatz entwickelt. Er bewertet die Interpolationsgüte an den Stationsorten,
ohne dass die zugehörige Beobachtung zur Interpolation verwendet wird. Dabei
stellte sich heraus, dass damit keine bemerkenswerten Unterschiede zwischen
der Analyse mit den unterschiedlichen Kovarianzmodellen festzustellen waren.
Nur die logarithmische Transformation brachte für Ozon eine Verschlechterung
der Ergebnisse. Die Gleichwertigkeit der Kovarianzmodelle kann an dem Umstand
liegen, dass der cross-validation-Analysefehler bereits von ähnlicher Größe
wie der geschätzte Beobachtungsfehler ist und somit keine wesentliche
Verbesserung möglich ist. Weiterhin wurden nur 8 Stationen in der Umgebung des
Analysepunktes verwendet, so dass die Unterschiede der Kovarianzmodelle für
große Abstände nicht zum Tragen kommen. Der cross-validation-Fehler liegt
jedoch über dem theoretischen Analysefehler, bei dessen Berechnung man davon
ausgeht, dass das Kovarianzmodell perfekt ist. Folglich sind die
Kovarianzmodelle nur eine Approximation. Es ist fraglich, inwieweit die
"wahre" Kovarianzfunktion aus den Stichproben ermittelt werden kann.
Abschließend werden die Karten der analysierten stündlichen Felder anhand
ihrer Mittelwerte für das Jahr 2001 in Deutschland präsentiert. Dabei werden
Karten mit den punktförmigen Beobachtungswerten und der Modellrechnung den
Karten der vier Analysevarianten (A, A(log), B und C) als kontinuierliches
Feld gegenübergestellt. Die Unterschiede sind für die verschiedenen
Implementierungen mit Ausnahme der log-transformierten Daten gering. Das
homogene Kovarianzmodell A und das terminbezogene C liefern sehr ähnliche
Strukturen. Mit dem Kovarianzmodell B wird der ländliche Charakter über großen
Teilen des Gebietes besser wiedergegeben, während die Werte in den urbanen
Ballungsgebieten außerhalb des Ruhrgebietes zu niedrig erscheinen. Neben
diesen passiven Ansätzen wurde eine aktive Datenassimilation auf Basis des
homogenen Kovarianzmodells A getestet. Die Karten der Jahresmittelwerte zeigen
keine großen Unterschiede zum passiven Fall für das hier betrachtete deutsche
Gebiet mit hoher Stationsdichte. Die passive Analyse ist von gleicher Güte,
wie die aktive Verbesserung des Modellfeldes durch die Assimilation und seine
dann weniger starke Korrektur in der Analyse zum Termin.
de
dc.description.abstract
The subject of the thesis are the ground level concentrations of O3, NO2, NO,
PM10 and SO2. The methodological approach of the work is comparing and
combining con-centration data of two different information sources: 1) the
observation of about 300 operational air quality monitoring sites in Germany
and 2) simulations of the Chemical Transport Model REM/Calgrid with a
horizontal resolution of about 25*25 km2. The thesis contains contributions
for a comprehensive air quality climatology and model evaluation, statistical
analysis (i.e. interpolation), covariance modelling and data as-similation.
Air quality assessment according to the EU-framework directive has been a
practical motivation of the work. The results are preconditions for a scale
dependent assessment and mapping of the air quality standards. In the first
step the concentration time series were classified by means of a hierarchical
clustering in to air quality regimes for each species separately. Depending on
the spe-cies, the regimes can be labelled as "mountain", "rural", "suburban",
"urban", "polluted urban", "street" and "severe polluted street" or as five
levels of pollution for PM10 and SO2. The knowledge of the regimes is vital
for model evaluation and data assimilation because the majority of the
observation is located in polluted areas having a small spatial
representativiness. A regime based climatology of both the observed and
modelled data gives an overview of typical and maximum concentrations levels
and the daily, weekly, annual and interannual variability. Moreover the
comparison of the classification for different years and species is a tool to
detect trends and special properties of the measurement strategy. The main
part of the thesis is dedicated to statistical analysis of the concentration
data by means of optimum interpolation (OI). OI can be considered as passive
data assimila-tion. The analysed fields are an optimal combination of the
observations and the model data according to their error statistics. The
estimation of the errors statistics, i.e. the bias, the observation error
variance and the covariance of the background error, is the main problem of
the analysis. The statistical moments were estimated from samples of empirical
space time values by covariance modelling. Three different covariance mod-els
were developed: a standard homogeneous covariance model (CM A) from instanta-
neous spatial data and two climatic inhomogeneous CMs (B and C) from filtered
space time data for every hour of the day. CM B is a combination of homogenous
CMs for different air quality regimes. CM C is based on the EOF expansion of
the empirical covariance matrix. The observation error is considered as an
spatially uncorrelated component of the measurement. Its variance is estimated
by means of a covariance model, which extrapolates the variance of the smooth
spatially correlated part to the measurement location. In the homogenous case
A one value of the observation error variance is obtained for all stations at
a given time. In the climatic case individual values for each stations are
derived for the hours of the day. All covariance models were applied for the
analysis of hourly concentration fields in 2001. The analysis performance of
the three CM has been tested by means of cross validation: The difference
between the measurement and the interpolated values from surrounding stations
is checked. The RMSE of this difference is of about the same size as the
observation error for all approaches. Besides the passive assimilation two
active schemes have been tested. One is active Optimum Interpolation based on
CM A for a model run, i.e. the modelled field for every hour is replaced by
the analysed field. The other is a test run of the Kalman-Filter, which is a
complex 4D data assimilation technique. The empirical covariances were
compared with the covariance calculated by the Kalman-Filter. This comparison
could be important for an improvement of the Kalman-Filter performance.
en
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
air quality regimes
dc.subject
data assimilation
dc.subject
covariance modelling
dc.subject.ddc
500 Naturwissenschaften und Mathematik::550 Geowissenschaften, Geologie::550 Geowissenschaften
dc.title
Immissionsfelder aus Beobachtung, Modellierung und deren Kombination
dc.contributor.firstReferee
Prof. Dr. Hans-Joachim Lange
dc.contributor.furtherReferee
Prof. Dr. Peter Builtjes
dc.date.accepted
2003-02-06
dc.date.embargoEnd
2003-03-25
dc.identifier.urn
urn:nbn:de:kobv:188-2003000713
dc.title.translated
Observed and modelled ground level concentration fields and their combination
en
refubium.affiliation
Geowissenschaften
de
refubium.mycore.fudocsId
FUDISS_thesis_000000000934
refubium.mycore.transfer
http://www.diss.fu-berlin.de/2003/71/
refubium.mycore.derivateId
FUDISS_derivate_000000000934
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access