Gegenstand der Arbeit sind die Felder der bodennahen Spurenstoffimmissionen von Ozon, NO2, NO, SO2 und Feinstaub (PM10) in Deutschland. Die hier betrachteten Immissionswerte stammen zum einen aus den operationellen Luftgütemessnetzen der Bundesländer, zum anderen wurden sie mit dem Eulerschen Chemie-Transport-Modell REM/Calgrid simuliert. Die horizontale Auflösung der Modellfelder beträgt 0.5° geo-grafische Länge mal 0.25° Breite (ca. 25*25 km2). Der grundlegende methodische Ansatz der Arbeit ist die Gegenüberstellung und die Kombination beider Informationsquellen zum Zweck der klimatologischen Zusammen-schau, der Modellevaluierung und der Analyse bzw. der Datenassimilation. Unter dem Begriff "Analyse" versteht man eine räumliche Interpolation der Beobachtung durch die Kombination mit einem bereits vorgegebenen Feld. Im Fall dieser Arbeit ist das immer ein vom Modell REM/Calgrid berechnetes Feld. Die Analyse ist ein wichtiger Bestandteil der Datenassimilation, da sie die Beobachtungen in das Modellfeld einfügt. Man spricht von "passiver Datenassimilation", wenn die analysierten Felder nicht aktiv in der Modellrechnung weiterverwendet werden. In Kapitel 2 wurde eine Klassifikation von stoffspezifischen Immissionsregimes erarbeitet, die auf den mittleren Werten und den typischen Tagesschwankungen der Beobachtungen beruht. Die Klassifikation erfolgte mit Hilfe eines robusten hierarchischen Clusterverfahrens. Je nach Stoff werden dabei die Regimes "Berg", "Land", "Vorstadt", "Stadt", "belastete Stadt", "Straße", "Straße extrem" oder fünf unterschiedliche Belastungsstufen unterschieden. Die gewonnene Klassifikation stimmt für Ozon gut mit der offiziellen Umweltbundesamt-Klassifikation überein, die auf der Ozonimmission der Jahre 1990-96 beruht, und verfeinert diese. Die Klassifikationen der Messstationen für die anderen Stoffe stellen ein neues Ergebnis dar. Die Klassifikation der Regimes wurde auf die Modellrechnung übertragen, so dass für jede modellierte Jahreszeitreihe ein Regime angegeben werden kann. Für eine angemessene Modellevaluierung ist die Kenntnis der Regimes von Beobachtung und Modellrechnung unerlässlich, aufgrund der unterschiedlichen Skalen und der überproporti-onal hohen Anzahl von Beobachtungen in städtischen und verkehrsnahen Regimes. Kapitel 3 enthält eine regimeorientierte Klimatologie von Beobachtungen und Modelldaten. Durch sie werden Unterschiede und Übereinstimmungen hinsichtlich der mittleren Belastung, der chemischen Kopplung und der Periodizität im Tages-, Wochen- und Jahresgang sowie der zwischenjährlichen Variabilität im Zeitraum 1995-2001 aufgezeigt. Das Modell und die Beobachtungen stimmen in ihrer zeitlichen Variabilität gut überein. Das Modell überschätzt etwas den Tagesgang und Jahresgang und unterschätzt den Wochengang. Das Kapitel 4 befasst sich mit der Methodik von Analyse und Datenassimilation unter dem Blickwinkel der statistischen Besonderheiten der Immissionsdaten. Ein umfangreicher Literaturüberblick stellt wichtige Arbeiten zur Kartierung von Immissionsdaten, zur inhomogenen Kovarianzmodellierung und zur Assimilation von Immissionsmessungen in Chemie-Transport-Modelle vor. In einem theoretischen Teil wird auf die Beschreibung von räumlichen Zufallsprozessen und die Schätzung seiner Momente aus Raum-Zeit-Daten eingegangen. Weiterhin werden die Gleichungen der statistischen Analyse und verschiedener Formen der Datenassimilation diskutiert. Das Grundproblem der statistischen Analyse ist die Bereitstellung der räumlichen Momente der Beobachtungen, der Modellrechnung bzw. die von deren Differenz (Beobachtungsinkremente). Diesem Problem ist das Kapitel 5 gewidmet. Für die Schätzung der Momente aus einer Stichprobe sind vereinfachende Annahmen zur Bildung eines Kovarianzmodells erforderlich. In der Arbeit werden ein homogenes terminbezogenes (A) und zwei inhomogene klimatische Kovarianzmodelle (B, C) entwickelt und miteinander verglichen. Das homogene Kovarianzmodell A beruht auf den Beobachtungen eines Termins und liefert eine abstandsabhängige homogene Kovarianzfunktion für verschiedene Richtungssektoren. Es kann gut die zeitliche Variabilität der räumlichen Kovarianz abbil-den, da es für jeden Termin neu ermittelt wird. Die inhomogenen Ansätze werden separat für jede Tagesstunde gewonnen; sie können jedoch die über den Tagesgang hinausgehende zeitliche Variabilität nicht erfassen. Sie beruhen auf stationspaarbezogenen Kovarianzwerten, die aus gefilterten Zeitreihendaten geschätzt werden. Das Kovarianzmodell B greift auf die abgeleiteten Regimes zurück und setzt sich aus homogenen Kovarianzfunktionen für jede Kombination von Regimes zusammen. Das inhomogene Kovarianzmodell C beruht auf einer Interpolation der Eigenvektoren der empirischen Kovarianzmatrix. Wichtigstes praktisches Ergebnis der Kovarianzmodellierung ist die Quantifizierung der Standardabweichung eines unkorrelierten biasfreien Beobachtungsfehlers für alle Stationen. Der Beobachtungsfehler ist neben dem Messinstrumentenfehler ein Maß für die räumliche Repräsentativität der Messung. Der Betrag der Varianz des klimatischen Beobachtungsfehlers macht von ca. 20% für Ozon bis zu ca. 60% für NO der Gesamtvarianz der Beobachtungsinkremente aus. Der Bias zwischen Modell und Beobachtung wurde klimatisch stationsbezogen oder homogen für alle Stationen zu einem Termin ermittelt. Er zeichnet sich durch einen ausgeprägten Tagesgang aus, der auf einen zu schwachen vertikalen Austausch in der Nacht und zu starken Austausch während des Tages durch die Modellierung schließen lässt. Weiterhin werden die mit Hilfe der Kovarianzmodelle erfassten räumlichen Strukturen und deren Anisotropie diskutiert. Die festgestellte Anisotropie der Kovarianz geht eher auf die Lage der Emissionszentren und der Messnetzanordnung als auf meteorologische Einflussfaktoren zurück. Für eine Testanwendung eines Kalman-Filters für REM/Calgrid wurde dessen dynamische Kovarianzmodellierung mit der hier durchgeführten empirischen verglichen. Damit wurde eine Möglichkeit zur gezielten Verbesserung der Assimilationsleistung mit dem Kalman-Filter aufgezeigt. Das 6. und letzte Kapitel widmet sich der Analyse von stündlichen Immissionsfeldern auf der Basis von Beobachtungen und Modellrechnungen. Die angestrebte horizontale Auflösung beträgt dabei ca. 15 km. Es werden verschiedene technische Fragestellungen der Implementierung, wie z. B. die Anzahl der beeinflussenden Stationen, die Biaskorrektur bzw. die Log-Transformation, diskutiert. Die Analyse erfolgt unter Verwendung der Kovarianzmodelle A, B und C und zusätzlich mit Kovarianzmodell A für die logarithmisch transformierten Werte. Um die Güte der Analyseleistung zu ermittelt, wurde ein cross-validation- Ansatz entwickelt. Er bewertet die Interpolationsgüte an den Stationsorten, ohne dass die zugehörige Beobachtung zur Interpolation verwendet wird. Dabei stellte sich heraus, dass damit keine bemerkenswerten Unterschiede zwischen der Analyse mit den unterschiedlichen Kovarianzmodellen festzustellen waren. Nur die logarithmische Transformation brachte für Ozon eine Verschlechterung der Ergebnisse. Die Gleichwertigkeit der Kovarianzmodelle kann an dem Umstand liegen, dass der cross-validation-Analysefehler bereits von ähnlicher Größe wie der geschätzte Beobachtungsfehler ist und somit keine wesentliche Verbesserung möglich ist. Weiterhin wurden nur 8 Stationen in der Umgebung des Analysepunktes verwendet, so dass die Unterschiede der Kovarianzmodelle für große Abstände nicht zum Tragen kommen. Der cross-validation-Fehler liegt jedoch über dem theoretischen Analysefehler, bei dessen Berechnung man davon ausgeht, dass das Kovarianzmodell perfekt ist. Folglich sind die Kovarianzmodelle nur eine Approximation. Es ist fraglich, inwieweit die "wahre" Kovarianzfunktion aus den Stichproben ermittelt werden kann. Abschließend werden die Karten der analysierten stündlichen Felder anhand ihrer Mittelwerte für das Jahr 2001 in Deutschland präsentiert. Dabei werden Karten mit den punktförmigen Beobachtungswerten und der Modellrechnung den Karten der vier Analysevarianten (A, A(log), B und C) als kontinuierliches Feld gegenübergestellt. Die Unterschiede sind für die verschiedenen Implementierungen mit Ausnahme der log-transformierten Daten gering. Das homogene Kovarianzmodell A und das terminbezogene C liefern sehr ähnliche Strukturen. Mit dem Kovarianzmodell B wird der ländliche Charakter über großen Teilen des Gebietes besser wiedergegeben, während die Werte in den urbanen Ballungsgebieten außerhalb des Ruhrgebietes zu niedrig erscheinen. Neben diesen passiven Ansätzen wurde eine aktive Datenassimilation auf Basis des homogenen Kovarianzmodells A getestet. Die Karten der Jahresmittelwerte zeigen keine großen Unterschiede zum passiven Fall für das hier betrachtete deutsche Gebiet mit hoher Stationsdichte. Die passive Analyse ist von gleicher Güte, wie die aktive Verbesserung des Modellfeldes durch die Assimilation und seine dann weniger starke Korrektur in der Analyse zum Termin.
The subject of the thesis are the ground level concentrations of O3, NO2, NO, PM10 and SO2. The methodological approach of the work is comparing and combining con-centration data of two different information sources: 1) the observation of about 300 operational air quality monitoring sites in Germany and 2) simulations of the Chemical Transport Model REM/Calgrid with a horizontal resolution of about 25*25 km2. The thesis contains contributions for a comprehensive air quality climatology and model evaluation, statistical analysis (i.e. interpolation), covariance modelling and data as-similation. Air quality assessment according to the EU-framework directive has been a practical motivation of the work. The results are preconditions for a scale dependent assessment and mapping of the air quality standards. In the first step the concentration time series were classified by means of a hierarchical clustering in to air quality regimes for each species separately. Depending on the spe-cies, the regimes can be labelled as "mountain", "rural", "suburban", "urban", "polluted urban", "street" and "severe polluted street" or as five levels of pollution for PM10 and SO2. The knowledge of the regimes is vital for model evaluation and data assimilation because the majority of the observation is located in polluted areas having a small spatial representativiness. A regime based climatology of both the observed and modelled data gives an overview of typical and maximum concentrations levels and the daily, weekly, annual and interannual variability. Moreover the comparison of the classification for different years and species is a tool to detect trends and special properties of the measurement strategy. The main part of the thesis is dedicated to statistical analysis of the concentration data by means of optimum interpolation (OI). OI can be considered as passive data assimila-tion. The analysed fields are an optimal combination of the observations and the model data according to their error statistics. The estimation of the errors statistics, i.e. the bias, the observation error variance and the covariance of the background error, is the main problem of the analysis. The statistical moments were estimated from samples of empirical space time values by covariance modelling. Three different covariance mod-els were developed: a standard homogeneous covariance model (CM A) from instanta- neous spatial data and two climatic inhomogeneous CMs (B and C) from filtered space time data for every hour of the day. CM B is a combination of homogenous CMs for different air quality regimes. CM C is based on the EOF expansion of the empirical covariance matrix. The observation error is considered as an spatially uncorrelated component of the measurement. Its variance is estimated by means of a covariance model, which extrapolates the variance of the smooth spatially correlated part to the measurement location. In the homogenous case A one value of the observation error variance is obtained for all stations at a given time. In the climatic case individual values for each stations are derived for the hours of the day. All covariance models were applied for the analysis of hourly concentration fields in 2001. The analysis performance of the three CM has been tested by means of cross validation: The difference between the measurement and the interpolated values from surrounding stations is checked. The RMSE of this difference is of about the same size as the observation error for all approaches. Besides the passive assimilation two active schemes have been tested. One is active Optimum Interpolation based on CM A for a model run, i.e. the modelled field for every hour is replaced by the analysed field. The other is a test run of the Kalman-Filter, which is a complex 4D data assimilation technique. The empirical covariances were compared with the covariance calculated by the Kalman-Filter. This comparison could be important for an improvement of the Kalman-Filter performance.