The demand for reliable small area statistics has been growing in public and private organizations. Sample surveys are designed to produce reliable estimates for quantities of interest on higher geographic levels, but can have very small or even zero sample sizes for lower geographic levels. Direct estimates, which only rely on area-specific information, are usually unbiased but can produce results with high variability in the case of small sample sizes. Small area estimation (SAE) techniques have been developed to gain reliability compared to direct estimates by borrowing strength from additional information. One well known SAE method is the empirical best linear unbiased predictor (EBLUP) of the small area mean that incorporates auxiliary variables using the linear mixed model approach. In addition, spatial information can be used to borrow strength over space. One approach to account for geographical information is to extend the linear mixed model and allow for spatially correlated random area effects (cf. Pratesi and Salvati, 2008, SEBLUP). An alternative is to include the spatial information by non-parametric mixed models (cf. Opsomer et al., 2008, NPEBLUP). Another option is the geographic weighted regression where the model coefficients vary across the study area (cf. Chandra et al., 2012, GWEBLUP). Under the assumption of normally distributed error terms, these approaches are useful for estimating small area means efficiently. The normality assumption can be violated in the presence of outliers and, hence, it can be beneficial to reduce the influence of outliers and use robust methods for SAE (cf. Sinha and Rao, 2009). This thesis extends the current literature by providing robust extensions for the GWEBLUP of the area mean. In particular, a robust projective and a robust predictive version of the GWEBLUP is proposed. In addition, two analytic MSE estimates are developed based on the pseudo-linearization approach of Chambers et al. (2011) and under the full linearization approach of Chambers et al. (2014). The proposed methods have been implemented for the R-language (R Core Team, 2016) in the package saeRGW. The performance of the proposed methods is assessed in model and design-based simulation studies. The model-based simulation indicates that in the presence of spatial non-stationarity and outliers, applying the proposed robust methods can lead to efficiency gains compared to the non-robust GWEBLUP of the small area mean. In addition, the proposed MSE estimators show good properties in terms of bias and stability in the investigated scenarios. The design-based simulation also indicates that in case of the Berlin real estate database it can be beneficial to combine the GWEBLUP with robust protection for estimating small area means of the quoted net rent.
Small-Area-Verfahren gewinnen zunehmend an Bedeutung in der amtlichen Statistik und privaten Institutionen. Bevölkerungsstichproben liefern in der Regel verlässliche Schätzungen für aggregierte Populationsgrößen, können jedoch sehr kleine Stichprobenumfänge in tieferen regionalen Ebenen aufweisen. Direkte Schätzverfahren, welche ausschließlich auf regionalen Beobachtungen basieren, liefern bei kleinem Stichprobenumfang zwar unverzerrte, jedoch meist sehr unpräzise Schätzungen. Methoden der Small-Area- Schätzung (SAE - Small Area Estimation) hingegen können bei kleinen Stichprobenumfängen durch Zuhilfenahme zusätzlicher Informationen verlässlichere Regionalstatistiken liefern. Eine gängige Methode für SAE ist der Empirical Best Linear Predictor (EBLUP). Hier werden für die Schätzung von kleinräumigen Mittelwerten Hilfsvariablen mithilfe gemischter linearer Modelle einbezogen. Darüber hinaus können auch räumliche Informationen verwendet werden, um die Schätzgenauigkeit weiter zu erhöhen. Geographische Information können zum Beispiel berücksichtigt werden, indem eine räumliche Korrelation zwischen den zufälligen Effekten im gemischten Modell zugelassen wird (vgl. Pratesi and Salvati, 2008, SEBLUP). Außerdem können räumliche Informationen auch nichtparametrisch in das gemischte Modell aufgenommen werden (vgl. Opsomer et al., 2008, NPEBLUP). Eine weitere Option ist die geographisch gewichtete Erweiterung des gemischten Modells, in der die Koeffizienten räumlich variieren (cf. Chandra et al., 2012, GWEBLUP). Unter der Annahme normalverteilter Fehlerterme sind diese Ansätze effizient um detaillierte Regionalstatistiken zu Schätzen. Diese Normalverteilungsannahme kann jedoch durch einzelne extreme Beobachtungen (Ausreißer) verletzt werden. Der Einfluss von Ausreißern kann durch die Verwendung von robusten SAE- Methoden reduziert werden (vgl. Sinha and Rao, 2009). In dieser Arbeit wird eine Erweiterung für den GWEBLUP zur robusten Schätzung von kleinräumigen Mittelwerten entwickelt. Hierbei werden eine robuste Variante nach Sinha and Rao (2009) und eine korrigierte nach Chambers et al. (2014) eingeführt. Darüber hinaus werden zwei analytische Methoden für die MSE-Schätzungen entwickelt: (i) nach dem Pseudo- Linearisierungsansatz von Chambers et al. (2011); (ii) und nach dem vollständigen Linearisierungsansatz von Chambers et al. (2014). Die entwickelten Methoden wurden zusätzlich im R-Paket saeRGW implementiert. Die statistischen Eigenschaften der entwickelten Methoden wurden in modellund designbasierten Simulationsstudien untersucht. Unter räumlicher nichtstationarität mit Ausreißern führen die entwickelten robusten Methoden in der modellbasierten Simulation zu Effizienzgewinnen. Darüber hinaus zeigt die MSE Schätzung in den untersuchten Szenarien gute Eigenschaften in Bezug auf Verzerrung und Stabilität. Die Ergebnisse der designbasierten Simulation deuten ebenfalls auf einen Effizienzgewinn durch die Verwendung der entwickelten Methoden bei der Schätzung der mittleren Nettokaltmieten in Planungsräumen der Stadt Berlin hin.