dc.contributor.author
Baldermann, Claudia
dc.date.accessioned
2018-06-08T00:28:15Z
dc.date.available
2017-12-01T10:17:39.849Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/11989
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-16187
dc.description.abstract
The demand for reliable small area statistics has been growing in public and
private organizations. Sample surveys are designed to produce reliable
estimates for quantities of interest on higher geographic levels, but can have
very small or even zero sample sizes for lower geographic levels. Direct
estimates, which only rely on area-specific information, are usually unbiased
but can produce results with high variability in the case of small sample
sizes. Small area estimation (SAE) techniques have been developed to gain
reliability compared to direct estimates by borrowing strength from additional
information. One well known SAE method is the empirical best linear unbiased
predictor (EBLUP) of the small area mean that incorporates auxiliary variables
using the linear mixed model approach. In addition, spatial information can be
used to borrow strength over space. One approach to account for geographical
information is to extend the linear mixed model and allow for spatially
correlated random area effects (cf. Pratesi and Salvati, 2008, SEBLUP). An
alternative is to include the spatial information by non-parametric mixed
models (cf. Opsomer et al., 2008, NPEBLUP). Another option is the geographic
weighted regression where the model coefficients vary across the study area
(cf. Chandra et al., 2012, GWEBLUP). Under the assumption of normally
distributed error terms, these approaches are useful for estimating small area
means efficiently. The normality assumption can be violated in the presence of
outliers and, hence, it can be beneficial to reduce the influence of outliers
and use robust methods for SAE (cf. Sinha and Rao, 2009). This thesis extends
the current literature by providing robust extensions for the GWEBLUP of the
area mean. In particular, a robust projective and a robust predictive version
of the GWEBLUP is proposed. In addition, two analytic MSE estimates are
developed based on the pseudo-linearization approach of Chambers et al. (2011)
and under the full linearization approach of Chambers et al. (2014). The
proposed methods have been implemented for the R-language (R Core Team, 2016)
in the package saeRGW. The performance of the proposed methods is assessed in
model and design-based simulation studies. The model-based simulation
indicates that in the presence of spatial non-stationarity and outliers,
applying the proposed robust methods can lead to efficiency gains compared to
the non-robust GWEBLUP of the small area mean. In addition, the proposed MSE
estimators show good properties in terms of bias and stability in the
investigated scenarios. The design-based simulation also indicates that in
case of the Berlin real estate database it can be beneficial to combine the
GWEBLUP with robust protection for estimating small area means of the quoted
net rent.
de
dc.description.abstract
Small-Area-Verfahren gewinnen zunehmend an Bedeutung in der amtlichen
Statistik und privaten Institutionen. Bevölkerungsstichproben liefern in der
Regel verlässliche Schätzungen für aggregierte Populationsgrößen, können
jedoch sehr kleine Stichprobenumfänge in tieferen regionalen Ebenen aufweisen.
Direkte Schätzverfahren, welche ausschließlich auf regionalen Beobachtungen
basieren, liefern bei kleinem Stichprobenumfang zwar unverzerrte, jedoch meist
sehr unpräzise Schätzungen. Methoden der Small-Area- Schätzung (SAE - Small
Area Estimation) hingegen können bei kleinen Stichprobenumfängen durch
Zuhilfenahme zusätzlicher Informationen verlässlichere Regionalstatistiken
liefern. Eine gängige Methode für SAE ist der Empirical Best Linear Predictor
(EBLUP). Hier werden für die Schätzung von kleinräumigen Mittelwerten
Hilfsvariablen mithilfe gemischter linearer Modelle einbezogen. Darüber hinaus
können auch räumliche Informationen verwendet werden, um die Schätzgenauigkeit
weiter zu erhöhen. Geographische Information können zum Beispiel
berücksichtigt werden, indem eine räumliche Korrelation zwischen den
zufälligen Effekten im gemischten Modell zugelassen wird (vgl. Pratesi and
Salvati, 2008, SEBLUP). Außerdem können räumliche Informationen auch
nichtparametrisch in das gemischte Modell aufgenommen werden (vgl. Opsomer et
al., 2008, NPEBLUP). Eine weitere Option ist die geographisch gewichtete
Erweiterung des gemischten Modells, in der die Koeffizienten räumlich
variieren (cf. Chandra et al., 2012, GWEBLUP). Unter der Annahme
normalverteilter Fehlerterme sind diese Ansätze effizient um detaillierte
Regionalstatistiken zu Schätzen. Diese Normalverteilungsannahme kann jedoch
durch einzelne extreme Beobachtungen (Ausreißer) verletzt werden. Der Einfluss
von Ausreißern kann durch die Verwendung von robusten SAE- Methoden reduziert
werden (vgl. Sinha and Rao, 2009). In dieser Arbeit wird eine Erweiterung für
den GWEBLUP zur robusten Schätzung von kleinräumigen Mittelwerten entwickelt.
Hierbei werden eine robuste Variante nach Sinha and Rao (2009) und eine
korrigierte nach Chambers et al. (2014) eingeführt. Darüber hinaus werden zwei
analytische Methoden für die MSE-Schätzungen entwickelt: (i) nach dem Pseudo-
Linearisierungsansatz von Chambers et al. (2011); (ii) und nach dem
vollständigen Linearisierungsansatz von Chambers et al. (2014). Die
entwickelten Methoden wurden zusätzlich im R-Paket saeRGW implementiert. Die
statistischen Eigenschaften der entwickelten Methoden wurden in modellund
designbasierten Simulationsstudien untersucht. Unter räumlicher
nichtstationarität mit Ausreißern führen die entwickelten robusten Methoden in
der modellbasierten Simulation zu Effizienzgewinnen. Darüber hinaus zeigt die
MSE Schätzung in den untersuchten Szenarien gute Eigenschaften in Bezug auf
Verzerrung und Stabilität. Die Ergebnisse der designbasierten Simulation
deuten ebenfalls auf einen Effizienzgewinn durch die Verwendung der
entwickelten Methoden bei der Schätzung der mittleren Nettokaltmieten in
Planungsräumen der Stadt Berlin hin.
en
dc.format.extent
VI, 161 Seiten
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
Small area estimation
dc.subject
robust statistics
dc.subject
spatial non-stationarity, geographically weighted regression
dc.subject.ddc
300 Sozialwissenschaften::310 Statistiken
dc.title
Robust Small Area Estimation under Spatial Non-Stationarity for Unit-Level
Models
dc.contributor.firstReferee
Prof. Dr. Timo Schmid
dc.contributor.furtherReferee
Prof. Nicola Salvati, PhD
dc.date.accepted
2017-10-30
dc.identifier.urn
urn:nbn:de:kobv:188-fudissthesis000000105851-5
dc.title.subtitle
Theory and Empirical Results
dc.title.translated
Robuste Small-Area-Schätzung unter räumlicher Nicht-Stationarität für Modelle
auf Individualebene
en
dc.title.translatedsubtitle
Theorie und empirische Resultate
en
refubium.affiliation
Wirtschaftswissenschaft
de
refubium.mycore.fudocsId
FUDISS_thesis_000000105851
refubium.mycore.derivateId
FUDISS_derivate_000000022730
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access