dc.contributor.author
Warnholz, Sebastian
dc.date.accessioned
2018-06-07T22:50:33Z
dc.date.available
2016-08-29T09:37:46.172Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/9706
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-13904
dc.description.abstract
The demand for reliable small area statistics from sample surveys has grown
substantially over the past decades due to their growing use in public and
private sectors. The field of Small Area Estimation aims at producing such
statistics. In this Thesis I consider several spatial and temporal extensions
to the Fay-Herriot (FH) Model to improve the mean squared prediction error
(MSPE) of predictions for small domains. Such predictions can be influenced by
single observations in the data; hence the estimation of the model parameters
and predictions is based on the estimation methodology around robust empirical
best linear unbiased predictions (REBLUPs). With regard to robust area level
models four such models are under consideration: the FH model, a spatial
extension, a temporal extension and a spatio-temporal model. These methods are
extended to obtain (i) an area level robust EBLUP (REBLUP); (ii) an area level
spatial REBLUP (SREBLUP); (iii) a temporal REBLUP (TREBLUP); and (iv) a
spatio-temporal REBLUP (STREBLUP). I present these methods in a comprehensive
framework of robust area level models. For the estimation of the MSPE a
parametric bootstrap method is adapted as well as a analytical solution based
on a pseudolinear representation of the predictors. In this context also a
bias correction based on a limited translation estimator is adapted to account
for a potential bias associated to robust methods. In addition to the
development of these robust methods their implementation in the R-package
saeRobust is investigated. The package provides an initial version for the
application of the developed methodology. In this regard some numerical
stability tests are performed and also basic features like diagnostic plots
for model residuals are reviewed. Also an outcome of this Thesis is the
package saeSim which provides a framework for simulation studies within the
R-language. It aims at simplifying the configuration of such studies by
providing tools for data generation, sampling, and a link to the parallel
computing fascilities in the R-language. The methods under consideration are
then further investigated in model and design based simulation studies. Here
the performance of the predictions and the MSPE estimators are studied when
area level outliers are present. Furthermore I discuss how unit level outliers
as well as area level outliers may effect domain predictions based on area
level models. This discussion is continued in the context of a design based
simulation. In this study a synthetic population is utilised based on the
Structural Business Survey in the Netherlands. Here the tax-turnover in 20
industry sectors is targeted. This data includes unit level outliers, area
level outliers, as well as an informative sampling design.
de
dc.description.abstract
Die Nachfrage nach zuverlässigen Statistiken für kleine Gebiete hat in den
vergangenen Jahrzehnten stark zugenommen. Ein Grund dafür ist der Bedarf
solcher Statistiken in der amtlichen Statistik. Oft basieren Ergebnisse auf
Umfragedaten und die Hauptaufgabe des Forschungsfeldes der *Small Area
Estimation* ist es die Vorhersagewerte mit Bezug auf den mittleren
quadratischen Vorhersagefehler (MSPE) zu optimieren -- selbst wenn nur wenige
Beobachtungen innerhalb einzelner Gebiete zur Verfügung stehen. In dieser
Arbeit werden dazu räumliche und zeitliche Erweiterungen des Fay-Herriot (FH)
Models genutzt. Diese Modelle basieren stark auf Verteilungsannahmen und in
diesem Zusammenhang können die Ergebnisse leicht durch einzelne Beobachtungen
beeinflusst werden. Hierzu werden deshalb räumliche und zeitliche
Erweiterungen des FH Modells mit Ausreißer-robuster Schätzmethodik kombiniert.
Die Modelle die hierbei genutzt werden sind das FH Modell, eine räumliche
Erweiterung, eine zeitliche Erweiterung und eine räumlich-zeitliche
Erweiterung. Basierend auf diesen Modellen werden robuste Alternativen
vorgestellt. Diese sind eingebettet in die Klasse der gemischten linearen
Modelle. In der Kombination ergeben sich damit robuste empirische beste
lineare unverzerrte Prediktoren (REBLUPs). Das sind (1) der REBLUP, (2) ein
räumlicher REBLUP (SREBLUP), (3) ein zeitlicher REBLUP (TREBLUP), und (4) ein
räumlich-zeitlicher REBLUP (STREBLUP). Diese verschiedenen Erweiterungen
werden in einem gemeinsamen Rahmen von robusten Area-Level-Modellen
dargestellt, wobei dieser auf gemischten linearen Modellen aufsetzt. Zur
Schätzung des MSPE werden ein parametrisches Bootstrap-Verfahren verwendet und
ein analytisch hergeleiteter Schätzer. Zudem wird eine einfache Korrektur des
Vorhersagefehlers \-- der bei der Verwendung robuster Verfahren auftreten kann
-- vorgeschlagen. Diese Korrektur basiert auf einem limited translation
estimator. Zusätzlich zu der methodischen Erweiterung der robusten gemischten
linearen Modelle werden auch die entsprechenden Implementierungen in Form von
Software Paketen vorgestellt. Das R-Paket saeRobust beinhaltet Funktionen, um
alle eingeführten Verfahren in der Praxis anzuwenden. Zudem werden einige
numerische Eigenschaften der Implementierung dargelegt sowie typische
Grafiken, um die Güte von Ergebnissen beurteilen zu können. Außerdem wird das
Paket saeSim vorgestellt. Hierbei handelt es sich um ein R-Paket welches das
Aufsetzen von Simulationsstudien vereinfacht. Dabei werden Werkzeuge zur
Datengenerierung, Stichprobenziehung und die Möglichkeit des parallelen
Rechnens gegeben. Die eingeführten Methoden werden außerdem in model- und
designbasierten Simulationsstudien untersucht. Dabei werden die statistischen
Eigenschaften der Punktschätzungen und auch die der MSPE Schätzung dargelegt.
Diese Untersuchungen basieren auf Daten, die direkt auf der Gebietsebene
generiert werden. Um sowohl einzelne Beobachtungen als auch gesamte Gebiete
als Ausreißer untersuchen zu können, werden in einer weiteren Simulation
Beobachtungen einer Population simuliert. Der Vorteil dabei ist, dass der
gesamte Prozess der Datengenerierung bis hin zu der Anwendung von Area-Level-
Methoden abgebildet werden kann. In einer designbasierten Studie werden dann
die Steuereinnahmen in 20 Industriesektoren vorhergesagt. Diese Studie nutzt
eine synthetischen Population, welche auf dem Structural Business Survey in
den Niederlanden basiert. Diese Untersuchung kombiniert eine informative
Stichprobenziehung mit dem Vorkommen von Ausreißern auf Individual- und
Gebietsebene.
de
dc.format.extent
vii, 151 Seiten
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
mixed linear models
dc.subject
small area estimation
dc.subject
fay herriot model
dc.subject.ddc
300 Sozialwissenschaften::330 Wirtschaft::339 Makroökonomie und verwandte Themen
dc.subject.ddc
500 Naturwissenschaften und Mathematik::510 Mathematik::519 Wahrscheinlichkeiten, angewandte Mathematik
dc.title
Small Area Estimation Using Robust Extensions to Area Level Models
dc.contributor.contact
sebastian.warnholz@fu-berlin.de
dc.contributor.firstReferee
Prof. Dr. Timo Schmid
dc.contributor.furtherReferee
Prof. Dr. Nikos Tzavidis
dc.date.accepted
2016-06-24
dc.identifier.urn
urn:nbn:de:kobv:188-fudissthesis000000102812-7
dc.title.subtitle
Theory, Implementation and Simulation Studies
dc.title.translated
Small-Area-Statistik mit robusten Erweiterungen für Area-Level-Modelle
de
dc.title.translatedsubtitle
Theorie, Implementierung und Simulationsstudien
de
refubium.affiliation
Wirtschaftswissenschaft
de
refubium.mycore.fudocsId
FUDISS_thesis_000000102812
refubium.mycore.derivateId
FUDISS_derivate_000000019880
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access