dc.contributor.author
Mack, Benjamin Manuel
dc.date.accessioned
2018-06-07T20:11:15Z
dc.date.available
2017-06-26T11:18:02.403Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/6686
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-10885
dc.description.abstract
Land use and land cover maps are crucial information products required for
various purposes in scientific, administrative and commercial domains. Such
maps can be efficiently derived by supervised classification of remote sensing
data. In many such mapping projects the collection of reference data, which is
required for building the classification model, is one of the largest items of
expenditure. When only one or a few classes need to be mapped, e.g. an
invasive species, one-class classification (OCC) is an attractive pattern
recognition approach. It allows for the learning of a classification model
from labeled reference data for the class of interest only. There is no need
for a representative dataset for the counter-class which consists of all other
classes and is therefore often much more difficult to generate. However, in
real-world applications it can be very challenging to handle flexible state-
of-the-art OCC algorithms. There is a large body of scientific literature
addressing OCC which can be grouped in methodological and applied research.
Likewise, the scientists generating this research can be grouped in two
communities: the developers and users of OCC algorithms. This thesis reflects
on the differences between the prevalent methods, objectives and datasets in
the two communities. It identifies and closes knowledge, methodological and
technological gaps that are particularly relevant from a user's perspective.
In particular, this thesis provides an in-depth comparative study including
three base classifiers and several parameter and model selection approaches.
The study is innovative since, in contrast to other comparative studies, it
incorporates the potential performance of the base classifiers and analyses
the performance loss due to the model selection approaches. It shows that in
many cases a high performance loss has to be accepted when relying on fully
automatic approaches. Furthermore it shows that the potential performance of
MaxEnt, one of the most frequently used algorithms in the user community, is
poorer than the biased SVM, a less frequently used algorithm that is perceived
as more difficult to tune. The results directly motivate the development of
strategies and analytical tools which support the user during model selection
and improves the handling of flexible but complicated algorithms such as the
biased SVM. Finally, an objective was to study a specific type of OCC problem
in which the class of interest is very rare in the area to be mapped and where
the number of positive labeled training samples is small. While such data
characteristics are frequently met by users they are rather unusual in the
benchmark datasets used by developers. A novel OCC approach is developed which
is designed for handling such problems.
de
dc.description.abstract
Landbedeckungs- und Landnutzungskarten sind wesentliche Informationsprodukte
für zahlreiche wissenschaftliche, administrative und kommerzielle Aufgaben.
Solche Karten können mit Hilfe der überwachten Klassifikation effizient aus
Fernerkundungsdaten gewonnen werden. In vielen Kartierungsprojekten ist die
Generierung von Referenzdaten für das Training des Klassifikators ein
wesentlicher Kostenpunkte. Wenn nur wenige Klassen kartiert werden müssen,
z.B. eine invasive Art, stellt die 1-Klassen Klassifikation (1KK) einen
attraktiven Ansatz dar. Sie ermöglicht das Lernen eines Klassifikationsmodells
aus gelabelten Refernzdaten der Zielklasse. Ein representativer Datensatz für
die Gegenklasse ist nicht nötig. Diese Gegenklasse besteht aus allen anderen
Klassen des Untersuchungsgebietes und ist daher schwer zu charakterisieren. In
realen Anwendungen können flexible 1-Klassen Klassifikatoren allerdings schwer
zu handhaben sein. Die existierende wissenschaftliche Literatur zu 1KK kann in
methodische und angewandte Forschung gruppiert werden. Ebenso lassen sich die
Wissenschaftler in zwei Gruppen einteilen, die Entwickler und die Nutzer von
1KK-Algorithmen. In dieser Doktorarbeit werden die Unterschiede zwischen den
vorherrschenden Methoden, Zielen und Datensätzen in den beiden Gruppen
kritisch reflektiert. Forschungsbedarf, der insbesondere aus der Perspektive
des Nutzers von Relevanz ist, wird identifiziert. Im Rahmen dieser Arbeit
wurde eine vergleichende Studie durchgeführt, in welcher drei
Basisklassifikatoren, verschiedene Modellselektionsverfahren untersucht
wurden. Die Studie ist innovativ, da sie die potentielle Performanz der
Basisklassifikatioren und den Performanzverlust aufgrund der
Modellselektionsverfahren offenlegt. Das zeigt, dass mit voll-automatischen
Modellselektionsverfahren in vielen Fällen ein hoher Performanzverlust in Kauf
genommen werden muss. Außerdem wird deutlich, dass die potentielle Performanz
von MaxEnt, einer der am häufigsten verwendenten Klassifikatoren in der Gruppe
der Anwender, schlechter abschneidet als die biased SVM, ein weniger häufig
verwendeter Algorithmus, der als schwieriger in der Handhabung gilt. Die
Ergebnisse motivieren die Entwicklung einer Strategie und analytischer
Werkzeuge, welche den Nutzer während der Modellselektion unterstüzen und die
Handhabung flexibler und komplizierter Algorithmen wie der biased SVM
vereinfachen. Schließlich ist ein Ziel dieser Arbeit, die Untersuchung der 1KK
besonders schwieriger Datensätze mit ungleicher Klassenverteilung und einer
kleinen Menge an gelabelten Trainingsdaten. Während Datensätze mit solchen
Charakteristika unter Nutzern häufig auftreten, sind diese eher selten unter
den Benchmark-Datensätzen der Entwickler anzutreffen. Ein neuartiger 1KK-
Ansatz wurde entwickelt, welcher besonders für die Lösung solcher Probleme
geeignet ist.
de
dc.format.extent
xv, 106 Seiten
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
Remote sensing
dc.subject
one-class classification
dc.subject
land-cover classification
dc.subject
land-use classification
dc.subject.ddc
500 Naturwissenschaften und Mathematik::550 Geowissenschaften, Geologie::550 Geowissenschaften
dc.title
Applied One-Class Classification of Remote Sensing Data
dc.contributor.contact
ben8mack@gmail.com
dc.contributor.firstReferee
Prof. Dr. Björn Waske
dc.contributor.furtherReferee
Prof. Dr. Sebastian Schmidtlein
dc.date.accepted
2017-06-16
dc.identifier.urn
urn:nbn:de:kobv:188-fudissthesis000000104936-2
dc.title.translated
Angewandte Ein-Klassen Klassifikation von Fernerkundungsdaten
de
refubium.affiliation
Geowissenschaften
de
refubium.mycore.fudocsId
FUDISS_thesis_000000104936
refubium.mycore.derivateId
FUDISS_derivate_000000021693
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access