Land use and land cover maps are crucial information products required for various purposes in scientific, administrative and commercial domains. Such maps can be efficiently derived by supervised classification of remote sensing data. In many such mapping projects the collection of reference data, which is required for building the classification model, is one of the largest items of expenditure. When only one or a few classes need to be mapped, e.g. an invasive species, one-class classification (OCC) is an attractive pattern recognition approach. It allows for the learning of a classification model from labeled reference data for the class of interest only. There is no need for a representative dataset for the counter-class which consists of all other classes and is therefore often much more difficult to generate. However, in real-world applications it can be very challenging to handle flexible state- of-the-art OCC algorithms. There is a large body of scientific literature addressing OCC which can be grouped in methodological and applied research. Likewise, the scientists generating this research can be grouped in two communities: the developers and users of OCC algorithms. This thesis reflects on the differences between the prevalent methods, objectives and datasets in the two communities. It identifies and closes knowledge, methodological and technological gaps that are particularly relevant from a user's perspective. In particular, this thesis provides an in-depth comparative study including three base classifiers and several parameter and model selection approaches. The study is innovative since, in contrast to other comparative studies, it incorporates the potential performance of the base classifiers and analyses the performance loss due to the model selection approaches. It shows that in many cases a high performance loss has to be accepted when relying on fully automatic approaches. Furthermore it shows that the potential performance of MaxEnt, one of the most frequently used algorithms in the user community, is poorer than the biased SVM, a less frequently used algorithm that is perceived as more difficult to tune. The results directly motivate the development of strategies and analytical tools which support the user during model selection and improves the handling of flexible but complicated algorithms such as the biased SVM. Finally, an objective was to study a specific type of OCC problem in which the class of interest is very rare in the area to be mapped and where the number of positive labeled training samples is small. While such data characteristics are frequently met by users they are rather unusual in the benchmark datasets used by developers. A novel OCC approach is developed which is designed for handling such problems.
Landbedeckungs- und Landnutzungskarten sind wesentliche Informationsprodukte für zahlreiche wissenschaftliche, administrative und kommerzielle Aufgaben. Solche Karten können mit Hilfe der überwachten Klassifikation effizient aus Fernerkundungsdaten gewonnen werden. In vielen Kartierungsprojekten ist die Generierung von Referenzdaten für das Training des Klassifikators ein wesentlicher Kostenpunkte. Wenn nur wenige Klassen kartiert werden müssen, z.B. eine invasive Art, stellt die 1-Klassen Klassifikation (1KK) einen attraktiven Ansatz dar. Sie ermöglicht das Lernen eines Klassifikationsmodells aus gelabelten Refernzdaten der Zielklasse. Ein representativer Datensatz für die Gegenklasse ist nicht nötig. Diese Gegenklasse besteht aus allen anderen Klassen des Untersuchungsgebietes und ist daher schwer zu charakterisieren. In realen Anwendungen können flexible 1-Klassen Klassifikatoren allerdings schwer zu handhaben sein. Die existierende wissenschaftliche Literatur zu 1KK kann in methodische und angewandte Forschung gruppiert werden. Ebenso lassen sich die Wissenschaftler in zwei Gruppen einteilen, die Entwickler und die Nutzer von 1KK-Algorithmen. In dieser Doktorarbeit werden die Unterschiede zwischen den vorherrschenden Methoden, Zielen und Datensätzen in den beiden Gruppen kritisch reflektiert. Forschungsbedarf, der insbesondere aus der Perspektive des Nutzers von Relevanz ist, wird identifiziert. Im Rahmen dieser Arbeit wurde eine vergleichende Studie durchgeführt, in welcher drei Basisklassifikatoren, verschiedene Modellselektionsverfahren untersucht wurden. Die Studie ist innovativ, da sie die potentielle Performanz der Basisklassifikatioren und den Performanzverlust aufgrund der Modellselektionsverfahren offenlegt. Das zeigt, dass mit voll-automatischen Modellselektionsverfahren in vielen Fällen ein hoher Performanzverlust in Kauf genommen werden muss. Außerdem wird deutlich, dass die potentielle Performanz von MaxEnt, einer der am häufigsten verwendenten Klassifikatoren in der Gruppe der Anwender, schlechter abschneidet als die biased SVM, ein weniger häufig verwendeter Algorithmus, der als schwieriger in der Handhabung gilt. Die Ergebnisse motivieren die Entwicklung einer Strategie und analytischer Werkzeuge, welche den Nutzer während der Modellselektion unterstüzen und die Handhabung flexibler und komplizierter Algorithmen wie der biased SVM vereinfachen. Schließlich ist ein Ziel dieser Arbeit, die Untersuchung der 1KK besonders schwieriger Datensätze mit ungleicher Klassenverteilung und einer kleinen Menge an gelabelten Trainingsdaten. Während Datensätze mit solchen Charakteristika unter Nutzern häufig auftreten, sind diese eher selten unter den Benchmark-Datensätzen der Entwickler anzutreffen. Ein neuartiger 1KK- Ansatz wurde entwickelt, welcher besonders für die Lösung solcher Probleme geeignet ist.