The present paper describes a method to anonymize trajectories which focuses on a subsequent automated map construction. A process of automated map construction is intensively discussed in related work, particularly since the availability of devices with GPS and Internet access is increasing rapidly. Furthermore, there are already means to anonymize trajectory data. However, these concentrate not on a subsequent map construction. The subsequent use of these anonymized data is mostly data analysis which can, for example, answer the following questions: What are main traffic flows? Which districts have the highest number of connections in-between? Within this process detailed data is destroyed because it is not relevant to answer those questions. However, detailed data is necessary to provide evidence about a map: With the help of the exact course of the GPS traces, the exact course of the road can be deducted, with the analysis of movements turn rules can be created, and with the variation of the GPS traces the width of the road or the number of lanes can be determined. With the help of a map construction targeted anonymization method, which can be integrated in a data collection process, detailed data is preserved and generic data is dismissed. Important elements are the identification of proximate trajectories and the aggregation and representation of trajectories. The evaluation compares the merging of GPS trajectories to trajectory aggregations. Therefore, particularly multiple distance measures and multiple merging strategies are compared to each other. An important conclusion is that little improvements, which are targeted to solve practical problems, have a stronger impact on the quality of the result than the application of different distance measures.
Die vorliegende Arbeit beschreibt ein Verfahren zur Anonymisierung von Trajektorien, welches auf eine nachgelagerte automatisierte Kartengenerierung ausgerichtet ist. Eine automatisierte Kartengenerierung ist in der Literatur schon oftmals behandelt worden, vor allem seit die Verbreitung von Geräten mit GPS und Internetzugang zunimmt. Weiterhin gibt es bereits Verfahren zur Anonymisierung von GPS Spuren. Diese konzentrieren sich aber nicht auf eine mögliche spätere Verwendung zur Erstellung von Kartenmaterial. Der nachgelagerte Nutzen dieser anonymisierten Daten besteht vor allem in der späteren Datenanalyse, z.B. der Beantwortung von folgenden Fragen: Was sind hauptsächliche Verkehrsströme? Zwischen welchen Stadtgebieten gibt es die meisten Verbindungen? Dabei werden Detaildaten vernichtet, da sie für die Beantwortung nicht relevant sind. Diese Daten sind aber wichtig, um Aussagen über eine Karte zu treffen: Durch den genauen Verlauf von GPS Spuren kann auf den Straßenverlauf geschlossen werden, durch das Erkennen von Bewegungen können Abbiegevorschriften erstellt werden und durch die Varianz von GPS Spuren kann die Straßenbreite oder die Anzahl der Spuren ermittelt werden. Mit einem speziell dafür ausgerichtetem Anonymisierungsverfahren, welches in einen Datensammelprozess eingebunden werden kann, werden Detailinformationen erhalten und übergeordnete Informationen verworfen. Wichtige Bestandteile sind die Erkennung von zusammengehörigen Trajektorien und die Zusammenfassung und Repräsentation von Trajektorien. Die Evaluation vergleicht das Zusammenführen von GPS Spuren zu Aggregationen. Dabei werden insbesondere mehrere Distanzmaße und mehrere Strategien zur Zusammenführung miteinander verglichen. Eine wesentliche Aussage ist, dass kleinere Verbesserungen, welche darauf ausgerichtet sind, konkrete Probleme zu lösen, einen größeren Beitrag zu der Ergebnisgüte leisten können als die Anwendung unterschiedlicher Distanzmaße.