In this work, the developments and results of the non-sequential structure alignment method GANGSTA+ are presented. The method solves the structure alignment problem hierarchically. Initially the secondary structure elements of two protein structure pairs are assigned. This is achieved with a deterministic algorithm, which solves the so called contact-map-overlap problem with a combinatorial approach. After the assignment of secondary structure elements between a protein structure pair, GANGSTA+ translates the assignment to the residue-level with a point matching approach, which is described in detail in this work. On the basis of the residue-level assignment a transformation matrix is determined, which aligns the two protein structures to each other. Contrary to most other methods GANGSTA+ is able to ignore the sequential order of the assigned secondary structure elements and is even able to align secondary structure elements in sequence reversed direction. Despite the enlarged solution space, the method is approximately as fast as the fastest available sequential structure alignment methods. GANGSTA+ has been applied on several million protein structure pairs and the results have been made available to the public by online services. It could be shown that GANGSTA+ is able to find non-sequential structural analogs for protein structures stated to be novel folds. The whole functionality of GANGSTA+ is available to the public at several online services and applications.
In dieser Arbeit werden die Entwicklung und die Ergebnisse der nicht- sequentiellen Proteinstrukturüberlagerungsmethode GANGSTA+ vorgestellt. Die Methode löst das Strukturüberlagerungsproblem stufenweise und bestimmt zu Anfang eine Zuordnung von Sekundärstrukturelementen zwischen einem gegebenen Proteinstrukturpaar. Dies geschieht mit einem deterministischen Algorithmus, der das sogenannte „contact-map-overlap“ Problem kombinatorisch optimiert. Auf die Zuordnung der Sekundärstrukturelemente folgt dann die Bestimmung einer eindeutigen Zuordnung der Residuen beider Proteinstrukturen. Dies wird mithilfe einer Punktüberlagerungsmethode erreicht, welche detailliert in dieser Arbeit erläutert wird. Ist die eindeutige Zuordnung auf Residuenebene bestimmt wird eine Transformationsmatrix ermittelt, welche die beiden Proteinstrukturen überlagert. Im Gegensatz zu den meisten anderen Methoden ist GANGSTA+ in der Lage die sequentielle Anordnung der Sekundärstrukturelemente zu ignorieren und sogar sequenzinvertierte strukturelle Ähnlichkeiten zu ermitteln. Trotz des größeren Lösungsraumes ist die Methode in etwa so schnell wie die schnellsten bisher entwickelten sequentiellen Strukturüberlagerungsmethoden. GANGSTA+ wurde auf mehrere Millionen Proteinpaare angewendet und die Ergebnisse sind öffentlich zugänglich gemacht worden. Es konnte gezeigt werden das GANGSTA+ in der Lage ist für Proteinstrukturen, welche als neu gelten, nicht-sequentielle Strukturanaloga zu finden. Die gesamte Funktionalität von GANGSTA steht der Öffentlichkeit über mehrere Internetseiten und Softwareanwendungen zur Verfügung.