Protein-DNA interaction plays a major role in gene regulation. As the human genome has been successfully decoded, the current focus of research is now on understanding the interaction of genes and what they are doing. Understanding these mechanisms is crucial to better understand and cure diseases where gene regulation is important. The tools currently available to analyze living cells at a molecular level are still very limited. It is still not known how genes are regulated and which proteins can physically interact with them. ChIP-nexus is a protocol that quantitatively analyzes the interaction of proteins with deoxyribonucleic acid. Tools presented in this work aim to optimize the results obtained by this method and make it easy to use. Results: The newly developed tools have been successfully validated against published data. Furthermore, the results could be improved in some aspects such as the number of useable reads. The useability could be improved by integrating all preprocessing tools into two programs that are still flexible enough to allow for possible future changes. Speed improvements in the order of 5 times were achieved by applying multithreading techniques and using vector instructions.
Protein-DNA Interaktion spielt eine große Rolle in Genregulation. Seitdem das menschliche Genom vor einigen Jahren entschlüsselt wurde, liegt der Fokus nun darauf ein besseres Verständnis dieser Gene und deren Regulation zu erlangen. Verständnis dieser Mechanismen ist entscheidend, um Krankheiten, bei denen Genregulation eine Rolle spielt, besser zu verstehen und zu heilen. Aktuell sind die zur Verfügung stehenden Werkzeuge, um lebende Zellen auf molekularer Ebene zu untersuchen, noch sehr begrenzt. Für viele Gene ist immer noch nicht bekannt, wie sie reguliert werden und welche Proteine mit den entsprechenden Stellen auf der DNA interagieren. ChIP-nexus ist eine Methode, welche geeignet ist neue Erkenntnisse über Protein-DNA Interaktion zu gewinnen. Die in dieser Arbeit vorgestellten Werkzeuge helfen dabei dies zu erleichtern und das Verfahren durch eine effiziente und einfache bioinformatische Analyse-Pipeline einem größerem Publikum zugänglich zu machen. Ergebnisse: Die neu entwickelten Programme wurden erfolgreich anhand veröffentlichter Daten validiert. Die Ausbeute an nutzbaren Daten konnte durch neue Verarbeitungsmethoden gesteigert werden. Außerdem konnte die Benutzbarkeit durch Integration aller Verarbeitungsschritte deutlich erleichtert werden. Die Geschwindigkeit des Preprozessings wurde durch Anwendung von Multithreading-Techniken und Verwendung von Vektorinstruktionen durchschnittlich 5-fach gesteigert.