Die Identifizierung kleiner Moleküle, wie chemische Verbindungen oder Antikörper, welche spezifische Bindungsaffinitäten für Zielproteine aufzeigen, bleibt eine der wichtigsten Herausforderungen in der biologischen, chemischen und medizinischen Forschung. Besonders für die Entdeckung neuer Arzneimittel stellt es ein zentrales Thema dar. Die sogenannten DNA-kodierten Substanz- Banken stellen eine neue Technik für die Synthese und die Selektion einer großen Anzahl von kleinen Liganden, die spezifisch an relevante Proteine binden, dar. Nach einer Affinitäts-basierten Selektion können DNA-kodierte Moleküle mithilfe des eindeutigen DNA-Barcodes identifiziert und analysiert werden. In dieser Arbeit wird die Technik einer neuartigen Synthesestrategie für DNA-kodierte Substanz-Banken beschrieben. Diese wurde auf dem Prinzip der Festphasenpeptidsynthese generiert und basiert auf dem Konzept der sequenzabhängigen Sortierung und anschließenden Synthese (DNA-routed synthesis). Dabei wird die Nukleinsäure (Genotyp) benutzt, um die Synthese von kleinen Molekülen (Phänotyp) zu erfassen. Die hier etablierte Methode basiert auf einem iterativen Ablauf, der sich aus den Hauptkomponenten der Ligations-, Separations, Spaltungs und Synthesereaktion zusammensetzt. Dabei konnte das Verfahren auf den Magnetpartikelprozessor KingFisher Flex von Thermo Scientific übertragen werden, so dass eine halbautomatisierte Technologie entstand. Bereits nach zwei Syntheserunden können 256 verschiedene Molekülvarianten aufgrund der Verwendung von 16 unterschiedlichen Adaptermolekülen, generiert werden. Es konnte mittels Sanger-Sequenzierung gezeigt werden, dass die Sortierung bzw. Separation der ligierten DNA-Bank durch eine sehr kurze einmalige Tagsequenz mittels Hybridisierung möglich und vor allem spezifisch ist. Nach zwei vollständigen Syntheserunden, bei denen die Aminosäuren Glycin und das Vitamin d-Biotin unter 16 verschiedenen Synthesebedingungen an die DNA-Bank synthetisiert wurden, konnten Selektionsexperimente gegen das Zielmolekül Streptavidin durchgeführt werden. Durch die Anwendung der Hochdurchsatzsequenzierung zur Analyse der DNA- kodierten Substanz-Bank konnten die optimalen Synthesebedinungen ermittelt werden. Die Dekodierung des Barcodes gab dabei Aufschlüsse über die verwendeten Synthesebedingungen. Als besonders effizientes Kopplungsreagenz konnte DMT-MM und als Lösungsmittel DMF mittels 454-Pyrosequenzierung ermittelt werden. Dieses Ergebnis stärkt die Tatsache, dass Hochdurchsatzsequenzierung der neuen Generation für die Analyse von DNA- kodierten Substanz-Bank geeignet sind. Der hohe Durchsatz dieser Sequenzierungsart gewährleistet die Analyse von großen Datenmengen DNA- kodierter Substanz-Banken und verringert dabei die Dekodierungskosten. Mit der hier dargestellten Methode konnte gezeigt werden, dass es möglich ist, die neuartigen DNA-kodierten Wirkstoffbanken zur Selektion von optimalen Synthesebedingungen zu verwenden als auch schnell und kostengünstig diese aufzubauen, um dann als Liganden gegen pharmazeutisch und medizinisch bedeutsame Zielmoleküle eingesetzt zu werden.
The identification of small molecules, such as chemical compounds that with high specificity and affinity for given target proteins remains a key challenge in the biological, chemical and medical research. There is a need to discover new drugs, especially with novel properties without limiting constraints such as rational design. The so-called DNA-encoded libraries provide a new approach for the synthesis and the selection of a large number of small ligands that bind specifically to target proteins of interest. DNA- encoded molecules can be identified and analyzed using unique DNA barcodes following an affinity-based selection. In this work, the technique of a novel synthetic strategy for DNA-encoded libraries is described. This was based on the principle of solid-phase peptide synthesis and on the concept of DNA- routed synthesis. The nucleic acid (genotype) is used to detect the synthesis of small molecules (phenotype) following the natural example of protein translation. The established method is based on an iterative process, composed of the main steps of ligation, separation, cleavage and synthesis reaction. The method was adapted to the magnetic particle processor KingFisher Flex from Thermo Scientific, resulting in a a semi-automated procedure. Already after two rounds of synthesis 256 different molecule variants can be generated by using 16 different adapter molecules. Shown by Sanger sequencing, specific sorting and separation of the ligated DNA library by hybridization is possible by using a very short and unique tag sequence. After two full synthesis rounds in which the amino acids glycine and the vitamin d-biotin were synthesized to the encoding DNA library using 16 different synthesis conditions, selection experiments against the target molecule streptavidin were performed. Optimal synthesis conditions were determined by using high-throughput sequencing for the analysis of the enriched DNA-encoded library. The decoding of the barcode elucidated the respective synthesis conditions. Through the use of the 454 pyrosequencing system a particularly efficient coupling reagent DMT-MM in combination with the solvent DMF could be determined. This result reinforces the fact that the new generation of massive parralell sequencing is highly suitable for analysis of DNA-encoded libraries. The high throughput of these sequencing systems ensures the analysis of large data sets of DNA-encoded chemical libraries and thereby reduces the costs of decoding. With the described method it was demonstrated that it is possible to use the novel DNA- encoded chemical libraries for the selection of optimal synthesis conditions. These can be constructed quickly and inexpensive and applied in high throughput screening processes for ligand discovery of pharmaceutically and medically important target molecules.