The pandemic spread of HIV started almost 30 years ago and has claimed the lives of several million people since then. The virus attacks the immune system of its host. Untreated, the HIV infection leads to drastic opportunistic diseases, advancing to AIDS after a few years. At this stage, the immune system is severely damaged and causes the decease of the infected person. Fortunately, the number of new infections per year decreases thanks to extensive HIV/AIDS-awareness campaigns and potent treatment regimen. Whilst to date no vaccination or cure for an HIV infection has been found, there exist antiviral treatments, which allow infected people to reach a close to normal life expectancy. Still, the pandemic can not be eradicated, with annually new infections world wide running into millions, especially in developing countries. The reason is, on the one hand, lacking HIV education, hence renouncing of prevention, and on the other hand, unavailable treatment options. Also in developed countries the virus continues to spread, despite of pervasive awareness- and treatment programs. The highest risk of further transmission is early after infection. This can be explained with the elevated virus load in the human body in the early (acute) phase after transmission, in combination with the initial unawareness of the own infection. Usually, medication lowers the risk of viral transmission. However, HIV is a rapidly mutating virus with a fast replication cycle, which allows it to quickly adapt to selective pressure. This entails the development of resistant mutations, leading to reduced or no effect of an antiviral drug. The combination of drugs needs to be changed accordingly, to prevent treatment failure. The situation gets critical, if multi-drug resistances occur and hardly any drug combination is working. Yet, mutational pathways of reaching resistant mutations include bottlenecks and can only be acquired with a certain genomic background. It remains an ongoing challenge to learn more about the constraints for the virus to develop drug resistance. The currently available antiviral drugs target different processes of the HIV life cycle by binding to crucial enzymes, and other involved proteins, or by competing with nucleosides to stop the reverse transcription process. Recently, new therapeutic strategies are advancing: Despite the encoding for essential proteins, RNAs comprise a multitude of regulatory elements and functional structures controlling virtually all biological processes. Hence, regulating motifs in RNAs are promising drug targets, and first achievements in this direction have been attained. Nevertheless, processes of the regulatory mechanisms in the HIV life cycle, as well as detailed structural information of the RNA are still underexplored. In this work, we present methods for the qualitative and quantitative inference of evolutionary constraints, including the Mutational Intereference Mapping Experiment (MIME) and direct coupling analysis (DCA). Based on the former, we provide the software MIMEAnTo to predict functional elements in RNA. Furthermore, results of the adaption of the MIME framework to in cell experiments are presented. We determined regulatory motifs in the 5' UTR of HIV-1, which are essential for viral RNA production in cells, as well as the packaging process of nascent virions, respectively. Lastly, we attempt to improve the prediction of functional regions with MIME by incorporating methods used in DCA. We set up a benchmark with different scenarios of mutational effects (disrupting function) including pairwise epistasis (evolutionary constraints), and could indeed see improvements for a number of cases. Yet, these are preliminary results, which encourage us to further address the approach in more detail.
Seit ihrem Beginn vor etwa 30 Jahren, konnte die weltweite Epidemie von HIV noch immer nicht aufgehalten werden und kostete seither mehrere Millionen Menschenleben. Der Virus greift das Immunsystem seines Wirtes an. Bleibt eine HIV Infektion unbehandelt, führt sie zu schweren opportunistischen Erkrankungen, bis hin zu AIDS. In dieser Phase ist das Immunsystem bereits schwer geschädigt und führt rasch zum Tode der infizierten Person. Glücklicherweise ist die Zahl der jährlichen Neuinfektionen aufgrund umfassender Aufklärungskampagnen und effektiver Behandlungsmöglichkeiten rückläufig. Zwar wurde bis heute keine wirksame Impfung oder vollkommene Heilung entdeckt, jedoch können infizierte Personen mit Hilfe von antiretroviralen Therapien eine nahezu durchschnittliche Lebenserwartung erreichen. Allerdings ist HIV, bedingt durch hohe Mutationsrate und schnellem Replikationszyklus, ein besonders anpassungsfähiger Virus, was ihm ermöglicht, Resistenzen gegen Medikamente auszubilden. Die Situation wird besonders kritisch, wenn sich Multiresistenzen entwickeln. Die Entdeckung neuer Behandlungsstrategien ist daher von dringender Notwendigkeit. RNAs enthalten neben Genregionen, in denen essentielle Proteine kodiert sind, eine Vielzahl regulatorischer Elemente und funktionaler Strukturen, die die meisten biologischen Prozesse beeinflussen. Eine Veränderung dieser Regionen durch Mutation, würde unter Umständen zur Folge haben, dass der Organismus nicht überlebt, da lebenswichtige Funktionen nicht ausgeführt werden können. Funtionsrelevante Motive und Strukturen bilden sogenannte Evolutionary Constraints, also funktions- und strukturabhängige Hemmung von Evolution. Das macht sie zu vielversprecheneden Angriffspunkten für neue Wirkstoffe. Dies setzt detailliertes Wissen über die regulatorischen Mechanismen und notwendigen Strukturen vorraus, die an lebenswichtigen Prozessen des HIV Zyklus beteiligt sind. Jedoch sind die genauen Abläufe und Zusammenhänge dieser Mechanismen nicht ausgiebig erforscht. In der vorliegenden Arbeit behandeln wir Techniken zur Bestimmung von Evolutionary Constraints, im Kontext von genomischer RNA in HIV. Wir erläutern unterschiedliche Herangehensweisen, um qualitative und quantitative Rückschlüsse auf Evolutionary Constraints zu ziehen. Hauptaugenmerk legen wir dabei auf die beiden Methoden Direct Coupling Analysis (DCA) und Mutational Interference Mapping Experiment (MIME). Basierend auf Letzterer, präsentieren wir Software zur Vorhersage von funktionalen Elementen in RNA. Des Weiteren haben wir das MIME Framework für in cellulo Experimente adaptiert. Dabei konnten wir regulatorische Motive im 5' untranslatierten Bereich des HIV-1 Genoms detektieren, welche sowohl wichtig für die Produktion viraler RNA in Zellen, als auch für die Integration des viralen Genoms in neu entstehende Viren sind. Zum Schluss haben wir das Ziel verfolgt, die Vorhersage funktionaler Regionen in MIME zu verbessern, in dem wir an DCA angelehnte Methoden einbeziehen. Dazu führen wir einen Benchmark mit verschiedenen Szenarien durch. Wir generieren Daten mit unterschiedlich vielen Mutationseffekten, welche die Funktion der RNA einschränken, sowie paarweiser Epistasis (Evolutionary Constraints). Tatächlich konnten wir für einige Fälle Verbesserungen feststellen. Dies sind jedoch vorerst vorläufige Ergebnisse, die uns aber bestärken, diesen Ansatz weiter zu verfolgen.