Evolution is a major actor of function of living beings. Studying biological processes with the perspective of an evolutionary biologist is important in order to have the most complete picture possible of the processes acting in nature. Following this idea, we have studied protein sequences to study two different biological systems. Such information was used to build evolutionary scenarios for our two questions. We first studied alpha-solenoid repeat proteins. We have improved a method to detect such motives inside of protein sequences and applied this updated method to all sequences available in protein databases. The study of the distribution of such sequences in the tree of life shows that eukaryota are the taxons displaying the most this type of structure, as well as two groups of bacteria, cyanobacteria and planctomycetes. Importantly, the three groups of alpha-solenoid show limit similarity. We speculate that they appeared independently. Equally important, the three groups, eukaryota and the two bacteria taxons, are associated with increased cellular complexity versus classical bacteria groups. We hypothesized that the increased demand of protein important to protein transport and synthesis in living beings with compartmentalized cells induces a higher recruitment of alpha-solenoid proteins, as they require more complex protein machinery in order to be built. This high pressure could have occurred in the three groups independently, increased the recruitment of alpha-solenoid proteins. The second evolutionary scenario we tried to put together is about the renin-angiotensin system which regulates hypertension in higher vertebrates. To perform this, we conducted a phylogenetic analysis of a dozen of proteins involved in the system, from higher vertebrates to invertebrates. We found that contrary to naïve thinking, some of the components of the system appeared before the set of the system, and had a complete different function, showing orthologue sequences in invertebrates. Some proteins, present in taxons with no regulation of hypertension such as Drosophila, were previously used for development a long time before being co-opted for homeostasis regulation in vertebrates. We could confirm the onset of the system around the appearance of cartilage fishes, around 400 million years ago. Both analysis, of alpha-solenoid repeat proteins and protein sequences from the renin- angiotensin system, showed the importance of using evolutionary cues in order to better comprehend how living being work. Aside from these evolutionary scenarios, we also used evolutionary along with structural information in order to study the impact of mutations for the structure of various proteins, and the relation of such mutations to disease and function. For these analyses, we have developed a tool called PDBpaint to visualize various annotations on the structure of proteins.
Evolution prägt die Funktionsweise aller Lebewesen. Es ist notwendig biologische Prozesse aus der Perspektive eines Evolutionsbiologen zu betrachten, wenn man ein möglichst vollständiges Bild von den natürlichen Vorgängen erhalten möchte. In diesem Sinne haben wir Proteinsequenzen herangezogen um zwei verschiedene biologische Systeme zu untersuchen und um Evolutionsszenarios für unsere beiden Fragestellungen zu entwickeln. Zunächst analysierten wir Proteine mit sich wiederholenden Alpha-Solenoidsequenzen. Wir verbesserten eine Methode zur Detektion solcher Motive innerhalb von Proteinsequenzen und wandten die verbesserte Methode auf alle Sequenzen an, die in Proteindatenbanken erhältlich waren. Die Untersuchung der Verteilung solcher Motive im phylogenetischen Stammbaum der Arten zeigte, dass besonders Eukaryonten und zwei Gruppen von Bakterien, die Cyanobakterien und Planctomyceten, diese Struktur tragen. Wichtig hierbei ist, dass die drei Gruppen von Alpha-Solenoidsequenzen nur begrenzte Ähnlichkeit aufweisen. Wir nehmen an, dass sie unabhängig voneinander entstanden sind. Genauso wichtig ist, dass die drei Gruppen, Eukaryonten und die zwei bakteriellen Taxa, ein erhöhtes Maß an zellulärer Komplexität aufweisen im Vergleich mit anderen bakteriellen Gruppen. Unsere Hypothese ist, dass Alpha-Solenoid Proteine durch den zunehmendem Bedarf an Proteinen für Transport und Synthese in Lebewesen mit kompartmentalisieren Zellenvermehrt entstehen, da sie eine komplexe Proteinmaschinerie benötigen, um gebildet zu werden. Dieser Druck könnte in allen drei Gruppen unabhängig bewirkt haben, dass Alpha-Solenoid Proteine in immer größerer Zahl hervorgebracht wurden. Das zweite evolutionäre Szenario, das wir untersuchten, das Renin-Angiotensin System, reguliert Bluthochdruck in höheren Vertebraten. Wir unternahmen eine phylogenetische Analyse von zwölf Proteinen, die in das System involviert sind, von höheren Vertebraten bis hin zu Invertebraten. Wir fanden heraus, dass entgegen unseren Erwartungen einige Komponenten lange vor dem eigentlichen Regulationssystem auftraten, mit völlig anderen Funktionen, gezeigt anhand von orthologen Sequenzen in Invertebraten. Einige Proteine, die in Taxa ohne Regulation von Bluthuchdruck zu finden sind, so wie Drosophila, wurden schon lange vorher für die Regulation von Entwicklung verwendet. Wir konnten bestätigen, dass das System etwa gleichzeitig mit den Knorpelfischen entstand, ca. vor 400 Millionen Jahren. Beide Analysen, sowohl die der Alpha-Solenoid Proteine als auch der Proteinsequenzen des Renin-Angiotensin Systems, haben gezeigt, wie wichtig es ist, Hinweise aus der Evolution in die Betrachtungen mit einzubeziehen, bei dem Versuch Lebewesen und ihre Funktionsweise, zu verstehen. Neben diesen Evolutionsszenarios verwendeten wir evolutionäre gleichzeitig mit strukturellen Informationen um den Einfluss von Mutationen auf die Struktur verschiedener Proteine zu erforschen, sowie die Beziehung solcher Mutationen zu Krankheit und Funktion. Für solche Analysen haben wir PDBpaint entwickelt, ein Werkzeug zur Visualisierung von Annotationen in Proteinstrukturen.