A major characteristic of life sciences is the generation of vast amounts of raw data produced by modern wet lab technologies. The data may come from large-scale experiments where chemical compounds are tested on their ability to act as possible agents against certain diseases. It can also originate in the determination of the 3D structure of macromolecules, or from the genetic code of a species. Evaluation and integration of that raw data is becoming increasingly important. Currently, often only a fraction of the generated data is integrated and evaluated. The data integration problem is addressed in the first part of the work. A data-warehouse is developed that integrates 3D information on proteins with information about potential drugs, potential binding sites and advanced 3D binding site screening techniques. Furthermore, as similarity screening of molecules and proteins can often only be carried out with limited accuracy on a limited amount of data sets. A framework is presented that facilitates the integration of data sources and methods with an emphasis on exact 3D screening techniques. The amount of searchable macromolecular structures, such as proteins and RNAs is growing rapidly. However, there are only a few methods available allowing for a rapid 3D screening of thousands of proteins, and only a handful of methods can be used for aligning RNA structures. A novel method is presented that uses n-grams and index structures in concert with a nomenclature that reduces a biomolecule to a string. It can be shown that the method delivers comparable or better results in comparison to leading methods in the field of protein and RNA alignment. The method can be used in high throughput experiments because of its precision and adjustable speed. The last part of the work deals with interaction and signal transduction. Expression levels correlate to the amount of signals that are transduced in a biological network. Various concepts are evaluated that map expression levels of genes on the apoptosis signal transduction network using Petri nets. Finally, a software package is presented that is able to simulate Petri nets based on the developed paradigm. The software can hide the complexity of the Petri net, which allows non- computer experts to use the software efficiently.
Eine Hauptcharakteristik der Lebenswissenschaften ist die große Menge von Rohdaten, die von modernen biotechnologischen Verfahren erzeugt werden. Diese Rohdaten können beispielsweise von großen Experimentalreihen stammen, die untersuchen, ob bestimmte Moleküle gegen eine Krankheit wirken. Des Weiteren entstehen große Mengen von Rohdaten bei der Bestimmung der 3D Struktur von Biomolekülen und bei der Aufklärung des genetischen Codes von Lebewesen. Die Auswertung und Integration wird daher zunehmend wichtiger – zurzeit wird jedoch nur ein kleiner Teil dieser Rohdaten integriert. Datenintegration ist Gegenstand des ersten Teils dieser Arbeit. Ein Data-Warehouse wird vorgestellt, das 3D Information von Proteinen mit Wissen über Medikamente und 3D Techniken zur Analyse bzw. Vorhersage von Bindungsstellen integriert. Die begrenzte Genauigkeit, mit der Moleküle in Datenbanken gesucht werden können, ist oftmals ein weiteres Problem. Aus diesem Grund wurde ein Framework entwickelt, das die Integration von Datenquellen und Methoden zur genauen 3D Suche ermöglicht. Die Anzahl an 3D Strukturen von Makromolekülen wie Proteinen und RNS wächst rapide. Es gibt jedoch nur wenige Methoden, die eine 3D Ähnlichkeitssuche auf tausenden Proteinen in Echtzeit erlauben. Zudem gibt es nur wenige Methoden, die auf RNS Strukturen funktionieren. Diese Arbeit präsentiert eine neue Methode, die auf der Umwandlung von 3D Strukturen zu Zeichenketten basiert. Zur schnellen Suche wird eine Index Struktur verwendet. Es kann gezeigt werden, dass die Methode ähnliche oder bessere Resultate im Vergleich zu führenden Methoden im strukturellen Protein- und RNS-Alignment liefert. Die Methode kann in Hochdurchsatz-Experimenten verwendet werden, da Geschwindigkeit und Präzision eingestellt werden kann. Der letzte Teil der Arbeit befasst sich mit der Interaktion in Signalwegen. RNS Expressionsraten von Proteinen korrelieren häufig mit der Anzahl von Signalen die von diesen Proteinen in einem biologischen Netzwerk generiert werden. Daher werden verschiedene Konzepte evaluiert, die die Expression von Genen auf den Signalweg der Apoptose übertragen. Die Abstraktion des Apoptose Signalwegs erfolgt durch ein Petri Netz. Zudem wird ein Softwarepaket vorgestellt, das Petri Netze simulieren kann. Die Software ist in der Lage, die Komplexität des Petri Netzes auszublenden, was ermöglicht, dass Nicht-Experten die Software benutzen.