dc.contributor.author
Köhler, Sebastian
dc.date.accessioned
2018-06-07T21:05:28Z
dc.date.available
2013-05-28T11:48:13.816Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/7379
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-11578
dc.description.abstract
Das Verständnis der Beziehungen zwischen menschlichen Phänotypen und den
zugrunde liegenden Genen ist ein zentrales Thema der modernen Biomedizin.
Umfangreiche Datensätze über Interaktionen zwischen Gen-Produkten ermöglichen
neue Ansätze zur Untersuchung dieser Beziehungen, indem die Zellen als
komplexe Systeme bzw. Netzwerke betrachtet werden. Bisherige Ansätze
betrachten dabei die lokale Nachbarschaft zu identifizierten Krankheitsgenen
mittels Berechnung der kürzesten Pfade, um Krankheitsgene vorherzusagen. In
dieser Arbeit wird hingegen gezeigt, dass Maße, die die gesamte
Netzwerkstruktur einbeziehen, sehr gut für diese Problemstellung geeignet
sind. Dafür wird eine Methode basierend auf dem Random-Walk vorgestellt und
verglichen. Die Analyse von Krankheiten und deren Symptomen wird seit langem
durch das Fehlen von Standards behindert. Phänotypische Beschreibungen wurden
bisher lediglich in Textform abgelegt, wodurch automatisierte computerbasierte
Analysen behindert werden. Diese Arbeit stellt die Human Phenotype Ontology
(HPO) vor und beschreibt deren Anwendung auf Ähnlichkeitsberechnungen zwischen
Krankheiten auf Basis von semantischer Ähnlichkeit zwischen den phänotypischen
Spektren der Krankheitsbilder. Des Weiteren wird ein Programm vorgestellt,
welches mit Hilfe der HPO das Finden von klinischen Diagnosen in der
Humangenetik unterstützt. Dieses wurde mit einem neuen statistischen Modell
unterlegt, welches die Zuweisung von P-Werten für semantische Ähnlichkeiten
erlaubt. Motiviert durch das Ziel, Genotyp-zu-Phänotyp Assoziationen direkt zu
finden, sollen neue Hochdurchsatz-Projekte nach und nach alle Gene von
Modellorganismen ausschalten und die phänotypischen Konsequenzen aufzeichnen.
Vor allem die speziesübergreifende Übertragung von solchen phänotypischen
Daten ist wichtig, um die Beziehungen zwischen den Genotypen und Phänotypen
beim Menschen besser zu verstehen. Speziesübergreifende Phänotyp-Analysen sind
von enormer Bedeutung, da es derzeit mehr als 5.000 menschliche Gene ohne
Phänotyp-Informationen gibt, für die es allerdings detaillierte Phänotypen-
Information für die orthologen Gene in Maus und/oder Zebrafisch gibt. In
dieser Arbeit wird die Entwicklung einer speziesübergreifenden,
harmonisierten, semantischen Repräsentation von phänotypischen Abnormalitäten
vorgestellt. Es wird beschrieben, wie man dadurch systematisch phänotypische
Informationen von Modellorganismen und menschlichen monogenen Krankheiten
integrieren kann. Weiterhin wird gezeigt, wie dies genutzt werden kann, um
komplexe Phänotypen in Krankheiten, die durch Copy-Number-Variations (CNV)
ausgelöst werden, einzelnen betroffenen Genen zuzuordnen. Mit diesem Ansatz
wurden phänotypische "Vervielfachungen" als Charakteristikum von CNVs
gefunden, bei denen mehrere Gene ein bestimmtes phänotypisches Merkmal
beeinflussen. Häufig stellen diese "Vervielfachungen" neuartige Hypothesen für
die gemeinsame Funktion der beteiligten Gene dar. Diese Hypothesen werden
durch Korrelation mit Gene Ontology-Ähnlichkeit unterstützt und zeigen eine
statistisch signifikante Nähe im Protein-Interaktions-Netzwerk, welche durch
die Random-Walk-Methode ermittelt wurde.
de
dc.description.abstract
Understanding the relationships between human phenotypic abnormalities and
their underlying genes is an important subject in biomedicine. Comprehensive
data sets on interactions between gene products enable novel systems
approaches to be applied for elucidating those associations. Recently,
neighborhood approaches, analysing the local shortest-path distances between
network nodes, have been applied to the problem of disease gene prediction.
Here it is shown that a global network-similarity measure based on random
walks, is well suited for analysing vicinity in protein-protein interaction
networks, and that this boosts the performance of guilt-by-association
approaches for gene-to-phenotype research. Analysing disease information has
long been hampered by the lack of standards and semantics in knowledge
representation on associated phenotypic abnormalities. Often, phenotype
descriptions were stored as a part of free text, making automated mining very
difficult. This work presents the Human Phenotype Ontology (HPO) and its
application to disease similarity calculation based on semantic similarity
between phenotypic spectra. A tool is presented that uses the HPO to aid with
clinical diagnostics in medical genetics and makes use of a novel statistical
model assigning P-values to semantic similarity scores. Motivated by the aim
of revealing genotype-to-phenotype associations directly, high-throughput
projects are now exploring complete phenomes of model organisms such as mouse.
Especially the transfer of knowledge across species is important to understand
the relations between genotypes and phenotypes in model organisms on the one
hand, and those seen in human diseases on the other hand. Cross-species
phenotype analysis is of major importance, given that there are currently more
than 5,000 human genes with no phenotype information, but for which detailed
phenotypes are available for their mouse and/or zebrafish orthologs. In this
work, the development of cross-species, harmonised, semantic representation of
phenotype information is presented. A computational framework is developed to
comprehensively harvest phenotypic information from model organisms and
single-gene human hereditary disorders annotated to HPO terms. It is
exemplified how this can speed the interpretation of the complex phenotypes of
CNV disorders, and how this ontology-based approach is used to identify
similarities between human phenotypes and the mutational phenotypes in known
model organism genes. Using this approach, phenotypic multiplicities are
identified as common characteristic of CNVs, in which multiple genes are said
to influence a particular phenotypic feature of a broader spectrum of
phenotypes. Often, the association between the genes of these multiplicities
represent novel hypotheses and are supported by correlation with Gene Ontology
similarity and random walk vicinity in protein interaction networks.
en
dc.format.extent
XVI, 158 S.
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
human phenotype
dc.subject
model organism phenotype
dc.subject
graph algorithm
dc.subject.ddc
000 Informatik, Informationswissenschaft, allgemeine Werke::000 Informatik, Wissen, Systeme
dc.subject.ddc
600 Technik, Medizin, angewandte Wissenschaften::610 Medizin und Gesundheit
dc.subject.ddc
500 Naturwissenschaften und Mathematik::500 Naturwissenschaften::500 Naturwissenschaften und Mathematik
dc.subject.ddc
500 Naturwissenschaften und Mathematik::570 Biowissenschaften; Biologie
dc.title
Phenotype informatics
dc.contributor.contact
sebastian.koehler@charite.de
dc.contributor.firstReferee
Prof. Dr. Martin Vingron
dc.contributor.furtherReferee
Prof. Dr. Peter N. Robinson
dc.contributor.furtherReferee
Christopher J. Mungall, Ph.D.
dc.date.accepted
2013-05-16
dc.identifier.urn
urn:nbn:de:kobv:188-fudissthesis000000094386-9
dc.title.subtitle
Network approaches towards understanding the diseasome
dc.title.translated
Phänotyp-Informatik
de
dc.title.translatedsubtitle
Netzwerk-Ansätze zur Analyse genetisch beeinflusster Erkrankungen
de
refubium.affiliation
Mathematik und Informatik
de
refubium.mycore.fudocsId
FUDISS_thesis_000000094386
refubium.mycore.derivateId
FUDISS_derivate_000000013499
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access