dc.contributor.author
Mireles Chavez, Victor
dc.date.accessioned
2022-06-07T08:52:58Z
dc.date.available
2022-06-07T08:52:58Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/34985
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-34702
dc.description.abstract
Biological systems are often described as being composed of a set of semi-independent modules, each of which can be ascribed its own function, evolutionary history, developmental origin, or a combination thereof. One commonly accepted property of such modules is that they are redeployed across different conditions, so that sets of elements that have been jointly subject to evolutionary processes are re-purposed. This property of being composed of reusable modules has been suggested as a hallmark of biological systems, and its significance, both in an evolutionary setting and from a purely epistemic point of view, has been long debated in literature.
In this work, a formalization of the notion of module reusability is provided, along with an algorithm and a series of measurements that can be used to study it. The final objective is to provide a concise and mathematically-expressible vocabulary with which to express statements about reusability, along with the mathematical and computational tools to assert their validity. For this purpose, references in literature to the reusable nature of biological modules are organized, and a common minimum description is proposed.
In brief, systems are represented by a presence-absence matrix, whose columns represent conditions and whose rows represent elements. This matrix is then decomposed into a product of two matrices, using a stochastic gradient descent algorithm, one of which represents the compositions of modules, and the other one representing the usage of this modules across different conditions. This decomposition is such that the resulting modules are maximally reusable, and so upper bounds can be estimated for many properties related to reusability. Analytical results are provided that help describe the space of decompositions of a system, and which relate the problem at hand with other, related, problems studied with the use of matrices.
Example applications of this framework are provided in this work, both for synthetic and real biological data. The conclusion of these experiments is that the amount of module reusability observed in a system is dependant on the reusability of individual elements. Furthermore, it is suggested that biological systems exhibit modules which are not particularly reusable when compared to randomly-generated systems. Finally, the results presented here suggest that a feature specific of biological systems is the distribution of such reusabilities, with a large amount of condition specific and constitutive modules being present.
en
dc.description.abstract
Biologische Systeme werden oft so beschrieben, dass sie aus einer Reihe von halb-unabhängigen Modulen bestehen, denen jeweils eine eigene Funktion, eine eigene Evolutionsgeschichte, ein eigener Entwicklungsursprung oder eine Kombination davon zugeschrieben werden kann. Eine allgemein akzeptierte Eigenschaft solcher Module ist, dass sie unter verschiedenen Bedingungen wiederverwendet werden, so dass Sätze von Elementen, die gemeinsam evolutionären Prozessen unterworfen waren, wiederverwendet werden. Diese Eigenschaft, aus wiederverwendbaren Modulen zu bestehen, wurde als Kennzeichen biologischer Systeme vorgeschlagen, und ihre Bedeutung, sowohl in einer evolutionären Umgebung als auch aus rein epistemischer Sicht, wird in der Fachliteratur schon lange diskutiert.
In dieser Arbeit wird eine Formalisierung des Begriffs der Wiederverwendbarkeit von Modulen vorgelegt, zusammen mit einem Algorithmus und einer Reihe von Messungen, die zu seiner Untersuchung verwendet werden können. Das endgültige Ziel ist es, ein prägnantes und mathematisch ausdrückbares Vokabular bereitzustellen, mit dem Aussagen über die Wiederverwendbarkeit gemacht werden können, zusammen mit den mathematischen und rechnerischen Werkzeugen, um ihre Gültigkeit zu bestätigen. Zu diesem Zweck werden Verweise in der Literatur auf die Wiederverwendbarkeit von biologischen Modulen geordnet und eine gemeinsame Mindestbeschreibung vorgeschlagen.
Kurz gesagt, Systeme werden durch eine Präsenz-Absenz-Matrix dargestellt, deren Spalten Bedingungen und deren Zeilen Elemente repräsentieren. Diese Matrix wird dann mit Hilfe eines stochastischen Gradientenabstiegsalgorithmus in ein Produkt aus zwei Matrizen zerlegt, von denen die eine die Zusammensetzungen von Modulen und die andere die Verwendung dieser Module über verschiedene Bedingungen hinweg darstellt. Diese Dekomposition ist so beschaffen, dass die resultierenden Module maximal wiederverwendbar sind, und so können obere Grenzen für viele Eigenschaften, die mit der Wiederverwendbarkeit zusammenhängen, geschätzt werden. Es werden analytische Ergebnisse bereitgestellt, die helfen, den Raum der Dekompositionen eines Systems zu beschreiben, und die das vorliegende Problem mit anderen, verwandten Problemen in Beziehung setzen, die mit der Verwendung von Matrizen untersucht wurden.
Beispielanwendungen dieses konzeptionellen Rahmens werden in dieser Arbeit sowohl für synthetische als auch für reale biologische Daten bereitgestellt. Die Schlussfolgerung aus diesen Experimenten ist, dass das Ausmaß der Wiederverwendbarkeit von Modulen in einem System von der Wiederverwendbarkeit der einzelnen Elemente abhängt. Außerdem wird vorgeschlagen, dass biologische Systeme Module aufweisen, die im Vergleich zu zufällig generierten Systemen nicht besonders wiederverwendbar sind. Schließlich legen die hier vorgestellten Ergebnisse nahe, dass ein spezifisches Merkmal biologischer Systeme die Verteilung solcher Wiederverwendbarkeiten ist, wobei eine große Menge an zustandsspezifischen und konstitutiven Modulen vorhanden ist.
de
dc.format.extent
vi, 103 Seiten
dc.rights.uri
https://creativecommons.org/licenses/by-sa/4.0/
dc.subject
Matrix Decomposition
en
dc.subject
Biological Modularity
en
dc.subject
Binary Matrices
en
dc.subject
Module Reusability
en
dc.subject
Wiederverwendbarkeit von Modulen
de
dc.subject
Matrizenzerlegung
de
dc.subject
Biologische Modularität
de
dc.subject.ddc
500 Natural sciences and mathematics::510 Mathematics::518 Numerical analysis
dc.subject.ddc
000 Computer science, information, and general works::000 Computer Science, knowledge, systems::004 Data processing and Computer science
dc.subject.ddc
500 Natural sciences and mathematics::500 Natural sciences::500 Natural sciences and mathematics
dc.title
Finding Reusable Modules Using Sparse Matrix Decompositions
dc.contributor.gender
male
dc.contributor.firstReferee
Tim, Conrad
dc.contributor.furtherReferee
Nikoloski, Zoran
dc.date.accepted
2022-03-28
dc.identifier.urn
urn:nbn:de:kobv:188-refubium-34985-2
refubium.affiliation
Mathematik und Informatik
refubium.note.author
Supported by the Max Plank Society and the Konrad Zuse Instiute Berlin.
Includes results previously published in V. Mireles and T. O. Conrad, Reusable building blocks in biological systems, Journal of the Royal Society Interface, 15 (2018), p. 20180595 and in V. Mireles and T. O. Conrad, Minimum-overlap Clusterings and the Sparsity of Overcomplete Decompositions of Binary Matrices, Procedia Computer Science, 51 (2015), pp. 2967–2971.
en
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access
dcterms.accessRights.proquest
accept