dc.contributor.author
Wirth, Felix Nikolaus
dc.date.accessioned
2024-06-27T09:13:21Z
dc.date.available
2024-06-27T09:13:21Z
dc.identifier.uri
https://refubium.fu-berlin.de/handle/fub188/43280
dc.identifier.uri
http://dx.doi.org/10.17169/refubium-42996
dc.description.abstract
Implementing modern data-driven medical research approaches ("Artificial intelligence", "Data Science") requires access to large amounts of data ("Big Data"). Typically, this can only be achieved through cross-institutional data use and exchange ("Data Sharing"). In this process, the protection of the privacy of patients and probands affected is a central challenge. Various methods can be used to meet this challenge, such as anonymization or federation. However, data sharing is currently put into practice only to a limited extent, although it is demanded and promoted from many sides. One reason for this is the lack of clarity about the advantages and disadvantages of different data sharing approaches. The first goal of this thesis was to develop an instrument that makes these advantages and disadvantages more transparent. The instrument systematizes approaches based on two dimensions - utility and protection - where each dimension is further differentiated with three axes describing different aspects of the dimensions, such as the degree of privacy protection provided by the results of performed analyses or the flexibility of a platform regarding the types of analyses that can be performed. The instrument was used for evaluation purposes to analyze the status quo and to identify gaps and potentials for innovative approaches. Next, and as a second goal, an innovative tool for the practical use of cryptographic data sharing methods has been designed and implemented. So far, such approaches are only rarely used in practice due to two main obstacles: (1) the technical complexity of setting up a cryptography-based data sharing infrastructure and (2) a lack of user-friendliness of cryptographic data sharing methods, especially for medical researchers. The tool EasySMPC, which was developed as part of this work, is characterized by the fact that it allows cryptographically secure computation of sums (e.g., frequencies of diagnoses) across institutional boundaries based on an easy-to-use graphical user interface. Neither technical expertise nor the deployment of specific infrastructure components is necessary for its practical use. The practicability of EasySMPC was analyzed experimentally in a detailed performance evaluation.
en
dc.description.abstract
Moderne datengetriebene medizinische Forschungsansätze („Künstliche Intelligenz“,
„Data Science“) benötigen große Datenmengen („Big Data“). Dies kann im Regelfall nur
durch eine institutionsübergreifende Datennutzung erreicht werden („Data Sharing“).
Datenschutz und der Schutz der Privatsphäre der Betroffenen ist dabei eine zentrale
Herausforderung. Um dieser zu begegnen, können verschiedene Methoden, wie etwa
Anonymisierungsverfahren oder föderierte Auswertungen, eingesetzt werden. Allerdings
findet Data Sharing in der Praxis nur selten statt, obwohl es von vielen Seiten gefordert
und gefördert wird. Ein Grund hierfür ist die Unklarheit ¸über Vor- und Nachteile
verschiedener Data Sharing-Ansätze. Erstes Ziel dieser Arbeit war es, ein Instrument zu
entwickeln, welches diese Vor- und Nachteile transparent macht. Das Instrument
bewertet Ansätze anhand von zwei Dimensionen - Nutzen und Schutz - wobei jede
Dimension mit drei Achsen weiter differenziert ist. Die Achsen bestehen etwa aus dem
Grad des Schutzes der Privatsphäre, der durch die Ergebnisse der durchgeführten
Analysen gewährleistet wird oder der Flexibilität einer Plattform hinsichtlich der Arten von
Analysen, die durchgeführt werden können. Das Instrument wurde zu
Evaluationszwecken für die Analyse des Status Quo sowie zur Identifikation von Lücken
und Potenzialen für innovative Verfahren eingesetzt. Als zweites Ziel wurde anschließend
ein innovatives Werkzeug für den praktischen Einsatz von kryptographischen Data
Sharing-Verfahren entwickelt. Der Einsatz entsprechender Ansätze scheitert bisher vor
allem an zwei Barrieren: (1) der technischen Komplexität beim Aufbau einer
Kryptographie-basierten Data Sharing-Infrastruktur und (2) der Benutzerfreundlichkeit
kryptographischer Data Sharing-Verfahren, insbesondere für medizinische Forschende.
Das neue Werkzeug EasySMPC zeichnet sich dadurch aus, dass es eine
kryptographisch sichere Berechnung von Summen (beispielsweise Häufigkeiten von
Diagnosen) über Institutionsgrenzen hinweg auf Basis einer einfach zu bedienenden
graphischen Benutzeroberfläche ermöglicht. Zur Anwendung ist weder technische
Expertise noch der Aufbau spezieller Infrastrukturkomponenten notwendig. Die
Praxistauglichkeit von EasySMPC wurde in einer ausführlichen Performance-Evaluation
experimentell analysiert.
de
dc.rights.uri
http://www.fu-berlin.de/sites/refubium/rechtliches/Nutzungsbedingungen
dc.subject
Data sharing infrastructures
en
dc.subject
Secure multi-party computation
en
dc.subject
Data protection
en
dc.subject.ddc
600 Technik, Medizin, angewandte Wissenschaften::610 Medizin und Gesundheit::610 Medizin und Gesundheit
dc.title
Innovative methods for sharing data across institutions in medical research
dc.contributor.gender
male
dc.contributor.firstReferee
N.N.
dc.contributor.furtherReferee
N.N.
dc.date.accepted
2024-06-30
dc.identifier.urn
urn:nbn:de:kobv:188-refubium-43280-3
dc.title.translated
Innovative Verfahren für die standortübergreifende Datennutzung in der medizinischen Forschung
ger
refubium.affiliation
Charité - Universitätsmedizin Berlin
dcterms.accessRights.dnb
free
dcterms.accessRights.openaire
open access
dcterms.accessRights.proquest
accept