This thesis addresses two interesting problems of multiple testing in high- dimensional gene expression data: 1\. The local false discovery rate. 2\. The permutation test. The false discovery rate (FDR) has been "rediscovered" as a suitable measure of significance for microarray data. The local FDR is not a natural extension of FDR but follows a substantially different concept. The first part of this thesis introduces the theory of FDRs together with a stochastical search algorithm, which estimates the local FDR well. The second part of this thesis deals with artifacts that arise if permutation testing is applied to biological data such as gene expression data. We introduce a novel approach to remove artifacts due to hidden confounders by using an appealingly simple algorithm.
In der vorliegenden Arbeit werden zwei Aspekte des multiplen Testproblems auf hoch-dimensionalen Genexpressionsdaten behandelt: 1\. Die Lokale False Discovery Rate. 2\. Der Permutationstest. Die False Discovery Rate (FDR) wurde im Zusammenhang mit Microarraydaten als geeignetes Signifikanzmaß "wiederentdeckt". Die lokale FDR ist jedoch keine Erweiterung der FDR. Tatsächlich liegen der FDR und der lokalen FDR grundsätzlich verschiedene Ansätze zugrunde. Der erste Teil der Dissertation gibt eine Einführung in die Theorie der FDRs und stellt einen stochastischen Suchalgorithmus vor, der gute Schätzer für die lokale FDR liefert. Der zweite Teil der Arbeit behandelt Artefakte, die beim Anwenden eines Permutationstests auf biologischen Daten entstehen können. Es wird ein neuer Lösungsweg vorgeschlagen, wie Artefakte vermieden werden können, die durch versteckte Kovariablen entstehen.