Many applications involve analysing dynamical systems that undergo rare transitions between two metastable subsets $A$ and $B$ of state space. For example, in clinical disease modelling, one can model a patient's state as a metastable stochastic process that occasionally transits from a 'healthy' subset $A$ to a 'diseased' subset $B$. We develop a numerical method for analysing the statistics of transitions of a diffusion process between the two disjoint subsets of the bounded state space.
Transition path theory (TPT) was first formulated to solve this problem for ergodic diffusion processes. The main object of this theory is a committor function, which at any state of the state space is defined as the probability of reaching the set $B$ before reaching the set $A$, conditioned on starting from the given state. The computation of the committor function requires solving a second order partial differential equation involving the generator of the process. Therefore, TPT for diffusion processes requires the knowledge of the stochastic differential equation governing the process. Furthermore, the high dimensional nature of many problems makes solving such partial differential equations difficult in practice. In order to perform computations, a discretisation method is needed. TPT for Markov jump processes has been developed for this reason. However, space discretisation results in a loss of the Markov property.
We discretise the state space using Voronoi tessellations and model the underlying diffusion process by a non-Markovian jump process on the associated Delaunay graph. To this process we associate the analogues of the committor function, isocommittor surfaces, the probability current and streamlines. These objects are the key objects in both TPT for diffusion processes and TPT for Markov jump processes. In this thesis, we define these objects for the non-Markovian jump process described above. All of the objects we define can be computed using sampled trajectories, thus our approach is completely data-driven and does not rely on the knowledge of the stochastic differential equation governing the underlying process. This differentiates our approach from TPT for diffusion processes. Furthermore, we do not assume Markovianity which differentiates our approach from TPT for Markov jump processes.
We prove the convergence of three of our objects to their analogues in TPT for diffusion processes, in the limit of infinitely fine discretisation. This validates the discrete approach we suggest. Moreover, we prove error bounds for the committor function, the probability current and the associated streamlines. To the best of our knowledge this is the first discrete TPT approach that comes with rigorous proofs of convergence.
Viele Anwendungen beinhalten die Analyse dynamischer Systeme, die seltene Übergänge zwischen zwei metastabilen Teilmengen $A$ und $B$ des Zustandsraums durchlaufen. Beispielsweise kann der Zustand eines Patienten als metastabiler stochastischer Prozess modelliert werden, der gelegentlich von einer "gesunden" Teilmenge $A$ zu einer "krankhaften" Teilmenge $B$ übergeht. Wir entwickeln ein numerisches Verfahren zur Analyse der Statistik der Übergänge eines Diffusionsprozesses zwischen den beiden disjunkten Teilmengen des begrenzten Zustandsraums.
Transition Path Theory (TPT) wurde zunächst formuliert, um dieses Problem für ergodische Diffusionsprozesse zu lösen. Das Hauptobjekt dieser Theorie ist eine Committor-Funktion, die in jedem Zustand des Zustandsraums definiert ist als die Wahrscheinlichkeit, die Menge $B$ zu erreichen, bevor die Menge $A$ erreicht wird, bedingt auf das Starten aus dem gegebenen Zustand. Die Berechnung der Committor-Funktion erfordert das Lösen einer partiellen Differentialgleichung zweiter Ordnung, an welcher der Generator des Prozesses beteiligt ist. Daher erfordert TPT für Diffusionsprozesse die Kenntnis der stochastischen Differentialgleichung, die den Prozess steuert. Darüber hinaus erschwert die hohe Dimensionalität vieler Probleme die Lösung solcher partiellen Differentialgleichungen in der Praxis. Um Berechnungen durchführen zu können, ist eine Diskretisierungsmethode erforderlich. Aus diesem Grund wurde TPT für Markow-Sprungprozesse entwickelt. Die Diskretisierung des Raumes führt jedoch zum Verlust der Markow-Eigenschaft.
Wir diskretisieren den Zustandsraum mit Hilfe von Voronoi-Diagrammen und modellieren den zugrunde liegenden Diffusionsprozess durch einen nicht-Markowschen Sprungprozess auf dem zugehörigen Delaunay-Diagramm. Diesem Prozess ordnen wir die Analoga der Committor-Funktion, die Isocommittor-Oberflächen, den Wahrscheinlichkeitsstrom und die Stromlinien zu. Diese Objekte sind die Schlüsselobjekte sowohl in TPT für Diffusionsprozesse als auch in TPT für Markow-Sprungprozesse. In dieser Arbeit definieren wir diese Objekte für den oben beschriebenen nicht-Markowschen Sprungprozess. Alle von uns definierten Objekte können mit simulierten Trajektorien berechnet werden, sodass unser Ansatz vollständig datenbasiert ist und sich nicht auf das Wissen der stochastischen Differentialgleichung stützt, die den zugrunde liegenden Prozess steuert. Dies unterscheidet unseren Ansatz von TPT für Diffusionsprozesse. Darüber hinaus setzen wir keine Markow-Eigenschaft voraus, was unseren Ansatz von TPT für Markow-Sprungprozesse unterscheidet.
Wir beweisen die Konvergenz von drei unserer Objekte zu ihren Analoga in TPT für Diffusionsprozesse, im Limes der unendlich feinen Diskretisierung. Dies bestätigt den von uns vorgeschlagenen diskreten Ansatz. Darüber hinaus beweisen wir Fehlerabschätzungen für die Committor-Funktion, den Wahrscheinlichkeitsstrom und die damit verbundenen Stromlinien. Nach unserem besten Wissen ist dies der erste diskrete TPT-Ansatz, der mit rigorosen Konvergenznachweisen einhergeht.