Mittels unterschiedlicher statistischer Analysemethoden wurde das Vorhersagepotential für langfristige Witterungsprognosen an der Station Berlin-Dahlem abgeschätzt. Als Prediktoren dienten dabei die großräumigen Feldverteilungen des Bodendrucks sowie des 500-hPa-Geopotentials, d.h. der Momentanzustand der atmosphärischen Zirkulation. Prediktand war i.a. die Klimamitteltemperatur der Folgemonate, die in einigen Fällen noch durch die Anzahl der Tage mit meßbarem Niederschlag ergänzt wurde. Zur Bestimmung der Vorhersageleistung wurden die Cross-Validation bzw. ein Examinationskollektiv eingesetzt. Die ermittelten RV-Werte deuten darauf hin, daß die als "principal-components regression (PCR)" bezeichnete Methode den anderen getesteten Verfahren überlegen ist. Zu diesen gehören mehrere Varianten sogenannter Analogverfahren, die Clusteranalyse sowie die multiple lineare Regression. Der vermutliche Grund für die Überlegenheit der PCR ist die in der Methode enthaltene Glättung der Eingangsvariablen, die zu einer Verminderung des Rauschanteils führt. Zusätzlich konnte die Anzahl der zur Beschreibung des aktuellen Systemzustands notwendigen Variablen aufgrund der hohen Interkorrelationen der Originaldaten merklich reduziert werden, wodurch die Wahrscheinlichkeit einer rein zufällig guten Anpassung deutlich verringert wird. Trotz dieser methodischen Vorteile zeigte es sich, daß erfolgreiche Langfristvorhersagen für die betrachtete geographische Region äußerst schwierig zu realisieren sind. Im Falle der Temperatur konnte ein RV-Wert von ca. 0,1 als maximal mögliche Obergrenze der Vorhersageleistung bestimmt werden, im Falle des Niederschlags liegt der Wert noch darunter. Dabei ist erstaunlich, daß die Vorhersagequalität weder von der Vorlaufzeit noch von der Jahreszeit eindeutig abhängt. Da die ermittelten Resultate klassischen Hypothesentests zufolge erst bei einem weit über 1000 Fälle umfassenden Kollektiv unabhängiger Prognosen statistisch signifikant von Null verschieden wären (hier ca. 160), wurde ein anderer Weg beschritten, um dennoch Aussagen zur Signifikanz machen zu können. Mit Hilfe von insgesamt 1000 ?bootstrap?-Realisierungen konnte nachgewiesen werden, daß die aufgedeckten Zusammenhänge zwischen der großräumigen Vorzirkulation und den Folgetemperaturen Berlins mit hoher statistischer Sicherheit als überzufällig betrachtet werden können. Im Falle der Niederschlagsprognosen konnte hingegen nicht ausgeschlossen werden, daß es sich bei den ermittelten positiven RV- Werten um reine Scheingüte handelt.
By use of several different statistical methods the atmospherical long-range predictability was estimated for Berlin. As predictors northern hemisphere monthly-mean sea-level pressure and 500-hPa height fields were used, i.e. the present state of the atmospherical circulation. Usually the mean temperatures of the following months were predicted, in some cases supplemented by the number of days with measurable precipitation (>0.0 mm) during an individual month. Skill scores were calculated either in a cross-validation framework or by use of a totally independent batch of data. Compared to the other methods the so-called principal-components regression (PCR) performed superiorly. These are multiple linear regression, cluster analysis and several variants of analog prediction methods. The reason for the superiority of the PCR probably is the implicit smoothing of the original data, which leads to a reduction of noise. Furthermore, because the original grid points are mutually correlated extensively, it was possible to lower the number of variables needed to describe the system substantially. Therefore the problem of multiplicity lost some of its importance. Even though PCR seems to bear some methodical advantages, it still is rather troublesome to produce long-range forecasts with a reasonable amount of success in this specific region. For temperature forecats a skill score of approximately 0.1 was estimated as an upper bound, in the case of precipitation forecats the value lies well below that. It also is remarkable that forecast quality neither depends on the lead-time nor on the time in the year. To evaluate the statistical significance of the results at hand, the bootstrap method was used. Thereby it was possible to prove that the discovered relations between the preceding atmospherical circulations and the following temperatures are of high significance, albeit small. In case of the precipitation forecats such a testimony can not be given. Here it is still possible that only artificial skill was found.