Obwohl die Unterrichtsplanung eine Kernaufgabe von Lehrkräften darstellt und als Prädiktor für die Unterrichtsqualität und damit den Lernerfolg von Schülerinnen und Schülern gilt, ist sie von wenigen Ausnahmen abgesehen bislang kein intensiv untersuchter Forschungsgegenstand in der empirischen biologiedidaktischen Forschung. Dabei spielen insbesondere schriftliche Unterrichtsentwürfe in der deutschen Lehrkräftebildung eine wichtige Rolle und sind genuiner Teil von Prüfungsleistungen in der 1. Phase der Lehrkräftebildung (Studium) sowie in der 2. Phase der Lehrkräftebildung (Referendariat). Trotz vermehrter Kritik an einer intransparenten und inkonsistenten Beurteilungspraxis vor allem in der 2. Phase der Lehrkräftebildung liegen nach wie vor keine empirisch geprüften Kriterien vor, mit denen die Qualität schriftlicher Unterrichtsentwürfe valide eingeschätzt werden kann. Im Rahmen des vorliegenden Dissertationsvorhabens wurde daher ein Kriterienraster entwickelt, mit dem die Qualität schriftlicher Unterrichtsentwürfe angehender Lehrkräfte valide eingeschätzt werden kann. Als theoretische Basis wurde zu diesem Zwecke das pedagogical content knowledge (PCK) genutzt, so dass das Kriterienraster neben generischen Aspekten der Unterrichtsplanung auch naturwissenschaftsdidaktische Befunde reflektiert. Das Vorgehen umfasste drei Schritte. Erstens wurde nach dem Verfassen einzelner Beiträge dieser Dissertation und angesichts der zunehmenden Forschungsaktivität in der Unterrichtsplanungsforschung ein Scoping Review durchgeführt, um einen Überblick über das derzeit noch diffuse Feld der empirischen Unterrichtsplanungsforschung in den Naturwissenschaftsdidaktiken zu gewinnen. Da die zum Planen von Unterricht im Allgemeinen sowie zum Verfassen eines schriftlichen Unterrichtsentwurfs im Besonderen notwendige Unterrichtsplanungskompetenz als Konstrukt bislang nur vage konzeptualisiert ist, konnte auf dem Wege des Scoping Reviews und mit den empirischen Befunden aus den Beiträgen dieser Dissertation ein heuristisches Modell entwickelt werden, das die aktuelle empirische Forschungslage zusammenfasst und aus dem sich Desiderate für die weitere Forschung ableiten lassen. Das Modell basiert auf dem Refinded Consensus Model of PCK und erweitert es insofern, als es neben der in der empirischen Forschung verbreiteten Identifikation konzeptuellen Wissens die Bedeutung prozeduralen Wissens in der Unterrichtsplanung betont und erstmals konkrete Variablen benennt, die den Transformationsprozess von PCK zwischen den verschiedenen realms im Modell erklären. Zweitens wurde auf der Basis des heuristischen Unterrichtsplanungskompetenzmodells eine qualitative Inhaltsanalyse von Staatsexamensentwürfen (N = 46) durchgeführt. Hierbei wurde untersucht, inwiefern der Vernetzungsgrad von PCK-Facetten mit der holistisch eingeschätzten Qualität der Staatsexamensentwürfe korreliert. Die aus der PCK-Forschung abgeleitete Annahme, dass sich Qualität in der Anzahl der Stellen niederschlägt, an denen PCK-Facetten miteinander vernetzt werden, konnte in dieser Untersuchung nicht bestätigt werden. Unter den von einem erfahrenen Fachseminarleiter holistisch bewerteten Entwürfen fanden sich sowohl als sehr gut bewertete Entwürfe mit schwach vernetztem PCK als auch als schwach bewertete Entwürfe mit vergleichsweise stark vernetztem PCK. Daraus kann geschlossenen werden, dass zur Beurteilung schriftlicher Unterrichtsentwürfe weniger die Quantität an PCK-Verbindungen als eher die Qualität der Verbindungen untersucht werden müsste. Drittens wurden die Ergebnisse der Analyse von Staatsexamensentwürfen dazu genutzt, ein Kriterienraster zu entwickeln, dessen Kriterien überwiegend die Vernetzung von mindestens zwei PCK-Facetten adressieren. Zu diesem Zwecke wurden zu Aspekten, die laut theoretischer und empirischer Unterrichtsplanungsliteratur planungsrelevant sind, Niveaustufen formuliert, die aus den zuvor analysierten Staatsexamensentwürfen entnommen werden konnten. Auf diese Weise konnte deduktiv-induktiv ein Kriterienraster entwickelt werden, das 24 Kriterien mit jeweils drei Niveaustufen umfasst. Die Niveaustufen beschreiben Qualitätsunterschiede in der Berücksichtigung der 24 Kriterien, beispielsweise dergestalt, dass ein Aspekt gar nicht berücksichtigt wird (Level 0), dass er beschrieben wird (Level 1) oder dass er darüber hinaus auch fachdidaktisch begründet wird (Level 2). Um sicherzustellen, dass das Kriterienraster geeignet ist, um die Qualität von Unterrichtsentwürfen valide zu beurteilen, wurde ein umfassendes Validitätsargument entwickelt. Neben einem Feedback durch Dozierende (1. Phase der Lehrkräftebildung) sowie Fachseminarleiterinnen und Fachseminarleiter (2. Phase der Lehrkräftebildung), die die Relevanz der Kriterien bestätigten, wurde das Kriterienraster auf weitere Unterrichtsentwürfe (N = 100) angewendet. Die Analysen zeigen, dass das Kriterienraster stark mit den holistischen Bewertungen der Qualität dieser Unterrichtsentwürfe korreliert und dass Referendarinnen und Referendare im Staatsexamen (n = 64) im Durchschnitt einen signifikant höheren Score erreichen als Master-Studierende nach dem Praxissemester (n = 36). Insgesamt lässt sich schlussfolgern, dass die Scores, die mit dem Kriterienraster gewonnen werden können, valide als Maß für die Qualität schriftlicher Unterrichtsentwürfe im Fach Biologie zu interpretieren sind. Aus den empirischen Untersuchungen, mit denen das Kriterienraster entwickelt und überprüft worden ist, werden abschließend Implikationen für die empirische naturwissenschaftsdidaktische Unterrichtsplanungsforschung sowie für die Lehrkräftebildung abgeleitet.
Although lesson planning is a core task of teachers, it has not been a subject of intensive research in empirical research, with few exceptions. In particular, written lesson plans play an important role in German teacher education and are a genuine part of examination performance in the 1st as well as in the 2nd phase of teacher education. Despite increased criticism of an intransparent and inconsistent assessment practice, especially in the 2nd phase of teacher education, there are still no empirically tested criteria with which the quality of written lesson plans can be validly assessed. Therefore, in this dissertation project, a scoring rubric was developed with which the quality of written lesson plans of prospective biology teachers can be validly assessed. The procedure comprises three steps. First, a scoping review was conducted to gain an overview of the currently still diffuse field of empirical lesson planning research in science education. Since lesson planning competence has so far only been vaguely conceptualized as a construct, a first heuristic lesson planning competence model could be developed by means of the scoping review. According to this model, particularly pedagogical content knowledge (PCK) has an effect on the development of lesson planning competence. Second, based on the heuristic lesson planning competence, a qualitative content analysis of lesson plans written for the second state examination (N = 46) was conducted. The focus lied on the extent to which the degree of interconnectedness of PCK facets correlated with the holistically assessed quality of these lesson plans. The assumption derived from PCK research that quality is reflected in the number of instances where PCK facets are interconnected was not confirmed in this study. Among the lesson plans holistically evaluated by an experienced teacher educator in the 2nd phase of teacher training, there were both high-quality lesson plans with poorly interconnected PCK and low-quality lesson plans with relatively highly interconnected PCK. It can be concluded that for the assessment of written lesson plans, less the quantity of PCK connections but rather the quality of the PCK connections should be examined. Third, the results of the analysis of written lesson plans were used to develop a scoring rubric whose criteria predominantly address the interconnectedness of at least two PCK facets. For this purpose, levels were formulated for aspects that are relevant for planning according to theoretical and empirical literature. In doing so, it was possible to deductively-inductively develop a scoring rubric comprising 24 criteria, each with three performance level descriptions. To ensure that the scoring rubric is suitable for validly assessing the quality of lesson plans, a comprehensive validity argument was developed. In addition to feedback from teacher educators in the 1st and the 2nd phase of teacher education who confirmed the relevance of the criteria, the scoring rubric was applied to additional lesson plans (N = 100). The analyses show that the scores correlate strongly with the holistic quality assessment of these lesson plans and that trainee teachers in the state examination (n = 64) achieve a significantly higher score on average than master's students after the practical semester (n = 36). Overall, it can be concluded that the scores that can be collected with the scoring rubric can be validly interpreted as a measure of the quality of written lesson plans in biology. Finally, implications for empirical research in biology education and teacher education are derived from the empirical studies used to develop and test the criteria grid.