Seit 2003 wurde den Ländern in Form der Bildungsstandards für bestimmte Fächer (beispielsweise Mathematik, Deutsch) ein bundesweit einheitlicher Referenzrahmen zur Verfügung gestellt um die Leistungen ihrer Schülerinnen und Schüler einzuordnen (KMK, 2016). Insbesondere bildungsstandardbasierte Tests ‒ in Form der Vergleichsarbeiten (VERA) ‒ sind an Schulen weit verbreitet. So sind Lehrkräfte der 3. und 8. Jahrgangsstufe öffentlicher Schulen in Deutschland dazu verpflichtet, jährlich in mindestens einem Fach die VERA Tests für ihre insgesamt etwa 1.4 Millionen Schülerinnen und Schüler durchzuführen (KMK, 2012 Fassung von 2018; Statistisches Bundesamt, 2017). Auf der Grundlage der VERA-Tests erhalten Lehrkräfte Leistungsinformationen auf der Schul-, Klassen- und Individualebene, welche primär für die Unterrichts- und Schulentwicklung genutzt werden sollen (KMK, 2015). Die Bildungsstandards sollen „fachliche und fachübergreifende Basisqualifikationen [formulieren], die für die weitere schulische und berufliche Ausbildung von Bedeutung sind und die anschlussfähiges Lernen ermöglichen.“ (KMK, 2004, S. 7). Dieser Anspruch impliziert, dass auf Grundlage der Testergebnisse zentrale Kriterien des Schulerfolgs vorhersagbar sein sollten. Es existierte lediglich eine Studie (Graf, Harych, Wendt, Emmrich & Brunner, 2016), die die Prognosegüte bildungsstandardbasierter Tests explizit untersucht hat.
Infolge dessen wurde die übergreifende Forschungsfrage untersucht, inwiefern bildungsstandardbasierte Mathematik- und Deutschtests (im Lesen) geeignet sind, den zukünftigen schulischen Erfolg von Schülerinnen und Schüler – fokussiert auf spätere Schulhalbjahresnoten und bildungsstandardbasierte Testleistungen im selben Fach – vorherzusagen.
Die zentralen Befunde der vorliegenden Dissertation lassen sich wie folgt zusammenfassen: (1) Die Prognosegüte auf bis zu 5 Jahre spätere Testleistungen und Noten ist vergleichbar mit jener für kommerziell erhältliche Schulleistungstests. (2) Bildungsstandardbasierte Tests haben einen inkrementellen prognostischen Mehrwert gegenüber Schulhalbjahresnoten auf bis zu 5 Jahre spätere Testleistungen und Noten. (3) Die Ausprägung der Prognosegüte bildungsstandardbasierter Tests und deren inkrementeller prognostischer Mehrwert variiert zum Teil zwischen den Schulen. An den meisten Schulen liefern die bildungsstandardbasierten Tests jedoch einen Informationsgewinn zur Prognose. (4) Bildungsstandardbasierte Tests können im Sinne eines Screenings eingesetzt werden, um die Identifikation von Schülerinnen und Schüler zu verbessern, die bis zu 5 Jahre spätere Bildungsergebnisse in Form von bildungsstandardbasierten Testleistungen und Noten verfehlen.
Damit wird ein Beitrag zu bestehenden Forschungsdesideraten in Deutschland geleistet, die nicht nur für bildungsstandardbasierte Tests bestehen sondern ebenso für standardisierte Schulleistungstests im Allgemeinen. Darüber hinaus werden verschiedene Ansätze diskutiert, anhand derer zukünftig die Validierung und Implementierung von VERA Tests im Sinne einer formativen Leistungsmessung an Schulen gefördert werden könnte.
Since 2003 a national educational standard was introduced for specific subjects (e. g. mathematics, german) in primary and secondary education in Germany to evaluate the performance of their students (KMK, 2016). Standard-based tests that are used in the state wide assessment VERA are very common in German schools: Teachers of Grades 3 and 8 at public schools have to test their students in at least one subject every year. Consequently, about 1.4 million students complete the VERA assessment every year in Germany (KMK, 2012 Version of 2018; Statistisches Bundesamt, 2017). The state-wide assessment program VERA offers teachers information on students’ proficiency levels on the school-, class- and student-level. Teachers are supposed to use this information primarily to improve their teaching and for school improvement (KMK, 2015). The national educational standard should describe basic competencies that are important for students’ future success at school and the working world as well as for their future learning (KMK, 2004). This implies that their current proficiency levels are presumed to inform about their future school success. So far existed one study (Graf et al., 2016) that focused on the prediction validity of national educational standard assessment explicitly.
In this light, the present PhD thesis examined the extent to which standard-based test scores in mathematics and German reading comprehension predict students’ success at school as expressed in their future grades and standard-based proficiency levels in the corresponding subject.
The major contributions of this PhD project are summarized as follows: (1) The power of standard-based test scores to predict future standard-based test scores and grades up to 5 years later is comparable to the predictive power of commercial achievement tests in Germany. (2) Standard-based test scores incrementally predict future standard-based test scores and grades up to 5 years later beyond controlling for grades. (3) The predictive power of standard-based test scores vary to some extent between schools, but standard-based tests are predictive of students’ future test scores and grades at most schools. (4) Standard-based tests can be used as a screening to improve the identification of students who are at risk of failing important educational outcomes as assessed in proficiency levels and grades up to 5 years later.
This kind of evidence contributes to reduce the existing lack in the current state of research for standard-based tests in Germany that is not limited to the national educational standard. Furthermore, approaches to enhance the validity and implementation of standard-based tests in state-wide assessment programs like VERA as formative learning assessments are discussed.