Warum ist Empirische Bildungsforschung für Lehrkräfte wichtig?
Die Anforderungen an Lehrkräfte haben sich in den letzten Jahrzehnten grundlegend gewandelt. Von ihnen wird nicht nur pädagogisches Geschick und Fachwissen erwartet, sondern auch die Fähigkeit, ihr professionelles Handeln auf wissenschaftlich fundierter Grundlage zu gestalten. In diesem Zusammenhang gewinnt die empirische Bildungsforschung zunehmend an Bedeutung.
Zentrales Stichwort ist dabei die evidenzbasierte Praxis: Entscheidungen im Schulalltag – etwa zur Unterrichtsgestaltung, Diagnose von Lernständen oder dem Umgang mit Heterogenität – sollen nicht mehr allein auf Intuition, Erfahrung oder Tradition beruhen. Vielmehr wird gefordert, dass Lehrkräfte wissenschaftliche Theorien und Forschungsergebnisse situationsangemessen in ihre Praxis einbeziehen. Ziel ist es, pädagogisches Handeln nachvollziehbar, begründet und wirksam zu gestalten. Die Kultusministerkonferenz betonte bereits 2004, dass zukünftige Lehrkräfte in der Lage sein sollen, bildungswissenschaftliche Forschungsbefunde zu rezipieren, kritisch zu interpretieren und für ihre Unterrichtspraxis nutzbar zu machen (KMK, 2004; vgl. Prenzel, Bauer & Renkl, 2015).
Das bedeutet nicht, dass Lehrkräfte selbst forschen müssen – wohl aber, dass sie forschungssensibel werden: Sie sollen einschätzen können, wie belastbar bestimmte Erkenntnisse sind, wie sie sich auf die eigene Unterrichtssituation übertragen lassen und wo deren Grenzen liegen.
Diese Anforderung steht in engem Zusammenhang mit dem modernen Verständnis von Professionalität im Lehrerberuf. Lehrkräfte gelten heute als Mitglieder einer Profession, also eines wissensbasierten Berufs mit hoher Verantwortung. In diesem Kontext lassen sich drei theoretische Zugänge zur Lehrerprofessionalität unterscheiden:
-
Der strukturtheoretische Ansatz betont, dass Lehrkräfte täglich mit komplexen und unvorhersehbaren Situationen konfrontiert sind, für die es keine festen Handlungsrezepte gibt. Professionelles Handeln bedeutet hier, reflektiert und kompetent mit Unsicherheiten umzugehen.
-
Der kompetenztheoretische Ansatz definiert klar umrissene Kompetenzbereiche – etwa Diagnose-, Fach-, Methoden- oder Beziehungskompetenz –, die empirisch mit Lernerfolgen von Schülerinnen und Schülern in Verbindung gebracht werden können. Lehrkräfte sollen über Fähigkeiten verfügen, die messbar und nachweislich zur Förderung von Lernprozessen beitragen.
-
Der berufsbiografische Ansatz betrachtet Professionalität als entwicklungsbezogenen Prozess: Lehrkräfte entwickeln ihre professionelle Haltung, ihre Kompetenzen und ihren beruflichen Habitus über Jahre hinweg – durch Studium, Berufspraxis und kontinuierliche Fortbildung (vgl. Terhart, 2011).
In all diesen Ansätzen spielt empirische Bildungsforschung eine entscheidende Rolle. Sie liefert nicht nur Erkenntnisse über erfolgreiche Lehr-Lernprozesse, sondern bietet auch eine Basis für die professionelle Weiterentwicklung von Lehrpersonen. Eine forschungsbasierte Ausbildung und Fortbildung trägt dazu bei, die Qualität von Unterricht und Schule langfristig zu sichern – im Sinne eines lernförderlichen und chancengerechten Bildungssystems.
Was ist Empirische Bildungsforschung?
Empirische Bildungsforschung bezeichnet die wissenschaftliche Untersuchung von Bildungsrealitäten auf Grundlage systematisch erhobener Erfahrungen. Der Fokus liegt dabei vor allem auf der institutionalisierten Bildung – also auf Bildungsprozessen in Kitas, Schulen, Hochschulen oder im Bereich der Weiterbildung. Ziel ist es, herauszufinden, wie Bildungsprozesse verlaufen, wer welche Qualifikationen und Kompetenzen erwirbt, wovon dieser Erwerb abhängig ist und welche Auswirkungen Bildung auf Individuen und Gesellschaft hat (vgl. Gräsel 2015). Dabei unterscheidet sich empirisches Wissen von Alltagswissen vor allem durch seine Systematik, intersubjektive Überprüfbarkeit und seine Orientierung an wissenschaftlichen Theorien. Während Alltagswissen oft auf unsystematischen Erfahrungen beruht und nicht überprüfbar ist, wird empirisches Wissen explizit formuliert, kritisch hinterfragt und methodisch abgesichert (vgl. Bortz/Döring 2009).
Zentrale Merkmale der Empirischen Bildungsforschung
Ein zentrales Merkmal empirischer Bildungsforschung ist ihre Problemorientierung. Sie untersucht konkrete Fragestellungen, die sowohl das Bildungssystem als Ganzes als auch einzelne Institutionen oder Individuen betreffen können – zum Beispiel Fragen nach Chancengleichheit, Unterrichtsqualität oder Kompetenzentwicklung von Schüler*innen. Dabei ist die Forschung häufig interdisziplinär angelegt, das heißt sie greift auf Erkenntnisse und Methoden aus benachbarten Disziplinen wie Psychologie, Soziologie, Ökonomie oder Medizin zurück.
Kennzeichnend ist außerdem die Verwendung empirischer Forschungsmethoden. Diese lassen sich grob in zwei Paradigmen unterteilen: Das quantitative Paradigma verwendet standardisierte Messinstrumente und statistische Auswertungen, um generalisierbare Aussagen zu treffen. Das qualitative Paradigma hingegen arbeitet mit nicht-standardisierten Daten und legt den Fokus auf die Deutung und Rekonstruktion individueller Bildungsprozesse. Beide Ansätze verfolgen ein systematisches, nachvollziehbares Vorgehen und unterliegen strengen wissenschaftlichen Qualitätskriterien (vgl. Gräsel 2015)
.
Aktuelle Fragestellungen in der Empirischen Bildungsforschung
Empirische Bildungsforschung beschäftigt sich mit einer Vielzahl aktueller Themen, die meist einen engen Bezug zur Bildungspolitik und -praxis haben. Dazu gehören internationale und nationale Leistungsvergleiche wie PISA oder TIMSS, die Bildungsleistungen in verschiedenen Ländern analysieren. Auch Vergleiche zwischen den deutschen Bundesländern sind ein wiederkehrender Schwerpunkt.
Ein weiteres wichtiges Themenfeld ist die Frage nach Chancengerechtigkeit und sozialer Selektivität im Bildungssystem – also danach, wie Bildungschancen verteilt sind und wie stark diese von sozialer Herkunft, Migrationshintergrund oder Geschlecht abhängen. Darüber hinaus werden Kompetenzentwicklungen im Längsschnitt, etwa durch Panelstudien wie das NEPS, untersucht. Ebenfalls von zentralem Interesse sind Studien zur Qualität von Unterricht und zur Wirksamkeit professioneller Kompetenzen von Lehrkräften. Auch die Weiterentwicklung methodischer Ansätze stellt ein wichtiges Forschungsfeld dar (vgl. Gräsel 2015).
Im Rahmen dieser Themenfelder wird zwischen Unterrichtsforschung und Lehr-Lernforschung unterschieden: Während sich Unterrichtsforschung mit der Struktur und Qualität von Unterricht als Ganzem beschäftigt, untersucht die Lehr-Lernforschung die konkreten Prozesse des Lehrens und Lernens – zum Beispiel wie Motivation oder Vorwissen das Lernen beeinflussen.
Felder der Bildungsforschung
Die Bildungsforschung ist breit aufgestellt und umfasst viele verschiedene institutionelle Bereiche. Dazu zählen die vorschulische Bildung, die schulische Bildung, die Qualität von Unterricht und Schule, die Gestaltung der Ganztagsschule, die Hochschulbildung, die außerschulische Bildung sowie die Erwachsenen- und Weiterbildung. Diese Vielfalt an Forschungsfeldern verdeutlicht, dass Bildung heute als lebenslanger Prozess verstanden wird, der in unterschiedlichen Kontexten stattfindet (vgl. Ditton & Reinders 2015).
Entwicklung der Empirischen Bildungsforschung
Die Ursprünge der empirischen Bildungsforschung reichen bis ins späte 19. und frühe 20. Jahrhundert zurück, etwa zur experimentellen Pädagogik von Ernst Meumann und Wilhelm A. Lay. Einen Wendepunkt markierte die sogenannte „empirische Wende“ in den 1960er Jahren: Der Bildungsforscher Georg Picht machte auf den geringen Anteil an höheren Bildungsabschlüssen in Deutschland aufmerksam. Zeitgleich kritisierte Ralf Dahrendorf die mangelnde Chancengleichheit im deutschen Bildungssystem.
In der Folge entstanden zentrale Forschungsinstitutionen wie das Max-Planck-Institut für Bildungsforschung in Berlin (1963) und das IPN – Leibniz-Institut für die Pädagogik der Naturwissenschaften (1966). In den 1970er Jahren wurden neue Schulmodelle erprobt, in den 1990ern rückte Deutschland durch TIMSS-Studien und schließlich durch den sogenannten PISA-Schock 2000 erneut ins Zentrum der internationalen Aufmerksamkeit: Die Leistungen deutscher Schülerinnen und Schüler lagen nur im Mittelfeld, und die hohe Abhängigkeit von sozialer Herkunft wurde deutlich.
Seitdem hat sich die empirische Bildungsforschung massiv ausgeweitet – mit vielen neuen Professuren, Drittmittelprojekten und nationalen wie internationalen Studien. Daraus entwickelte sich eine evidenzbasierte Bildungspraxis: Bildungspolitische und pädagogische Entscheidungen sollen nicht mehr allein auf Tradition oder Intuition beruhen, sondern auf empirisch gesicherten Erkenntnissen (vgl. Gräsel 2015).
(Gräsel, 2020)
Reinders, C. (2022). Was ist empirische Bildungsforschung? In H. Reinders (Hg.), Empirische Bildungsforschung: Eine elementare Einführung (S. 153-160). Springer
Warum braucht man Kenntnisse über Forschungsmethoden in der Bildungsforschung?
Bildungsforschung liefert systematisch gewonnene Erkenntnisse darüber, wie Lernen und Lehren funktioniert – damit Bildung gerecht, wirksam und zukunftsfähig gestaltet werden kann.
- Zwei Sichtweisen:
-
Geisteswissenschaftliche Pädagogik: Bildung ist individuell, ganzheitlich, nicht messbar.
-
Empirische Bildungsforschung: Bildung lässt sich durch systematische Datenerhebung untersuchen (Fragebögen, Tests, Interviews).
-
-
Empirisches Forschen bedeutet: Beobachtung mit den Sinnen, gezieltes Fragen, systematisches Zuhören → Bild von Bildungsrealität entsteht.
-
Forschungsmethoden = Regeln für gute Fragen und systematisches Verstehen von Antworten.
-
Ziel: Erkenntnisse über Bildungsprozesse als Teil sozialer Realität gewinnen.
Wissenschaftstheoretische Grundlagen (S. 154–155)
-
Zwei Realitätsauffassungen:
-
Objektive Realität (→ kritischer Rationalismus, Popper):
-
Realität ist unabhängig, für alle gleich, regelhaft.
-
Standardisierte Verfahren (z. B. Fragebögen) sind geeignet zur Erfassung.
-
-
Subjektive Realität (→ symbolischer Interaktionismus, Mead):
-
Realität ist individuell konstruiert.
-
Erfassung durch offene Interviews, fallorientierte Methoden.
-
-
Merksatz: Die Beobachtung der Bildungsrealität basiert auf der Annahme, ob Realität objektiv gegeben oder subjektiv konstruiert ist.
-
Konsequenz für Theoriearbeit:
-
Objektive Realität: Theorien = allgemeingültige Gesetzmäßigkeiten → empirisch prüfbar.
-
Subjektive Realität: Theorien = Ergebnis vergleichender Einzelfallbetrachtung → Sinnverstehen.
-
Theorieprüfung (Deduktion) vs. Theoriegenerierung (Induktion) (S. 155–156)
-
Deduktion:
-
Von Theorie zur Empirie.
-
Ziel: Hypothesen prüfen (z. B. „Lernmotivation steigert Lernerfolg“).
-
→ typisch für quantitative Forschung.
-
-
Induktion:
-
Von Einzelfall zur Theorie.
-
Ziel: Aus konkreten Beobachtungen generalisierende Aussagen ableiten.
-
→ typisch (aber nicht ausschließlich) für qualitative Forschung.
-
Merksatz:
-
Deduktion: Theorie → Prüfung an Fällen.
-
Induktion: Fälle → Ableitung allgemeiner Aussagen.
Ablauf quantitativer und qualitativer Forschung (S. 157–158)
4.1 Quantitative Forschung
-
Ausgangspunkt: Theorie oder Hypothese.
-
Schritte:
-
Auswahl geeigneter Methode (z. B. Fragebogen, standardisierte Beobachtung).
-
Operationalisierung: Theoretische Begriffe werden messbar gemacht (z. B. „Lernfreude“ durch Skalen).
-
Datenerhebung → statistische Auswertung.
-
-
Charakteristika:
-
Langer Forschungszeitraum.
-
Theorien sind immer nur vorläufig gültig (→ Falsifikationsprinzip nach Popper).
-
Wiederholte Bestätigungen an verschiedenen Stichproben erhöhen Geltung der Theorie.
-
4.2 Qualitative Forschung
-
Ausgangspunkt: Forschungsfrage (z. B. „Wie erleben SchülerInnen projektbezogenen Unterricht?“).
-
Methode: Unstrukturierte Beobachtungen, offene Interviews.
-
Merkmale:
-
Offenheit für neue Themen, Perspektiven der Befragten.
-
Datenerhebung und Auswertung erfolgen iterativ (dynamischer Prozess).
-
Möglichkeit der Rückkopplung und Anpassung während des Forschungsprozesses.
-
Fazit (implizit aus dem Text)
-
Quantitative und qualitative Methoden unterscheiden sich hinsichtlich:
-
Erkenntnisinteresse,
-
Realitätsverständnis,
-
Theoriebildung,
-
Forschungslogik.
-
-
Kombination beider Ansätze (Mixed Methods) erlaubt umfassendere Einsichten in Bildungsprozesse.
Reinders, H. & Post, I. (2022). Quantitative Auswertungsverfahren. In H. Reinders (Hg.), Empirische Bildungsforschung: Eine elementare Einführung (1. Aufl., S. 269-279). VS Verlag für Sozialwissenschaften.
Das solltest du wissen...
-
Quantifizierung = Transformation von Antworten in Zahlen zur Auswertung.
-
Deskriptiv = Was sagt meine Stichprobe?
-
Inferentiell = Was sagt meine Stichprobe über die Population?
-
Effektstärke ≠ Signifikanz: Signifikanz prüft ob ein Effekt existiert, Effektstärke wie stark er ist.
-
Cohen's d und R² sind wichtige Maßzahlen zur Interpretation der Ergebnisse.
Quantitative Auswertungsverfahren
- Quantitative Verfahren dienen der systematischen Auswertung von Daten aus Befragungen, Beobachtungen oder Experimenten.
- Zentrale Merkmale:
- Quantifizierung: Überführung qualitativer Angaben in Zahlen
- Ziel: Muster, Häufigkeiten oder Zusammenhänge in Daten sichtbar machen.
Deskriptive Statistik (beschreibende Statistik)
- Dient der Beschreibung von Daten in einer Stichprobe:
- Absolute Häufigkeit (Anzahl an Personen je Merkmalsausprägung (z. B. 300 Jugendliche besuchen die Hauptschule)).
- Relative Häufigkeit (Anteil einer Merkmalsausprägung an der Gesamtstichprobe).
- Maße der zentralen Tendenz: z. B. arithmetisches Mittel (Durchschnitt).
- Median: Der Median ist diejenige Merkmalsausprägung der geordneten Daten, die die Stichprobe häufig teilt.
- Maße der Streuung: z. B. Standardabweichung (wie stark variieren Werte um den Mittelwert? -> je größer der Wert der Standardabweichung, desto stärker variieren die Werte der Stichprobe um den Stichprobenmittelwert).
- Merksatz: Deskriptive Statistik beschreibt, wie Daten in einer Stichprobe verteilt sind.
Skalenniveaus – die vier Messniveaus im Überblick
Das Skalenniveau beschreibt, wie genau eine Variable gemessen wurde und welche mathematischen Operationen zulässig sind (z. B. Mittelwert berechnen).
- Nominalskala – nur Benennung (Kategorien)
- Merkmale: Keine Rangfolge, nur Unterscheidung möglich.
- Beispiele: Geschlecht (m/w/d), Schulform (Hauptschule, Realschule, Gymnasium), Lieblingsfach
- Zulässige Aussagen: Gleichheit/ Ungleichheit: Statistik: Häufigkeiten, Modus, Kein Mittelwert!
- Ordinalskala – Rangordnung, aber keine exakten Abstände
- Merkmale: Werte lassen sich sortieren, aber Abstände sind nicht exakt messbar.
- Beispiele: Schulnoten (1–6), Zufriedenheit (z. B. „sehr zufrieden“ bis „unzufrieden“), Platzierungen (1., 2., 3.)
- Zulässige Aussagen: größer/kleiner, Reihenfolge, Statistik: Median, Rangkorrelation, Kein sinnvoller Mittelwert, da Abstände nicht gleich sind.
- Intervallskala – exakte Abstände, kein absoluter Nullpunkt
- Merkmale: Abstände sind gleich groß, aber kein „echter“ Nullpunkt.
- Beispiele: Temperatur in °C, IQ-Werte
- Zulässige Aussagen: Differenzen sinnvoll (z. B. 20 °C ist 10 °C wärmer als 10 °C), Statistik: Mittelwert, Standardabweichung, Kein Verhältnisausdruck („20 °C ist nicht doppelt so warm wie 10 °C“).
- Verhältnisskala (Ratioskala) – echter Nullpunkt + exakte Abstände
- Merkmale: Wie Intervallskala, aber mit absolutem Nullpunkt → Verhältnisse möglich!
- Beispiele: Körpergröße (z. B. 180 cm), Alter (z. B. 20 Jahre), Einkommen, Dauer
- Zulässige Aussagen: 20 Jahre ist doppelt so alt wie 10 Jahre, Statistik: Alle Verfahren erlaubt (Mittelwert, Varianz etc.)
Inferenzstatistik (schlussfolgernde Statistik)
- Ziel: Von Stichprobenergebnissen auf die Population schließen.
- Zentrale Konzepte:
- Stichprobe: Auswahl aus einer Grundgesamtheit.
- Population/Grundgesamtheit: Gesamtheit aller Personen, über die Aussagen getroffen werden sollen.
- Repräsentative Stichprobe: Eine Stichprobe ist dann repräsentativ, wenn sie hinsichtlich vorab festgelegter Merkmale der Zusammensetzung der Population entspricht.
Hypothesentest
- Prüft, ob eine theoretische Annahme (Hypothese) durch die Daten gestützt wird.
- Ergebnis ist eine Wahrscheinlichkeit, keine absolute Wahrheit.
- Hypothese = Eine wissenschaftliche Annahme über einen Zusammenhang oder Unterschied.
- Zwei Formen:
- Nullhypothese (H₀): Es gibt keinen Effekt, Zusammenhang oder Unterschied.
- Alternativhypothese (H₁): Es gibt einen Effekt oder Unterschied.
Signifikanzniveau (α)
- Gibt die maximale Irrtumswahrscheinlichkeit an, mit der man bereit ist, die Nullhypothese fälschlich abzulehnen.
- Standard: α = 0,05 (5 %)
p-Wert
- Gibt die tatsächliche Wahrscheinlichkeit an, dass das Ergebnis bei Gültigkeit von H₀ so oder noch extremer auftritt.
- Wenn p ≤ α, wird H₀ abgelehnt → das Ergebnis ist statistisch signifikant.
Klassifikation inferenzstatistischer Verfahren
- Parametrisch (voraussetzungsreich) vs. non-parametrisch (voraussetzungsarm -> basieren auf nominal- oder ordinalskalierten Daten).
- Verfahren nach Erkenntnisinteresse:
- Unterschiede prüfen → z. B. t-Test, Varianzanalysen.
- Zusammenhänge prüfen → z. B. Korrelation, Regression.
- Testtheorien:
- Klassische Testtheorie (KTT): basiert auf beobachteten Werten.
- Probabilistische Testtheorie (PTT/IRT): berücksichtigt Item- und Personenparameter.
Aussagen durch inferenzstatistische Verfahren
- Drei zentrale Kennwerte:
- Empirischer Wert: z. B. Mittelwertsdifferenz, Korrelation.
- Irrtumswahrscheinlichkeit (p-Wert): Wahrscheinlichkeit, dass ein Ergebnis zufällig entstanden ist.
- Signifikant, wenn p < 0,05.
- Effektstärke: Wie stark ist der gefundene Effekt?
- z. B. Cohen’s d: d < 0,20 (schwach), d > 0,80 (stark).
- Aufgeklärte Varianz (R²): Anteil der Varianz einer Variable, die durch eine andere erklärt wird.
Fazit
- Quantitative Verfahren unterteilen sich in:
- Deskriptive Statistik (Beschreibung innerhalb der Stichprobe).
- Inferenzstatistik (Übertragung auf die Grundgesamtheit).
- Vorteile:
- Große Datenmengen vergleichbar machen.
- Hypothesen systematisch prüfen.
- Nachteile:
- Komplexitätsreduktion → Informationsverlust.
- Ergebnisse sind stets wahrscheinlich, nicht sicher.
Uhlendorff, H. & Prengel, A. (2013). Forschungsperspektiven quantitativer Methoden im Verhältnis zu qualitativen Methoden. In B. Friebertshäuser (Hg.), Handbuch quantitative Forschungsmethoden in der Erziehungswissenschaft (s. 145-148). Beltz Juventa
Gemeinsamkeiten und Differenzen quantitativer und qualitativer Methoden in der Erziehungswissenschaft (S. 145–147)
Gemeinsamkeiten qualitativer & quantitativer Forschung
- Ziel: empirisch fundiertes Wissen über Erziehung gewinnen.
- Beide arbeiten:
- theoriebezogen
- regel- und kriteriengeleitet
- mit vergleichbarem Forschungsablauf (→ Mayring 2001):
- Formulierung von Fragestellung und Theoriebezug
- Festlegung von Methode und Material
- Datenerhebung und -auswertung
- Reflexion und Ergebnisdarstellung
- Gemeinsames Problem: Wirklichkeit ist nicht direkt abbildbar, sondern nur perspektivisch zugänglich.
- Erkenntnisse sind stets revidierbar und komplementär.
Unterschiede qualitativer & quantitativer Forschung
Quantitativ
Makroebene, große Fallzahlen
Wenige Aspekte, starke Hypothesen
Mathematisch-statistisch
Forschersubjektivität ausgeschlossen
Qualitativ
Mikroebene, kleine Fallzahlen
Viele Aspekte, offene Vorannahmen
Sprachlich-hermeneutisch
Forschersubjektivität einbezogen
- Beide liegen auf einem Kontinuum und können sich ergänzen.
- Jede Methode erschließt spezifische Erkenntnisse:
- Quantitativ: z. B. nationale Daten “(z. B. Anzahl der Sitzenbleiber auf nationaler Ebene)” (S. 146)
- Qualitativ: z. B. subjektive Sinnkonstruktionen “(z. B. Biographische Rekonstruktion der Entstehung von Gewaltbiografien)” (S. 146)
Methodenmix (Triangulation) als Erkenntnisgewinn
- Kombination beider Zugänge führt zu vertieftem Verständnis:
- z. B. quantitative Umfragen → ergänzt durch qualitative Fallstudien
- oder: qualitative Fallstudien → Grundlage für quantitative Hypothesenbildung
- Publikationen zu Methodenmix nehmen zu (z. B. Kelle 2008, Mayring 2001).
Komplementarität statt Konkurrenz!
- Quantitative und qualitative Methoden haben unterschiedliche Stärken, die sich in einem Methodenmix fruchtbar ergänzen.
- Ein reflektierter, theoriegeleiteter Umgang mit beiden Ansätzen erhöht die Qualität empirischer Forschung in der Erziehungswissenschaft.
Stanat Artelt (2009). Schulleistungsuntersuchungen. In Handbuch Schule von Blömeke et al.
Die Autorinnen unterscheiden zwischen verschiedenen Formen von Leistungserhebungen:
-
Internationale Vergleichsstudien (z. B. PISA, TIMSS, PIRLS): ermöglichen länderübergreifende Aussagen über den Leistungsstand und das Bildungssystem.
-
Nationale Studien (z. B. IQB-Bildungstrend, VERA): dienen der innerstaatlichen Überprüfung von Bildungsstandards und regionalen Unterschieden.
-
Individualdiagnostische Verfahren: liefern Hinweise auf Förderbedarfe einzelner Schüler*innen.
Zentrales Kennzeichen dieser Studien ist die Standardisierung der Tests sowie die Fokussierung auf Kompetenzen statt reinen Wissensbeständen.
Wissenschaftliche Fundierung und Konstruktion
Ein wesentliches Qualitätsmerkmal ist die theoretische Fundierung der Kompetenzbereiche und die empirische Skalierung der Aufgaben (z. B. durch Item-Response-Theorien). Damit ist gewährleistet, dass:
-
die Tests reliabel und valide messen,
-
Schwierigkeitsgrade empirisch abgestuft werden können,
-
Vergleichbarkeit innerhalb und zwischen Gruppen gegeben ist.
Wichtig ist der Unterschied zwischen Output (z. B. Noten, Abschlüsse) und Outcome (tatsächlich erfasste Kompetenzen).
Funktion und Nutzen
Schulleistungsstudien erfüllen mehrere zentrale Funktionen:
-
Monitoring-Funktion: langfristige Beobachtung von Trends (z. B. Kompetenzentwicklung, Bildungsgerechtigkeit).
-
Rechenschaftsfunktion: Transparenz für Politik, Verwaltung und Öffentlichkeit.
-
Steuerungsfunktion: evidenzbasierte Gestaltung von Bildungsprozessen, Curricula und Fördermaßnahmen.
-
Professionalisierungsfunktion: Anregungen für Lehrerbildung und Unterrichtsentwicklung.
Dabei betonen die Autorinnen, dass der Nutzen nicht automatisch eintritt, sondern von der qualifizierten Nutzung der Ergebnisse abhängt.
Befunde und Entwicklungen
Insbesondere PISA hat gezeigt, dass Bildungssysteme – darunter auch Deutschland – deutliche Schwächen im Hinblick auf Chancengleichheit, individuelle Förderung und Kompetenzorientierung aufweisen. Die empirischen Ergebnisse führten u. a. zu:
-
Einführung von Bildungsstandards durch die KMK,
-
der Einrichtung des Instituts zur Qualitätsentwicklung im Bildungswesen (IQB),
-
einer zunehmenden Output-Orientierung schulischer Arbeit.
Die Autorinnen weisen aber auch auf erhebliche Unterschiede zwischen den Bundesländern hin – sowohl im Leistungsniveau als auch in der sozialen Selektivität.
Kritische Reflexion und Grenzen
Stanat und Artelt heben hervor, dass Schulleistungsstudien trotz ihres Erkenntnispotenzials nicht ohne Probleme sind:
-
Sie können keine kausalen Erklärungen liefern – nur Korrelationen.
-
Der Fokus auf messbare Kompetenzen kann zur Verengung des Bildungsbegriffs führen.
-
Die Gefahr einer Testorientierung („teaching to the test“) besteht.
-
Die öffentliche Diskussion ist häufig verkürzt, etwa wenn Rankings ohne Kontext präsentiert werden.
Dennoch sehen die Autorinnen in der evidenzbasierten Steuerung eine Chance zur Qualitätsentwicklung, sofern die Ergebnisse differenziert interpretiert und konstruktiv genutzt werden.
Implikationen für Schule und Unterricht
Für Schulen und Lehrkräfte ergeben sich daraus konkrete Herausforderungen:
-
Reflexion über die eigenen Leistungserwartungen und Unterrichtspraktiken.
-
Notwendigkeit, Ergebnisse aus Studien pädagogisch zu kontextualisieren.
-
Stärkere Ausrichtung auf individuelle Förderung und Kompetenzentwicklung.
-
Förderung eines professionellen Umgangs mit diagnostischen Instrumenten und vergleichenden Leistungserhebungen.
Das darf nicht sein! - ist aber leider so... (Gräsel, 2022)
-
Schüler*innen aus sozioökonomisch besser gestellten Familien haben auch bei gleicher Leistung deutlich höhere Chancen auf den Besuch einer höheren Schulform und auf höhere Bildungsabschlüsse.
-
Die soziale Herkunft beeinflusst nicht nur den Bildungserfolg im Sinne von Abschlüssen, sondern auch den Kompetenzerwerb – Kinder aus privilegierten Familien erreichen höhere Kompetenzniveaus.
-
Bildung, berufliche Positionen und gesellschaftlicher Status werden in Deutschland in hohem Maße sozial vererbt.
-
Das Schulsystem kann die ungleichen Sozialisations- und Lernbedingungen in den Familien nicht ausgleichen.
-
Besonders an Übergangsstellen im Bildungssystem (z. B. Grundschule → weiterführende Schule) wirken soziale Selektionsmechanismen.
-
Studien zeigen, dass insbesondere die Bildungsaspiration der Eltern und die Entscheidungen der Lehrkräfte die soziale Selektion an diesen Schnittstellen beeinflussen.