GEW Baden-Württemberg
Du bist hier:

GrundschulempfehlungBessere Lernergebnisse durch strikte Homogenisierung?

Eine vielbeachtete Studie kommt zu dem Ergebnis, dass bei sehr streng durchgeführter Leistungstrennung die Leistungen von Schüler*innen besser sind als in heterogenen Lerngruppen. Muss die GEW jetzt umdenken? Eine Einordnung.

15.09.2021 - Von Ute Kratzmeier, GEW-Referentin für allgemeine Bildung

In der renommierten Zeitschrift für Soziologie wurde 2020 ein Beitrag veröffentlicht, der die Effekte einer strikten Differenzierung nach den kognitiven Leistungen von Schüler*innen untersucht (Hartmut Esser / Julian Seuring: Kognitive Homogenisierung, schulische Leistungen und soziale Bildungsungleichheit, Zeitschrift für Soziologie 2020, Seite 277 bis 301, de Gruyter Oldenbourg).

Die Ergebnisthese: Wenn es gelingt, diese Leistungstrennung sehr streng durchzuführen, sind die Leistungen von Schüler*innen besser als in heterogenen Lerngruppen, der soziale Herkunftseffekt kann ausgeschaltet werden.

Muss die Beschlusslage der GEW jetzt umgeschrieben werden? Ist die Trennung der Kinder nach Klasse vier doch erfolgversprechender als die mühevolle individuelle Förderung in heterogenen Gruppen?

Die Studie

Am Ausgangspunkt der Untersuchung stellen die Autoren Hartmut Esser und Julian Seuring die sattsam bekannten Strukturphilosophien gegenüber: Die Differenzierung der Kinder nach Leistung verstärkt den Effekt der sozialen Herkunft, gegliederte Systeme befördern daher die Bildungsungleichheit. Die andere Position: Wenn Lerngruppen homogen gemäß dem Leistungsvermögen sind, kann gezielter gelernt werden, die Leistungen werden besser. Die erste Position, die auch von der GEW vertreten wird, bezeichnen die Autoren interessanterweise als „Standardposition“, man könnte auch sagen „Mainstream“. Für den wissenschaftlichen und internationalen Diskurs dürfte dies durchaus zutreffen, für die schulische Praxis in Deutschland wohl kaum. Nun denn.

Dass Schule und Differenzierung Bildungsungleichheit schaffen oder zumindest erheblich verstärken, ist eine zentrale These und auch ein empirisches Ergebnis aller internationalen Leistungsstudien. Mit dem Schlagwort „PISA-Schock“ erlangte es 2001 große Berühmtheit.

Laut Esser und Seuring ist dieses Ergebnis „erwartungswidrig“. Das bedeutet, dass der umgekehrte Effekt eigentlich plausibler sei: In homogenen Lerngruppen kann gezielter auf die Kinder und ihr Leistungs- und Lernvermögen eingegangen werden, was zu besseren Ergebnissen führen müsse. Dieser Plausibilität gehen sie in einem differenzierten statistischen Modell nach und prüfen es mit Daten der „National Educational Panel Study“ (NEPS). Sie verwenden dazu Schüler*innenkohorten, die im Schuljahr 2010/2011 die 5. Klassen besuchten.

Voraussetzung für die Homogenisierungsthese ist, dass die Aufteilung der Lerngruppen tatsächlich „strikt“ ist, das heißt, dass allein das kognitive Vermögen ausschlaggebend sein darf. Esser und Seuring nehmen in ihrer Studie für sich in Anspruch, dass sie, im Gegensatz zu PISA & Co., auch die „kognitive Komposition der Schulen und Schulklassen“ in den Blick nehmen. Dies wurde bei den bisherigen Leistungsstudien nicht erfasst, wodurch fälschlicherweise die Entwicklungseffekte allein auf die soziale Herkunft zurückgeführt würden.

Unter der Annahme, dass die Verteilung der kognitiven Fähigkeiten von Kindern in allen sozialen Schichten gleich ist, käme es an den Schulen bei strikter Sortierung nach Intelligenz zu sozial sehr stark gemischten Gruppen (ability-tracking). Beeinflusst hingegen die soziale Herkunft in hohem Maße die Schulentscheidung, wird es zu kognitiv gemischten, aber sozial homogen Gruppen kommen (nobility-tracking).

Dies liegt unter anderem an den Eltern: Kommen sie aus sozial eher schlechter gestellten Milieus, scheuen sie sich häufig, für ihre Kinder anspruchsvollere Bildungswege zu wählen, auch wenn sie die Fähigkeiten dazu haben. Bei besser gestellten Eltern ist es umgekehrt. Diesen Effekt der „Bildungsaspiration“ kann man mit einer stark verbindlichen Grundschulempfehlung minimieren: „Bei einer rein fähigkeitenbezogenen Sortierung wäre zugleich die soziale Mischung maximal: Wenn nur die Leistungen zählen, tritt die soziale Herkunft in den Hintergrund.“ (Seite 285)

Deshalb wählten Esser und Seuring den Grad Verbindlichkeit der Grundschulempfehlung in den Bundesländern für ihr Modell aus. Dabei wurden nur diejenigen Länder berücksichtigt, die das „tracking“ bereits in Klasse 4 vornehmen.

Es wurden drei Gruppen der Übergangsregelung gebildet: liberal (fünf Bundesländer), mittelmäßig strikt (fünf Bundesländer) und strikt (drei Bundesländer, darunter Baden-Württemberg). Drei Bundesländer wurden nicht in die Untersuchung aufgenommen, weil sie die Kinder erst nach Klasse 6 aufteilen. Diese Gruppen wurden dann mit den Leistungsdaten ihrer Schüler*innen in Beziehung gesetzt. Strikt bedeutet, dass die Grundschulempfehlung verbindlich ist und die schulischen Abläufe und Leistungen stärker standardisiert sind (zum Beispiel zentrale Prüfungen, Leistungsvergleiche, Probezeiten und so weiter).

Der Unterschied des Modells bei Esser und Seuring zu den „Mainstream-Studien“ einschließlich PISA ist der, dass sie die kognitiven Fähigkeiten der Schüler*innen und der Schule beziehungsweise Schulklassen kontrollieren und nicht nur die soziale Herkunft.

Ergebnisse

„Das Ziel der empirischen Analyse ist die Identifikation der Systemeffekte einer strikten Differenzierung nach den kognitiven Fähigkeiten auf die Leistungen in der Sekundarstufe unter Kontrolle der dabei beteiligten allgemeinen Bedingungen und Vorgänge [...].“ (Seite 291)

Zusammenfassend ergibt sich: Werden durch statistische Verfahren die Komposition der Schulklassen und Schulen mit einbezogen, reduziert sich der Einflussfaktor soziale Herkunft immer weiter. Demnach ist es die leistungsgerechte Homogenisierung, die für Leistungsverbesserungen verantwortlich ist und nicht etwa die soziale Heterogenität. In leistungshomogenen Klassen kann der Unterricht stärker, man könnte auch sagen „problemloser“ auf das Potenzial der Schüler*innen abgestimmt werden, weil ihre Intelligenz ähnlich ist. So verstandener fokussierter Unterricht führt dann zu entsprechenden Leistungsverbesserungen und schwächt gleichzeitig soziale Effekte ab. Je strikter die Differenzierung erfolgt, desto höher ist das Leistungsniveau. „Die strikte Differenzierung ist, verbunden mit einer hohen kognitiven Homogenität der Schulklassen, offenbar gerade etwas für die Kinder in den unteren Bildungswegen“, stellen Esser und Seuring fest (Seite 296).

Die Empfehlungen an die Bildungspolitik sind entsprechend klar: Eine stärkere Orientierung an der Leistungsdifferenzierung, gegebenenfalls begleitet von Intelligenztests, soll „Fehlplatzierungen bei der Sortierung möglichst ganz vermeiden“ (Seite 297). Empfehlungen wie Ganztagsbetreuung, Talentscouting und so weiter könnten zusätzlich vor allem in schwierigen städtischen Bereichen unterstützen und für mehr Bildungsbeteiligung Benachteiligter sorgen, jedoch die strikte Differenzierung nicht ersetzen.

Rezeption der Studie

Lohmann (2021) und Klemm (2021) verweisen darauf, dass bei der Gruppenbildung nach der Stringenz der Grundschulempfehlung nicht berücksichtigt wurde, dass die Verbindlichkeit der Empfehlung in Baden-Württemberg ab 2012/2013 aufgehoben wurde. Dies dürfte allerdings für die Kohorte 2010/2011 noch keine Auswirkung gehabt haben. Maßgeblicher ist der von Klaus Klemm aufgezeigte Hinweis, dass auch die IQB-Ergebnisse den Befunden von Esser und Seuring entsprechen: Die Kompetenzwerte der Schüler*innen in „strikten“ Bundesländern sind höher, der Zusammenhang von Leistung und sozialer Herkunft dagegen niedriger. Klemm untersucht dann, ob dies vor allem auf die Stringenz der Verteilung der Schüler*innen nach Grundschulempfehlung zurückzuführen ist und schaut sich dazu die Gymnasialbesuchsquote der Bundesländer in den 8. Klassen an. Ein Vergleich zeigt, dass sich diese Quote in den liberalen Ländern (Durchschnitt 35,9 Prozent) und in den „strikteren“ Ländern (34,1 Prozent) kaum unterscheidet. Diese Differenz [...] verweist darauf, dass der erwartete Sortierungseffekt im Vergleich der beiden Ländergruppen auf die Bildungsbeteiligung so gut wie nicht wirkt (Klemm 2021, Seite 3).

Sodann vergleicht Klemm die Ergebnisse der IQB-Studien für die vierten und die neunten Klassen. In beiden Studien findet sich wieder die Gruppierung strikte Sortierung – bessere Leistungen – geringere soziale Abhängigkeit und liberale Sortierung – schlechtere Leistungen – stärkere soziale Abhängigkeit. Merke also: Diese Gruppierung findet sich auch zu einem Zeitpunkt, an dem die Sortierung noch gar nicht stattgefunden hat! Denn in allen Grundschulen aller Bundesländer lernen Kinder gemeinsam.

Es wäre demnach zu untersuchen, was Länder mit durchweg guten beziehungsweise besseren Leistungen von denen mit schlechteren Leistungen unterscheidet – jenseits der Organisation des Übergangs. Ein Faktor könnte laut Klemm der deutlich höhere Anteile an Migrant*innen in den liberaleren Ländern sein, eine andere zu prüfende Hypothese die vielleicht tatsächlich stärkere Leistungsorientierung in den „guten“ Ländern.

Brisant sind die bildungspolitischen Implikationen der Ergebnisse von Esser und Seuring. Denn, selbst wenn man ihnen folgen möchte, wie dies die Befürworter*innen des gegliederten Schulsystems sicher gerne tun, heißt das ja nicht, dass es beim Status Quo bleiben könnte. Vielmehr müsste eine verbindliche Grundschulempfehlung in eine strikte Übergangsverpflichtung münden. Anders könnte die kognitive Homogenisierung nicht sicher hergestellt werden. Die korrekte Zuordnung zur einmal zugewiesenen Leistungsgruppe müsste außerdem stetig überprüft werden. Ergebnisse von Vergleichstests, die eine abweichende Zuordnung ergäben, würden zwangsläufig einen Wechsel in eine andere Leistungsgruppe, Schulart oder Schule erfordern. Ob angesichts eines solchen Regimes eine entspannte und motivierende Lernumgebung entstehen kann, darf bezweifelt werden.

Mit dem Studiendesign setzt sich Joachim Lohmann auseinander. Er kritisiert, dass allein schon die Zuordnung der Länder in drei Stringenzgruppen zwischenzeitlich erfolgte Strukturveränderungen nicht berücksichtigt. In nahezu allen Bundesländern gibt es inzwischen alternative Zugangswege zum Abitur, besonders augenscheinlich ist dies in den fünf Bundesländern mit Zwei-Wege- beziehungsweise Zwei-Säulen-Modell. Diese „ultraliberale“ Ländergruppe lässt sich laut Lohmann in keine der Gruppen der Esser-Seuring-Studie einordnen. Wenn jedoch schon diese Zuordnung falsch ist, laufen vermeintliche Klassen-Kompositionseffekte ins Leere, wie zum Beispiel der, dass bei einem unterdurchschnittlichen kognitiven Niveau von Klassen die Leistungsstärksten die sind, die in homogener Zusammensetzung lernen (Lohmann 2021, Seite 3).

Die Unterscheidung in die Schulartengruppen Gymnasien und Nicht-Gymnasien ist laut Lohmann ohnehin viel zu holzschnittartig, weil sich die Schulstruktur der Nicht-Gymnasien in den Bundesländern erheblich unterscheidet. Sie sind „eine Mixtur vieler unterschiedlicher Schulformen sowie aus nach Leistung zusammengesetzter Klassen“ (ebenda).

Nun ist es nicht so, dass kognitive Homogenisierung per se unsinnig ist. Linda Wirthwein weist in der „Expertise Gemeinschaftsschule“ (2013) darauf hin, dass sich die „vorübergehende Separierung“ und „die Aufteilung in verschiedene domänenspezifische Leistungsgruppen“ als eine Maßnahme einer erfolgreichen Hochbegabtenförderung erwiesen hat. Allerdings lassen sich selbst für diese schon recht homogene Gruppe „keine Standardmaßnahmen empfehlen“ (Seite 81), vielmehr geht es um ein Konzert verschiedener Förderansätze. Es liegt nahe, dass dies für die Bandbreite an kognitiven Fähigkeiten der Schüler*innen insgesamt erst recht gilt.

Dennoch ist der Intelligenzbegriff der Studie viel zu statisch. Er lässt sich allein aus der Grundschulempfehlung nur unzureichend ableiten. Fähigkeiten, Interessen und Talente sind sehr individuell, sie entwickeln sich im Laufe der Bildungsbiografie, was nicht zuletzt auch an den Förderungen und Erfahrungen in und außerhalb der Schule liegt. Will man den Wirkungen einer Leistungsdifferenzierung nachspüren, braucht man den Vergleich mit einem System, das auf äußere Trennung verzichtet. Ein solches System ist in keinem Bundesland wirklich etabliert.

Die vornehmste Aufgabe der Schule ist die Eröffnung von Bildungschancen für alle Schüler*innen und ihre bestmögliche Förderung. Die Studie erweckt den Eindruck, als ob dies ausschließlich mit einer Sortierung nach der vierten Klasse und im althergebrachten Raster der Gliedrigkeit möglich wäre. Dass dies eine doch sehr unwahrscheinliche, ja anmaßende These ist, zeigen die unterschiedlichsten Schulsysteme weltweit.