Erhalten Frauen auf ihrem Bildungsweg tatsächlich bessere Noten als Männer? Und wenn ja, sind diese Geschlechterunterschiede über alle Länder, Fächer und Altersstufen hinweg gleich? Stecken Jungen somit wirklich in der „Krise“?
Diese und weitere Fragen untersucht die Metaanalyse „Gender Differences in Scholastic Achievement: A Meta-Analysis“ von Voyer und Voyer (2014) auf der Basis von mehr als 500 Studienergebnissen, zu denen mehr als eine Million SchülerInnen und Studierende beigetragen haben.
Metaanalyse im Überblick
Fokus der Studie: Geschlechterunterschiede bezogen auf Noten in der Schule und an der Universität
Zielgruppe: Lernende unterschiedlicher Altersstufen und Länder
Durchschnittliche Effektstärke: Frauen (Schülerinnen und Studentinnen) haben insgesamt bessere Noten als Männer (Schüler und Studenten) (d = 0.23, kleiner Effekt)
Weitere Befunde: Der Unterschied zugunsten von Frauen ist besonders groß in sprachlichen Fächern und in fächerübergreifenden Gesamtnoten, aber signifikant kleiner in Mathematik und in Naturwissenschaften als in Gesamtnoten
Einleitung
Forschungsbefunde aus Leistungsvergleichsstudien mit standardisierten Testverfahren (z.B. PISA-Studie) der vergangenen zwei Jahrzehnte deuten darauf hin, dass Jungen in Mathematik und in den Naturwissenschaften bessere Leistungen erzielen als Mädchen. Diese Befunde werden in den Medien und der Bildungspolitik häufig diskutiert. Bisherige Metaanalysen (vgl. Else-Quest et al., 2010) bestätigen diese Ergebnisse, wenn es darum geht, die Leistungen der SchülerInnen anhand von standardisierten Tests (im Rahmen von Leistungsvergleichsstudien) zu erfassen, wobei der Leistungsvorsprung der Jungen recht klein ist.
Wirft man jedoch einen Blick auf die Leistungserfassung durch Noten im schulischen und universitären Bereich, so zeichnet sich ein anderes Bild ab: Studien weisen nach, dass Studentinnen und Schülerinnen insgesamt bessere Noten von Dozierenden und Lehrkräften erhalten als Studenten und Schüler. Seit einigen Jahren ist in diesem Zusammenhang häufig die Rede von der sogenannten „boy crisis“ oder Krise der Jungen – der Annahme, dass Jungen neuerdings zunehmend hinter die Leistungen von Mädchen zurückfallen.
Die Metaanalyse von Voyer und Voyer (2014) gibt den Forschungsstand zu Leistungsunterschieden zwischen den Geschlechtern wieder und geht erstmalig der Frage nach, ob es Geschlechterunterschiede zugunsten von Mädchen bzw. Frauen hinsichtlich der Noten gibt und welche Bedingungen (sogenannte Moderatoren) diese Geschlechterunterschiede beeinflussen.
Worum geht es in dieser Studie?
Die Metaanalyse von Voyer und Voyer (2014) fasst die Befunde aus 369 Primärstudien, die zwischen 1914 und 2012 in wissenschaftlichen Fachzeitschriften und Dissertationen veröffentlicht wurden, systematisch zusammen. Die AutorInnen untersuchen die Schulleistungen von über einer Million Personen, die zum Zeitpunkt der Erhebungen entweder eine Grundschule, eine weiterführende Schule oder eine Universität besucht haben.
Auf Basis dieser umfassenden Daten analysiert die Studie, ob es tatsächlich einen Geschlechterunterschied in den Noten zugunsten von Frauen gibt. Zudem untersuchen die AutorInnen, ob diese Unterschiede je nach Moderatoren variieren:
- Fachbereich. Sprachen, Mathematik, Naturwissenschaften, Sozialwissenschaften und fächerübergreifende Gesamtnoten z.B. Grade Point Average (GPA)
- Altersgruppe. Lernende der Grundschule, Sekundarstufe oder Universität
- Ländergruppe.* Nordamerika (271 Studien), Skandinavien (29 Studien) und Sonstige Länder (69 Studien)
- Schultyp. Privat versus öffentlich
- Bewertungsmaß für Noten. Prozentwerte, die in Noten umgerechnet werden, oder Punkteskala
- Veröffentlichungsjahr der Primärstudie.**
* Diese Länderkategorie umfasst die USA und Kanada.
** Weitere Moderatoren wie die Geschlechterzusammensetzung und die ethnische Zusammensetzung in der Klasse sind ebenfalls Teil der Untersuchung, werden aber hier nicht weiter berichtet.
Was findet diese Studie heraus?
In ihrer Metaanalyse zeigen die AutorInnen, dass Schülerinnen und Studentinnen insgesamt signifikant bessere Noten erhalten als Schüler und Studenten (d = 0.23; kleiner positiver Gesamteffekt). Wichtige Moderatorvariablen, die diese Geschlechterunterschiede in der Notengebung beeinflussen, sind Fachbereiche, Altersgruppen und Ländergruppen.
Die Befunde für die einzelnen Fachbereiche (siehe Tabelle 1) zeigen, dass die Notenunterschiede zwischen den Geschlechtern in sprachlichen Fächern signifikant größer sind (d = 0.37) als im Bereich der Gesamtnoten (d = 0.25). Die Unterschiede zwischen den Geschlechtern in Mathematik sind hingegen sehr gering (d = 0.07) und signifikant kleiner als die Effekte bei den Gesamtnoten.
Tabelle 1. Effektstärken der Geschlechterunterschiede innerhalb der verschiedenen Fachbereiche.
Fachbereich | Effektstärke (Cohen's d) | Anzahl der Studien |
---|---|---|
Gesamtnoten | 0.25 | 258 |
Sprachen | 0.37 | 81 |
Mathematik | 0.07 | 93 |
Naturwissenschaften | 0.15 | 31 |
Sozialwissenschaften | 0.17 | 26 |
Die Notenunterschiede zwischen den Geschlechtern innerhalb der verschiedenen Fachbereiche werden in der Metaanalyse sowohl hinsichtlich der Altersgruppen als auch der Länderzugehörigkeit differenziert (siehe Tabelle 2). Sowohl in den sprachlichen Fächern als auch im MINT-Bereich zeigt sich, dass die Geschlechterunterschiede zur Sekundarstufe I hin deutlich und signifikant zunehmen, auf diesem Niveau stabil bleiben und erst im Studium wieder geringer werden.
Die Geschlechterunterschiede in Naturwissenschaften, Sprachen und innerhalb der Gesamtnoten sind für SchülerInnen in der Sekundarstufe I und II signifikant größer als für Studierende. Auch der Länderkontext hat einen Einfluss auf die Geschlechterunterschiede. Die größten Unterschiede zwischen den Fachbereichen existieren in der Ländergruppe Nordamerika.
Bemerkenswert ist, dass im Gegensatz dazu sowohl in den skandinavischen als auch den übrigen Ländern keine signifikanten Geschlechterunterschiede im Fach Mathematik bestehen. Die Moderationsanalysen für verschiedene Schultypen, Bewertungsmaße und Publikationsjahre zeigen hingegen keine signifikanten Unterschiede.
Tabelle 2. Effektstärken der Moderatoren Altersgruppe und Ländergruppe.
Moderatoren | Gesamtnoten (Cohen's d) | Sprachen (Cohen's d) | Mathematik (Cohen's d) | Naturwissenschaften (Cohen's d) |
---|---|---|---|---|
Altersgruppe | ||||
Grundschule | 0.37* | 0.20* | -0.01 | 0.10 |
Sekundarstufe I | 0.36* | 0.45* | 0.23* | 0.23* |
Sekundarstufe II | 0.39* | 0.47* | 0.11* | 0.16* |
Studium | 0.21* | 0.21* | 0.12* | 0.01 |
Ländergruppen | ||||
Nordamerika | 0.29 | 0.47* | 0.17* | - |
Skandinavien | 0.03 | 0.35* | 0.03 | - |
Sonstige Länder | 0.27* | 0.15* | -0.04 | - |
* signifikanter Effekt
Wie bewertet das Clearing House Unterricht diese Studie?
Die Clearing House Unterricht Research Group bewertet die Metaanalyse anhand der folgenden fünf Fragen und orientiert sich dabei an den Abelson-Kriterien (1995):
Wie substanziell sind die Effekte?
Der Gesamteffekt der Geschlechterunterschiede in den Noten von d = 0.23 kann nach Cohens Konventionen (1988) als kleiner Effekt eingestuft werden. Dieser Effekt bedeutet, dass 59 % der Frauen bessere Noten erzielen als der Durchschnitt der Männer.
Im Vergleich zu bisherigen Ergebnissen von Metaanalysen zu Geschlechterunterschieden – die einen sehr kleinen und somit eher zu vernachlässigenden Gesamteffekt von d = -0.05 zugunsten von Männern in Mathematik (Lindberg et al., 2010) oder einen sehr kleinen Effekt (d = 0.11) zum Vorteil für Frauen in sprachlichen Fächern berichten (z.B. Hyde & Linn, 1988) –, ist der gefundene Effekt bezogen auf den Notenunterschied zwischen den Geschlechtern von d = 0.23 in der vorliegenden Metaanalyse relativ deutlich ausgeprägt.
Wie differenziert sind die Ergebnisse dargestellt?
Die Differenziertheit der berichteten Effekte wird von der Clearing House Unterricht Research Group anhand der untersuchten Fachbereiche, Altersgruppen und des Erfolgskriteriums (Schulnote) beurteilt. Die Ergebnisse der Metaanalyse sind sehr differenziert für die Bereiche Mathematik, Naturwissenschaften, Sprachen und Gesamtnoten dargestellt. Zudem wird detailliert erfasst, welcher Altersgruppe bzw. Institution die untersuchten Lernenden zuzuordnen sind und wie sich die Schulnote errechnet.
Wie verallgemeinerbar sind die Befunde?
Die Metaanalyse prüft mithilfe von Moderatoranalysen, inwiefern die Befunde verallgemeinerbar sind. Die Effektstärken unterscheiden sich systematisch für verschiedene Länderkontexte, Altersgruppen und Fächer. Daraus folgt, dass die Geschlechterunterschiede dadurch beeinflusst und nicht im Sinne eines einheitlichen Gesamteffektes generalisierbar sind.
Allerdings ist die Robustheit der durchschnittlichen positiven Effekte zu Geschlechterunterschieden für alle Fachbereiche, Altersgruppen und Ländergruppen bemerkenswert. Das bedeutet, dass die positive Richtung der Effekte für diese Bereiche verallgemeinert werden kann, nicht aber deren Größe. Die positive Tendenz der Effekte unterstützt somit zudem die Annahme, dass Frauen in allen Fächern bessere Schulnoten erhalten als Männer. Keine Einschränkung des Gesamteffekts ergibt sich für Schultypen, Bewertungsmaße und das Publikationsjahr.
Folglich kann für diese Bereiche der Geschlechterunterschied in den Schulnoten verallgemeinert werden. Besonders interessant ist daran, dass die Geschlechterunterschiede bereits über einen langen Zeitraum hinweg stabil sind.
Was macht die Metaanalyse wissenschaftlich relevant?
Die Metaanalyse ist wissenschaftlich aus drei Gründen als sehr bedeutsam zu werten: Erstens ist sie die erste Metaanalyse zum Thema, die sich auf Schulnoten statt auf Leistung in standardisierten Tests bezieht.
Zweitens gibt sie einen umfassenden Überblick über Befunde aus einem Jahrhundert an Forschung in diesem Bereich wieder und drittens gehen in die Analyse nicht nur Studien aus Nordamerika, sondern auch aus Skandinavien sowie anderen Ländern unterschiedlicher Kulturen (wie etwa Kanada, Türkei, Deutschland oder Taiwan) ein.
Wie methodisch verlässlich sind die Befunde?
Die Befunde sind aus methodischer Sicht als sehr verlässlich einzuordnen. Die Begründung und Transparenz des methodischen Vorgehens entspricht überwiegend den Kriterien gängiger Anforderungskataloge (z.B. APA Meta-Analysis Reporting Standards).
Die einzelnen Schritte des Erstellungsprozesses der Metaanalyse sind größtenteils sehr gut dokumentiert. Besonders hervorzuheben ist, dass die Auswahl der Primärstudien und die statistischen Analysen der Metaanalyse vorbildlich begründet und sehr gut nachvollziehbar dargestellt werden.
Weitere Informationen zur Beurteilung des methodischen Vorgehens finden Sie in unserem Rating Sheet.
Fazit für die Unterrichtspraxis
Nimmt man aus dieser umfassenden Metaanalyse eines mit, so ist es wohl der Befund, dass Mädchen in der Schule durchgehend bessere Noten erhalten als Jungen. Dabei sind zwei weitere Befunde dieser Metaanalyse ebenfalls bemerkenswert: Zwar sind die Unterschiede in Mathematik und in den Naturwissenschaften kleiner als in sprachlichen Fächern, aber auch hier schneiden Schülerinnen besser ab.
Entgegen der weitverbreiteten Annahme handelt es sich bei diesem Unterschied jedoch keineswegs um ein neueres Phänomen oder eine akute „boy crisis“. Die AutorInnen zeigen, dass Unterschiede in dieser Größenordnung seit rund hundert Jahren stabil geblieben sind und genauso auch in Ländern außerhalb der Ländergruppe Nordamerika nachweisbar sind.
Zur Einordnung dieses Befundes sei nochmals auf die eingangs erwähnten Erkenntnisse verwiesen: Bei standardisierten Messverfahren, wie sie etwa in Large-Scale-Studien (wie z.B. PISA) zum Einsatz kommen, erbringen Jungen vor allem in den MINT-Fächern gleichwertige Leistungen (siehe Studienbeispiel von Lloyd et al., 2005) oder sogar etwas bessere Leistungen als Mädchen (vgl. Else-Quest et al., 2010).
Das bedeutet: Je nachdem, welches Leistungsmaß man heranzieht – Ergebnisse standardisierter Tests oder Noten –, kommt man zu unterschiedlichen Einschätzungen bezüglich der Geschlechterunterschiede in den Leistungen.
Damit bleiben vor allem zwei Fragen ungeklärt: Wie kommt es zu unterschiedlichen Ergebnissen durch unterschiedliche Messverfahren und warum haben Mädchen nun bessere Noten als Jungen? Aktuell kann man nur vermuten, dass die Notengebung und die unterschiedlichen Interaktionen in Schule und Unterricht, die mit der Benotung in Verbindung stehen, maßgeblich zu solchen Unterschieden beitragen.
Studienbeispiel
Lloyd und Kollegen (2005) untersuchen Geschlechterunterschiede zwischen Mädchen und Jungen in Bezug auf ihre Leistungen in Mathematik. Die Stichprobe umfasst 99 SchülerInnen der 7. Klasse sowie 62 SchülerInnen der 4. Klasse aus Kanada.
Die Leistung der SchülerInnen wurde durch zwei Maße erfasst: einerseits durch einen standardisierten Mathematiktest (Foundation Skills Assessment) und andererseits durch die Mathematiknoten der Schulzeugnisse. Die durchschnittliche Leistung im standardisierten Mathematiktest lag bei 503.56 Punkten.
Die Ergebnisse des Tests zeigen, dass Mädchen zwar eine geringfügig höhere Punkteanzahl (+14 Punkte; d = 0.17) erreichten als Jungen, dieser Leistungsunterschied zwischen den Geschlechtern jedoch nicht signifikant ist. Der standardisierte Leistungstest weist also keinen statistisch bedeutsamen Unterschied zwischen den Geschlechtern nach.
Mit Hinblick auf die Schulnoten lässt sich hingegen ein entscheidender Unterschied feststellen. Schülerinnen erhielten signifikant bessere Mathematiknoten von den Lehrkräften als Schüler (d = 0.44).