Testtheorie, Testpsychologie und Pädagogische Diagnostik
Vorbemerkungen
Wer in der Schule ständig misst, läuft im Rausch der Vermessenheit leicht Gefahr, Unmögliches zu messen.
Im Lehrberuf sind Sie zunehmend mit Tests verschiedener Provenienz konfrontiert und Sie entwickeln selbst Prüfungen. Mit neuen digitalen Hilfsmitteln und künstlicher Intelligenz eröffnen sich in der Schule interessante Möglichkeiten, diagnostische Verfahren effektiver und effizienter zu machen.
Das folgende vielgestaltige Lernangebot fördert kompetentes testtheoretisches Nachdenken, führt systematisch in wesentliche Qualitätskriterien für das Testen und Prüfen ein und exemplifiziert sie.
Vorurteile und ideologisch verkürzte Positionen
Tests sind bei vielen Menschen nicht gefühlsneutral. Sie haben längst in Psychiatrie, Schulpsychologie, Schule und Arbeitswelt Eingang gefunden. Seit es solche Instrumente in der Psychologie gibt, wird die Psychometrie kritisiert, in sie werden nicht erfüllbare Erwartungen projiziert und die Aussagekraft der Tests werden gerne überschätzt. Euphorie wie Verteufelung sind naheliegend, besonders bei mangelndem Sachverstand. Der Testerei wird mitunter eine geradezu toxische Ideologie der Vermessung des Menschen unterstellt, Tests werden in einen Zusammenhang mit heimlicher Überwachung, Kontrolle und gar Bestrafung gebracht oder mit ungesunder Konkurrenzorientierung, unerwünschter Selektion, Normierung und Standardisierung; aber auch mit Optimierung des Lernens, mit Fairness, Nützlichkeit und Ökonomie. Neben messtheoretischen stellen sich so auch ethische Fragen. Hier wird versucht, die Thematik unvoreingenommen und nicht aus einer bestimmten ideologischen Position darzustellen. Unbefangenheit impliziert wissenschaftlichen Pluralismus jenseits absoluter Gewissheiten.
Tests und Prüfungen: zwei enge Verwandte
Im engeren Sinne, wie Tests im ersten Kapitel definiert werden, sind Prüfungen, die Lehrpersonen zur Feststellung der erreichten Kompetenzniveaus ihrer Schüler:innen produzieren, keine Tests. Doch Prüfungen in der Schule teilen mit Tests einige Merkmale und werden deshalb vielerorts oft auch unter den Überbegriff Test subsummiert oder synonym verwendet. Was die Arbeit von Lehrpersonen betrifft, könnte man ebenso die Wortmarke Assessment verwenden, dies in Übereinstimmung mit Pophams (2020) Definition:
"Educational assessment is a formal attempt to determine students’ status with respect to educational variables of interest" (S. 12).
Anstelle formal passen auch die Adjektive systematisch, geplant, bewusst und zielgerichtet. Gemeint sind nicht informelle Einschätzungen und Bewertungen, die en passant gemacht werden.
Tests und Prüfungen als Datenlieferanten für vielfältige Zwecke
In den meisten Fällen sollten Tests und Prüfungen in der Schule Daten liefern, aus denen geschlossen werden kann, was Schüler:innen wirklich wissen und können, was sie längerfristig und auch in neuen Situationen nutzen können. Dies ist fraglos notwendig, wenn es um die Ziffernnoten in Zeugnissen geht. Damit ist jedoch noch nicht das ganze Spektrum beschrieben. Nach dem Zweck des Beurteilens lassen sich fünf Hauptformen unterscheiden:
- Tests und Prüfungen im formativen Bereich (Assessment for/as Learning) sollten mithelfen, geeignete Lerntätigkeiten, Lernmaterialien und Lehr-Lernstrategien zu finden sowie motivierende Mindsets zu entwickeln. Wer lehrt, der benutzt diagnostische Verfahren, um die Qualität der individuellen Lerntätigkeiten der Schüler:innen zu verbessern. Wer lehrt, der beurteilt und optimiert die Qualität des eigenen Unterrichts.
- Tests und Prüfungen im summativen und zertifizierenden Bereich (Notenzeugnisse, Assessment of Learning) sollten eine faire, validere Notenvergabe unterstützen. Wer lehrt, der prüft und bescheinigt amtlich gegenüber Dritten die Schulleistungen der einzelnen Schüler:innen.
- Tests und Prüfungen im prognostischen und selektiven Bereich sollten Zulassungsentscheidungen für weiterführende Bildungswege verbessern. Bei folgenschweren Entscheidungen wird mittels standardisierter Tests die Datengrundlage erweitert und die Beurteilungsqualität gesteigert.
- High Stakes Tests sind notwendig für das Bildungsmonitoring oder kantonale Qualitätsentwicklungsprozesse. Sie stehen nicht im Zentrum dieses Lernobjekts. Wer lehrt, verfolgt mit Interesse die Leistungen des Schulsystems.
Verschiedene Zwecke erfordern verschiedene Tests und Prüfungen
Im Alltag geht die entscheidende Frage oft vergessen, wozu ein Test entwickelt worden ist. Nur wer den genauen Zweck sowie sowie die Grenzen eines Tests kennt, kann die damit generierten Daten verstehen und richtig interpretieren. Im schulischen Bereich sind insbesondere neun verschiedene Anliegen relevant:
- Erkundung des Vorwissens und der verfügbaren Fertigkeiten im Hinblick auf den Erwerb einer weiterführenden Kompetenz
- Überwachung der Lernfortschritte einzelner Schüler:innen
- Verbesserung des laufenden Unterrichts, der aktuellen Lernprozesse
- Erfassung der erreichten Kompetenzniveaus der Schüler:innen zur amtlichen Bescheinigung der erreichten Leistungsniveaus im Ziffernzeugnis (kompetenzorientierte Notengebung)
- Vergleiche zwischen Schüler:innen
- Prognose für künftige Bildungs- und Ausbildungswege
- Ermittlung und Steigerung der Effektivität des eigenen Unterrichts
- Evaluation der Unterrichtsqualität zur Beurteilung der Lehrer:innen
- Einschätzung der Leistungen und Effektivität des Bildungssystems
Zumeist ist es nicht möglich, mit einem Test valide Daten für mehrere Zwecke zu generieren. Selten lässt sich ein Test für zwei verschiedene Zwecke gleichzeitig nutzen. Dies geht stets auf Kosten der Testqualität. Test oder Prüfungen, die Lehrpersonen zur Erfassung der Lernleistungen der einzelnen Schüler:innen ihrer Klasse anfertigen, haben beispielsweise eine andere Gestalt und folgen einer anderen Logik als Tests für das nationale Bildungsmonitoring oder die kantonale Schulqualitätsentwicklung. Zur Professionalität der Lehrer:innen gehören die Kompetenzen, die Qualität von Tests und Prüfungen für verschiedene Zwecke richtig einzuschätzen.
Um Qualitäten des Testens, Prüfens und Beurteilens geht es in diesem Lernobjekt.
Testtheoretische Basics mit Impulsen für die Praxis des Testens, Prüfens und Beurteilens
Grundanforderungen an Tests, Qualitätsmerkmale und andere wichtige Parameter zur Testerstellung und Testauswertung werden in den folgenden Kapiteln einführend dargestellt. Dieses grundlegende testtheoretische Wissen soll beim Erstellen und Interpretieren von Prüfungen mithelfen, wesentliche Qualitätsstandards zu erfüllen. Das Lernobjekt gibt Impulse zum Weiterlernen und Weiterdenken in einem zentralen schulischen Handlungsfeld.
Erörtert werden grundlegende Sachverhalte und ein paar statistische Kennwerte. Intelligenztests sind die am längsten erforschten und am besten entwickelten Fähigkeitstests. Mit ihnen lassen sich besonders gut wesentliche Qualitätsmerkmale illustrieren und die Grenzen der Fähigkeitstests aufzeigen.
Sachverstand
Begegnen Sie Tests mit Neugier und kritischem Sachverstand, aber nicht mit übermässigem Vertrauen. In der Praxis des Testens und Prüfens ist es nicht üblich, dass testtheoretische Ansprüche optimal eingelöst werden können. Dazu fehlen vielfach die finanziellen, zeitlichen, materiellen und personellen Ressourcen. Die vielerlei notwendigen Bedingungen für die Entwicklung fachgerechter Tests und Prüfungen werden notorisch unterschätzt. Gerade im Bildungs- und Schulbereich müssen Tests und Prüfungen – Methoden, Daten, Interpretationen – ständig geprüft und ernsthaft hinterfragt werden. Die Grenzen der angewendeten Verfahren sind klar und detailliert auszuweisen.
Testwerte müssen interpretiert werden. Dazu gehört ein Qualitäts-Check des verwendeten Verfahrens. Die reicht aber noch nicht aus. Verbreitet existieren Tetsts, die auf fragwürdigen oder konfusen Theorien oder Modellen beruhen. "Messwerte" können nicht sinnvoll interpretiert werden, wenn eine solide theoretische Basis dessen, was gemessen wird, fehlt.
Tests können im Widerspruch zur ethischen Maxime der Normalität aller interpretiert werden und Exklusion anstelle sozialer Teilhabe an Lerngelegenheiten befördern.
[Disclaimer: Ohne zusätzliches pädagogisches, psychologisches, soziologisches und ethisches Verständnis, ohne fachspezifisches und fachdidaktisches Wissen und ohne elaboriertes, kontextspezifisches und gut erprobtes Handlungsrepertoire kann nicht klug, verantwortungsvoll, effizient und fair beurteilt werden. Diese Professionalität und Expertise entstehen fortwährend durch ein Elixier aus intelligentem Studium, zielstrebigem Training und motivierender, erfolgreicher Praxis.]
Teachers who can test well will be better teachers.
(Popham, 2020, S. 1)
Indeed, increasing assessment literacy may be the most cost-effective way to improve our schools.
(Popham, 2020, S. 33)
Ein Selbsttest über das Testen
Wie denken Sie über das Testen? – Beantworten Sie folgenden Kurztest.
Wie steht es um Ihre Assessment Literacy?
Weitere Literatur
Bower, J. & Thomas, P. L. (Eds.). (2013). De-testing + de-grading schools. Authentic alternatives to accountability and standardization. New York: Lang.
Gaspard, H., Trautwein, U. & Hasselhorn, M. (Hrsg.). (2019). Diagnostik und Förderung von Motivation und Volition. Göttingen: Hogrefe.
Popham, W. J. (2020). Classroom assessment. What teachers need to know (9th ed.). Pearson.
Sawchuk, 2019). Is it time to kill annual testing? Education Week, January, 8 2019.
Stanovich, K. E. (2009). What intelligence tests miss. The psychology of rational thought. London: Yale University Press.