Conference PaperPDF Available

Evaluation eines Unterrichtskonzepts zur Quantenoptik mit Einzelphotonenexperimenten -Ergebnisse einer Pilotstudie

Authors:

Abstract

Evaluation eines Unterrichtskonzepts zur Quantenoptik mit Einzelphotonenexperimenten -Ergebnisse einer Pilotstudie
Philipp Bitzenbauer
Jan-Peter Meyn
FAU Erlangen-Nürnberg
Evaluation eines Unterrichtskonzepts zur Quantenoptik mit
Einzelphotonenexperimenten Ergebnisse einer Pilotstudie
Das Unterrichtskonzept zur Quantenoptik
Dem Konzept liegt das Experiment aus der
Publikation von Grangier et al. (Grangier, Roger, &
Aspect, 1986) zugrunde, mit dem gleichzeitig die
Unteilbarkeit von Photonen als auch die
Einzelphotoneninterferenz gezeigt werden kann. Die
Ergebnisse dieses Experiments führen dazu, dass die
Vorstellung des Photons als lokalisierbares Teilchen
fallen gelassen werden muss. Gegliedert ist das
Unterrichtskonzept in vier Kapitel, die in insgesamt
vier Schulstunden unterrichtet werden. Am Beispiel
des Quantenobjekts „Photon“ können damit
Wesenszüge der Quantenphysik (Küblbeck &
Müller, 2007) vermittelt werden:
Kapitel 1: Einzelphotonendetektoren
Kapitel 2: Koinzidenzmessung
Kapitel 3: Unteilbarkeit von Photonen
Kapitel 4: Einzelphotoneninterferenz
Details zum Konzept findet man bei Bitzenbauer &
Meyn (2019).
Forschungsdesign und Methodik
Zur Evaluation der entwickelten
Elementarisierungen quantenoptischer
Konzepte wurden Teaching
Experiments mit = 13 Schülerinnen
und Schülern der gymn. Oberstufe
durchgeführt. Dabei zeigte sich, dass
insbesondere die Erklärung der
Funktionsweise von Einzel-
photonendetektoren in Analogie zum
Entstehen und zum Abgang einer
Schneelawine von den Schülerinnen
und Schülern durchweg sehr gut
akzeptiert und als hilfreich empfunden
wurde. Auch die Erläuterungen zur
Koinzidenzmessung als Grundlage von
Einzelphotonenexperimenten sowie die Erklärung zum Antikorrelationsfaktor stießen auf
mittlere bis gute Akzeptanzwerte. Die Paraphrasierungen als Teil der Teaching Experiments
konnten von der überwiegenden Zahl der Schülerinnen und Schülern mit mindestens
zufriedenstellender Qualität widergegeben werden. Mit diesen qualitativen Ergebnissen liegen
Indizien vor, dass die Experimente mit den entwickelten Erklärungen für Schülerinnen und
Schüler verständlich sind und es wurden nur kleinere Änderungen am Konzept vorgenommen.
Die Akzeptanzbefragungen ermöglichen überdies die Untersuchung von
Schülervorstellungen, die durch das neue Konzept gefördert werden.
Abb. 1: Schematische Darstellung des
Experiments von Grangier et al. (1986).
Abb. 2: Übersicht über das Studiendesign.
487
Auf Grundlage der Erkenntnisse aus den Teaching Experiments folgt eine summative
Evaluation des Unterrichtskonzepts im Prä-Posttest-Design mit Follow-Up-Test. Zusätzlich
soll mit Hilfe einer Befragung von Lehrkräften die Praxistauglichkeit des Konzepts evaluiert
werden und leitfadengestützte Interviews in der Retrospektive sollen zeigen, inwiefern
Schülerinnen und Schüler ein elaboriertes Verständnis bis hin zu den Wesenszügen der
Quantenphysik erwerben.
Entwicklung eines Testinstruments zur Quantenoptik
Damit die Zusammenstellung der Prüfungsfragen die Inhaltsbereiche der Intervention gut
abbildet, wurde zunächst ein Blueprint nach Flateby (2013) entwickelt; dabei handelt es sich
um eine Themenmatrix, die Inhaltsbereiche der Intervention einerseits und die in diesen
Themen zu erreichenden Lernniveaus der Schülerinnen und Schüler andererseits beinhaltet
und nach Relevanz gewichtet (Krebs, 2008). Zu den jeweiligen Inhaltsbereichen wurden
zunächst 21 Items im offenen Format formuliert. Um sinnvolle Distraktoren zu finden, wurden
diese an = 23 Lehramtsstudierende gegeben. Häufig auftauchende Fehler oder solche
Antworten, die inhaltlich nah an der richtigen Lösung sind, können als plausible Distraktoren
für das Testinstrument extrahiert werden; dieses Vorgehen ist in der fachdidaktischen
Forschung verbreitet (Schnell, Hill, & Esser, 2018) insbesondere wenn keine Befunde zur
Schülervorstellungen vorliegen.
Bei geschlossenen Aufgabenformaten decken die Antwortmöglichkeiten mitunter nicht alle
denkbaren Reaktionen der Probandinnen und Probanden ab, beeinflussen sich gegenseitig
oder entsprechen nicht der natürlichen Antwort der Befragten (ebd.), was sich negativ auf die
Validität auswirken kann (Rost, 2004). Eine gängige Methode zur Überprüfung der Qualität
von Testaufgaben ist die des „Lauten Denkens“, die unabhängig vom Aufgabenformat
eingesetzt werden kann (Hadenfeldt, Repinning, & Neumann, 2014). Im Zuge der Pilotierung
des Testinstruments wurde die Methode des „Lauten Denkens“ vorrangig zur Optimierung der
Aufgabengüte und damit zur Verbesserung der Validität auf Item-Ebene mit = 13
Oberstufenschülerinnen und -schülern durchgeführt. Am Anfang stand eine Instruktion zum
Lauten Denken, die in Anlehnung an Mackensen-Friedrichs (2004) formuliert wurde, um eine
standardisierte Durchführung der Methode sicherzustellen (Sandmann, 2014). Die „Laute
Denken“-Erhebung führte zur sprachlichen Überarbeitung aller Items und drei Items sind
zusätzlich entstanden.
Beim Bearbeiten des Tests ist jeweils zusätzlich zum Kreuz bei der richtigen der drei
Aussagen, die eigene Sicherheit beim Ankreuzen anzugeben. Ein Punkt wird nur vergeben,
wenn die Antwort richtig und der Proband sich mindestens sicher ist. Dadurch soll der
Rateeinfluss minimiert werden und außerdem werden zusätzliche Auswertemöglichkeiten
geschaffen. Mit dem Test wird nicht das Ziel verfolgt „die“ Quantenoptik als Konstrukt zu
messen; stattdessen geht es um zentrale Begriffe zu unterschiedlichen Teilgebieten der
Quantenoptik. Zunächst wird also damit untersucht, inwiefern das entwickelte
Unterrichtskonzept dazu beiträgt, dass Schülerinnen und Schüler sich im Begriffsfeld der
Quantenoptik bewegen können und inwiefern sie sich im Umgang mit den Begriffen sicher
sind. Tiefergehende Verknüpfungen zwischen den Begriffen, Elaborationen und Bezüge zu
den Wesenszügen der Quantenphysik werden in leitfadengestützten Interviews erhoben.
Ausgewählte Ergebnisse der Pilotstudie
Für eine Itemanalyse wurde eine Pilotstudie mit insgesamt = 100 StudienanfängerInnen der
Ingenieurswissenschaften durchgeführt, wobei 86 vollständige Prä-Posttestpaare vorliegen.
73 der Teilnehmer waren männlich. Items mit einer Itemschwierigkeit < .2 bzw. > .8 wurden
genauso eliminiert, wie Items mit Trennschärfen unter .3 (Neuhaus & Braun, 2007). Übrig
bleibt ein Itemset bestehend aus 13 Items. Alle haben Trennschärfen oberhalb von. 3, teilweise
liegen diese sogar im guten Bereich > .5 (Fisseni, 2004). Cronbach’s Alpha als Maß für die
488
interne Konsistenz des Testinstruments beträgt = .78. Die Split-Half-Reliabilität liegt bei
= .71. Ein Argument für Kriteriumsvalidität sind signifikante Korrelationen des
Posttestergebnisses mit den Außenkriterien Durchschnittsnote Physikmit = ( <
0.01) sowie dem Interesse an Quantenphysik mit =  ( < 0.01). Eine
konfirmatorische Faktorenanalyse bestätigt die dreifaktorielle Struktur des Testinstruments,
sodass die drei Subskalen „Einzelphotonenexperimente“ (= .53), „Photonen“ (= .61)
und „Theoretische Aspekte“ (= .61) empirisch trennbar sind (/ = 0.83, <
0.001, = 1.00,  = 0.00,  = 0.063). Die Inhaltsvalidität wurde neben einer
Lehrplananalyse mittels eines Expertenratings ( = 8) gesichert.
Zum Vergleich von Prätestergebnis ( = 3.12;
 ) und Posttestergebnis ( 
= 3.15) wurde ein nichtparametrischer
Wilcoxon-Test für verbundene Stichproben
gerechnet. Dieser zeigt einen signifikanten
Lernzuwachs mit großer Effektstärke (( =
 < .001, = 3.73). Teilt man die
Stichprobe nach Leistungsterzilen (abhängig
vom Prätestergebnis) auf, so zeigt eine Analyse
des absoluten Lernzuwachses, dass dieser für die
leistungsstärkeren Probanden ( = 2.21,  =
2.17) niedriger ist als für Leistungsschwächere
( = 3.00,  = 2.66), sodass ein höherer
Lernzuwachs nicht auf ein höheres Vorwissen zurückzuführen ist.
Beim Ankreuzen im Posttest sind die ProbandInnen signifikant sicherer als im Prätest (( =
   < 0.001,  ); insbesondere werden sie bei allen Items im Posttest
signifikant sicherer, bis auf bei einem Item, bei dem mit dem atomaren Energieübergang ein
Inhalt abgefragt wird, der nicht explizit Teil des Unterrichtskonzepts ist;
geschlechterspezifische Unterschiede sind nach einem Mann-Whitney-U-Test nicht statistisch
signifikant ( = 663.00, = 0.76). Es zeigt sich ein hoch signifikanter Zusammenhang
zwischen der mittleren Sicherheit der Probanden im Posttest und ihrer Durchschnittsnote in
Physik ( = .33, = .002).
Untersucht man den absoluten Lernzuwachs in Abhängigkeit vom angegebenen Interesse an
Quantenphysik, so zeigt sich, dass die (sehr) interessierten ProbandInnen im Mittel einen
höheren Lernzuwachs vorweisen, als die weniger Interessierten. Überraschend ist aber, dass
die nicht und gar nicht Interessierten einen ebenso hohen Lernzuwachs zeigen, wie die sehr
Interessierten. Hier ist in der Hauptuntersuchung die Frage zu klären, ob mit dem qualitativen
Konzept insbesondere die an Physik weniger Interessierten und leistungsschwächeren
Schülerinnen und Schüler erreicht werden.
Abbildung 4: Lernzuwachs in Abhängigkeit vom Interesse an Quantenphysik.
0
5
10
15
20
0246810 12
Häufigkeit
Erreichte Punktzahl
Prätest Posttest
Abbildung 3: Testergebnisse im Prä-
Posttestvergleich.
489
Literatur
Bitzenbauer, P., & Meyn, J.-P. (2019). Quantenphysik greifbar unterrichten. Plus Lucis.
Fisseni, H.-J. (2004). Lehrbuch der psychologischen Diagnostik. Hogrefe.
Flateby, T. L. (2013). A Guide for Writing and Improving Achievement Tests. University of South Florida.
Glug, I. (2009). Entwicklung und Validierung eines Multiple-Choice-Tests zur Erfassung prozessbezogener
naturwissenschaftlicher Grundbildung. Kiel.
Grangier, P., Roger, G., & Aspect, A. (1986). Experimental evidence for a photon anticorrelation effect on a
beam splitter: a new light on single-photon interference. Europhysics Letters.
Hadenfeldt, J., Repinning, B., & Neumann, K. (2014). Die kognitive Validität von Ordered Multiple Choice
Aufgaben zur Erfassung des Verständnisses von Materie. Zeitschrift für Didaktik der Naturwissenschaften.
Krebs, R. (2008). Multiple Choice Fragen? Ja, aber richtig. Medizinische Fakultät; Institut für Medizinische
Lehre IML; Abteilung für Assessment- und Evaluation AAE. Bern.
Küblbeck, J., & Müller, R. (2007). Die Wesenszüge der Quantenphysik. Aulis.
Mackensen-Friedrichs, I. (2004). Förderung des Expertiseerwerbs durch das Lernen mit Beispielaufgaben im
Biologieunterricht der Klasse 9. Kiel.
Neuhaus, B., & Braun, E. (2007). Testkonstruktion und Erhebungsstrategien praktische Tipps für empirisch
arbeitende Didaktiker. In H. Bayrhuber, Kompetenzentwicklung und Assessment (S. 135-165). Innsbruck:
Studienverlag.
Rost, J. (2004). Lehrbuch Testtheorie - Testkonstruktion. Bern u.a.: Verlag Hans Huber.
Sandmann, A. (2014). Lautes Denken die Analyse von Denk-, Lern- und Problemlöseprozessen. In D. Krüger,
I. Parchmann, & H. Schecker, Methoden in der naturwissenschaftsdidaktischen Forschung (S. 179-188).
Springer .
Schnell, R., Hill, P. B., & Esser, E. (2018). Methoden der empirischen Sozialforschung. De Gruyter.
490
... The test addresses content knowledge as well as explanatory schemes and consists of 29 multiple-choice items and four open questions. Most of the items used has been adapted from already existing proven tests ( Bitzenbauer & Meyn, 2020;Di Uccio et al., 2019;Singh, 2008). All items cover the topics: Quantum behaviour of electrons and photons, superposition and probability amplitudes, measurement and wave optics. ...
... Aufgrund kleiner Stichproben wurde nur mit klassischer Testtheorie ausgewertet. Diese Aspekte (außer der Inhaltsvalidität) wurden bereits in [32] diskutiert. Die Inhaltsvalidität wird argumentativ gestützt. ...
Conference Paper
Full-text available
In der empirischen Unterrichtsforschung wird im Kontext von Testentwicklung oft von der Validierung eines Testinstruments gesprochen. Die Debatte über das Testgütekriterium Validität führte zu einer Verschiebung der Auffassung von Validität. Heute ist weniger von der Validität als Eigenschaft eines Tests die Rede. Vielmehr steht eine valide Testwertinterpretation im Zentrum der Sicherung von Testqualität. Dass ein Testverfahren valide Testwertinterpretation erlaubt, muss argumentativ abgeleitet werden. Die erforderlichen Argumentationsstränge sind dabei nicht standardisierbar. Insbesondere für Forschungsbereiche, in denen es nur wenig belastbare theoretische Vorarbeiten gibt, birgt das Hürden. Hier setzt dieser Artikel an: anhand eines "best-practice"-Beispiels aus der Didaktik der Quantenphysik wird aufgezeigt, wie ein solcher argumentativer Prozess methodisch erfolgen kann. Zunächst wird der Bedarf einer Neuentwicklung eines Testinstruments für die summative Evaluation eines Unterrichtskonzepts zur Quantenoptik begründet. Die Testentwicklung wird beschrieben. Inwiefern eine valide Testwertinterpretation möglich ist, wird argumentativ abgeleitet: Die Ergebnisse von einer Studie zum Lauten Denkens, sowie einer Expertenbefragung werden mit Ergebnissen einer quantitativen Pilotstudie kombiniert.
... Von Koinzidenzen zu Wesenszügen der Quantenphysik empirisch trennbaren Subskalen "Einzelphotonenexperimente", "Photonen" und "Theoretische Aspekte" konnte in der Pilotstudie konfirmatorisch bestätigt werden ( 2 / = 0.83, < 0.001, = 1.00, = 0.00, = 0.063) [25]. Es ergibt sich ein klares Bild: Der deutlichste Zuwachs von Prä-zu Posttest zeigt sich für die Subskala "Photonen", die mit drei Items insbesondere die naive Teilchenvorstellung des Quantenobjekts Photon adressiert. ...
Conference Paper
Full-text available
Mit dem Erlanger Unterrichtskonzept zur Quantenoptik wird das Ziel verfolgt, eine moderne Sichtweise auf die Quantenphysik zu vermitteln. Lernende sollen anschlussfähiges Wissen bis hin zu den Wesenszügen der Quantenphysik aufbauen. Im Rahmen einer summativen Evaluation mit Schülerinnen und Schülern der gymnasialen Oberstufe wird das Konzept evaluiert. Ein mixed-methods-Ansatz wurde gewählt, um verschiedene Perspektiven auf die Lernprozesse nachzeichnen zu können. Erste Ergebnisse aus einem Fragebogen zum deklarativen Wissen in Quantenoptik im Prä-Post-Follow-Up-Testdesign sowie einem Vorstellungsfragebogen zur Quantenphysik werden vorgestellt. Es zeigt sich: Lernende gelangen zu einem angemessenen Begriffsverständnis zur Quantenoptik und bauen ein überwiegend adäquates Verständnis der Wesenszüge auf, aber eine Teilchenvorstellung von Photonen scheint stabil zu sein.
Article
Full-text available
Quantenphysik unterscheidet sich von der klassischen Physik fundamental: Während Beobachtungen mechanischer Vorgänge einfach möglich sind und sich durch den Beobachtungsprozess kein Einluss auf den Vorgang ergibt, sind vergleichbare Beobachtungen in der Quantenphysik nicht möglich, da jeder Messprozess den Zustand eines Quantensystems ändert . Weil wir Menschen im Alltag keine Erfahrungen mit der Quantenphysik machen, wie es mit der klassischen Physik alltäglich der Fall ist, bleibt die Quantenphysik unanschaulich. Alle menschgemachten Bilder, Modelle oder Analogien zur Veranschaulichung der Quantenphysik sind nur auf den ersten Blick hilfreich, ziehen aber nachweislich Fehlvorstellungen nach sich. Die Frage „Wie kann das denn so sein?”, die sich daher in der Quantenphysik auftut, ist nach Feynman „Ausdruck eines unkontrollierten aber vergeblichen Wunsches, es als etwas Vertrautes ansehen zu wollen.” In diesem Artikel soll gezeigt werden, wie quantenoptische Konzepte in ein Unterrichtskonzept eingebettet unterrichtet werden können, um anhand von Experimenten mit einzelnen Photonen in die Quantenphysik einzuführen.
Chapter
Lautes Denken ist eine Forschungsmethode aus der Kognitionspsychologie, die wie kaum eine andere den Zugang zu den kognitiven Prozessen ermöglicht, die während einer Handlung ablaufen. Sie wird vornehmlich zur Analyse von Denk-, Lern- und Problemlöseprozessen angewandt, ist aber auch für die Analyse von Unterricht und für die Kompetenzmodellierung hilfreich. Beim lauten Denken verbalisiert die Versuchsperson möglichst alle Gedanken, die in der Regel zeitgleich während einer Handlung entstehen. Beim retrospektiven lauten Denken werden die Gedanken direkt nach der Handlung beschrieben, z. T. mit Hilfe von Film- oder Tonaufnahmen als Stimulated Recall. Bei der Datenerhebung entstehen Video- bzw. Audiodateien, die transkribiert werden. Die Protokolle des lauten Denkens (so genannte verbale Daten) werden im Hinblick auf theoretische Konstrukte kategoriengeleitet analysiert und können mit statistischen Verfahren evidenzbasiert und unter Berücksichtigung weiterer Datenquellen ausgewertet werden.
Thesis
Naturwissenschaftliche Grundbildung stellt eine notwendige Voraussetzung für die kritische Beurteilung von Entwicklungen in den Naturwissenschaften und die Auseinandersetzung mit einer durch Naturwissenschaften und Technik geprägten Kultur dar. Insbesondere der Prozess naturwissenschaftlicher Erkenntnisgewinnung wird dabei als bedeutsam für ein grundlegendes Verständnis von Wissenschaft angesehen. Nicht erst seit den Ergebnissen aus TIMSS und PISA gibt es daher Bemühungen, die naturwissenschaftliche Grundbildung von Schülerinnen und Schülern zu verbessern. Leider fehlte es bisher abseits der veröffentlichten PISA-Items an Instrumenten, die eine Überprüfung dieser Bemühungen in ökonomischer, objektiver und valider Weise erlauben und insbesondere prozessbezogene Anteile naturwissenschaftlicher Grundbildung erfassen. Das Ziel dieser Arbeit bestand demnach in der Entwicklung eines Tests zur Erfassung der hier als dqprozessbezogendq bezeichneten naturwissenschaftlichen Grundbildung, die anhand der Fertigkeiten dqIdentifizieren wissenschaftlicher Hypothesendq, dqPlanen einer wissenschaftlichen Untersuchungdq und dqNutzen wissenschaftlicher Ergebnissedq operationalisiert wurde. Das als Gruppen-Screening angelegte Verfahren wurde nach der probabilistischen Testtheorie für Schülerinnen und Schüler der neunten Klasse aus Haupt-, Realschule und Gymnasium entwickelt. Auf Basis der in unterschiedlichen Testphasen erhobenen Daten wurde es überarbeitet und in eine abschließende Testform gebracht. Im Anschluss folgte die Validierung. Die Reliabilität des Testverfahrens nach Cronbachs Alpha beträgt 0,81, die probabilistische WLE-Reliabilität 0,77. Diese Werte sind für einen Gruppen-Leistungstest als gut zu bezeichnen. Die durchschnittliche Trennschärfe der Items liegt bei 0,45 und die Itemschwierigkeiten variieren zwischen -1,66 und 0,88. Die mittlere Itemschwierigkeit beträgt -0,14. Der Test kann damit für die vorliegende Stichprobe als angemessen bezeichnet werden, auch wenn er ein wenig zu leicht erscheint. Die interne Validierung ergab, dass die entwickelten Testitems als raschhomogen bezeichnet werden können. Die als eindimensional postulierte Kompetenz konnte nach der Durchführung von Modellgeltungstests und nach Überprüfung der Korrelationen der drei Fertigkeiten bestätigt werden. Die Bemühungen um die Entwicklung eines dqTests zu Erfassung prozessbezogener naturwissenschaftlicher Grundbildungdq können als erfolgreich bezeichnet werden. Das entstandene Verfahren ist ökonomisch, valide und reliabel und zeichnet sich durch gute statistische Kennwerte aus. (Autorenreferat).
Article
We report on two experiments using an atomic cascade as a light source, and a triggered detection scheme for the second photon of the cascade. The first experiment shows a strong anticorrelation between the triggered detections on both sides of a beam splitter. This result is in contradiction with any classical wave model of light, but in agreement with a quantum description involving single-photon states. The same source and detection scheme were used in a second experiment, where we have observed interferences with a visibility over 98%.
Die kognitive Validität von Ordered Multiple Choice Aufgaben zur Erfassung des Verständnisses von Materie
  • J Hadenfeldt
  • B Repinning
  • K Neumann
Hadenfeldt, J., Repinning, B., & Neumann, K. (2014). Die kognitive Validität von Ordered Multiple Choice Aufgaben zur Erfassung des Verständnisses von Materie. Zeitschrift für Didaktik der Naturwissenschaften.
Medizinische Fakultät; Institut für Medizinische Lehre IML; Abteilung für Assessment-und Evaluation AAE
  • R Krebs
Krebs, R. (2008). Multiple Choice Fragen? Ja, aber richtig. Medizinische Fakultät; Institut für Medizinische Lehre IML; Abteilung für Assessment-und Evaluation AAE. Bern.