Article

Lehrbuch Testtheorie, Testkonstruktion

Authors:
To read the full-text of this research, you can request a copy directly from the authors.

No full-text available

Request Full-text Paper PDF

To read the full-text of this research,
you can request a copy directly from the authors.

... Bei der Konstruktion wurde aufgrund der heterogenen Zielgruppe auf fachlich korrekte, einfach verständliche Sprache mit möglichst geringem Textumfang Wert gelegt (Rost, 2004 Titel sprachlich ergänzt. Dieser wird während der ersten drei Sekunden eingeblendet. ...
... Auch das Theorieblatt (siehe Anhang) wurde in einer einfach verständlichen Sprache mit geringem Textumfang gehalten (Rost, 2004). Dadurch wurde der Heterogenität der Zielgruppe Rechnung getragen. ...
... Der Multiple-Select Test ist ein Leistungstest (Rost, 2004) Die Multiple-Select Aufgaben für den Aufgabentyp "Vergleich" umfassen drei Fragen (siehe Tab. 14). ...
... Im einfachsten Fall werden die kodierten Itemantworten zu einem Wert aufsummiert und dieser Summenwert unter Berücksichtigung eines angenommenen Messfehlers als Repräsentant der wahren Persönlichkeits-bzw. Fähigkeitsausprägungen einer Person aufgefasst (Bühner, 2011(Bühner, , 2021Wess, 2020). Bevor in der probabilistischen Testtheorie ein solcher Summenwert als Repräsentant einer latenten Personenvariable jedoch ermittelt wird, wird zunächst das Muster der Itemantworten analysiert (Rost, 2004). Dazu wird auf Basis der erhobenen empirischen Daten ein Modell gebildet, das unter Berücksichtigung von Personenparametern und Itemschwierigkeiten sowie gegebenenfalls weiteren Parametern die Wahrscheinlichkeit vorhersagt, ein Item positiv zu beantworten (Koller et al., 2012;. ...
... Dazu wird auf Basis der erhobenen empirischen Daten ein Modell gebildet, das unter Berücksichtigung von Personenparametern und Itemschwierigkeiten sowie gegebenenfalls weiteren Parametern die Wahrscheinlichkeit vorhersagt, ein Item positiv zu beantworten (Koller et al., 2012;. Deuten die empirischen Daten darauf hin, dass die Items diesem gemeinsamen zugrundeliegenden Modell folgen, gibt der Summenwert eine sinnvolle Auskunft über die Persönlichkeits-bzw. Fähigkeitsausprägung einer Person (Rost, 2004). Wenn hingegen einzelne Items einer Skala dem Modell nicht genügen, wird davon ausgegangen, dass diese nicht eindimensional im Sinne der Skala sind, da sie möglicherweise (auch) andere Personenvariablen als die der Skala messen. ...
... Wenn hingegen einzelne Items einer Skala dem Modell nicht genügen, wird davon ausgegangen, dass diese nicht eindimensional im Sinne der Skala sind, da sie möglicherweise (auch) andere Personenvariablen als die der Skala messen. Solche Items eignen sich daher nicht für die Berechnung eines gemeinsamen Skalensummenwertes (Klock, 2020;Rost, 2004). Ein Vorteil der probabilistischen Testtheorie besteht also darin, dass durch die Überprüfung der Modellpassung höhere Güteanforderungen an das Messinstrument gestellt werden . ...
Book
Die vorliegende Arbeit stellt die Konzeption und Evaluation des Lehr-Lern-Laborseminars MiRA-digital zum mathematischen Modellieren mit digitalen Werkzeugen dar. MiRA-digital wird als fachdidaktisches Seminar im Rahmen der ersten Phase der Lehrkräftebildung an der Universität Münster angeboten. Das Seminar zeichnet sich durch eine Theorie-Praxis-Verzahnung sowie komplexitätsreduzierte Rahmenbedingungen aus und zielt darauf ab, Mathematiklehramtsstudierende bereichsspezifisch (d.h. für den Unterrichtsbereich des mathematischen Modellierens mit digitalen Werkzeugen) zu professionalisieren. Die Evaluation des Seminars bezieht sich auf die Wirksamkeit dieser Professionalisierung und erfolgt mittels einer quantitativen quasi-experimentellen Interventionsstudie im Prä-Post-Design. Mit Fokus auf das bereichsspezifische Aufgabenwissen und das bereichsspezifische adaptive Interventionswissen wurden Daten von N = 165 Studierenden über vier Semester erhoben und kumulativ ausgewertet. Die Ergebnisse zeigen, dass die Entwicklung der beiden bereichsspezifischen Wissensarten positiv und signifikant durch die Teilnahme am Seminar MiRA-digital beeinflusst wird. In einem Lehr-Lern-Laborseminar zum mathematischen Modellieren ohne digitale Werkzeuge und einer Kontrollgruppe konnte hingegen keine umfassende signifikante Entwicklung dieser Wissensarten festgestellt werden. Damit wird die Wirksamkeit des Lehr-Lern-Laborseminars MiRA-digital bestätigt.
... Interpretiert werden kann der Koeffizient analog zu Cronbachs α, wobei dieses die Reliabilität eines Tests überschätzen würde (vgl. Rost, 2004). Die Reliabilität nach Andrichs beträgt für die Rasch-Skalierung der Pilotierung .83, ...
... Eine Prüfung dahingehend, ob andere Modelle (z.B. Mixed-Rasch-Modelle) besser sind als das bereits gefundene, erübrigen sich nach Rost (2004), wenn der χ 2 Test gezeigt hat, dass das Modell auf die Daten passt. Wichtiger ist das "Brauchbarkeitskriterium", das eine Aussage darüber macht, ob das Modell für den Zweck brauchbar ist. ...
... Der AIC (Akaike's Information Criterion) vergleicht die erreichte Log-Likelihood (Wahrscheinlichkeit der Daten unter Modellgeltung) mit der dazu benötigten Parameteranzahl, wohingegen der BIC (Best Information Criterion) noch die Anzahl der Personen miteinbezieht (vgl. Rost, 2004). Im Falle des Vergleichs der 3-Klassenlösung und der 4-Klassenlösung ergibt sich, durch die unterschiedliche Gewichtung der Parameteranzahl beider Modelle, kein eindeutiges Bild. ...
Book
Full-text available
Problemlösen ist eine wesentliche Voraussetzung für das Handeln in allen Bereichen des Lebens: In einfachen Alltagssituationen, bei (natur-) wissenschaftlichen Fragestellungen oder bei komplexeren gesellschaftlich relevanten Problemen spielt die Lösung von Problemen eine Rolle. Im Bereich der Physik werden insbesondere innerhalb des schulischen und universitären Kontextes Probleme bearbeitet. Die täglichen Erfahrungen des Lehrbetriebs an Hochschulen machen jedoch deutlich, dass Teile der Studierenden große Schwierigkeiten haben, Probleme erfolgreich zu lösen. Die Diskrepanz zwischen der Wichtigkeit des Problemlösens und den Schwierigkeiten, die Studierenden dabei haben, ist der Ausgangspunkt für die zentrale Fragestellung der vorliegenden Arbeit: Was unterscheidet "gute" von "schlechten" Problemlösern und welche Faktoren beeinflussen den Erfolg beim Problemlösen? Die Arbeit fokussiert hierbei auf Probleme aus dem Themenfeld der Mechanik. Hit Hilfe einer empirischen Untersuchung wird dazu beigetragen, bereits bekannte Erkenntnisse aus der traditionsreichen Forschung zum Problemlösen zu bestätigen, zu quantifizieren und zueinander in Beziehung zu setzen. Es werden sowohl quantitative als auch qualitative Eigenschaften "guter" und "schlechter" Problemlöser herausgearbeitet - gute Problemlöser können beispielsweise auf mehr Fachwissen zurückgreifen, besitzen ein höheres Selbstkonzept und machen weniger Planungsfehler beim Bearbeiten physikalischer Problemstellungen.
... Before discussing the details of the LCA, we will summarize general commonalities and differences between the LCA (details in Sect. 6.4) and the Rasch analysis (details e.g., Rost, 2004;Sick, 2010;Boone et al., 2014;Boone & Staver, 2020) (overview: Fig. 6.1). Overall, LCA in its structure is completely parallel to the Rasch analysisthe only difference is the scaling level of the latent variable (Rost, 2004). ...
... 6.4) and the Rasch analysis (details e.g., Rost, 2004;Sick, 2010;Boone et al., 2014;Boone & Staver, 2020) (overview: Fig. 6.1). Overall, LCA in its structure is completely parallel to the Rasch analysisthe only difference is the scaling level of the latent variable (Rost, 2004). Rasch models result in continuous ordered ability θ, while LCA models lead to unordered categorical class membership c, unless further specified. ...
... LCA models are, like Rasch models, mixture distribution models, meaning the latent variable (the continuous θ or the categorical c) is derived in a way that the local independence of observed variables is givendependencies between items will disappear if only persons from one class c or with one ability θ are considered (Rost, 2004). This assumption is a strong simplification of the complex reasons behind concrete response behavior and might only seldom be true. ...
Chapter
Full-text available
Models based on Rasch’s (1960) measurement theory build quantitative, continuous latent variables based on persons’ categorical responses. In contrast, within latent class analysis (LCA), persons are represented by qualitative, categorical latent variables. LCA can be used to identify patterns within categorical responses. In this chapter, we present the general idea of the LCA, including conventions for interpreting results, compare the LCA with Rasch analysis and combine the LCA’s results with a unidimensional Rasch model. Our presentation is based on a concrete empirical example that investigates experimental design errors and includes the used data set and R scripts as supplemental materials.
... Before discussing the details of the LCA, we will summarize general commonalities and differences between the LCA (details in Sect. 6.4) and the Rasch analysis (details e.g., Rost, 2004;Sick, 2010; (overview: Fig. 6.1). Overall, LCA in its structure is completely parallel to the Rasch analysisthe only difference is the scaling level of the latent variable (Rost, 2004). ...
... 6.4) and the Rasch analysis (details e.g., Rost, 2004;Sick, 2010; (overview: Fig. 6.1). Overall, LCA in its structure is completely parallel to the Rasch analysisthe only difference is the scaling level of the latent variable (Rost, 2004). Rasch models result in continuous ordered ability θ, while LCA models lead to unordered categorical class membership c, unless further specified. ...
... LCA models are, like Rasch models, mixture distribution models, meaning the latent variable (the continuous θ or the categorical c) is derived in a way that the local independence of observed variables is givendependencies between items will disappear if only persons from one class c or with one ability θ are considered (Rost, 2004). This assumption is a strong simplification of the complex reasons behind concrete response behavior and might only seldom be true. ...
Chapter
Learning progressions (LPs) have been highlighted in science education over the past ten years. LPs have the potential to guide curriculum development, instruction, and assessments. An LP has to be validated using empirical evidence, and Rasch model is one of the most broadly used measurement models to connect the empirical evidence with the hypothesized LP. However, Rasch model has limitations as it only provides students’ overall ability measures and item difficulties, offering limited information about the specific cognitive skills (i.e., attributes) needed to complete specific tasks. This study thus develops an approach that combines Rasch model and cognitive diagnosis models (CDMs) to assess students’ ability and fine-grained attributes. Students’ ability, the difficulty of individual attributes, as well as students’ attribute mastery patterns estimated from the Rasch-CDM approach can be used to validate LPs. Additionally, attribute mastery patterns of LP levels, ability distribution, and attribute difficulty can be visualized on a map, named as MGZA, showing how students progress towards more sophisticated thinking about a topic. We demonstrate this approach by validating the LP of buoyancy.
... to 5 (strongly agree) is less than 10% (Rost, 2004). We therefore conclude, based on the model fit indices, that the one-dimensionality of the objective TK measure is supported. ...
... The third model (Model 2) included the control variables from three levels-the student level, teacher level, and school levelto identify the proportion of the included variables to explain additional variance in students' ICT literacy. To determine whether varying intercepts improved the models, the Akaike information criterion (AIC) and Bayesian information criterion (BIC) were used; lower AIC and BIC indicate a better model fit (Rost, 2004). Additionally, model fit was measured by -2 Log Likelihood (-2LL). ...
... Two sample questions from the objective assessment test are presented in Tables 4 and 5. Based on previous research instruments for the objective assessment of TK (e.g., Test of Technological and information Literacy, TILT; seeSenkbeil et al., 2013), the objective assessment test was designed to be unidimensional and to include aspects of knowledge and skills related to TK. To test the one-dimensionality of the objective TK measure, we used the Bayesian Information Criterion (BIC) and the Akaike's Information Criterion (AIC) as indicators of model fit(Rost, 2004). Lower indices indicate better model fit. ...
Thesis
Teachers are responsible for teaching digital skills to learners by integrating them into the curriculum, prompting researchers to call for a close examination of the impact of teachers' digital skills on learners' digital skills (Lachner et al. 2019; Lorenz et al., 2019; Lucas et al., 2021; Schmid et al., 2021). However, in order to examine this relationship in more detail, this dissertation would first need to examine in depth the impact of the COVID–19 pandemic on learners' digital media use as well as the valid measurement of teachers' digital skills, as this has not yet been sufficiently implemented in empirical educational research. Research regarding digital skills of teachers and learners has become increasingly important, especially in light of the COVID–19 pandemic and the accompanying global school closures. Nevertheless, there are some areas of teachers' and learners' digital skills that demand clarification. Accordingly, few researchers have addressed the problems particularly in the areas of 1) the impact of the COVID–19 pandemic on learners' digital media use, as school closures made the use of digital media in home and school daily life inevitable, 2) the measurement of teachers' digital skills to gain knowledge in educational science and to develop targeted interventions to promote teachers' digital skills, and 3) the impact of teachers' digital skills on learners' digital skills. Accordingly, as outlined in this dissertation, three studies were conducted to gain insights into the highlighted research areas. In the first study in this dissertation, we examined how learners used digital media before and during the COVID–19 pandemic. International mean comparisons suggest that learners rarely used digital media in school for school-related purposes (Schaumburg et al., 2019), suggesting that the digital media use is not yet central to everyday school life. However, given the global school closures due to COVID–19 pandemic in the spring/summer of 2020 and the accompanying imperative for learners and teachers to use digital media for school-related purposes, it is reasonable to assume that the COVID–19 pandemic has influenced learners' digital media use. The assumption of the impact of the COVID–19 pandemic on learners' digital media use is particularly interesting, as previous research has shown that purposeful digital media use can have a positive impact on learners' digital skills (Senkbeil, 2017), which is also an indispensable premise for successful participation in later professional life (Fraillon et al., 2020). While learners reported using digital media heterogeneously in relation to school and private contexts before the COVID–19 pandemic in 2019(N = 643), we asked learners in secondary schools in Bavaria before and during the COVID–19 pandemic (N = 644) and the accompanying school closure in spring 2020 via a representative telephone survey to what extent they use digital media for both social and school purposes. Learners were classified into different profiles based on their digital media use responses using Latent Profile Analysis. Our results show that learners' digital media use became more homogeneous in terms of school-related purposes during the COVID–19 pandemic in 2020. Specifically, learners increasingly reported using digital media for school-related purposes, such as researching on the Internet or learning. This may suggest that learners' digital skills may also have developed positively during the COVID–19 pandemic. However, our results also show that learners from low-education families (B = 0.79, p <.05) are particularly at risk of being left behind by the even faster pace of digitization, as learners from low-education families were particularly likely to be represented in profiles that reported using digital media for social rather than school activities, which may have a negative impact on learners' digital skills (Senkbeil, 2017). Research on teachers' digital skills has also gained much momentum, especially since the onset of the COVID–19 pandemic. However, a closer look at research on teachers' digital skills reveals that research often examines teachers' self-efficacy in technological knowledge, i.e., knowledge and skills with and about using digital media (Lachner et al., 2019). The establishment of self-assessment instruments is widely recognized in educational science, based on the assumption that inferences can be made from teachers' self-efficacy with regard to their actual technological knowledge (Hatlevik & Hatlevik, 2018). Nevertheless, recent studies show that the results between self-assessments and objective assessment measures of teachers' technological knowledge are weakly to poorly correlated, suggesting a systematic bias in self-assessments (Parry et al., 2021; Baier & Kunter, 2020; Drummond & Sweeny, 2017). At the same time, knowledge of teachers' actual, objectively measured digital skills professional knowledge is essential, especially in light of the COVID -19 pandemic and related distance learning, to determine appropriate interventions to target teachers´ digital skills. However, for a variety of reasons, such as the scope of the test and the acceptability of test takers, using objective assessment measures may not be sufficiently feasible in practice in every case. Accordingly, the first study in this dissertation addresses the question of the extent to which self-assessment instruments can be designed to minimize the extent of possible bias. Meta-analytic findings have already shown that self-assessment results correlate more strongly with objective measures of assessment when self-assessment instruments include concrete context-specific information (Talsma et al., 2018). By providing context-specific information, such as concrete scenarios in self-assessment instruments, subjects are provided with a concrete context, potentially avoiding systematic bias in self-assessments due to the absence of contextual information. The results show that the scenario-based self-assessment regarding the subcomponent, operating and using digital media (β = 0.25, SE = 0.13, p =.05) significantly predicts the objective assessment of technological knowledge (R2 =0.23) of N = 75 (prospective) teachers. In summary, scenario-based self-assessment may be an appropriate tool for getting closer to the results of the objective assessment measures. Overall, the results suggest that, especially for technical operational skills, the contextual information helped subjects to assess their own skills more accurately, so that over- or underestimation of subjects' skills or knowledge can be prevented by the scenario-based self-assessment (Sailer et al., 2021a). While research is needed on measuring teachers' digital skills and the impact of the COVID–19 pandemic on learners' digital media use, scholars also call for investigating the "connection" between teachers' digital skills and learners' digital skills (e.g., Guggemos & Seufert, 2021). With the integration of digital skills into curricula (e.g., Siddiq et al., 2016), teachers have the responsibility to foster learners´ digital skills. The third study in this dissertation examines the extent to which teachers' digital skills (n = 220), mediated by their professional knowledge regarding the high-quality use of digital media in instruction, affects students' digital skills(n = 1620). The results of multilevel analysis show that neither teachers' digital skills (b = -.08, t(692) = 1.66 .01, p >.05) nor teachers' professional knowledge regarding the high-quality use of digital media in instruction (b = -0.05, t(690) = -1.83 p >.05) have a significant impact on students' digital skills. Overall, the results of this dissertation suggest a lasting impact of the COVID -19 pandemic on learners' use of digital media, which should be considered in further research in the future. Furthermore, the use of digital media in the classroom is an important determinant of the advancement of learners' digital skills. Although no significant effect of teachers' professional knowledge of digital skills on learners' digital skills was found, the results of the three studies in this dissertation nevertheless indicate that the use of digital media in the classroom should be promoted so that teachers in the future establish student-centered use of digital media in the classroom to meet the requirements of curricula that demand that learners and teachers be prepared for teaching and learning in the digital society.
... Der SpraVesT ist als Speedtest (Rost, 2004) Testordner .............................................................................. 15 Abbildung 4: Eintragungen im Protokollbogen ..................................................................................... 16 (Althelmig & Jungjohann, 2024). Aktuell liegen formelle LVD-Verfahren vorrangig für die Kulturtechniken Lesen, Schreiben und Mathematik vor und gleichzeitig werden ein breiteres Repertoire an LVD-Verfahren für die Praxis und Forschung gefordert (Hoffmann & Böhme, 2017). ...
... Aus den Testergebnissen können somit Rückschlüsse für die therapeutische oder schulische Förderung gezogen werden. SpraVesT ist ein Test ohne schriftsprachliche Instruktionen, um insbesondere auch die Entwicklung von Kindern ohne oder mit geringen Schriftsprachkompetenzen als potentielle Risikogruppe für Schwierigkeiten im schulischen Lernen darzustellen.Der SpraVesT ist als Speedtest(Rost, 2004) mit einem Zeitlimit von fünf Minuten umgesetzt. In einem Speedtest bearbeiten die Kinder unterschiedlich viele Items in dem festgelegten Zeitrahmen. ...
Technical Report
Full-text available
In der Testbeschreibung wird die Lernverlaufsdiagnostik (LVD) SpraVesT zur Messung des mündlichen Sprachverständnisses inklusive der Testkonstruktion, des Itempools sowie die versionsabhängige Durchführung und Auswertung vorgestellt. Durch die Lernverlaufsdiagnostik können Lernverläufe kontinuierlich abgebildet und Förderentscheidungen individuell angepasst werden (Gebhardt et al., 2021). Der SpraVesT erweitert das Testrepertoire um einen Test zum Sprachverständnis, denn kindliche Schwierigkeiten im Verstehen von Sprache bleiben oft unerkannt und haben das Potential den Schulerfolg negativ zu beeinflussen (z.B. Spreer et al., 2019). Der SpraVesT liegt in einer analogen Version für Kinder mit geringen Medienerfahrungen (z.B. Kindergartenalter) und für die Durchführung in Einzelsettings sowie in einer digitalen, tabletbasierten Version für den Einsatz in inklusiven Schulen und Förderschulen vor. Die digitale Version ist auf der Onlineplattform Levumi.de (Gebhardt et al., 2016) als kostenfreies Bildungsmedium (open educational ressource, OER) implementiert und kann im Einzel- oder Gruppensetting am Tablet oder PC durchgeführt werden. Der SpraVesT enthält keine schriftsprachlichen Anteile (z.B. Instruktionen werden in leichten Sätzen vorgesprochen), damit auch Kinder ohne oder mit geringen Schriftsprachkenntnissen den SpraVesT niederschwellig nutzen können. Der SpraVesT ist als Speedtest (Rost, 2004) mit einer festen Durchführungszeit von fünf Minuten konstruiert. Der Itempool umfasst 80 Items als Bildauswahlverfahren, in dem die Kinder anhand einer Audioausgabe zu einem vorgesprochenen Satz mit spezifischer Struktur das genau passende Bild auswählen. Die Konstruktion der Sätze berücksichtigt verschiedene grammatische Strukturen, um entwicklungsspezifische Erkenntnisse zu gewinnen. Es wird in vier Dimensionen das Verständnis folgender grammatischer Strukturen überprüft: Präpositionalphrasen (20 Items), Sätze mit Numerusflexion (20 Items), Sätze mit Steigerung von Adjektiven (20 Items) sowie Relativsätze (20 Items).
... Zudem wurde vorforum kriminalprävention 2/2020 rangig auf Daten zurückgegriffen, welche eine unmittelbare Verwendung in der Polizeilichen Kriminalstatistik finden. Diesbezüglich existieren für das Bundesgebiet über einen längeren Zeitraum etablierte Kodiervorschriften (Bundeskriminalamt, 2019b(Bundeskriminalamt, , 2019c (Rost, 2004). Die Latent Class Analyse in der hier verwendeten Form setzt zudem logisch voneinander unabhängige, kategoriale Variablen voraus (Kempf, 2008). ...
... Als zusätzliches Kriterium zur Beurteilung der optimalen Klassenanzahl wurden die durchschnittlichen Zuordnungssicherheiten für die einzelnen Klassen sowie das Kriterium bedeutsamer Differenzierungen im Lichte theoretischer Ansätze berücksichtigt (vgl. Biedermann, 2014;Rost, 2004). Für die technische Umsetzung der LCA wurde auf das Softwarepaket poLCA innerhalb der statistischen Programmiersprache R zurückgegriffen (Linzer & Lewis, 2011). 2 ...
Article
Full-text available
Sexualstraftäter stellen eine heterogene Population dar, selbst innerhalb der Teilgruppe des sexuellen Missbrauchs von Kindern. Für eine wirksame Prävention und Strafverfolgung muss diese Heterogenität entsprechend berücksichtigt werden. Typologien und die damit mögliche Identifikation homogenerer Teilgruppen strukturieren die Vielfalt des Phänomens und sind daher eine wichtige Grundlage für die Forschung und Praxis. Sie unterstützen die Entwicklung theoretischer Modelle, um die Phänomene zu erklären und im Weiteren Interventions- und Präventionsansätze abzuleiten. Das Ziel dieser Untersuchung bestand deshalb in einer typologischen Differenzierung verschiedener Tatbegehungsmuster bei sexuellem Missbrauch von Kindern. Hierfür wurden mithilfe einer Latent Class Analyse (LCA) 2204 Fälle des sexuellen Missbrauchs von Kindern analysiert, die im polizeilichen Datenbanksystem POLAS des Landes Brandenburg hinterlegt waren und zwischen 2013 und 2018 an die Polizeiliche Kriminalstatistik gemeldet wurden. Es wurden sieben Varianten (Klassen) von Tatbegehungsmustern identifiziert. Das Zusammenspiel der Tatbegehungsmerkmale in den einzelnen Klassen zeigt sich in der Analyse von Freitextschilderungen. Der Beitrag erläutert im ersten Teil Zielstellung, Methode sowie erste Ergebnisse und benennt die Literaturquellen. Im zweiten Teil (Septemberausgabe) werden die einzelnen Tatbegehungsklassen näher charakterisiert und klassenspezifische Implikationen für die Prävention und Strafverfolgung ausgeführt.
... Der Ein weiterer Test zur Erfassung von MPCK speziell für Lehramtsstudierende für die Primarstufe wurde im Rahmen der Large-Scale-Studie TEDS-M (Teacher Education and Development Study: Learning to Teach Mathematics) entwickelt und umfasst 32 Items in unterschiedlichen Formaten (Multiple-Choice, Complex-Multiple-Choice, offenes Antwortformat). Die Skalierung des Tests erfolgte vor dem Hintergrund der Item-Response-Theorie (Blömeke et al. 2010a), die immer eine größere Stichprobe für die komplexen Modellierungen erfordern (Rost 2004). Die Besonderheit des Tests besteht vor allem darin, dass Gemeinsamkeiten der Curricula aus insgesamt 15 teilnehmenden Ländern als inhaltliche Grundlage für die Itementwicklung genutzt wurden und daher nationale Besonderheiten nicht abgebildet sind (Blömeke et al. 2010b). ...
... B. in anderen Bundesländern mit abweichenden Curricula, beschränkt. Zudem lagen eher geringe Stichprobengrößen vor, was bei IRT-Modellierungen zu Verzerrungen in den Parameterschätzungen führen kann (Rost 2004). Als ebenfalls einschränkend kann unsere Variablenauswahl betrachtet werden, was wir am Beispiel der Erlernbarkeit von MPCK skizzieren möchten: Wir haben in der Studie den Zusammenhang mit der Semesterzahl untersucht, ein passenderes Vorgehen wäre jedoch die Analyse der Entwicklung des MPCK, welche explizit durch spezifische Lerngelegenheiten hervorgerufen werden müsste. ...
Article
Full-text available
Zusammenfassung Mathematikdidaktisches Wissen stellt eine zentrale Komponente der professionellen Kompetenz von (angehenden) Primarstufenlehrkräften im Bereich Mathematik dar, die mit situationsspezifischen Fertigkeiten zusammenhängt und, vermittelt über das professionelle Handeln, Effekte auf die mathematischen Leistungen von Schüler:innen haben kann. Um mathematikdidaktisches Wissen im Zusammenhang mit anderen Komponenten professioneller Kompetenz (z. B. Emotionen, Überzeugungen, Handlungsplanung, Instruktionsqualität) untersuchen zu können, bedarf es eines ökonomischen und frei verfügbaren Tests, welcher gängige Gütekriterien hinreichend erfüllt. Der vorliegende Beitrag stellt die Validierung eines solchen Tests vor. Entsprechend der Teststandards werden Grundnahmen in den Evidenzkategorien Inhalt, Struktur und Beziehungen zu anderen Variablen untersucht, um zu prüfen, ob die Testscores Schlussfolgerungen zum Konstrukt mathematikdidaktisches Wissen von Lehramtsstudierenden der Primarstufe zulassen. Die Ergebnisse liefern Validitätsargumente, die auf eine hinreichend hohe Reliabilität des Tests hinweisen und für theoriekonforme Schlussfolgerungen basierend auf den Testwerten sprechen. Der Beitrag schließt ab mit einer integrativen Betrachtung der Validierungsevidenzen, die für den Test bisher vorliegen.
... [3] Because of the way the exam was designed, we apply three different major models to the data (the students' responses to the exam). First, we apply a uni-dimensional Rasch model (one-parameter logistic model, 1PL), [4,5] which assumes that our exam represents a holistic thermodynamic competency without significant sub-dimensions; second, a Rasch testlet bifactor model (BF) [6,7] that expects students to have one general and one or more subject-specific competencies; and third, a partial credit model (PCM) [8][9][10] that shifts the attention to distinct sub-competencies within individual exam tasks. ...
... [4] Information Criteria AICc compares the quality of a model with its complexity (number of model parameters). [5,11,17] It is only interpretable between different models for the same data set. Lower values show model improvement. ...
Article
Contributing to a competency model for engineering thermodynamics, we investigate the empirical competency structure of our exams in an attempt to answer the question: Do we test the competencies we want to convey to our students? We demonstrate that thermodynamic modeling and mathematical solution emerge as significant dimensions of thermodynamic competency. Furthermore, we show how we were able to improve exam quality and raise our awareness about what actually makes exam tasks easy or difficult.
... The four dimensions were each scaled with a one-parameter Rasch model (cf. e.g., Rost, 2004). For the calculations, the software R with the packages TAM (Robitzsch et al., 2021) and eRm (Mair & Hatzinger, 2007) was used. ...
... The one-dimensionality of the scales was tested globally with the help of Andersen tests (cf. e.g., Rost, 2004). According to Lienert and Raatz (1998), the EAP reliabilities of the individual dimensions are sufficient for group comparisons. ...
Conference Paper
Full-text available
Dealing with simulation and modelling tasks with digital tools in mathematics lessons puts high demands on teachers when it comes to the preparation and implementation of lessons. These must be met in teacher education. To measure the pre-service mathematics teachers' professional knowledge for teaching simulations and mathematical modelling with digital tools, we propose a theory-based model and subsequently present items of an associated test instrument. Using a one-parameter Rasch model, we show that the underlying model can be confirmed empirically and discuss the potentials and limitations of the results.
... To obtain fewer but larger segments, and if AIC reveals a high number of segments that are hard to interpret, BIC is more suitable. Additionally, the theoretical interpretability and usefulness of the identified model should be considered when choosing a solution (Rost, 2004;Weller et al., 2020). ...
Article
Full-text available
The agricultural sector is a major contributor to global biodiversity loss. Ecological focus areas (EFAs), such as extensively used meadows, hedges, and buffer strips, are a cornerstone in promoting biodiversity conservation. Previous research highlights social and personal norms as strong predictors of farmers' efforts to conserve biodiversity. Accordingly, we aim to segment Swiss farmers according to their social and personal norms and analyze how these segments differ in terms of pro-environmental behavior. Furthermore, we are interested in whether these segments differ in terms of farmer's self-efficacy, the importance of farm sales and biodiversity payments, farmers' political priorities, and socio-demographic and farm characteristics. For the empirical analyses, we used a unique dataset combining data from a survey of Swiss farmers (N = 882) with data on registered EFAs from the Swiss Agricultural Information System. We explored the segments based on responses to four items capturing social and personal norms toward biodiversity conservation using latent class analysis. To estimate the mean differences between segments, we used an analysis of variance and covariance. Our results showed that farmer segments with high social and personal norms implemented more EFAs than those with lower social and personal norms. Moreover, high social and personal norms were associated with enhanced self-efficacy, higher importance of biodiversity payments for farm income, stronger priority for environmental policies, and less intensive agricultural production practices. This study informs policymakers in designing social norm interventions that, for example, include information about society's approval of farmers' biodiversity conservation efforts.
... This model scales the difficulties of digital tests, represented as item estimates, and students' performance per test, represented as person estimates, based on IRT methods. Goodness-of-level modeling was explored using standard fit indices such as reliability (Field, 2014;Rost, 2004), item discrimination (Fisseni, 1997;Kelava and Moosbrugger, 2012), and infits (weighted fits). Reliabilities larger than 0.7 (George and Mallery, 2003) or 0.6 (Hair et al., 1998), primarily positive item discrimination (Kelava and Moosbrugger, 2012), and infits in a range from 0.5 to 1.5 (Linacre, 2002;Wright and Linacre, 1994) or in a tighter range from 0.7 to 1.3 (Bond and Fox, 2013) imply acceptable fits. ...
Article
Full-text available
Fractions are a relevant yet complex topic of school mathematics. Fortunately, educational research issued rich knowledge of central concepts and associated difficulties for students. Using this knowledge for monitoring learning and formative assessment could support students’ learning process. However, access to apt evidence-based tests is restricted, and paper-based testing limits their practical usability. The digital adaptation of paper-based tests may address these challenges due to affordances like automated test scoring. Further, digital tests may facilitate repeated test use necessary for monitoring and formative activities. The present contribution focuses on fraction subconstruct knowledge and informal fraction knowledge and is part of a systematic research effort to transform paper-based tests into a digital format. With two cross-sectional studies in Grades 6 (N = 233) and 5 (N = 271), each with three measurement points, we investigated the psychometric properties of adapted digital parallel tests regarding their suitability for repeated testing. The internal structure of the adapted digital tests proved to be comparable to that of the original paper-based tests in many, but not all, aspects. Parallel tests were found to be sufficiently parallel. The findings for the two focused constructs support that systematic efforts lead to usable tools for students’ fraction learning. The discussion considers how this supports the transformation of research findings to support the adoption of formative assessment.
... Firstly, the items in the corresponding scales were evaluated considering internal consistency. The coefficient used was Cronbach's α, which treats each individual item as a separate test section (Rost, 2004). In addition, the corrected part-whole correlation was taken into account, as shown in Table 1. ...
Article
Full-text available
This paper investigates the impact of workload on leadership roles within the Austrian IT sector, by also paying attention to differences between genders. The research adopted a prospective design, selecting IT professionals, stratified by those with and without personnel responsibility and examined further through the lens of gender. A total of 200 participants completed the survey, where the modified German version of the Copenhagen Psychosocial Questionnaire (COPSOQ) served as the primary tool, which evaluated dimensions such as demands, influence, interpersonal relations, work interface, and conflicts. The results indicate that individuals with personnel responsibility experience significantly lower scores in the dimensions demands and influence , suggesting challenges in managing qualitative or emotional demands alongside perceived limitations in their scope of action. This trend persisted, albeit less marked, within the dimension work interface , indicating concerns regarding occupational stability (job security) among leading individuals. Gender analysis revealed that male participants reported fewer conflicts compared to females, highlighting discordance regarding experiencing workplace challenges. Discussion revolves around the difficulties faced by individuals with personnel responsibility in managing multifaceted demands of their role and the specific challenges encountered by female leaders. The findings emphasize the necessity of strategies to support leaders on acknowledging gender-specific challenges to enhance occupational health in the IT sector. This study contributes to the understanding of workload dynamics within leadership roles in the IT industry, recommending targeted measures to address the particular stress factors of leaders and highlight the need for gender-specific considerations in organizational support systems.
... The questions of the open-ended and MC tasks consist of the task base and the answer format (cf. Rost, 2004). The task base always contains a chemical question or problem for which a solution must be developed. ...
Article
Full-text available
Chemistry as a whole is divided into three levels. The macroscopic level describes real, observable phenomena of the material world. The submicroscopic level focuses on particles. The representative level includes pictorial and symbolic representations to visualize substance in its nature. Students often have problems separating these levels and conceptually transfer each of the three levels to the other. Therefore, teachers need to use chemical terminology correctly when teaching the substance-particle concept. Augmented Reality (AR) connects real and virtual world. The observer physically moves in a real environment that integrates virtual elements. The AR technology has great potential for learning in the subject chemistry, especially when it comes to making the “invisible” visible and illustrating scientific phenomena at particle level. The simultaneous presentation should avoid split-attention and offers new possibilities to interactively deal with (M)ER. The question arises whether AR has a positive effect on the use of technical language and the associated understanding of the concept of dealing with (M)ER at the substance and particle levels. With an AR app on the tablet and the AR glasses, the chemical processes of a real experiment are represented by AR visualizations. Therefore, the AR app was piloted. This study captured the chemistry handling with (M)ER of chemistry teachers (N = 30) using a pre-post survey. The participating preservice teachers are described below. Each test includes five tasks elaborated by thinking aloud. The thinking-aloud protocols to acquire the use of the chemical terminology are evaluated in MAXQDA.
... SPSS was used to evaluate the frequencies and correlations of the following scales: the results of the LRT competence test, individual and academic data, LRT-relevant learning opportunities, personality traits, and beliefs. The data were scaled according to the Rasch model (Rost, 2004), and further analyses, such as latent regression analysis, were conducted using ConQuest, default settings (converge ¼ 0.001, nodes ¼ 50). Pearson's measurement values were determined using the participants ability estimators (weighted likelihood estimates [WLE]) calculated from the LRT test data. ...
Article
Full-text available
This study conducted a quantitative study analysis of teacher competence in linguistically responsive teaching (LRT). To assess performance-oriented competence, we used a test instrument with video vignettes and corresponding items based on situation-specific skills perception (What do you perceive?) and decision-making (How would you act if you were teacher in this situation?). Participants were required to respond orally. The research questions focused on LRT competence and the connection between (pre-service and in-service) teachers’ LRT competence and individual characteristics (subjects of study and LRT-relevant teaching experience), LRT-relevant learning opportunities, and beliefs about multilingualism in school and teaching. We found that experienced teachers and those who studied English as a foreign language had higher test scores, and participants with positive beliefs were more likely to perform better on the test. Positive beliefs appear to play a fundamental role in teachers’ identities as linguistically responsive professionals. Also, findings indicate a valid innovative performance-oriented LRT measurement. We suggest a learning environment should be implemented with opportunities to reflect on (pre-service) teachers’ beliefs and creating sufficient space for reflecting on experiences, as professionalization succeeds with self-reflection to raise awareness of blind spots. Future research should focus on the relation of teachers’ actual classroom performance and situation-specific skills. Furthermore, LRT-relevant learning opportunities should be evaluated in detail to learn more about teacher professionalization in this field.
... Zum anderen wurden Leistungstests in Mathematik und Englisch analysiert, die mittels eines eindimensionalen Raschmodells skaliert wurden (vgl. Rost, 2004). Im Vergleich zur ursprünglichen Auswertung wurden nur raschkonforme Items mit guten Infit-und Outfit-Parametern in die Analysen aufgenommen und Mean Weighted Likelihood Estimates (WLE) geschätzt (vgl. ...
Article
Ausgehend von Fends Konzept der Einzelschule als pädagogischer Handlungseinheit wurde untersucht, welche Bedeutung die Schule für die Erzeugung von Schul- und Unterrichtsqualität im Vergleich zu den anderen Ebenen innerhalb des Mehrebensystems des Schulwesens hat. Analysiert wurde die Varianzverteilung zentraler Merkmale der Qualität von Schule und Unterricht sowie der Lernergebnisse zwischen den Ebenen des Schulsystems mittels hierarchischer Varianzzerlegungen. Die Befunde zeigen, dass es nicht die eine zentrale pädagogische Handlungseinheit (weder Klasse, noch Schule oder System) gibt. Je nach Merkmal sind unterschiedliche Ebenen bedeutsam.
... We then fixed the obtained item difficulty and estimated students' abilities prior and subsequent to the workshop in a two-dimensional model. The reliability for the mathematical modeling competence test was sufficient (Rost, 2004), as of an expected a posteriori reliability (EAP reliability) of 0.704 for the prior measurement and 0.702 for the subsequent measurement. All Items showed a satisfactory infit between 0.83 and 1.17. ...
Article
Full-text available
Introduction Nowadays, more and more digital resources are used in modern mathematical modeling classes. In order to access these resources, students need a suitable digital device—often mobile devices are used for this purpose. There are several concepts to enable students access to such devices. For example, students can be allowed to use their self-owned devices [Bring Your Own Device (BYOD) concept] or teachers can hand out school-owned devices to their students [device pool (pool) concept]. Currently, little is known about possible effects of different mobile device access concepts on student learning. Hence, in this study, we investigated their effects on students’ mathematical modeling competence. In doing so, we also considered an interaction between the access concept and the effects of (a) students’ problematic smartphone use and (b) students’ fear of missing out on learning mathematical modeling. Method To this end, we conducted an experiment, measured students’ mathematical modeling competence as the outcome variable, and analyzed data of 263 German students in grades 8 and 9 using a multilevel model. In the experiment, students were randomly assigned to one of two study conditions and completed a mathematics modeling workshop. In the BYOD condition, students utilized their self-owned smartphones to work on the workshop tasks, whereas in the pool condition, students utilized institutionally provided smartphones. Results As a main finding, our results showed an interaction effect between the mobile device access concept and students’ problematic smartphone use on their competence (β = −0.24, 95% CI [−0.47, −0.01]). Students utilizing their self-owned smartphones were negatively affected by their problematic smartphone use (B = −1.45, 95% CI [−2.45, −0.46]), whereas students utilizing provided smartphones were not affected (B = 0.04, 95% CI [−1.01, 1.09]). Students with maximal problematic smartphone use achieved higher competences when utilizing provided devices (BBYOD−Pool = −1.20, 95% CI [–2.35, –0.05]). Discussion Our study demonstrates the importance of thinking about effects of student-owned and provided digital devices on mathematics learning. Finally, we discuss (a) that our results do not reveal a general preferability for one of the two access concepts, as well as (b) the relevance of student characteristics when choosing an access concept.
... The third model (Model 2) included the control variables from three levels-the student level, teacher level, and school level-to identify the proportion of the included variables to explain additional variance in students' ICT literacy. To determine whether varying intercepts improved the models, the Akaike information criterion (AIC) and Bayesian information criterion (BIC) were used; lower AIC and BIC indicate a better model fit (Rost, 2004). Furthermore, the assessment of model adequacy utilized the Likelihood Ratio Test (LRT). ...
Article
Full-text available
With the integration of information and communication technologies (ICT) into curricula, teachers are responsible for promoting ICT literacy among secondary school students, which requires in-depth technological knowledge (TK) and technological-pedagogical knowledge (TPK) on the part of teachers. This study uses a multilevel analysis to examine how teachers’ professional knowledge at TK and TPK influences secondary school students’ ICT literacy. Using data from n = 1,566 students from a larger sample taught in N = 134 classes by N = 220 teachers in N = 39 schools, our results show contrary to our hypotheses, no significant relationship between teachers’ professional knowledge regarding TK and TPK and students’ cross-curricula ICT literacy. Furthermore, we did not find any significant relationship in our model between students’ study-related ICT use and ICT literacy. By analyzing the relationship between teachers’ TK and TPK and students’ ICT literacy, our study provides new insights into the relationship between teachers’ cross-curricular knowledge and students’ cross-curricular achievements. It discusses further possible explanations and directions for future research.
... Die allgemeine Beziehung zwischen der Lösungswahrscheinlichkeit und der Ausprägung der latenten Variablen wird in diesen Modellen durch eine S-förmige logistische Funktion beschrieben (vgl. Fischer, 1974;Rost, 2004;Steyer/Eid, 2001). ...
... Um sicherzustellen, dass Subtests fair gegenüber allen Schüler:innen sind, wird die Prüfung der Testgüte mittels der Item-Response-Theorie (IRT) empfohlen (Klauer, 1978). Hierfür eignen sich Raschmodelle, um Aussagen auf Itemebene sowie zur Dimensionalität der Skalen treffen zu können (Rost, 2004). ...
Article
Full-text available
Zusammenfassung Lesescreenings für den inklusiven Unterricht ermöglichen eine ökonomische und faire Testung des Leistungsstandes aller Schüler:innen, um eine datengestützte Hilfe für indi-viduelle Förderentscheidungen zu schaffen. Das hier präsentierte Paper-Pencil-Verfahren wurde als Basis für eine spätere computerbasierte adaptive Testung (CAT) entwickelt. Das Lesescreening LES-IN umfasst die vier Dimensionen Phonologische Bewusstheit, Sicherheit im lexikalischen Abruf, Geschwindigkeit im lexikalischen Abruf und Satzlesen mit Aufga-ben, die in Gruppensettings durchgeführt werden können. Es soll Schüler:innen mit gering ausgebildeten Voraussetzungen für das Textverständnis identifzieren. Die psychometrische Güte wurde bei N = 709 Schüler:innen der dritten Klassenstufe mit und ohne sonderpäd-agogischem Unterstützungsbedarf geprüft. Die Dimensionen Phonologische Bewusstheit und Satzlesen bilden die Personenfähigkeiten inklusiver Lerngruppen ausreichend gut ab, sodass die Ergebnisse für pädagogische Förderentscheidungen nutzbar sind. Beide Dimensionen Sicherheit und Geschwindigkeit im lexikalischen Abruf benötigen noch weitere mittelschwere Items, um die gewünschte Differenzierung für eine inklusive Lerngruppe zu er-reichen. Die Verbesserung und Weiterentwicklung des Screenings, dessen Implementation als frei verfügbarer computerbasierter adaptiver Test und der Einsatz des Screenings in der Schulpraxis werden diskutiert. Abstract Reading screenings for inclusive education allow for economical and fair testing of the achievement levels of all students to create a data-driven resource for individualized decisions. The paper-pencil method that we present in this paper was developed as a pilot version for later computerized adaptive testing (CAT). The reading screening LES-IN includes the four dimensions phonological awareness in the narrower sense, fluency in lexical route, speed in lexical route, and sentence reading with tasks that can be administered in group settings. It is designed to identify students with low-level reading skills necessary for text comprehension. Psychometric quality was tested in N = 709 students with and without need for special education in third grades. The dimensions phonological awareness and sentence reading represent the person abilities of inclusive learning groups sufficiently well so that the results can be used for educational support decisions. Both the dimensions fluency and speed in lexical route need more moderately difficult items to achieve the desired differentiation for an inclusive learning group. The improvement and further development of the screening, its implementation as a computerized adaptive test , and the use of the screening in school practice are discussed.
... Obwohl durchaus angezweifelt werden kann, dass die Abstände auf der Ratingskala z. B. zwischen 2 und 3 und zwischen 3 und 4 tatsächlich "gleich groß" sind -dieser Zweifel gilt insbesondere für die Einzelitem-Messwerte -, ist es üblich, Skalenwerte oder sogar Werte für Einzelitems dieser Art als "approximativ intervallskaliert" zu akzeptieren, da die arithmetischen Mittelwerte in der Regel dennoch sehr informativ sind (für eine kritische Diskussion siehe Rost, 2004). Auch in der Schule werden traditionell arithmetische Durchschnittsnoten berechnet, obwohl die Noten 5 und 6 in der Regel aus größeren Rohpunktintervallen bestehen als die Noten 1 -4. ...
... Erkläre mit einem Bild, warum Aufgaben zur Leistungsmessung ("Items") bestehen in der Regel aus einem Aufgabenstamm, der die Instruktion enthält, einem Antwortformat und einem Auswertungsschlüssel, der festlegt, welche Antwort wie zu werten ist (Rost 2004). Dabei ist die Offenheit von Aufgaben ein wesentlicher Stellparameter: Geschlossene Aufgaben, wie beispielsweise Multiple-Choice-Formate, sind ökonomisch und objektiv in der Auswertung und damit geeignet zur Konstruktion reliabler Tests. ...
Chapter
Full-text available
... a. Kubinger, 2002, 2003, Westhoff et al., 2004. Rost (2004) begründet Messmodelle allgemein, indem er sich auf Verhaltensaussagen des Typs "A ist intelligenter als B" bezieht und fragt, wie sich diese theoretische Aussage interpretieren lässt. "Man benötigt hierfür ein formales Modell, das in Form einer mathematischen Gleichung den angenommenen Zusammenhang zwischen der Wahrscheinlichkeit des Auftretens der Verhaltensweisen (…) und der Personeneigenschaft (…) sowie den Situationsmerkmalen (…) beschreibt. ...
... indicated that the items were distinct and that they tested different areas of content knowledge. In combination with the complexity of the latent construct of cognitive achievement, the low inter-item correlations confirmed construct validity (Rost, 2004). The reliability of the questionnaire was determined by Cronbach's alpha. ...
... Diese differiert dabei je nach der Lage im Leistungskontinuum. Die Genauigkeit der Messung ist im mittleren Bereich besser als im extremen Bereich (Rost, 2004 Auch wenn es hierzu bereits viel Forschung gibt, warnen bereits Lienert und Ratz, dass in der diagnostischen Praxis Verfahren selbst "zusammengebastelt" (Lienert & Raatz, 1998, S. 5) werden und so nicht sicher ist, ob solche Verfahren den Gütekriterien entsprechen. Aus der Sicht der psychologischen Praxis definieren Lienert und Raatz (1998) Hartung et al., 2021). ...
Book
Full-text available
Pädagogische Diagnostik ist eine Erkenntnisbemühung für die Grundlage von pädagogischen Entscheidungen. Im Alltag von Bildungseinrichtungen werden Leistungen und Kompetenzen implizit oder explizit bewertet. Immer dann findet auch pädagogische Diagnostik als mehr oder weniger nachvollziehbare und dokumentierbare Handlung statt mit dem Ziel, pädagogische Maßnahmen auszuwählen, zu begleiten und zu beobachten. Dieses Buch richtet sich an alle Personen in Bildungseinrichtungen und insbesondere an Studierende des Lehramts, der Sonderpädagogik und Schulpsychologie. Das Buch ist als Einführungsbuch angelegt und stellt die Grundbegriffe und Konzepte von Diagnostik in Bildungseinrichtungen vor. Hierbei werden die verschiedenen Formen von Tests sowie die Grundlagen des Messens kurz skizziert und die pädagogische Diagnostik von Lernschwierigkeiten dargestellt. Version 01 Mai 2023, Version 0.2 Juli 2023
... Nach [14] Zunächst wird die Frage nach den relevanten BIM-Zielen in der Fabrikplanung gestellt. Dann müssen 33 vorgegebene und kurz definierte BIM-Anwendungsfälle auf einer fünfstufigen Likert-Skala von "nicht relevant" bis "sehr relevant", also einschließlich der Option "weder noch relevant" bewertet werden [16]. Zudem kann auch die Antwort "keine Aussage zur Relevanz möglich" ausgewählt werden, da sich die Anwendungsfälle über sämtliche Lebenszyklusphasen einer Fabrik erstrecken und damit nicht zwingend bei allen Teilnehmenden Erfahrungswerte zu allen Anwendungsfällen vorliegen müssen. ...
Article
Full-text available
Das produzierende Gewerbe in Deutschland befindet sich in einem zunehmend turbulenten Marktumfeld. Der Reaktions- und Anpassungsfähigkeit an neue Gegebenheiten kommt dabei eine immer entscheidendere Rolle zu. Um die notwendigen Anpassungen umzusetzen, steigt die Relevanz digitaler Methoden und Werkzeuge in der Fabrikplanung signifikant an. Welche Rolle die Methodik des Building Information Modeling hierbei einnehmen kann, wird in diesem Beitrag vorgestellt. The market environment of manufacturing companies is considered to be turbulent. Reacting and adapingt to these new market conditions are abilities that play an increasingly important role. New digital methods and tools are used in factory planning to implement adaptations. This paper presents the relevance of Building Information Modeling in this context.
... Es zeigt sich auch eine signifikante Interaktion zwischen Zeitpunkt und Setting mit kleinem Effekt (F(2, 439) = 5.41, 2 Es werden zwei Schätzer für Personenparameter angegeben: Mit WLE wird die Fähigkeitsausprägung für einzelne Personen am besten ermittelt (vgl. Rost, 2004), EAP ist WLE bezüglich Testeffizienz überlegen (Wang, 2001 Ausgewählte Ergebnisse der Post-hoc-Tests zu den Forschungsfragen 1 und 2 Die beiden Subgruppen numerisches und qualitatives Setting (QS und NS) unterscheiden sich nicht vor der Intervention (t(229) = − .18, p = .561) ...
Chapter
Full-text available
Zusammenfassung Funktionale Zusammenhänge sind im Mathematikunterricht fast aller Jahrgangsstufen präsent, jedoch gelingt es Lernenden häufig nur unzureichend, tragfähige Vorstellungen zu Funktionen zu entwickeln. Experimente erweisen sich hier als geeignete Unterstützung. Werden sie durch Simulationen digital ergänzt, kann dies Lernende beim Experimentieren entlasten und den funktionalen Zusammenhang in den Vordergrund rücken. Es eröffnet auch eine dynamische Perspektive auf diesen und rückt das Änderungsverhalten der beteiligten Größen (Kovariation), das für Lernende eine besondere Hürde darstellt, stärker in den Fokus. Allerdings erfordert die Kombination von gegenständlichen Materialien und Simulationen gemäß dem Instrumental Approach die Genese zusätzlicher Nutzungsschemata durch Lernende, was kognitive Ressourcen bindet. Je näher die Materialien der mathematischen Tätigkeit stehen, umso effizienter ist diese Genese. Entscheidend für die Frage, ob digital gerahmte Experimente lernwirksamer sind, könnten demnach die dynamische Perspektive sowie die Passung der Materialien sein. Um dem nachzugehen, kontrastiert eine Pre-Post-Interventionsstudie ( N = 442) ein Setting mit fokussierter Passung der Materialien, ein Setting mit zusätzlichem inhaltlichen Fokus auf Kovariation und eine Kontrollgruppe ausschließlich mit Simulationen. Dabei zeigt sich, dass allein durch die Kombination aus Simulationen und gegenständlichen Materialien kein Mehrwert für das Verständnis von Funktionen entsteht. Ergänzt um eine dynamische Perspektive und den Fokus auf Kovariation erzielt die Kombination allerdings größere Lernzuwächse.
... In einem zweiten Schritt wird im Programm R (R Development Core Team, 2017) eine Latent Class-Analyse (LCA) mittels des Packages poLCA durchgeführt (Linzer & Lewis, 2011). Das probabilistische Verfahren der LCA, das von Lazarsfeld und Henry (1968) entwickelt wurde, nimmt eine Typologie oder Klassifikation von Daten vor (Dayton, 1998;Hagenaars & McCutcheon, 2002;Lazarsfeld & Henry, 1968;McCutcheon, 1987McCutcheon, , 2002Nylund, Asparouhov & Muthén, 2007;Rost, 2004). Mithilfe der LCA lassen sich Fälle in distinktive Klassen (Gruppen) aufteilen, sodass die Klassen in sich möglichst homogen, aber die Klassen untereinander möglichst heterogen sind (Lazarsfeld & Henry, 1968). ...
Presentation
Full-text available
Die Präsentation stellt die neue formative und webbasierte Diagnostik zum mündlichen Sprachverständnis (SpraVesT) vor und zeigt die ersten Ergebnisse zur psychometrischen Überprüfung im Querschnitt.
Chapter
The market’s increasing diversity of providers, products, and services confronts today’s companies with expanding customer demands and desires for immediate, individual treatment. Systematically managing customer data and concretely collecting and using feedback makes an effective and efficient customer approach possible, and also facilitates the individualization and optimization of services and products. This chapter deals with the preconditions, options for action, and effects of individualized service design. First, we discuss the necessity of data collection and enrichment as a basis for the use of customer data. Subsequently, we demonstrate possibilities and design measures in interaction and performance optimization through concrete examples. At the end of the chapter, we summarize relevant findings for decision-makers with guiding questions for a management-oriented approach in customer-data-centric product and service design.
Article
Background In counselling and psychotherapy, individuals may exhibit response styles when completing personality measures, potentially distorting comparisons of inter‐ and intra‐differences. However, previous research has primarily focused on nonclinical samples and cross‐sectional data, leaving gaps in our understanding of the stability of response styles and their impact on clinical samples. This study aimed to fill gaps in knowledge by applying a mixed Rasch model to explore response style stability in a personality measure in clinical adolescents. Methods The study sample consisted of 290 clinical adolescents (112 males and 178 females) who were experiencing depressive symptoms and receiving continuous treatment for at least 2 years. Each participant completed a personality assessment at four time points with a six‐month interval between each assessment. To comprehensively examine the stability of response styles over an extended period, this study utilised mixed Rash modelling to analyse enduring response patterns using data collected at the initial (T1) and fourth (T4) assessments, which were spaced 2 years apart. Results Using mixed Rasch modelling, the results showed that the extreme response style (ERS) and middle response style (MRS) were the two most common response styles in the five domains of the Big Five Inventory‐21 at T1 and T4. The ERS and MRS remained stable throughout the mental health intervention. There was no gender‐related relationship found for response styles in the data at separate time points (T1 and T4) or in the longitudinal data (long‐format data). Importantly, the findings revealed that odds of a clinical adolescent changing their personality response style (ERS → MRS or MRS → ERS) increased by 1.15 times with each unit increase in depression score. Conclusion Researchers and practitioners should be aware that the stability of the ERS and MRS for a personality measure may result in response style‐based explanations for findings obtained from longitudinal data, such as trait stability or trait change over waves.
Article
Full-text available
Zusammenfassung Der Erfolg eines individualisierten Mathematikunterrichts hängt wesentlich davon ab, dass Lehrerinnen und Lehrer den individuellen Lernstand und die Lösungswege von Kindern im Unterricht schnell und sicher diagnostizieren und daraus gezielte Hilfen und Förderansätze entwickeln können. Allerdings deuten Studien darauf hin, dass die diagnostische Kompetenz von Mathematiklehrkräften nicht ausreichend ausgebildet ist. Im Rahmen des Praxissemesters als Teil der praxisorientierten Ausbildung von angehenden Lehrkräften sollte es daher auch Ziel sein, ihre diagnostische Kompetenz fachspezifisch zu entwickeln. Konkret wird in der zugrundeliegenden Studie untersucht, inwieweit sich die mathematikspezifische diagnostischen Kompetenz von Grundschullehramtsstudierenden im Praxissemester entwickelt. Dies beinhaltet den Vergleich der Vorbereitungsphase an der Universität mit der anschließenden Praxisphase in den Schulen. Den Kern der als mixed-method angelegten längsschnittlichen Evaluation stellen vier Videovignetten dar. Die Studierenden ( N = 53) wurden in einer Online-Umfrage mit offenen Antwortformaten aufgefordert, die Lösungswege von Kindern zur Addition und Subtraktion im Zahlenraum bis 100 fachlich angemessen zu analysieren. Die quantitative Auswertung zeigt eine signifikante Verbesserung der diagnostischen Kompetenz innerhalb der universitären Vorbereitungsphase. In der Praxisphase selbst ist allerdings eine leicht negative Entwicklung zu verzeichnen. Insgesamt kann im einjährigen Praxissemester daher lediglich eine positive Entwicklungstendenz festgestellt werden. Zudem wird die Bedeutsamkeit eines spezifischen fachdidaktischen Wissens für das Gelingen handlungsleitender Diagnostik im Fach Mathematik von den vorliegenden Ergebnissen gestützt.
Article
Organized leisure activities are an important component of learning with a great potential for positive youth development. The available research has grown in the past decade but is still lacking differentiated analysis of specific activity determinants and longitudinal designs. Based on retrospectively collected quantitative data (n=1,547) at the end of low/ middle secondary schools in Germany (9th/10th grades), this study explores patterns of organized activity participation over the school years using LCA (Latent Class Analysis). Four latent classes could be identified on the basis of eight manifest activity determinants: None-Actives, Minor-Actives, Multiple-Actives, and Committed-Actives. Sociodemographic indicators as well as social, cultural, and economic capital predict the assignment to these classes.
Article
Full-text available
Die Weiterentwicklung der Lehrerbildung kann nur auf einem soliden wissenschaftlichen Fundament erfolgen. Eine zentrale Rolle hat die Unterrichtsforschung, die empirisch gesichertes Beschreibungs-, Erklärungs- und Handlungswissen bereitstellt. An einigen Beispielen aus der Unterrichtsforschung wird in diesem Beitrag erläutert, welche Forschungsansätze und welche Art von Erkenntnissen die Lehrerbildung voranbringen können. In einem Ausblick wird ein innovatives Konzept der Lehrerbildung vorgestellt, das einen ausgeprägten Berufsfeldbezug mit einer wissenschaftlichen Fundierung verbindet.
Chapter
Full-text available
In dem Spannungsverhältnis einer nach wie vor dominierenden monolingualen Unterrichtspraxis und den bildungspolitischen Rahmenvorgaben stehen Lehrkräfte täglich vor der Frage, nicht-deutsche Familiensprachen ihrer Schüler:innen in den Unterricht einzubeziehen oder zu negieren. Für den Umgang mit Mehrsprachigkeit im Unterricht ist es da von entscheidender Bedeutung, ob die Lehrkräfte in der sprachlichen Vielfalt der Schüler:innen einen didaktischen Mehrwert sehen. Im vorliegenden Beitrag werden Ergebnisse der BLUME II-Vignettenstudie (Pilotierung) – einer qualitativen Interviewstudie mit Grundschullehrkräften (N=31) – berichtet, die Einblicke in die Überzeugungen der Lehrkräfte zum Einbezug nicht-deutscher Familiensprachen im Grundschulunterricht ermöglichen. Ausgehend von den überwiegend befürwortenden Grundüberzeugungen, werden in den detaillierteren Ausführungen der Lehrkräfte Einschränkung und Bedenken der Lehrkräfte deutlich – insbesondere hinsichtlich der konkreten didaktischen Umsetzung im Unterricht. Die Auswertungen zeigen, dass die Lehrkräfte für den didaktischen Nutzen der Mehrsprachigkeit ihrer Schüler:innen vornehmlich ausgewählte Fächer als geeignet erachten oder regelmäßige Unterrichtsrituale wie Begrüßungen für die Einbindung in den Unterricht nutzen. Im Unterricht sehen die Lehrkräfte die Schüler:innen oftmals als Expertinnen und Experten für ihre Sprache. Maßnahmen, um den Einbezug nicht-deutscher Familiensprachen in den Unterricht anzuleiten – v. a. durch vorbereitende Arbeitsaufträge an die Kinder – spielen in den Augen der Lehrkräfte eine bedeutende Rolle.
Chapter
Kooperationen von Familie und Schule in Family Literacy Programmen können herkunftssprachliche Ressourcen für Lernprozesse adressieren und implementieren. Mehrsprachige Bilderbücher scheinen hierbei vielversprechende Materialien zu sein, da diese sich potenziell für das Vor- und Erstlesen in Familien und Unterricht eignen. Es stellt sich allerdings die Frage, welche Merkmale mehrsprachige Bilderbücher aufweisen müssen, um mehrsprachigkeitssensibel für beide Kontexte gewinnbringend verwendet werden zu können. Im vorliegenden Beitrag werden lese- und mehrsprachigkeitsdidaktische Kriterien zur Analyse der Eignung mehrsprachiger Bilderbücher für die Verknüpfung familialer Vorlesepraktiken und schulischen Erstleseunterrichts bei Schulanfänger:innen reflektiert und evaluiert. Diese werden auf ein Bücherkoffer-Korpus des Family Literacy-Projekts des Vereins „coach@school“ angewandt. Es zeigt sich u. a., dass sich Teile des Korpus zur Verbindung familialer Vorlesepraktiken und schulischen Erstleseunterrichts unter Berücksichtigung von Mehrsprachigkeit eignen und anregende Lerngelegenheiten bieten, insbesondere in Bezug auf Sprachvergleiche. Durch die Beschränkung auf additiv mehrsprachige Bilderbücher im Korpus werden allerdings Vorstellungen von Sprachen als getrennte, geschlossene Entitäten bestärkt und z. T. Sprachhierarchien reproduziert.
Book
Full-text available
Die Bedeutung von mehrsprachiger Bildung für Lernprozesse, für eine inklusive Bildungsumgebung sowie im erweiterten Sinn auch für Individuen und Gesellschaft ist Thema des Sammelbandes. Die Autor:innen plädieren für eine stärkere Akzeptanz sprachlicher Vielfalt in Bildungseinrichtungen. Der Schwerpunkt des Sammelbands liegt auf den Potenzialen mehrsprachiger Bildungspraktiken zur Entwicklung von fachlichen und persönlichen Kompetenzen sowie zur Bewältigung des Alltags in einer mehrsprachigen Gesellschaft. Die Autor:innen präsentieren konkrete Vorschläge zur Forschung, Umsetzung und Evaluation mehrsprachiger Bildungspraktiken. Eine zentrale Rolle in der Forschungsdebatte spielt das Translanguaging-Konzept von Ofelia García. Darüber hinaus werden die Diagnostik von Mehrsprachigkeit, die Rolle von Herkunftssprachen in der Bildungspraxis sowie Diskrepanzen zwischen den Überzeugungen von Grundschullehrkräften und der tatsächlichen Umsetzung einer mehrsprachigen Bildungspraxis thematisiert. Der Sammelband bietet vielfältige Perspektiven auf die Potenziale, Herausforderungen und Chancen von mehrsprachiger Bildungspraxis. Er richtet sich an Forschende, Praktiker:innen sowie Studierende, die an einer evidenzbasierten und inklusionsorientierten Bildung interessiert sind und sich für die Förderung mehrsprachiger Kompetenzen einsetzen möchten.
Article
Full-text available
Zusammenfassung: Gemäß der Wahrnehmung insbesondere von Hochschullehrenden verringern sich die Fähigkeiten der Abiturientinnen und Abiturienten im Fach Mathematik seit Jahrzehnten beständig. Allerdings liegen bisher kaum empirische Untersuchungen zur Trendentwicklung der Mathematikleistungen in der gymnasialen Oberstufe vor. Um der Frage nachzugehen, ob sich die vermutete negative Trendentwicklung empirisch nachweisen lässt, wurden die Mathematikleistungen von Abiturienten und Abiturienten in Hessen und Schleswig-Holstein untersucht. Dazu wurde eine Sekundäranalyse der Daten aus der First International Mathematics Study (FIMS) von 1964 und der Third International Science and Mathematics Study (TIMSS) von 1996 vorgenommen. Dabei wurden die Daten aus FIMS und TIMSS mit Hilfe der Item-Response-Theorie neu skaliert und anhand der neun Trenditems über ein Mean-Mean-Linking verbunden. Anschließend wurden die Mathematikleistungen von 1964 und 1996 durch ein Equipercentile-Equating in die TIMSS-Metrik überführt und in das TIMSS-Kompetenzstufenmodell eingeordnet. Die Ergebnisse zeigten, dass sich die Mathematikleistungen der Abiturientinnen und Abiturienten von 1964 und 1996 in den beiden Bundesländern Hessen und Schleswig-Holstein nicht signifikant unterschieden und sich die vermutete negative Trendentwicklung für diese beiden Bundesländer empirisch nicht belegen lässt.
Book
Full-text available
In dieser Arbeit wird der Frage nachgegangen, wie Lehrkräfte im Schulalltag jene Leistungen erfassen und bewerten, die unter der sogenannten mündlichen Mitarbeit zusammengefasst werden. Die wenige vorhandene Literatur zu diesem Thema offenbart zunächst vor allem eines: Es scheint nur wenig rechtliche Vorgaben und damit einen großen pädagogischen Spielraum bei der Bewertung mündlicher Mitarbeit zu geben. Im Hinblick auf die diagnostischen Fähigkeiten von Lehrkräften stellen sich damit verschiedene Fragen: Welche Vorgaben werden Lehrkräften zur Bewertung mündlicher Mitarbeit gemacht? Wie definieren Lehrkräfte mündliche Mitarbeit? Welche Kriterien legen sie der Leistungsbewertung zugrunde? Wie (oft) dokumentieren Lehrkräfte die Einzelleistungen und nach welchen Systemen bilden Lehrkräfte die Zeugnisnote? Antworten auf diese Fragen liefern die Befunde aus drei empirischen Teilstudien, die im Rahmen dieser Arbeit vorgestellt werden.
Chapter
Full-text available
Zusammenfassung Quantitative Testverfahren kommen zum Einsatz, wenn Leistungen von Personen gemessen werden sollen. Im Rahmen der Evaluation von Wissenschaftskommunikation ist dies bspw. der Fall, wenn durch Wissenschaftskommunikation Wissen oder Fähigkeiten von Teilnehmenden verbessert werden sollen und Evaluation empirisch prüfen möchte, ob dieses Ziel erreicht wurde. Bei der Auswahl, Entwicklung und Bewertung von Testverfahren sind Gütekriterien einzuhalten, damit das empirische Ergebnis inhaltlich sinnvoll interpretierbare Aussagen zulässt. Die Bewertung der empirischen Ergebnisse erfolgt zudem vor dem Hintergrund einer Bezugsnorm, die bewusst gewählt werden muss. In dem Beitrag gehen wir auf die verschiedenen Testgütekriterien und Bezugsnormen ein und plädieren für interdisziplinäre Kooperationen bei der Auswahl und Entwicklung von quantitativen Testverfahren für die Evaluation von Wissenschaftskommunikation.
Chapter
Full-text available
Dieses Kapitel vermittelt folgende Lernziele: Die unterschiedlichen Vorgehensweisen bei der Bildung theoretischer Konzepte in der qualitativen Forschung und der Operationalisierung theoretischer Konzepte in der quantitativen Forschung kennen. Wissen, was man unter der Konzeptspezifikation versteht und wie man dabei vorgeht. Latente und manifeste Variablen voneinander abgrenzen können. Die vier Skalenniveaus definieren und an Beispielen erläutern können. Die Ratingskala als Antwortformat von der psychometrischen Skala als Messinstrument unterscheiden können. Die Messung theoretischer Konzepte mit Einzelindikatoren, psychometrischen Skalen und Indizes als drei zentralen Operationalisierungsvarianten in ihren Vor- und Nachteilen abwägen können.
Chapter
Full-text available
Dieses Kapitel vermittelt folgende Lernziele: Wissen, was man unter qualitativer Datenanalyse versteht und verschiedene interpretative Auswertungsverfahren kennen. Wissen, was man unter quantitativer Datenanalyse versteht und unterschiedliche statistische Auswertungsansätze voneinander abgrenzen können. Die Logik des klassischen statistischen Signifikanztests zur Überprüfung von Hypothesen erläutern können. Bei quantitativen explorativen (gegenstandserkundenden und theoriebildenden) Studien Methoden der explorativen Datenanalyse beschreiben können. Bei quantitativen deskriptiven (populationsbeschreibenden) Studien die Parameterschätzung mittels Punkt- und Intervallschätzung hinsichtlich unterschiedlicher Arten von Parametern und Stichproben erklären können. Bei quantitativen explanativen (hypothesenprüfenden) Studien die Hypothesenprüfung mittels klassischem statistischem Signifikanztest hinsichtlich verschiedener Arten von Unterschieds-, Zusammenhangs- und Veränderungs-Hypothesen sowie Einzelfall-Hypothesen erläutern können.
Chapter
Dieser Beitrag stellt eine Einführung zur Evaluation von Unterstützungsmaßnahmen in mathematikbezogenen Studiengängen dar. Detailliert werden qualitative Ansätze zur Planung und Durchführung von Interviews und Beobachtungsstudien sowie quantitative Ansätze der Item- und Skalenentwicklung sowie -nutzung inklusive der Adaptation bestehender Skalen an die Untersuchungsziele erläutert und beispielhaft für durchgeführte Analysen im Rahmen des Projekts WiGeMath beschrieben. Im Beitrag wird der aus dem Projekt heraus entwickelten Ansatz zur Evaluation vorgestellt und darüber hinaus allgemeine Erläuterungen zur Methodik gegeben. Dies soll Leser*innen dazu befähigen, selbst eigene Evaluationen in diesem Kontext durchführen zu können. Darüber hinaus dient es dem Verständnis der im Projekt WiGeMath durchgeführten Evaluationsstudien und soll eine Grundlage für die folgenden Kapitel darstellen, in denen die drei Maßnahmetypen (Vorkurse, Brückenvorlesungen und Lernzentren) mit den jeweiligen Forschungsergebnissen und spezifischen Beschreibungen einzelner Good-Practice-Beispiele vorgestellt werden. Dafür wird zunächst das im Projekt WiGeMath zugrunde gelegte Evaluationsmodell Chen (Theory-driven evaluation. Sage, California, 1990) und Thumser-Dauth (Evaluation hochschuldidaktischer Weiterbildung. Entwicklung, Bewertung und Umsetzung des 3P-Modells. Kovac, Hamburg, 2007) vorgestellt. Anhand praktischer Beispiele wird aufgezeigt, wie die Planung, Entwicklung und Umsetzung sowie Auswertung einer Evaluation von hochschulischen Unterstützungsmaßnahmen im Sinne dieses Modells erfolgen kann.
Chapter
Quantitative Methoden der Schulforschung stehen angesichts der Komplexität des untersuchten Gegenstandsbereichs vor der Herausforderung, eine angemessene Abbildung schulischer Realität zu gewährleisten, auf deren Grundlage die empirische Überprüfung wissenschaftlicher Hypothesen zu validen und generalisierbaren Befunden führt. In diesem Beitrag wird auf das entsprechend etablierte Methodenrepertoire der Sozialforschung eingegangen und die spezifischen Anforderungen der empirischen Erfassung der Schulwirklichkeit thematisiert. Zudem werden besonders geeignete Datenauswertungsverfahren vorgestellt, die eine adäquate Analyse schulbezogener Hypothesen gewährleisten.
ResearchGate has not been able to resolve any references for this publication.