Project

Ratte (=Regensburger Analysetool für Texte)

Goal: (Weiter-)Entwicklung eines PC-Programms zur Berechnung von Lesbarkeitsindizes von Texten. (Momentan in der Testphase.)

Vorschlag zur Zitation:
Wild, Johannes/Pissarek, Markus (o. J.): Ratte. Regensburger Analysetool für Texte. Online verfügbar: https://www.uni-regensburg.de/sprache-literatur-kultur/germanistik-did/downloads/ratte/index.html (zuletzt geprüft: 22.07.2019).

Updates
0 new
15
Recommendations
0 new
7
Followers
0 new
64
Reads
27 new
2002

Project log

Johannes Wild
added an update
In der neuen Version wird RATTE von Grund auf neu gestaltet: Künftig wird nur noch eine Web-App zur Verfügung stehen. Das erlaubt es einerseits, das Programm flexibler zu erweitern und mit allen Geräten zu nutzen, andererseits können moderne Technologien wie Natural Language Processing für die Analyse eingesetzt werden. Neue Funktionen sind u.a.: Wortartenbestimmung (STTS-Tagger), MATTR (moving window TTR), Pronominalisierungsindex, Unterstützung des childLex-Korpus (25% der seltensten Wörter werden markiert), Speicherfunktion der Analyse (csv). Da noch ein paar Dinge zu ergänzen sind, voraussichtlich erst im kommenden Jahr. Ein Fork für den Französischunterricht ist ebenfalls geplant.
 
Johannes Wild
added an update
Webversion unter: http://ratte.herokuapp.com/
D.h. das Programm kann auch am Tablet, Smartphone etc. genutzt werden!
 
Johannes Wild
added an update
Analyse von Datenschutzerklärungen durch den Bayerischen Rundfunk mit RATTE:
 
Johannes Wild
added an update
Laut Auskunft unseres Rechenzentrums haben sich zum 01. Februar 2019 die Lizenzbedingungen von Oracle Java geändert,  Java wird nun auch für Bildungseinrichtungen kostenpflichtig. Das erste kostenpflichtige Update (Java 8, Update 212) ist zum 16. April 2019 erschienen. Wir empfehlen daher, auf OpenJDK umzusteigen, z.B.
 
Johannes Wild
added a research item
In Informationsgesellschaften wird ein großer Teil des Wissens mit Hilfe von Texten gespeichert und weiterge­geben. Die Fähigkeit zum Umgang mit vielfältigen Texten bildet eine Schlüsselkompetenz, die Schülerinnen und Schüler erwerben müssen. Damit sie sich diese aneignen können, müssen geeignete Übungstexte zur Verfügung stehen. Diese müssen sowohl inhaltlich angemessen sein als auch hinsichtlich Komplexität und Umfang (vgl. Ballstaedt et al. 1981, 222). Wie Sie entsprechende Texte gestalten sollten, beschreibt der folgende Beitrag.
Johannes Wild
added a research item
Die Auswahl geeigneter Text für den Schulunterricht ist nicht trivial. Neben dem angestrebten Leseziel muss die Komplexität sowie die Zeit, die zum Lesen benötigt wird, berücksichtigt werden. Wir haben ein Programm zur Berechnung von Lesbarkeitsindizes von Texten entwickelt, das mit einem einfachen Ampelsystem diesbezüglich entlasten soll. Über Anregungen/Verbesserungsvorschläge freuen wir uns! Online verfügbar: https://www.uni-regensburg.de/sprache-literatur-kultur/germanistik-did/downloads/ratte/index.html
Johannes Wild
added an update
Kleines Bugfix-Release: Version 1.6.1 ist online.
 
Johannes Wild
added an update
Version 1.6 ist online: Es ist nun über ein Eingabefeld eine freie Suche mit sog. "Regular Expressions" möglich (vgl. z.B. zur Übersicht der möglichen Befehle und Bedingungen: http://www.rexegg.com/regex-quickstart.html), außerdem kleine Fehler behoben.
 
Markus Pissarek
added an update
Um Texte unterschiedlicher Länge bei der TTR vergleichbar zu machen, wurde eine Formel implementiert, die nach 100 Wörtern abschneidet (basiert auf der Köhler-Galle-Methode, vgl. Popescu (2009): Word Frequency Studies, 249f. (online verfügbar: http://evrika-braila.ro/wp-content/uploads/2014/10/Book1-Word-Frequency-Studies-June-2009.pdf).
So können auch kürzere mit längeren Texten verglichen werden und die Werte liefern einen ersten Indikator für die TTR. Dies erscheint uns sinnvoll, da ansonsten die TTR aufgrund des Einflusses der Textlänge verfälscht wird. Korpusanalysen stehen noch aus.
Sollte ein Text weniger als 100 Wörter haben, wird auf die übliche Berechnung zurückgegriffen (siehe Dokumentation).
 
Johannes Wild
added an update
Version 1.5 ist online: Type-Token-Ratio implementiert (vgl. auch die neue Dokumentation)
Die Type-Token-Ratio wird nach der Köhler-Galle-Methode um einen textlängenspezifischen Faktor korrigiert (vgl. Popescu 2009: Word Frequency Studies, 249f. (online verfügbar: http://evrika-braila.ro/wp-content/uploads/2014/10/Book1-Word-Frequency-Studies-June-2009.pdf)).
Eventuell lassen sich die Werte nutzen, um die zu analysierenden Texte in Verhältnis zu Korpora wie childLex zu setzen (Distanz und/oder Steigung der Funktion(en)).
 
Johannes Wild
added an update
Gerade im Fokus: Wie erfasst man Wortschatz? Wir experimentieren gerade mit Frequenzlisten sowie dem Konzept lexikalischer Dichte.
Wir freuen uns über Anregungen.
 
Johannes Wild
added a project goal
(Weiter-)Entwicklung eines PC-Programms zur Berechnung von Lesbarkeitsindizes von Texten. (Momentan in der Testphase.)
Vorschlag zur Zitation:
Wild, Johannes/Pissarek, Markus (o. J.): Ratte. Regensburger Analysetool für Texte. Online verfügbar: https://www.uni-regensburg.de/sprache-literatur-kultur/germanistik-did/downloads/ratte/index.html (zuletzt geprüft: 22.07.2019).