Content uploaded by Manuel Burghardt
Author content
All content in this area was uploaded by Manuel Burghardt on Feb 15, 2017
Content may be subject to copyright.
www.palafra.org oder www.dhregensburg.de
PaLaFra —Entwicklung einer Annotations-
umgebung für ein diachrones Korpus
spätlateinischer und altfranzösischer Texte
Lars Döhling (lars.doehling@ur.de), Manuel Burghardt (manuel.burghardt@ur.de), Christian Wolff (christian.wolff@ur.de)
I) PROJEKTKONTEXT UND ZIELE
II) Entwicklung interaktiver Annotationswerkzeuge
III) Entwicklung eines gemeinsamen Tagsets
Aufbau eines digitalen Korpus spätlateinischer
und altfranzösischer Texte zur Rekonstruktion
des lateinisch-romanischen Sprachwandels
•Wo? Gallien
•Wann? 6.—8. Jhd. (spätlat.)
9.—14. Jhd. (altfranz.)
•Was? Religiöse, historische und juristische Texte
aus der digital Monumenta Germaniae Historica
(dMGH) und der Base de Français Médiéval (BFM)
Lemmatisierung, syntaktische und
morphologische Annotation
Spätlat.: PaLaFra, basierend auf Vorarbeiten
im Projekt CompHistSem
Altfranz.: Cattex09
Sprachübergreifende, diachrone Analysen durch
gemeinsames Tagset
Seite aus der
Pactus legis Salicae
Quelle: dMGH
Quellgebiet
des Korpus
MarMoT
Ziel: Korrekturen
verbessern Voranno-
tation sukzessive
Visueller Tagsetvergleich am
Beispiel der Vita Benedicti
und der Vie de saint Benoit
Tabelle zur Konvertierung der
lat./franz. Tagsets in ein
gemeinsames Tagset, basierend auf
den Universal Dependencies
Texte aus
der dMGH
Automatisches
Tagging
Manuelle
Korrektur