PreprintPDF Available

Das Korpus Deutsch in Namibia (DNam): Eine Ressource für die Kontakt-, Variations-und Soziolinguistik

Authors:
Preprints and early-stage research may not have been peer reviewed yet.

Abstract

This paper describes the corpus Deutsch in Namibia (DNam, 'German in Namibia'), which will be openly accessible via the Datenbank für Gesprochenes Deutsch (DGD, 'Database for Spoken German'). This corpus is a new digital resource that comprehensively and systematically documents the language use of the German-speaking minority in Namibia and related language attitudes. We discuss data collection and elicitation methods (conversation groups, "language situations", semi-structured interviews), data processing including transcription, normalisation and tagging, general corpus characteristics available (size, available metadata etc.) and some basic functionalities within the DGD. First research results based on this new empirical resource illustrate its value for studies on language contact, variation and sociolinguistics.
1
Das Korpus Deutsch in Namibia (DNam): Eine Ressource für
die Kontakt-, Variations- und Soziolinguistik
Christian Zimmer1, Heike Wiese2, Horst J. Simon1, Marianne Zappen-Thomson3,
Yannic Bracke2, Britta Stuhl1 & Thomas Schmidt4
Freie Universität Berlin1, Humboldt-Universität zu Berlin2, University of Namibia
(Windhoek)3, Institut für deutsche Sprache (Mannheim)4
Abstract: Dieser Beitrag widmet sich der Beschreibung des Korpus Deutsch in Namibia
(DNam), das über die Datenbank für Gesprochenes Deutsch (DGD) frei zugänglich sein
wird. Bei diesem Korpus handelt es sich um eine neue digitale Ressource, die den
Sprachgebrauch der deutschsprachigen Minderheit in Namibia sowie die zugehörigen
Spracheinstellungen umfassend und systematisch dokumentiert. Wir beschreiben die
Datenerhebung und die dabei angewandten Methoden (freie Gespräche,
„Sprachsituationen“, semi-strukturierte Interviews), die Datenaufbereitung inklusive
Transkription, Normalisierung und Tagging sowie die Eigenschaften des verfügbaren
Korpus (Umfang, verfügbare Metadaten usw.) und einige grundlegende Funktionalitäten
im Rahmen der DGD. Erste Forschungsergebnisse, die mithilfe der neuen Ressource
erzielt wurden, veranschaulichen die vielseitige Nutzbarkeit des Korpus für
Fragestellungen aus den Bereichen Kontakt-, Variations- und Soziolinguistik.
This paper describes the corpus Deutsch in Namibia (DNam, ‘German in Namibia’),
which will be openly accessible via the Datenbank für Gesprochenes Deutsch (DGD,
‘Database for Spoken German’). This corpus is a new digital resource that
comprehensively and systematically documents the language use of the German-speaking
minority in Namibia and related language attitudes. We discuss data collection and
elicitation methods (conversation groups, “language situations”, semi-structured
interviews), data processing including transcription, normalisation and tagging, general
corpus characteristics available (size, available metadata etc.) and some basic
functionalities within the DGD. First research results based on this new empirical
resource illustrate its value for studies on language contact, variation and sociolinguistics.
1 Einleitung
Das Deutsche in Namibia hebt sich durch verschiedene Merkmale von anderen Varietäten
innerhalb und außerhalb des geschlossenen deutschen Sprachraums ab.
1
Im Unterschied
zu anderen Varietäten außerhalb, in denen ein Sprachwechsel bevorsteht oder bereits
1
Unsere Arbeit wird gefördert durch die Deutsche Forschungsgemeinschaft (DFG) WI 2155/9-1; SI
750/4-1. Weitere Projektbeteiligte waren Hans C. Boas, Janosch Leugner, Laura Perlitz und Anika Kroll-
Tjingaete. Wir danken den zahlreichen Gewährspersonen für die große Kooperationsbereitschaft, ihre
Gastfreundschaft und das Interesse an unserem Forschungsprojekt. Dank gebührt weiterhin Jones Anam,
Christian Anders, Claudia Czarniak, Jan Gorisch, Philipp Klaußner, Semra Kizilkaya, Jula Kostka, Carina
Schüffler und Ray Tjingaet, die bei der Erstellung des Korpus mitgewirkt haben.
Preprint.
Der Aufsatz befindet sich derzeit in Begutachtung.
2
stattgefunden hat, wird Deutsch hier aktiv gepflegt, konsequent an folgende
Generationen weitergegeben und in formellen wie in informellen Situationen verwendet.
Dass ein Sprachwechsel nicht unmittelbar bevorsteht, ist dabei durchaus bemerkenswert,
da die Community lediglich ca. 20.000 SprecherInnen umfasst und sich zudem (im
Gegensatz z.B. zu den ebenfalls vitalen sectarian communities in Nordamerika) nicht
systematisch von anderen Gruppen abschottet.
Im Unterschied zu Varietäten innerhalb des geschlossenen deutschen Sprachraums ist
das namibische Deutsche in einen breit mehrsprachigen gesellschaftlichen Kontext
eingebettet. Charakteristisch und prägend ist in diesem Kontext ein intensiver
Sprachkontakt mit den beiden germanischen Sprachen Englisch und Afrikaans. Hinzu
kommt der (weniger stark ausgeprägte) Kontakt mit Bantu- und Khoisansprachen wie
Otjiherero oder Khoekhoegowab. Neben diesem multilingualen Setting ist auch die
sprachliche Heterogenität der deutschsprachigen ImmigrantInnen kennzeichnend für das
Deutsche in Namibia: Da Deutschsprachige aus unterschiedlichen deutschen
Dialektgebieten im Südwesten Afrikas aufeinandertrafen und miteinander interagierten,
handelt es sich beim heutigen namibischen Deutschen auch um das Resultat von
Varietäten- bzw. Dialektkontakt.
Die deutschsprachige Community in Namibia ist damit eine vitale
Sprachgemeinschaft, deren Sprachgebrauch maßgeblich durch Sprach- und
Varietätenkontakt geprägt ist. Neben grammatischen Spezifika hat diese Konstellation
auch ein interessantes Geflecht an einstellungsbezogenen Besonderheiten befördert:
Einerseits dient das Deutschlanddeutsche gerade in Bildungskontexten als
Prestigevarietät, und nicht-standardsprachliche Strukturen werden generell oft negativ
bewertet; andererseits fungieren gerade die namibia-spezifischen Formen als positiv
besetzte gruppenidentitätsstiftende Merkmale der deutschsprachigen NamibierInnen
(Wiese & Bracke i. Ersch.).
All dies macht das namibische Deutsche zu einem interessanten
Forschungsgegenstand, unter anderem für die Bereiche Kontaktlinguistik,
Variationslinguistik, Soziolinguistik und Jugendsprachforschung. Mit dem Korpus
Deutsch in Namibia (DNam) liegt nun erstmals eine Ressource vor, die den
Sprachgebrauch und die Spracheinstellungen der deutschsprachigen NamibierInnen
umfassend und systematisch dokumentiert. Über die Datenbank für Gesprochenes
Deutsch (DGD) des Instituts für Deutsche Sprache (IDS) wird diese neue Ressource frei
zugänglich gemacht. Das Korpus erlaubt grammatische, pragmatische und lexikalische
Analysen des Deutschen in Namibia einschließlich informelleren Sprachgebrauchs sowie
die Untersuchung einstellungsbezogener Merkmale innerhalb der Sprechergemeinschaft.
Mit einer Gesamtgröße von mehr als 200.000 Tokens erlaubt es das Korpus, auch
seltenere Phänomene datenbasiert und mithilfe authentischen Sprachmaterials zu
untersuchen und liefert eine Basis für systematische quantitative Analysen.
Flankiert wird das DNam-Korpus durch ein weiteres Korpus, das Übersetzungen der
klassischen Wenker-Sätze in umgangssprachliches (namibisches) Deutsch erfasst (Wiese
2014). Dieses Korpus enthält Daten von über 200 TeilnehmerInnen unterschiedlicher
Altersgruppen, die mithilfe eines Online-Fragebogens in den Jahren 2013 und 2014
gesammelt wurden. Das Korpus enthält die Wenker-Übersetzungen sowie biographische,
soziale und soziolinguistische Daten zu den TeilnehmerInnen, die mit Hilfe eines
Personenfragebogens erfasst wurden. Es steht unter der CC-By 3.0-Lizenz über folgende
URL frei zur Verfügung :
<https://www.linguistik.hu-berlin.de/de/institut/professuren/multilinguale-kontexte/Proje
kte/Namdeutsch/Korpusdaten/NamDeutsch-Wenker>.
Auch wegen der Vergleichbarkeit mit der großen Menge an Datensätzen, die mit dem
identischen Erhebungsinstrument in anderen Regionen und zu anderen Zeitpunkten
3
gesammelt wurden, handelt es sich hierbei um wertvolles Material für eine Reihe
linguistischer Fragestellungen. Für eine Beispielstudie, die auf der Analyse dieser Daten
basiert und auf Unterschiede beim Fremdwortgebrauch verschiedener Altersgruppen
fokussiert s. Zimmer (i. Ersch.).
In den weiteren Abschnitten skizzieren wir kurz das soziolinguistische Setting und die
Geschichte des Deutschen in Namibia, deren Kenntnis für das Verständnis der Daten
wichtig ist (Abschnitt 2).
2
Vor diesem Hintergrund erläutern wir dann das Design des
DNam-Korpus und gehen dabei auf die Datenerhebung (Abschnitt 3.1), die
Datenaufbereitung (Abschnitt 3.2), die Eigenschaften des Korpus (Abschnitt 3.3) und
grundlegende Funktionsweisen der DGD (Abschnitt 3.4) ein. Die Nutzungsmöglichkeiten
der Ressource werden dann anhand erster Studien illustriert (Abschnitt 4).
2 Deutsch in Namibia
Namibia ist ein Land, das durch ein hohes Maß an Mehrsprachigkeit gekennzeichnet ist.
Als Familiensprachen sind Bantusprachen (vor allem Oshiwambo, aber auch Otjiherero)
und Khoisansprachen (z.B. Khoekhoegowab) am weitesten verbreitet. Daneben spielen
zwei germanische Sprachen eine wichtige Rolle: Afrikaans wird in vielen Bereichen als
Lingua Franca verwendet, und Englisch ist alleinige Amtssprache (als „official
language“; neben 13 sogenannten „national languages“, darunter neben einer Reihe
autochthoner Sprachen insbesondere Bantusprachen auch Deutsch und Afrikaans).
Mitglieder der deutschsprachigen Minderheit sind in aller Regel mindestens
dreisprachig und beherrschen neben Deutsch auch Afrikaans und Englisch. Hinzu
kommen unterschiedlich stark ausgeprägte, meist jedoch sehr geringe Kenntnisse
einzelner Bantu- und/oder Khoisansprachen. Die deutschsprachige Minderheit umfasst
etwa 20.000 SprecherInnen und damit ungefähr 1% der ca. 2 Millionen NamibierInnen.
Die Immigration der Deutschsprachigen fand im Wesentlichen im Kontext der
Kolonialisierung des heutigen Namibia statt (Deutsch-Südwestafrika; 1884 1915). Aber
auch daran anschließend gab es und gibt es bis heute Zuwanderung aus dem
deutschsprachigen Raum in Europa.
Die deutsche Kolonial-Herrschaft endete mit dem Ersten Weltkrieg. Englisch und
Afrikaans wurden anschließend als Amtssprachen eingeführt und lösten Deutsch ab. Die
Verwaltung Südwestafrikas ging an Südafrika über, das das Gebiet zuvor besetzt hatte,
und die 1948 in Südafrika offiziell eingeführte Apartheidspolitik wurde auch auf
Südwestafrika übertragen. 1990 erlangte Namibia dann seine Unabhängigkeit von
Südafrika, wodurch auch die Apartheid beendet wurde. Im Zuge dessen wurde Englisch
der Status der alleinigen Amtssprache zugesprochen.
Sowohl die Apartheid als auch die Kolonialzeit haben das Land nachhaltig geprägt.
Noch heute sind deren Auswirkungen unübersehbar. Auch bei der Wahl der Amtssprache
spielte die jüngere Geschichte des Landes eine wichtige Rolle. Die früheren
Amtssprachen Afrikaans und Deutsch schieden wegen ihrer Konnotation mit der
Kolonial- bzw. Apartheidzeit aus. Weder eine der zahlreichen Bantu- noch eine der
Khoisansprachen wurde gewählt, um keine der entsprechenden Gruppen zu bevorteilen.
Stattdessen fiel die Wahl auf Englisch, das als neutrale Sprache wahrgenommen wurde.
Deutsch ist der Amtssprache untergeordnet, erfährt als eine von 13 Nationalsprachen aber
eine gewisse institutionelle Unterstützung. Dies äußert sich zum Beispiel darin, dass das
2
Für ausführlichere Ausführungen vgl. Pütz (1991, 1995), Gretschel (1995), Schmidt-Lauber (1998),
Böhm (2003), Deumert (2009, 2018), Ammon (2014), Dück (2018), Shah & Zappen-Thomson (2018),
Kroll-Tjingaete (2018), Zappen-Thomson (2019) und Zimmer (2019).
4
Fach Deutsch als Muttersprache (DaM) nicht nur an Privat-, sondern auch an staatlichen
Schulen belegt werden kann (für Details s. Zappen-Thomson 2019).
Generell ist es den Mitgliedern der deutschen Sprechergemeinschaft in Namibia ein
wichtiges Anliegen, dass SchülerInnen das Fach DaM belegen können. Da viele
Deutschsprachige auf geographisch abgelegenen Farmen leben und nicht flächendeckend
DaM angeboten wird, wohnen viele SchülerInnen in Internaten, die an Schulen mit DaM-
Unterricht angebunden sind (sogenannte Schülerheime). Hier wird auch in der Freizeit
vorwiegend Deutsch gesprochen.
Darüber hinaus engagieren sich viele Deutschsprachige für den Erhalt von
Privatschulen mit DaM-Unterricht. Dieses Engagement wird dadurch erleichtert, dass die
deutschsprachige Minderheit in Namibia zu den sozioökonomisch privilegierten Gruppen
gehört. Insgesamt ist die Community gut vernetzt und vergleichsweise aktiv. So werden
zahlreiche Veranstaltungen organisiert, die auch dem Erhalt der deutschen Sprache in
Namibia dienen sollen. Dazu gehören Karnevalssitzungen, Oktoberfeste,
Sportveranstaltungen usw. Zu den Domänen, in denen (auch) Deutsch gesprochen wird,
zählen außerdem die Kirchen: In vielen Teilen des Landes werden regelmäßig
deutschsprachige Gottesdienste angeboten. Ferner gibt es eine deutschsprachige
Tageszeitung (die Allgemeine Zeitung) und deutschsprachige Radiosender (das Hitradio
Namibia sowie ein deutschsprachiges Angebot der Namibian Broadcasting Corporation).
Ein Teil der Community hat darüber hinaus via Satellitenübertragung Zugang zu
deutschen Fernsehsendern.
3 Korpus-Design
Das DNam-Korpus wurde im Rahmen eines von der Deutschen Forschungsgemeinschaft
(DFG) geförderten Projekts („Namdeutsch: Die Dynamik des Deutschen im
mehrsprachigen Kontext Namibias“; Laufzeit: 2016 2020) erstellt, das zum einen
zunächst an der Universität Potsdam, dann an der Humboldt-Universität zu Berlin
(Projektleitung: [Heike Wiese]) und zum anderen an der Freien Universität Berlin
(Projektleitung: [Horst Simon]) und in Kooperation mit der University of Namibia,
Windhoek ([Marianne Zappen-Thomson]), durchgeführt wurde. Neben der
Dokumentation hat sich das Projekt der Beschreibung und Analyse grammatischer,
pragmatischer und einstellungsbezogener Spezifika des Deutschen in Namibia gewidmet.
Die Interpretation der grammatischen Besonderheiten erfolgte aus den Perspektiven von
Sprachwandel und Sprachvariation des Deutschen im mehrsprachigen Kontext und
fokussierte auf Interferenzen aus den Kontaktsprachen, den Ausbau binnenstrukturell
angelegter Tendenzen und Registerdifferenzierungen unter Bedingungen von
Sprachkontakt. Die Erfassung, Beschreibung und Analyse der sprachideologischen und
einstellungsbezogenen Eigenheiten erfolgte mit Blick auf den Konnex von Sprache und
Identität im mehrsprachigen Kontext (Wiese et al. 2017). Einige auf den Korpusdaten
basierende Ergebnisse werden in Abschnitt 4 veranschaulicht.
Mit dem im Projekttitel verwendeten Begriff Namdeutsch referieren wir auf namibisch
geprägten Sprachgebrauch des Deutschen. Dieser Begriff wird auch in der Community
häufig mit dieser Bedeutung verwendet. Alternative Bezeichnungen sind Nam-Släng,
Namlish und Südwesterdeutsch. Für die Verwendung von Namdeutsch haben wir uns
entschieden, da es sich hierbei um eine relativ neutrale Bezeichnung handelt, die weder
mit medial stilisiertem Sprachgebrauch assoziiert ist (anders als Nam-Släng) noch von
vielen jüngeren Community-Mitgliedern wegen ihrer Konnotation mit der Kolonialzeit
gemieden wird (im Gegensatz zu Südwesterdeutsch), und im Vergleich zu Namlish, das
auch namibisch geprägtes Englisch bezeichnen kann, terminologisch präziser ist (vgl.
hierzu auch Zimmer 2019).
5
Mit dem Korpustitel Deutsch in Namibia legen wir das Korpus möglichst breit an. Wie
unten noch deutlich wird, enthält das Korpus z.B. auch Material, das in formellen
Kommunikationssituationen erhoben wurde. Diese Daten sind z.T. sehr eng am
Standarddeutschen, das in Deutschland gesprochen wird. Ob sich hierbei eine eigene
namibische Variante des Standarddeutschen, also ein Standard-Namdeutsch entwickelt
oder ob solche Daten außerhalb des eigentlichen „Namdeutschen“ liegen – wobei sie
natürlich immer noch Teil des Deutschen in Namibia sind , ist Gegenstand aktueller
Forschung (vgl. z.B. Ammon, Bickel & Lenz 2016, Kellermeier-Rehbein 2016 und Wiese
& Bracke i. Ersch.).
Das Ziel, den deutschen Sprachgebrauch in Namibia möglichst umfassend zu
dokumentieren, spiegelt sich in der Wahl der Methoden für die Datenerhebung wider, die
im folgenden Abschnitt dargestellt wird.
3.1 Datenerhebung
Die Aufnahmen für das Korpus wurden im Juli/August und November 2017 in drei
verschiedenen Set-ups durchgeführt: freie Gespräche, Sprachsituationen“ und
Interviews. Die Datenerhebungen fanden in Unterrichts- und Internatsgebäuden (erste
Erhebungsphase) sowie auf den Farmen der Gewährspersonen, sonstigen Privatgebäuden
und öffentlichen Räumen statt (zweite Erhebungsphase). In der ersten Erhebungsphase
wurden SchülerInnen aufgenommen, in der zweiten Erhebungsphase schwerpunktmäßig
Erwachsene. Die Set-ups wurden in beiden Erhebungsphasen verwendet, allerdings wurde
das Vorgehen minimal altersgerecht angepasst. Im Folgenden werden die verwendeten
Set-ups näher erläutert:
1) Bei den freien Gesprächen unterhielten sich kleinere Gruppen von zwei bis fünf
Personen in Abwesenheit der ForscherInnen in informellem Setting über Themen
klassischer soziolinguistischer Interviews (z.B. Kinderspiele) und/oder alltagsrelevante
Aspekte des Lebens in Namibia. Für die Durchführung dieses Set-ups mit SchülerInnen
wurde im Vorfeld ein/e SprecherIn pro Gruppe als „AssistentIn“ ausgewählt, der/die als
ImpulsgeberIn während des Gruppengesprächs fungierte. Die Aufgabe dieser Person war
es, selbst am Gespräch teilzunehmen und neue Themen einzubringen, falls die
Unterhaltung ins Stocken geraten sollte. Dafür wurde dem/der ImpulgeberIn zuvor eine
Reihe von Themenvorschlägen an die Hand gegeben: EES (ein deutsch-namibianischer
Popmusiker), der Musikgeschmack der eigenen Eltern, Erfahrungen mit Deutschland-
Deutschen (namdeutsch: Jerries), Erkennungsmerkmale von Deutschland-Deutschen,
Kinderspiele (von NamibierInnen und Deutschland-Deutschen), Erfahrungen mit
verschiedenen Aktivitäten (Jagen, Puppenspielen, Steinschleudern [namdeutsch: Ketti],
Autofahren), gefährliche Situationen und schließlich Unterschiede zwischen
InternatsbewohnerInnen (namdeutsch: Heimer) und TagesschülerInnen (Städtern).
Die Motivation für die Themen war es, geeignete Impulse für ein lebendiges Gespräch
zu geben, bei dem die TeilnehmerInnen möglichst natürlich agieren. Wie die so
gewonnenen Daten zeigen, sind die Unterhaltungen darüber hinaus auch inhaltlich von
soziolinguistischem Interesse.
Ein weiterer Gesprächsimpuls wurde generiert, indem sich die Gruppen einen
Ausschnitt eines Musikvideos von EES anschauen konnten, in dem er Nam-Släng
verwendet: die ersten 80 Sekunden des Videos zum Song Sundowner.
3
Die
3
Das Video ist unter folgender URL verfügbar: <https://www.youtube.com/watch?v=lyq_UORMP4Q>
(zuletzt abgerufen am 05.09.2019).
6
ImpulsgeberInnen wurden gebeten, dieses Video auf einem zur Verfügung gestellten
Laptop relativ zu Beginn der Gesprächsrunde abzuspielen. Dies stimulierte nicht nur die
Gespräche in den Runden, sondern trug auch zum intendierten informellen Setting bei.
Nach anfänglicher Zurückhaltung entwickelten sich in zahlreichen Gruppen auf diese
Weise lebhafte Gespräche, wobei häufig die vorgeschlagenen Themenbereiche zugunsten
von (anderen) alltagsrelevanten Gegenständen verlassen wurden. Dieser Teil des Korpus
liefert somit freie und authentische Gespräche von befreundeten SchülerInnen. Für die
Transkription ausgewählt wurden die Gesprächsteile, die an das gemeinsame Betrachten
des Videos anschließen, da sich die TeilnehmerInnen zu diesem Zeitpunkt bereits an die
Aufnahmesituation gewöhnt und ihre anfängliche Zurückhaltung abgelegt hatten.
4
Bei der zweiten Erhebungsphase hat sich eine leichte Anpassung des Set-ups für die
Datenerhebung mit den überwiegend erwachsenen TeilnehmerInnen als gewinnbringend
herausgestellt: Hier haben wir auf ein Video und Themenvorschläge verzichten, sondern
die SprecherInnen gebeten, aktuelle Themen zu besprechen, über die sie sich auch sonst
unterhalten würden. In den aus Familienmitgliedern oder FreundInnen bestehenden
Gesprächsrunden wurden folglich von Anfang an selbstgewählte alltagsrelevante Themen
besprochen. Auch hier entwickelte sich nach anfänglicher Zurückhaltung in aller Regel
ein natürliches Gespräch.
2) Bei den Sprachsituationen“ handelt es sich um naturalistische Daten, die durch
gestellte Gespräche elizitiert wurden, die sich auf einen Verkehrsunfall beziehen (zur
Methode s. Wiese i. Ersch.). Der Verkehrsunfall wurde nonverbal in Form einer Foto-
Geschichte präsentiert. Abbildung 1 enthält sechs der zehn verwendeten Stimuli-Fotos.
4
Weiteres zur Datenauswahl wird in Abschnitt 3.2 besprochen.
7
Abbildung 1: Stimuli-Fotos für das Sp r achsitua tio nen-Set-up (Auswahl)
Für diese Gespräche wurde ein formelles und in ein informelles Setting simuliert, die sich
durch die GesprächspartnerInnen unterschieden. Im formellen Setting sollten sich die
Sprecher*innen vorstellen, sie sprächen mit einer Deutsch-Lehrkraft, die vom
Aufnahmeleiter / von der Aufnahmeleiterin gespielt wurde. Für das informelle Setting
wählten sie eine nahestehende Person unter den Anwesenden (Familienmitglieder oder
FreundInnen), die dann die/den GesprächspartnerIn spielte. Mithilfe dieses Set-ups
wurden somit gezielt Gespräche in einem vorgegebenen Register elizitiert, die möglichst
nah an natürlichen Spontandaten sein sollten. Als zusätzliche Kontrolle diente eine
Authentizitätsprüfung durch die Peer-group: Die Aufnahmen fanden immer in
Kleingruppen statt, sodass nach einem simulierten Gespräch unbeteiligte SprecherInnen
nach der Repräsentativität des vorangegangenen Gesprächs befragt werden konnten. Falls
dabei zur Sprache kam, dass ein Gespräch unnatürlich verlaufen sei oder z.B. eine
Sprecherin, „sehr steif“ oder „übertrieben im Slang“ gesprochen habe, wurden die
Aufnahmen wiederholt, bis ein Resultat erzielt wurde, das von der Gruppe akzeptiert
wurde.
Die gleiche Methode wurde und wird (mit entsprechend angepassten Stimuli) auch in
anderen Sprachkontaktsettings angewendet, sodass eine große und weiterwachsende
Bandbreite an vergleichbaren Daten aus unterschiedlichen Regionen verfügbar ist (vgl.
Wiese i. Ersch.). Unter anderem wurde das Set-up mit SchülerInnen in Berlin-Kreuzberg
erfolgreich genutzt. Für diese SprecherInnengruppe konnte gezeigt werden, dass die
mithilfe der „Sprachsituationen“ gesammelten elizitierten informellen Daten qualitativ
solchen entsprechen, die aus Spontansprache stammen (vgl. Wiese & Pohle 2016)
8
gleichzeitig liefern die „Sprachsituationen“ die Möglichkeit, systematisch und kontrolliert
vergleichbare Daten zu erfassen, die Registerdifferenzierungen abbilden.
3) Schließlich wurden mit jeweils zwei oder drei ProbandInnen semi-strukturierte
Interviews geführt. Die von den ForscherInnen gestellten Impulsfragen bezogen sich
dabei auf Spracheinstellungen, Sprachgebrauch, Meinungen zur Sprachpolitik,
Sprachbiographisches, Sprachpflege, perzeptionsdialektologische Aspekte usw. Für die
Transkription wurden sieben Interviews aus der zweiten Erhebungsphase ausgewählt.
Die Aufnahmen der ersten Erhebungsphase wurden an allen namibischen
Sekundarschulen mit DaM-Unterricht sowie einer Einrichtung für privaten
Deutschunterricht und mit der Unterstützung der dortigen Deutsch-Lehrkräfte gemacht.
Im Rahmen der ersten Datenerhebungsphase hatten die TeilnehmerInnen die Möglichkeit,
uns freiwillig eine Telefonnummer oder eine Mailadresse für künftige Kontaktaufnahmen
zu geben. Über die SchülerInnen, die uns diese Daten überlassen hatten, waren wir
anschließend in der Lage, auch Eltern als Gewährspersonen für die zweite
Erhebungsphase zu gewinnen. Mit dem „friend of a friend approach“ (Franke 2008: 109
111) konnten wir daraufhin von den ersten erwachsenen Kontaktpersonen ausgehend ein
größeres Netzwerk an TeilnehmerInnen aufbauen.
Die Sekundarschulen mit DaM-Unterricht befinden sich in der Hauptstadt Windhoek
(Deutsche Höhere Privatschule [DHPS] und Delta School Windhoek), in der Küstenstadt
Swakopmund (Private School Swakopmund und Namib High School) und in der im
Landesinneren gelegen Stadt Otjiwarongo (Otjiwarongo Secondary School). Aufnahmen
wurden außerdem in den kleineren Orten Otavi und Omaruru sowie auf Farmen in der
Umgebung von Windhoek, Witvlei, Omaruru und Otjiwarongo gemacht. Auf diese Weise
sind mit Khomas, Otjozondjupa, Erongo und Omaheke alle Regionen abgedeckt, in denen
Deutschsprachige in Namibia schwerpunktmäßig leben (vgl. Zimmer 2019). Abbildung 2
gibt einen Überblick über die Erhebungsorte. Um die Anonymität der TeilnehmerInnen
zu gewährleisten, werden die Farmen nicht konkreter lokalisiert.
Abbildung 2: Erhebungsorte in Namibia
9
3.2 Datenaufbereitung und -erschließung
Die Gesamtmenge an Daten, die mit der im vorigen Abschnitt beschriebenen
Vorgehensweise gesammelt werden konnten, überstieg deutlich die im Projekt
vorgesehenen Kapazitäten für die Transkription. Aus diesem Grund wurden
kriteriengeleitet Aufnahmen für die Transkription ausgewählt, während andere Audios
bislang noch nicht weiterbearbeitet wurden. Diese Audios werden in einer künftigen
Korpus-Version ebenfalls zugänglich.
Bei der Auswahl der zu transkribierenden Aufnahmen wurde generell darauf
geachtet, ein möglichst ausgewogenes Sample zu erstellen und dabei gleichermaßen
FarmerInnen wie StadtbewohnerInnen, SchülerInnen von Privat- und Staatsschulen und
SprecherInnen aus unterschiedlichen Gebieten Namibias zu berücksichtigen sowie die
drei Set-up möglichst ähnlich zu gewichten. Außerdem wurde im Zweifelsfall den
Aufnahmen mit SprecherInnen, die in Namibia geboren wurden, Vorrang gegeben.
Aufgrund des fortwährenden Zuzugs aus Europa sind allerdings auch ImmigrantInnen der
ersten Generation Teil der Community und haben ihren Anteil am zu dokumentierenden
Sprachgebrauch, weshalb wir diese SprecherInnen nicht kategorisch von der
Transkription ausgeschlossen haben. Darüber hinaus ermöglicht dies aufschlussreiche
Vergleiche der verschiedenen Gruppen. Insgesamt ist ein breites Spektrum an
Bildungsniveaus, Berufen und Altersgruppen abgedeckt, wobei Gespräche von bzw. mit
SchülerInnen der Geburtsjahrgänge 1999 bis 2003 einen Schwerpunkt im Korpus
darstellen.
Bei der Auswahl der freien Gespräche spielten darüber hinaus die Natürlichkeit und
die Lebendigkeit der Gespräche eine Rolle. Als Indikatoren dafür wurden verschiedene
Merkmale herangezogen: So wurden Gespräche tendenziell nicht berücksichtigt, wenn es
lange und häufige Gesprächspausen oder viele metasprachliche Kommentare gab, nur
einzelne TeilnehmerInnen sich am Gespräch beteiligten oder die vorgeschlagenen
Themen der Reihe nach abgehandelt wurden, ohne dass die Gruppe eigene
Gesprächsthemen einbrachte.
Die Transkription der ausgewählten Aufnahmen erfolgte nach den cGAT-minimal-
Richtlinien (Selting et al. 2009; Schmidt, Schütte & Winterscheid 2015) und mithilfe des
EXMARaLDA-Partitur-Editors (Schmidt 2016). Folglich wurde nicht phonetisch
transkribiert, sondern in literarischer Umschrift. Dieses System folgt in weiten Teilen der
Standardorthografie, erlaubt es aber gleichzeitig, typische Phänomene gesprochener
Sprache wie Elisionen, Kontraktionen, Wortabbrüche usw. abzubilden (Beispiele folgen
weiter unten). Gesprächspausen werden mit Angabe der Dauer (in Sekunden; z.B. (0.6))
ebenso dokumentiert wie Paraverbales (z.B. ((lacht))) und Nonverbales (z.B.
((Klingeln))).
Die ersten Versionen der Transkripte wurden von jeweils einem anderen Mitglied des
Transkriptionsteams kontrolliert. Bei der Kontrolle wurden Änderungsvorschläge in
Kommentaren festgehalten, anschließend von dem/der ursprünglichen TranskribentIn
überprüft, bei Bedarf besprochen und dann ggf. in das Transkript eingearbeitet. Nach
Transkription und Kontrolle der Transkripte durch das Transkriptionsteam erfolgte eine
weitere Kontrolle durch die deutschsprachige Namibierin Anika Kroll-Tjingaete
(University of Namibia, Windhoek). Dieser Arbeitsschritt war vor allem mit Blick auf
namibiaspezifische sowie afrikaanse und auch einige englische Tokens von großem Wert,
da diese von den deutschlanddeutschen TranskribentInnen nicht immer richtig erkannt
und entsprechend transkribiert werden konnten.
Im Rahmen der Transkription und der Kontrolle der Aufnahmen erfolgte auch die
Anonymisierung der Transkripte. Um die Anonymität der SprecherInnen zu
gewährleisten, wurden nicht nur Personennamen und spezifische Ortsangaben (z.B.
10
Farmnamen) anonymisiert, sondern auch alle anderen Aussagen, die Rückschluss auf die
Identität der sprechenden Person erlauben. Dazu wurden die Audio-Dateien an den zu
anonymisierenden Stellen akustisch maskiert. Für die Anonymisierung in den
Transkripten wurden vier Arten von Siglen angelegt:
1) Siglen für die SprecherInnen im Korpus. Diese sind folgendermaßen aufgebaut:
Der Anfang NAM kennzeichnet den Status als SprecherIn im Korpus.
Anschließend folgt eine dreistellige Zahl zur Identifikation sowie ein M oder W für
das Geschlecht des/der SprecherIn. Die abschließende Zahl zwischen 1 und 4
bezeichnet die Altersgruppe des/der SprecherIn: 1: 20 Jahre oder jünger; 2: 21-40
Jahre; 3: 41-60 Jahre, 4: über 60 Jahre. Dies ergibt eine vollständige Sigle wie z.B.
NAM001M1.
2) Siglen für die ForscherInnen, die Interviews geführt haben und/oder an den
„Sprachsituationen“ beteiligt waren: RES1 bis RES4. Siglen für die ForscherInnen
und alle anderen SprecherInnen im Korpus identifizieren die SprecherInnen nicht
nur in den Metadaten, sondern auch in den Transkripten, wenn die jeweilige Person
von anderen SprecherInnen erwähnt oder mit Namen angesprochen wird.
3) Siglen für einzelne Tokens, die anonymisiert wurden (z.B. Ortsnamen und Namen
von Personen, bei denen es sich nicht um SprecherInnen im Korpus handelt). Diese
sind zusammengesetzt aus dem Anfangsbuchstaben des anonymisierten Ausdrucks
und einer dreistelligen Zahl, z.B. N001.
4) Siglen für Äußerungen, die aus mehreren Tokens bestehen und anonymisiert
wurden. Solche längeren Passagen mussten z.B. anonymisiert werden, wenn durch
das Gesagte eine angesprochene oder erwähnte Person identifizierbar ist. Die
entsprechenden Siglen bestehen aus anonymisierte_Äußerung gefolgt von einer
dreistelligen Zahl, z.B. anonymisierte_Äußerung001.
Im Anschluss an die Transkription wurden verschiedene Annotationsschritte
durchgeführt. Die Annotationen wurden inline umgesetzt, d.h. unmittelbar in den
EXMARaLDA-Dateien in Form von weiteren Spuren für jedeN SprecherIn. Die
Transkripte beinhalten dadurch für alle SprecherInnen neben der ursprünglichen
Transkriptionsebene (trans), auch Informationen auf einer tokenisierten Ebene
(trans_tok), einer normalisierten Ebene (norm), Ebenen mit Wortart- und Lemma-
Annotationen (pos, lemma) und einer Ebene mit Annotationen für Tokens, die aus einer
Kontaktsprache stammen (FW); (vgl. Abbildung 3).
Abbildung 3: Transkriptions- und Annotationsspuren in einem EXMARaLDA-Transkript
11
Eine tokenisierte Ebene stellte die Grundlage für die weiteren Nachbearbeitungsschritte
dar. Tokenisierung bedeutete im Kontext unserer Datenbearbeitung die Erstellung einer
Spur in der EXMARaLDA-Transkriptdatei, auf der jedes Event genau ein Token enthält.
Ein Token ist dabei definiert als Text, der auf der ursprünglichen Transkriptionsebene
(trans) zwischen zwei Leerzeichen steht. Für diesen Arbeitsschritt wurde der Tokenisierer
des Programms Pepper (Zipser & Romary 2010) verwendet.
Beim Bearbeitungsschritt Normalisierung fand eine Anpassung des transkribierten
Textes statt. Auf der norm-Ebene entspricht die Schreibung der Tokens nicht cGAT,
sondern standarddeutscher Orthographie. Dies erleichtert zum einen die Suche im
Korpus. Zum anderen sind normalisierte Tokens notwendig, um bessere Resultate beim
Taggen von Lemmata und Wortarten zu erhalten (s. unten). Wichtig zu erwähnen ist, dass
die Normalisierung zwar eine orthographische Anpassung ans Standarddeutsche darstellt,
jedoch keine Ergänzungen oder „Korrekturen“ von Gesagtem vorgenommen wurden. Das
heißt insbesondere, dass syntaktische Nonstandard-Strukturen in Bezug auf Kasus,
Numerus, Genus, Reihenfolge usw. nicht normalisiert wurden. Entscheidungen über
Normalisierungen wurden auf Basis der (Online-Version der) Duden-Rechtschreibung
5
und der Richtlinien für die Normalisierung von cGAT-Transkripten für das Forschungs-
und Lehrkorpus Gesprochenes Deutsch (FOLK) (Winterscheid et al. 2019) getroffen.
Sofern ein Dudeneintrag vorlag, wurden auch Wörter mit den stilistischen Markierungen
„umgangssprachlich“ und „salopp“ entsprechend normalisiert. Das gilt beispielsweise für
Kontraktionen wie son oder aufm.
Die Normalisierung der Dateien wurde folgendermaßen umgesetzt: Auf einer Kopie
der trans_tok-Spur wurden die Tokens mithilfe eines Python-Skripts (falls notwendig)
durch eine normalisierte Variante ersetzt. Dafür wurde ein Ersetzungslexikon aus cGAT-
transkribierten Types und ihren normalisierten Entsprechungen verwendet. Dieses
Lexikon basiert auf dem Normalisierungs-Lexikon für das FOLK und wurde durch
korpus-spezifische Einträge ergänzt. Nach der automatischen Ersetzung wurde die
Normalisierung überprüft und manuell korrigiert.
Im nächsten Bearbeitungsschritt wurde ein POS- und Lemma-Tagging der
normalisierten Tokens vorgenommen. POS-Tags ermöglichen die Suche nach allen Types
einer Wortart und damit auch nach abstrakteren syntaktischen Konstruktionen. Die
Lemmatisierung vereinfacht die Suche, wenn alle Wortformen eines Lexems gefunden
werden sollen. Das verwendete POS-Tagset ist STTS 2.0 (Westpfahl 2014; Westpfahl et
al. 2017), eine speziell für die Annotation von Gesprächsdaten abgewandelte Version des
Stuttgart Tübingen Tagset (Schiller et al. 1999). Ergänzt wurde dieses Set durch drei
korpusspezifische Tags: SOART für die im Duden geführte Kontraktion son und ihre
Flexionsformen,
6
ATM für hörbares Atmen sowie META für in Doppelklammern auf der
Transkriptionsspur notierte paraverbale Äußerungen wie ((lacht)).
POS- und Lemma-Annotationen wurden automatisch mit EXMARaLDA (Dulko)
7
erstellt, einer Version des Partitur-Editors mit integriertem TreeTagger (Schmid 1995).
Dabei haben wir auf eine Parameterdatei zurückgegriffen, die auf einem Goldstandard aus
dem Korpus FOLK trainiert wurde (Westphal & Schmidt 2016). Da viele
kontaktsprachliche Types in unseren Daten vorhanden sind, die in den Trainingsdaten
fehlen dürften, wurde die Annotation in einem weiteren Schritt manuell optimiert. Dafür
haben wir Frequenzlisten von Types und deren Annotation generiert. Wenn ein Type
5
<www.duden.de> (zuletzt abgerufen am 25.10.2019).
6
Das Label wurde in Anlehnung an APPRART für eine Präposition mit inkorporiertem Artikel wie am
und zur gewählt (Schiller et al. 1999: 67).
7
S. https://bitbucket.org/nolda/exmaralda-dulko/src/default/ (letzter Zugriff am 23. September 2019).
12
einen POS-Tag mehr als fünf Mal erhalten hat, wurde geprüft, ob es sich dabei um einen
Fehler handelte und ggf. per automatischer Ersetzung ein anderer Tag vergeben.
8
Weiterhin bietet das Korpus auf der Ebene FM eine Annotation von
kontaktsprachlichen Tokens.
9
In den Daten findet sich, wie bereits angedeutet, ein
hoher Anteil von sprachlichem Material aus den lokalen Kontaktsprachen, insbesondere
aus Englisch und Afrikaans. Um dessen Identifikation zu erleichtern, wurden
entsprechende Tokens gesondert annotiert. Da keine Daten von vorneherein
ausgeschlossen werden sollten, wurde dabei eine sehr weite Definition von
kontaktsprachlichem Token zugrunde gelegt. So wurden z.B. auch englische Types
berücksichtigt, die als Teil des Standarddeutschen in Deutschland zählen können, wie
cool oder okay. Eine Differenzierung unterschiedlicher Arten von kontaktsprachlichen
Tokens ermöglicht die Annotation über die folgenden vier Merkmale, die für jedes
kontaktsprachliche Token kodiert sind:
1) GEBERSPRACHE: Welcher Gebersprache entstammt das Token?
2) SEQUENZ (±): Ist das Token Teil einer Folge mehrerer kontaktsprachlicher Tokens
(aus derselben Gebersprache) oder nicht?
3) INTEGRATION (±): Ist das Token morphologisch overt ins Deutsche integriert oder
nicht?
10
4) LEXIKONEINTRAG (±): Gibt es für das Token einen Eintrag im Duden oder nicht?
Annotations-Tags sind entsprechend aus vier Teilen aufgebaut wie z.B. A-S0-I0-L0 in
Abbildung 3. Die erste Komponente ist ein Buchstabe (E, A, O, U oder M) für die
Gebersprache des Tokens. Dabei steht E für Englisch, A für Afrikaans, O für other (=
andere namibische Kontaktsprachen), U für unknown (= das Token ist
höchstwahrscheinlich kontaktsprachlicher Herkunft, die Gebersprache jedoch unbekannt)
und M für multiple (bei Komposita aus mehreren Gebersprachen). Die weiteren
Komponenten des Tags bestehen jeweils aus einem Buchstaben gefolgt von 0 oder 1. Der
Buchstabe ist ein Kürzel für jeweils ein Merkmal: S für Sequenz, I für Integration, L für
Lexikoneintrag. Die folgende Ziffer gibt an, ob das Merkmal ausgeprägt ist oder nicht: 1
steht für ja, 0 für nein. Das Beispiel aus Abbildung 3 zeigt also, dass es sich bei net um
eine Übernahme aus dem Afrikaansen handelt (A), die hier nicht innerhalb einer Folge
mehrere afrikaanser Tokens auftritt (S0), keine overte Integration ins Deutsche aufweist
(I0) und nicht im Duden steht (L0).
Bei den kontaktsprachlichen Tokens ist zusätzlich vermerkt, wenn ein
kontaktsprachliches Token im Zuge eines constructed dialogue, also einer Wiedergabe
von (realer oder fiktiver) wörtlicher Rede, oder metasprachlich verwendet wird. In diesen
Fällen beinhaltet das Tag ein Suffix: -c für constructed dialogue bzw. -m für
Metasprachliches.
8
Es gab dabei Fälle, in denen Types mehr als einen möglichen POS-Tag haben (z.B. braaien als finite
(VVFIN) oder infinite Form (VVINF)). In diesen Fällen wurde nach der Auswertung von Stichproben eine
Entscheidung für die häufigere Angabe getroffen.
9
Diese Annotationsebene ist aus technischen Gründen in der aktuellen Version der DGD noch nicht
verfügbar, wird aber in einem künftigen Release zugänglich gemacht.
10
Als Fälle von morphologischer Integration ins Deutsche betrachten wir erstens kontaktsprachliche
Tokens, die eine deutsche Flexion aufweisen, die in der Gebersprache an dieser Stelle nicht verwendet
würde, und zweitens Komposita, die aus deutschen und kontaktsprachlichen Gliedern bestehen (z.B.
Babystimme). Alle Tokens, die zu nicht-flektierbaren Wortklassen gehören, sind per Definition nicht overt
integriert.
13
Die Einordnung von Sprachmischungsphänomenen in Kategorien wie Codeswitching,
Borrowing, etc. ist umstritten (vgl. Poplack 2018). Auf eine solche Einteilung wurde
daher bei der Annotation der kontaktsprachlichen Tokens im Korpus zugunsten der
genannten theorieneutralen Merkmale verzichtet. Nichtsdestoweniger stellen die
Merkmale mögliche Kriterien für eine solche Einteilung dar. So ließen sich bspw. alle
Tokens, die Teil einer Sequenz sind, in der keine morphologische Integration zu
beobachten ist, als Instanzen von Codeswitching auffassen. Ebenso kann ein
Dudeneintrag als Hinweis auf ein etabliertes Lehnwort betrachtet werden.
3.3 Eigenschaften des Korpus
Das Korpus umfasst über 18 Stunden transkribiertes Audio-Material und hat einen
Umfang von 224.392 Tokens.
11
Tabelle 1 gibt einen Überblick über die Verteilung auf die
drei verwendeten Set-ups.
Methode
Tokens
Laufzeit
SprecherInnen12
Aufnahmen
freie Gespräche
115.004
9:15:00 Stunden
65
21
„Sprachsituationen“
51.509
4:41:30 Stunden
103
198
Interviews
57.879
4:42:15 Stunden
15
7
gesamt
224.392
18:38:45 Stunden
110
226
Tabelle 1: Zusammenstellung des Korpus
Enthalten sind Aufnahmen von 110 SprecherInnen im Alter von 14 bis 75 Jahren (58
Sprecher, 52 Sprecherinnen). Das Material verteilt sich auf 226 Aufnahmen. Da mit den
TeilnehmerInnen in der Regel Aufnahmen in allen drei Set-ups durchgeführt wurden,
konnte pro SprecherIn oft mehr als ein Datentyp transkribiert werden, was intra-
individuelle Vergleiche zwischen den verschiedenen Set-ups ermöglicht.
13
Die
„Sprachsituationen“ liegen systematisch paarweise vor (für 99 SprecherInnen: formelles
und informelles Setting).
14
Komplementiert werden die Korpusdaten durch ausführliche Metadaten. Diese können
in der DGD angezeigt, exportiert und zum Filtern verwendet werden (s. unten). Neben
Informationen zum Set-up der jeweiligen Datenerhebung (z.B. Interview) sind vor allem
Information zu den SprecherInnen verfügbar. Dazu zählen generelle persönliche Angaben
wie Geburtsort, Geburtsjahr, Geschlecht, Wohnort, Beruf usw. Als Zusatzmaterial ist
darüber hinaus eine ganze Reihe weiterer (sprach-)biographischer Merkmale, etwa eigene
Sprachkenntnisse, Sprachkenntnisse der Eltern, Sprachgebrauch im Freundeskreis,
Kontakthäufigkeit mit Deutschland-Deutschen sowie Details zur eigenen Immigration
oder der Immigration der Vorfahren hinterlegt. Für SchülerInnen, die an der ersten
Erhebungsphase beteiligt waren, wurden darüber hinaus Medienkonsum und der
Gebrauch des Deutschen in verschiedenen Domänen erfasst. Eine vollständige Liste aller
als Metadaten verfügbaren Variablen und deren Merkmalausprägungen ist in der DGD
11
Die hier genannte Anzahl an Tokens bezieht sich auf die Transkriptions-Ebene im Korpus.
Annotationen und Normalisierungen wurden ebenso wie Klammern (zur Markierung nonverbaler
Handlungen) nicht mitgezählt.
12
In dieser Spalte werden nur die deutschsprachigen NamibierInnen aufgeführt. Hinzu kommen die an
der Datenerhebung beteiligten WissenschaftlerInnen mit den Siglen (RES1 bis RES4).
13
Dementsprechend ergibt sich die Gesamtzahl der SprecherInnen in Tabelle 1 nicht aus der Summe an
SprecherInnen in den einzelnen Set-ups.
14
Die Zahl von 103 SprecherInnen ergibt sich, weil z.T. weitere Personen im informellen Setting als
antwortende GesprächspartnerIn beteiligt waren (s. oben).
14
abrufbar. Zentrale Hintergrundinformationen und die Funktionsweise dieser Datenbank
werden im folgenden Abschnitt thematisiert.
3.4 Die Datenbank für Gesprochenes Deutsch
Als Forschungsdatenzentrum für Korpora gesprochener Sprache hat das Archiv für
Gesprochenes Deutsch (AGD) den Auftrag, Daten aus abgeschlossenen
Forschungsprojekten zu übernehmen, dauerhaft zu archivieren und für eine Nachnutzung
aufzubereiten und zugänglich zu machen. Im Falle des Namdeutsch-Projekts wurde ein
neues Modell für solche Datenübernahmen erprobt: Indem das Projekt bereits ab der
Konzeptionsphase und über die gesamte Laufzeit hinweg beratend begleitet wurde,
konnte der Aufwand zur Aufbereitung nach Datenübernahme am Projektende deutlich
reduziert werden. Das primäre Instrument zur Weitergabe und Nutzung aufbereiteter
AGD-Daten ist die Datenbank für Gesprochenes Deutsch (DGD https://dgd.ids-
mannheim.de), deren Grundfunktionalität im Folgenden kurz skizziert wird. Eine
ausführlichere Darstellung der DGD findet sich beispielsweise in Schmidt (2014),
praktische Hilfestellungen zur Verwendung (Video-Tutorials, Handreichungen) im Hilfe-
Menü der Anwendung selbst.
Wegen der datenschutzrechtlich sensiblen Natur vieler Daten in der DGD (so auch
beim DNam-Korpus) ist deren Nutzung auf Zwecke der akademischen Forschung und
Lehre beschränkt, was eine einmalige kostenlose persönliche Registrierung notwendig
macht. Interessierte NutzerInnen sind aufgefordert, hier Kontaktdaten zu nennen und zu
spezifizieren, für welchen Zweck der Zugang zur DGD benötigt wird. Nach
entsprechender positiver Prüfung der Angaben erhalten sie Zugangsdaten zum Login.
Die Plattform bietet Funktionalität erstens zum Browsen (Anhören, Ansehen) der
Korpusdaten, zweitens zur systematischen Recherche (auf transkribiertem und
annotiertem Material, auf Metadaten), drittens zum Download von Ausschnitten oder
ausgewählten vollständigen Datensätzen. Dabei sind alle zu einem Korpus gehörigen
Daten in vielfältiger Weise miteinander verknüpft, d.h. das Alignment zwischen
Transkription und Aufnahme, die Zuordnung von Metadaten zu Gesprächsaufnahmen und
SprecherInnen sowie die verschiedenen Annotationsebenen des Korpus sind an jeder
Stelle der Plattform für Exploration und Analyse der Korpusdaten zugreifbar.
Beispielsweise wird die Verknüpfung genutzt, um beim Lesen eines Transkripts in der
Browsing-Ansicht den zugehörigen Ausschnitt der Audio-Aufnahme aufzurufen, oder um
zu einem Recherchetreffer Informationen zum betreffenden Sprecher bzw. zur
betreffenden Sprecherin anzuzeigen.
Für vollständig transkribierte und reichhaltig annotierte Daten, wie sie im DNam-
Korpus vorliegen, ist vor allem die sog. Token-Recherche (im DGD-Menü unter:
Recherche > Tokens) ein mächtiges und flexibles Instrument zum Arbeiten mit den
Korpusdaten. Die Tokenrecherche erlaubt zunächst gezielte Abfragen auf dem Korpus
nach einzelnen Wortformen. Dabei können Informationen auf verschiedenen
Annotationsebenen miteinander verknüpft und reguläre Ausdrücke zur Spezifizierung von
Zeichenmustern werden. Das Ergebnis einer solchen Recherche wird mit den genannten
Verknüpfungen als Keyword in Context (KWIC)-Konkordanz dargestellt (vgl. Abbildung
4).
15
Abbildung 4: Tokenrecherche in der DGD, hier am Beispiel einer Suche nach gelaufen
Ausgehend von dieser initialen KWIC-Konkordanz bietet die DGD vielfältige
Möglichkeiten, mit Suchergebnissen zu interagieren, sie zu erweitern, zu verfeinern oder
weiter zu verarbeiten. Dazu gehören:
die Möglichkeit, einzelne Treffer im größeren Transkriptkontext anzuzeigen und
dabei auch auf das zugehörige Audio zuzugreifen (Zeile 3),
die Möglichkeit, einzelne Suchergebnisse manuell an- oder abzuwählen,
beispielsweise, um falsche Positive auszusortieren (Zeilen 13 und 14),
Kontextfilter, über die das Suchergebnis nach Vorkommen von spezifischen
Tokens im linken oder rechten Kontext weiter eingeschränkt werden kann
(fettgedruckte Tokens in der KWIC),
Metadatenfilter, über die Treffer mit Metadaten zu Aufnahmen und/oder
SprecherInnen korreliert werden können (zusätzliche Spalte „Art“, die sich auf das
Set-up der Aufnahme bezieht),
die Möglichkeit, den zu einem Treffer gehörenden Audio- und
Transkriptausschnitt auf den lokalen Rechner herunterzuladen und dort weiter zu
verarbeiten (z.B. um akustische Messungen mit einem Tool wie Praat
vorzunehmen).
Auf diese Weise lassen sich mithilfe der DGD verschiedene qualitativ oder quantitativ
orientierte Fragestellungen an das DNam-Korpus computergestützt bearbeiten. Da die
DGD auch korpusübergreifende Abfragen erlaubt, besteht zudem bei gebotener
methodischer Vorsicht, die insbesondere die unterschiedlichen Erschließungsformen der
anderen DGD-Korpora gebührend berücksichtigt die Möglichkeit kontrastierender
Untersuchungen, z.B. mit dem Forschungs- und Lehrkorpus Gesprochenes Deutsch, das
standardnahes gesprochenes Deutsch im deutschsprachigen Kerngebiet erfasst, oder mit
Korpora wie Australiendeutsch, die andere extraterritoriale Varietäten des Deutschen
dokumentieren.
16
4 Erste Analyseergebnisse
In diesem Abschnitt illustrieren wir kurz die Nutzungsmöglichkeiten des DNam-Korpus
anhand zweier Bereiche, nämlich der Registerdifferenzierung und der Kasus-Verwendung
(für ausführliche Analysen hierzu s. Wiese & Bracke i. Ersch. und Zimmer einger.).
Um Aufschluss über die intra-individuelle Variation von SprecherInnen in Form von
Registerdifferenzierung zu erhalten, die an die Formalität der jeweiligen Situation
geknüpft ist, bieten sich die durch das Set-up „Sprachsituationen“ gewonnenen Daten in
besonderer Weise an. Mithilfe der pro SprecherIn paarweise vorliegenden Aufnahmen
können systematische Vergleiche angestellt werden, um registerspezifische und
registerübergreifende Merkmale zu identifizieren, die dann noch weitere Vergleiche
innerhalb dieser Daten (z.B. nach Geschlecht oder Altersgruppe von SprecherInnen)
zulassen und auch mit Daten aus anderen Set-ups abgeglichen werden können. Auf diese
Weise können z.B. Befunde zum Varietätengefüge des namibischen Deutschen
interpretiert werden, die auch für die Frage nach einer spezifischen namibischen
Ausprägung des Standarddeutschen relevant sind (s. oben).
Im Hinblick auf registerspezifischen Sprachgebrauch liefern die Korpusdaten
interessante Hinweise auf den differenziellen Gebrauch lexikalischer und grammatischer
namdeutscher Charakteristika und ihre Interaktion mit einstellungsbezogenen Befunden
(vgl. Wiese & Bracke i. Ersch.). Für die informellen „Sprachsituationen“-Daten sind
insbesondere lexikalische Entlehnungen charakteristisch (vgl. (1) bis (3)), während die
formellen Daten typische Gehobenheitsmarker enthalten (vgl. (4) und (5)):
(1) da war like sone alte oma (NAM025M1)
(2) ich denk ihr phone war gebrochn (NAM062W1)
(3) un dann kommt sone tannie da an (NAM019M1)
(4) alles was da drin war is rausgefalln und somit auch ihr telefon (NAM022W1)
(5) da hat sich ein unfall ereignet wo eine ältre dame von eim amarok angefahrn
wurde (NAM025M1)
Die Häufigkeit lexikalischer Entlehnungen kann auf Grundlage der Korpusdaten als ein
konstitutives Merkmal für informelle Register des Namdeutschen identifiziert werden.
Zugleich gibt es aber interessante lexemspezifische Unterschiede: So sind zwar Lexeme
wie like und phone mit informellen Daten assoziiert, aber stampen und Trolley haben
einen vergleichsweise hohen Anteil von Vorkommnissen auch in den formellen
Bedingungen (vgl. auch Kroll-Tjingaete 2018 zu Entlehnungen in Zeitungstexten).
Nichtkanonische grammatische Charakteristika scheinen besonders dann mit dem
informellen Register assoziiert, wenn sie auch lexikalischen Transfer involvieren (Wiese
& Bracke i. Ersch.): So ist das nichtkanonische Muster seer/weh kriegen, das eine
semantisch-konstruktionelle Lücke im Deutschen schließt, in der Variante seer kriegen
mit lexikalischer Entlehnung charakteristisch für das informelle Register; die Variante
weh kriegen mit nativ-deutschen Lexemen findet sich dagegen ebenso in der formellen
Bedingung. Weitere nichtkanonische grammatische Phänomene, die auch für formelle
Register im Korpus belegt sind, sind das vermutlich kontaktbasierte Muster spät
sein/kommen sowie zwei Entwicklungen, die zusätzlich durch binnenstrukturelle
Dynamiken des Deutschen gestützt sein könnten, nämlich Verwendungen von haben
anstelle von sein bei Perfektbildungen mit Bewegungsverben und Belege für helfen mit
Akkusativ-Komplement (Wiese & Bracke i. Ersch.).
17
So ist Beispiel (6) den Aufnahmen aus einer formellen Sprachsituation entnommen,
während Beispiel (7) einer informellen Situation entstammt.
(6) da war ne alte frau die hat in der straße gelaufn und auf einmal kam ein auto
(NAM066M1)
(7) die hat da auf der straße gelaufn mit_n handy in der hand (NAM064W1)
Dass sowohl lexikalische als auch grammatische Charakteristika im formellen Register
auftreten, kann als möglicher Hinweis auf die Entwicklung einer namibischen
Standardvarietät des Deutschen interpretiert werden.
Die Befunde zum Sprachgebrauch passen zu einstellungsbezogenen Mustern, die sich
in den Korpusdaten aus soziolinguistischen Interviews zeigen. Hier finden sich Hinweise
auf ein Spannungsfeld zwischen Standardsprachideologien und sprachpuristischen
Einstellungen auf der einen Seite und die Abgrenzung gegenüber Deutschland im Sinne
einer lokalen, „namibischen“ Identität auf der anderen Seite (vgl. hierzu etwa auch
Schmidt-Lauber 1998; Kellermeier-Rehbein 2015). Während erstere einen
Sprachgebrauch stützen, der nah an der deutschlanddeutschen Standardsprache ist, kann
die lokale Identifizierung lexikalische Entlehnungen begünstigen. Die im Korpus deutlich
werdenden Registerdifferenzierungen reduzieren diese Spannung durch eine deutliche
Unterscheidung formeller und informeller Varianten, bei der insbesondere lexikalische
Entlehnungen für informelle Register salient zu sein scheinen Wiese & Bracke i. Ersch.).
Weitere Korpusstudien, die Erkenntnisse, die sich aus dem DNam-Korpus gewinnen
lassen, illustrieren, liegen für den Bereich der Kasus-Verwendung im Namdeutschen vor.
Wie in so gut wie allen deutschen Kontakt-Varietäten ist auch im Namdeutschen
Variation in diesem Bereich zu beobachten (zum Kasusgebrauch in anderen deutschen
Kontakt-Varietäten s. z.B. Franke 2008, Boas 2009, Yager et al. 2015, Rosenberg 2016).
Die Variation im Namdeutschen illustrieren die folgenden Beispiele:
(8) dann is sie umgefalln mit ihr handy (NAM097M1)
(9) die frau is mit ihrm handy gelaufn (NAM123M1)
Mithilfe des DNam-Korpus kann dieser Phänomenbereich nun empirisch fundiert
analysiert werden (vgl. Zimmer einger.). So zeigt sich z.B.,
a) dass deutschsprachige NamibierInnen Kasus in aller Regel in Einklang mit dem
deutschen Standarddeutschen verwenden und Strukturen wie in (8) eher eine Ausnahme
darstellen,
b) dass von der Variation vor allem Kontexte betroffen sind, in denen im
(deutschlanddeutschen) Standarddeutschen ein Dativ verwendet wird, während
Akkusativ-Kontexte im Standarddeutschen und im Namdeutschen nahezu identisch sind,
c) dass Dative wesentlich stabiler via Personalpronomen kodiert werden als z.B. durch
Artikel.
Vor allem die beiden letztgenannten Punkte treffen ebenso auch auf zahlreiche andere
deutsche Kontaktvarietäten zu (vgl. z.B. Salmons 1994, Van Ness 1994, de Kadt 2001,
Yager et al. 2015, Rosenberg 2018 usw.), was auf sprach- und varietätenübergreifend
wirksame Prinzipien hinweist, die sich hier als relevanter herausstellen als z.B. die
konkreten Kontaktsprachen des Deutschen.
18
Auch für solche Bereiche ermöglicht es das DNam-Korpus, auch systematisch
soziolinguistische Variablen einzubeziehen. Beim Kasus-Gebrauch zeigt sich z.B. ein
signifikanter Unterschied zwischen den verschiedenen Schulen, die die SprecherInnen
besuch(t)en. Hier sticht vor allem die einzige deutsche Auslandsschule, die DHPS,
heraus. Auch das Geschlecht der SprecherInnen ist bedeutsam ebenso wie die L1 der
Elternteile, vor allem die L1 der Mutter (vgl. Zimmer einger.). Dies verdeutlicht, dass die
durch das DNam-Korpus ermöglichte systematische Berücksichtigung von
grammatischen und soziolinguistischen Variablen entscheidend zum Verständnis des
deutschen Sprachgebrauchs in Namibia beitragen kann; insbesondere auch für
quantitative Analysen kann die Ressource gewinnbringend genutzt werden.
5 Fazit
Wie wir im vorliegenden Beitrag gezeigt haben, liegt mit dem DNam-Korpus eine
Ressource vor, die den Sprachgebrauch und die Spracheinstellungen innerhalb einer
deutschsprachigen Minderheit dokumentiert, die sprachwissenschaftlich besonders
interessant ist wegen ihrer Vitalität und dem ungebrochenen Ausbau des Deutschen in
formelle und informelle Register sowie wegen ihres soziolinguistischen Status als
Kennzeichen einer ethnischen Minderheit. Das Korpus erlaubt sowohl Untersuchungen,
die sich spezifisch dieser Community widmen, als auch vergleichende Studien. So besteht
nun die Möglichkeit, das Deutsche in Namibia bei datenbasierten und
varietätenübergreifenden Untersuchungen einzubeziehen und beispielsweise mit Texas
German (vgl. z.B. Boas 2009b) oder dem Kiezdeutschen (vgl. Wiese 2012) zu
kontrastieren. Das Deutsche in Namibia kann dabei eine wertvolle Vergleichsfolie
darstellen, deren sprachliche und sprachexterne Spezifika für kontrastive
Herangehensweisen gezielt genutzt werden können (Wiese et al. 2014; zum
vergleichenden Ansatz s. z.B. auch Rosenberg 2003). Nicht zuletzt deshalb hoffen wir,
mit unserem Korpus eine nützliche Ressource erstellt zu haben, die für eine große
Bandbreite an Forschungsfragen genutzt wird und zu einem vertieften Verständnis des
Zusammenspiels von Sprachkontakt, -wandel und -variation sowie Spracheinstellungen
und -ideologien beitragen kann.
Literatur
Ammon, Ulrich. 2014. Die Stellung der deutschen Sprache in der Welt. Berlin: de
Gruyter.
Ammon, Ulrich, Hans Bickel & Alexandra N. Lenz (Hrsg.). 2016. Variantenwörterbuch
des Deutschen. Die Standardsprache in Österreich, der Schweiz, Deutschland,
Liechtenstein, Luxemburg, Ostbelgien und Südtirol sowie Rumänien, Namibia und
Mennonitensiedlungen. 2. Aufl. Berlin & Boston: de Gruyter.
Boas, Hans C. 2009a. Case loss in Texas German. In Jóhanna Barðdal & Shobhana L.
Chelliah (Hrsg.), The Role of Semantic, Pragmatic and Discourse Factors in the
Development of Case, 347376. Amsterdam & Philadelphia: Benjamins.
Boas, Hans C. 2009b. The Life and Death of Texas German. (Publications of the
American Dialect Society 93). Durham, NC: Duke University Press.
Böhm, Michael Anton. 2003. Deutsch in Afrika: die Stellung der deutschen Sprache in
Afrika vor dem Hintergrund der bildungs- und sprachpolitischen Gegebenheiten
sowie der deutschen auswärtigen Kulturpolitik. (Duisburger Arbeiten zur Sprach-
und Kulturwissenschaft 52). Frankfurt am Main: Lang.
Deumert, Ana. 2009. Namibian Kiche Duits: the making (and decline) of a neo-African
language. Journal of Germanic Linguistics 21. 349417.
19
Deumert, Ana. 2018. Settler colonialism speaks: Early contact varieties in Namibia
during German colonial rule. Language Ecology 2. 91111.
Dück, Katharina. 2018. Namibia. In Albrecht Plewnia & Claudia M. Riehl (Hrsg.),
Handbuch der deutschen Sprachminderheiten in Übersee, 109130. Tübingen:
Narr/Francke/Attempto.
Duden-Rechtschreibung. 2017. Die deutsche Rechtschreibung. 27. Aufl. (Duden 1).
Berlin: Dudenverlag.
Franke, Katharina. 2008. „We call it Springbok-German!“: language contact in the
German communities in South Africa. PhD Diss. Monash University.
Gretschel, Hans-Volker. 1995. The status and use of the German language in independent
Namibia: Can German survive the transition? In Martin Pütz (Hrsg.),
Discrimination through Language in Africa? Perspectives on the Namibian
Experience, 299313. Berlin & New York: de Gruyter.
de Kadt, Elizabeth. 2001. “You still speak German?”: Teenage language skills in a
German-speaking community. In Tom Ammerlaan (Hrsg.), Sociolinguistic and
Psycholinguistic Perspectives on Maintenance and Loss of Minority Languages,
6172. Münster et al.: Waxmann.
Kellermeier-Rehbein, Birte. 2016. Sprache in postkolonialen Kontexten. Varietäten der
deutschen Sprache in Namibia. In Thomas Stolz, Ingo H. Warnke & Daniel
Schmidt-Brücken (Hrsg.), Sprache und Kolonialismus, 213234. Berlin & Boston:
de Gruyter.
Kroll-Tjingaete, Anika. 2018. Strukturelle Veränderungen der deutschen Sprache in
Namibia: eine textanalytische Untersuchung. (Hochschulschriften 51). Berlin:
trafo.
Poplack, Shana (2018). Borrowing: Loanwords in the Speech Community and in the
Grammar. Oxford Unversity Press.
Pütz, Martin. 1991. ‘Südwesterdeutsch’ in Namibia: Sprachpolitik, Sprachplanung und
Spracherhalt. Linguistische Berichte 136. 455476.
Pütz, Martin. 1995. Official monolingualism in Africa. In Martin Pütz (Hrsg.),
Discrimination through Language in Africa?, 155173. (Contributions to the
Sociology of Language 69). Berlin & New York: Mouton de Gruyter.
Rosenberg, Peter. 2003. Comparative speech island research: Some results from studies in
Russia and Brazil. In William Keel & Klaus J. Mattheier (Hrsg.), Deutsche
Sprachinseln weltweit: Interne und externe Perspektiven German Language
Varieties Worldwide: Internal and External Perspectives, 199238.
Rosenberg, Peter. 2016. Regularität und Irregularität in der Kasusmorphologie deutscher
Sprachinselvarietäten (Russland, Brasilien). In Andreas Bittner & Klaus-Michael
Köpcke (Hrsg.), Regularität und Irregularität in Phonologie und Morphologie:
Diachron, kontrastiv, typologisch. (Lingua Historica Germanica 13). Berlin &
Boston: de Gruyter.
Rosenberg, Peter. 2018. Überflutete Sprachinseln: Sprachvariation, Sprachwechsel und
Sprachwandel in deutschen Sprachinseln in Russland und Brasilien. In Alexandra
N. Lenz & Albrecht Plewnia (Hrsg.), Variation Normen Identitäten, 263282.
Berlin & Boston: de Gruyter.
Salmons, Joseph C. 1994. Naturalness and morphological change in Texas German. In
Nina Berend & Klaus J. Mattheier (Hrsg.), Sprachinselforschung: Eine
Gedenkschrift für Hugo Jedig, 5973. Frankfurt am Main: Lang.
Schiller, Anne, Simone Teufel, Christine Stöckert & Christine Thielen. 1999. Guidelines
für das Tagging deutscher Textcorpora mit STTS. (Kleines und großes Tagset).
Universität Stuttgart, Institut für maschinelle Sprachverarbeitung; Universität
Tübingen, Seminar für Sprachwissenschaft.
20
Schmid, Helmut. 1995. Improvements in part-of-speech tagging with an application to
German. Proceedings of the ACL SIGDAT-Workshop. Dublin.
Schmidt, Thomas. 2014. The Database for Spoken German DGD2. In Nicoletta
Calzolari, Khalid Choukri, Thierry Declerck, Hrafn Loftsson, Bente Maegaard,
Joseph Mariani, Asuncion Moreno, Jan Odijk & Stelios Piperidis (Hrsg.),
Proceedings of the Ninth Conference on International Language Resources and
Evaluation (LREC’14). Reykjavik: European Languages Resources Association
(ELRA).
Schmidt, Thomas. 2016. EXMARaLDA Partitur-Editor. Manual.
<http://www.exmaralda.org/pdf/Partitur-Editor_Manual.pdf>.
Schmidt, Thomas, Wilfried Schütte & Jenny Winterscheid. 2015. cGat. Konventionen für
das computergestützte Transkribieren in Anlehnung an das Gesprächsanalytische
Transkriptionssystem 2 (GAT2). <http://agd.ids-
mannheim.de/download/cgat_handbuch_version_1_0.pdf>.
Schmidt-Lauber, Brigitta. 1998. Die verkehrte Hautfarbe: Ethnizität deutscher Namibier
als Alltagspraxis. (Lebensformen 10). Berlin: Reimer.
Selting, Margret, Peter Auer, Dagmar Bart-Weingarten, Jörg Bergmann, Pia Bergmann,
Karin Birkner, Elizabeth Couper-Kuhlen, u. a. 2009. Gesprächsanalytisches
Transkriptionssystem 2 (GAT 2). Gesprächsforschung Online-Zeitschrift zur
verbalen Interaktion 10. 353402.
Shah, Sheena. 2007. German in a contact situation: The case of Namibian German.
eDUSA 2. 2045.
Shah, Sheena & Marianne Zappen-Thomson. 2018. German in Namibia. In Corinne A.
Seals & Sheena Shah (Hrsg.), Heritage Language Policies around the World,
128147. Abingdon & New York: Routledge.
Van Ness, Silke. 1994. Pennsylvania German. In Ekkehard König & Johan Van der
Auwera (Hrsg.), The Germanic Languages, 420438. London: Routledge.
Westpfahl, Swantje. 2014. STTS 2.0? Improving the Tagset for the Part-of-Speech-
Tagging of German Spoken Data. In Lori Levin & Manfred Stede (Hrsg.), LAW
VIII The 8th Linguistic Annotation Workshop. Dublin: Association for
Computational Linguistics and Dublin City University.
Westpfahl, Swantje & Thomas Schmidt. 2016. FOLK-Gold A GOLD standard for Part-
of-Speech-Tagging of Spoken German. In Nicoletta Calzolari, Khalid Choukri,
Thierry Declerck, Sara Goggi, Marko Grobelnik, Bente Maegaard, Joseph
Mariani, Hélène Mazo, Asunción Moreno, Jan Odijk & Stelios Piperidis (Hrsg.),
Proceedings of the Tenth Conference on International Language Resources and
Evaluation (LREC’16), Portorož, Slovenia. Paris: European Language Resources
Association (ELRA), 1493-1499.
Westpfahl, Swantje, Thomas Schmidt, Jasmin Jonietz & Anton Borlinghaus. 2017. STTS
2.0. Guidelines für die Annotation von POS-Tags für Transkripte gesprochener
Sprache in Anlehnung an das Stuttgart Tübingen Tagset (STTS). Version 1.1,
März 2017.
Wiese, Heike. 2012. Kiezdeutsch. Ein neuer Dialekt entsteht. München: Beck.
Wiese, Heike. 2014. Wenker-Namdeutsch. www.linguistik.hu-
berlin.de/de/institut/professuren/multilinguale-
kontexte/Projekte/Namdeutsch/Korpusdaten/NamDeutsch-Wenker.
Wiese, Heike. i. Ersch. Language Situations: A method for capturing variation within
speakers’ repertoires. In Yoshiyuki Asahi (Hrsg.), Methods in Dialectology XVI.
(Bamberg Studies in English Linguistics). Frankfurt am Main: Lang.
21
Wiese, Heike & Yannic Bracke. i. Ersch. Registerdifferenzierung im Namdeutschen:
Informeller und formeller Sprachgebrauch in einer vitalen Sprechergemeinschaft.
In Csaba Földes (Hrsg.), Kontaktvarietäten des Deutschen im Ausland. Tübingen:
Narr.
Wiese, Heike & Maria Pohle. 2016. „Ich geh Kino“ oder „… ins Kino“? Zeitschrift für
Sprachwissenschaft 35. 171216.
Wiese, Heike, Horst J. Simon, Marianne Zappen-Thomson & Kathleen Schumann. 2014.
Deutsch im mehrsprachigen Kontext: Beobachtungen zu lexikalisch-
grammatischen Entwicklungen im Namdeutschen und im Kiezdeutschen.
Zeitschrift für Dialektologie und Linguistik 81. 274307.
Wiese, Heike, Horst J. Simon, Christian Zimmer & Kathleen Schumann. 2017. German in
Namibia: A vital speech community and its multilingual dynamics. Language &
Linguistics in Melanesia. 221245.
Winterscheid, Jenny, Arnulf Deppermann, Thomas Schmidt Wilfried Schütte, Evi Schedl
& Julia Kaiser. 2019. Normalisieren mit OrthoNormal. Konventionen und
Bedienungshinweise für die orthografische Normalisierung von FOLKER-
Transkripten. Mannheim: Leibniz-Institut für Deutsche Sprache
[https://doi.org/10.14618/ids-pub-9326].
Yager, Lisa, Nora Hellmold, Hyoun-A Joo, Michael Putnam, Eleonora Rossi, Catherin
Stafford & Joseph C. Salmons. 2015. New structural patterns in moribund
grammar: case marking in heritage German. Frontiers in Psychology 6. 1716.
Zappen-Thomson, Marianne. 2019. Stützung des Spracherhalts bei deutschsprachigen
Minderheiten: Namibia. In Ulrich Ammon & Gabriele Schmidt (Hrsg.),
Förderung der deutschen Sprache weltweit, 517530. Berlin & Boston: de
Gruyter.
Zimmer, Christian. 2019. Deutsch als Minderheitensprache in Afrika. In Joachim Herrgen
& Jürgen Erich Schmidt (Hrsg.), Sprache und Raum Deutsch. Ein
internationales Handbuch der Sprachvariation, 11761190. (Handbücher zur
Sprach- und Kommunikationswissenschaft 30.4). Berlin: De Gruyter Mouton.
Zimmer, Christian. i. Ersch. Linguistic variation and age of speakers in Namibian
German: loan word usage in “Wenker sentences”. In Hans C. Boas (Hrsg.),
German Abroad: Comparative Perspectives on language Contact. Leiden: Brill
Zimmer, Christian. einger. Kasus im Namdeutschen.
Zipser, Florian & Laurent Romary. 2010. A model oriented approach to the mapping of
annotation formats using standards. In Nicoletta Calzolari, Khalid Choukri, Bente
Maegaard, Joseph Mariani, Jan Odijk, Stelios Piperidis, Mike Rosner & Daniel
Tapias (Hrsg.), Proceedings of the Workshop on Language Resource and
Language Technology Standards (LREC 2010). Valletta: European Languages
Resources Association (ELRA).
ResearchGate has not been able to resolve any citations for this publication.
Conference Paper
Full-text available
In this paper, I describe a 'Language Situations' method that allows us to systematically tap into speakers' repertoires: it captures naturalistic productions across different communicative situations, including informal as well as formal, and written as well as spoken settings. In order to do so, the 'Language Situations' method combines the advantages of controlled elicitations with those of spontaneous data collection. In this design, participants are familiarised with a fictional event. They are asked to imagine being a witness to this event and describe it in different communicative situations, e.g., in a phone call and in a WhatsApp message to friends, in a conversation with a stranger or in a formal written report. I show that the method is flexible enough to be adapted for different speaker populations and research questions, it is easy to apply, yet powerful enough to yield comparable, naturalistic data that captures register-bound choices within and across speakers, speech communities, and languages
Article
During the last decades, “natural” has often been used by linguists in an inductive or even anecdotal way as a synonym of “intuitively plausible” or of “cross‐linguistically frequent,” in reference to both synchrony and diachronic change. In more theoretical views, it often overlaps with cognitively simple (cf. Anttila, this volume), elementary and therefore universally preferred, and with Praguian (especially Jakobson's) notions of markedness (where unmarked loosely corresponds to natural).
Article
In this article I explore a particular set of contact varieties that emerged in Namibia, a former German colony. Historical evidence comes from the genre of autobiographic narratives that were written by German settler women. These texts provide – ideologically filtered – descriptions of domestic life in the colony and contain observations about everyday communication practices. In interpreting the data I draw on the idea of ‘jargon’ as developed within creolistics as well as on Chabani Manganyi’s (1970) comments on the ‘master-servant communication complex’, and Beatriz Lorente’s (2017) work on ‘scripts of servitude’. I suggest that to interpret the historical record is a complex hermeneutic endeavour: on the one hand, the examples given are likely to tell us ‘something’ about communication in the colony; on the other hand, the very description of communicative interactions is rooted in what I call a ‘script of supremacy’, which is quite unlike the ‘atonement politics’ (McIntosh 2014) of postcolonial language learning.
Book
https://global.oup.com/academic/product/borrowing-9780190256388?lang=en&cc=ca Studies of bilingual behavior have been proliferating for decades, yet short shrift has been given to its major manifestation, the incorporation of words from one language into the discourse of another. This volume redresses that imbalance by going straight to the source: bilingual speakers in their social context. Building on more than three decades of original research based on vast quantities of spontaneous performance data and a highly ramified analytical apparatus, Shana Poplack characterizes the phenomenon of lexical borrowing in the speech community and in the grammar, both synchronically and diachronically. In contrast to most other treatments, which deal with the product of borrowing (if they consider it at all), this book examines the process: how speakers go about incorporating foreign items into their bilingual discourse; how they adapt them to recipient-language grammatical structure; how these forms diffuse across speakers and communities; how long they persist in real time; and whether they change over the duration. Attacking some of the most contentious issue in language mixing research empirically, it tests hypotheses about established loanwords, nonce borrowings and code-switches on a wealth of unique datasets on typologically similar and distinct language pairs. A major focus is the detailed analysis of integration: the principal mechanism underlying the borrowing process. Though the shape the borrowed form assumes may be colored by community convention, Poplack shows that the act of transforming donor-language elements into native material is universal. Emphasis on actual speaker behavior coupled with strong standards of proof, including data-driven reports of rates of occurrence, conditioning of variant choice and measures of statistical significance, make Borrowing an indispensable reference on language contact and bilingual behavior.