Content uploaded by Xulio Sousa
Author content
All content in this area was uploaded by Xulio Sousa on Nov 02, 2021
Content may be subject to copyright.
Travaux de Linguistique et de Philologie
Nouveaux regards sur la variation dialectale
New Ways of Analyzing Dialectal Variation
TraLiPhi – Travaux de Linguistique et de Philologie
André Thibault, Mathieu Avanzi,
Nicholas Lo Vecchio, Alice Millour (éds.)
Nouveaux regards sur la variation dialectale
New Ways of Analyzing Dialectal Variation
La loi du 11 mars 1957 n’autorisant, aux termes des alinéas 2 et 3 de l’article 41, d’une part,
que les « copies ou reproductions strictement réservées à l’usage privé du copiste et non desti-
nées à une utilisation collective », et d’autre part, que les analyses et les courtes citations dans un
but d’exemple et d’illustration, « toute représentation ou reproduction intégrale, ou partielle, faite
sans le consentement de l’auteur ou de ses ayants-droit ou ayants-cause, est illicite » (alinéa 1er de
l’article 40).
Cette représentation ou reproduction, par quelque procédé que ce soit, constituerait donc une
contrefaçon sanctionnée par les articles 425 et suivants du Code Pénal.
ISBN 978-2-37276-056-0
EAN 9782372760560
© Éditions de linguistique et de philologie, Strasbourg 2021.
Ouvrage publié avec le soutien nancier de l’Équipe d’Accueil 4509 (Sens, Texte,
Informatique et Histoire), de l’École Doctorale V (Concepts et langages – ED 0433)
et du Conseil Académique de Sorbonne Université, ainsi que du projet de recherche
CAMARADERIE (porteur: Mathieu Avanzi) subventionné dans le cadre du pro-
gramme de soutien à la recherche ‘Émergence’ de Sorbonne Université.
V
Table des matières / Table of contents
Présentation / Presentation ........................................................................................ 1
A. Cartographier à l’aide de nouveaux outils numériques / Mapmaking
using new digital tools
A.1. Numérisation des œuvres traditionnelles / Digitizing traditional works
Hans Geisler, Robert Forkel, Johann-Mattis List
A digital, retro-standardized edition of the Tableaux Phonétiques
des Patois Suisses Romands (TPPSR) ............................................................... 13
1. Introduction ........................................................................................................... 13
2. Background ............................................................................................................ 13
2.1. Fading voices of Suisse romande ................................................................ 13
2.2. Benets of the TPPSR .................................................................................. 15
3. Digitizing the TPPSR ........................................................................................... 17
3.1. ASCII and Unicode ...................................................................................... 17
3.2. The TPPSR transcription system ................................................................ 18
3.2.1. Vowels ................................................................................................... 18
3.2.2. Consonants ........................................................................................... 20
3.3. Representing the TPPSR data in Unicode ................................................ 20
3.3.1. Strict canonical decomposition coding (NFD) ............................... 21
3.3.2. Canonical Combining Classes (ccc) and stacking order ................ 22
3.3.3. Interacting and non-interacting combining classes ........................ 22
3.3.4. Encoding complex TPPSR graphemes ............................................. 23
3.3.5. Encoding the TPPSR vowel ligature ................................................ 24
3.3.6. Substitute characters ........................................................................... 24
3.3.6.1. Weak articulation ........................................................................... 25
3.3.6.2. Weak nasalization .......................................................................... 25
TABLE DES M ATIÈRES / TABLE OF CONTENTS
VI
3.3.6.3. Latin Small Letter U With Left Hook ........................................ 25
3.3.6.4. Latin Small Letter C With Latin Small Letter H Inside ........... 26
4. Retro-standardizing the TPPSR ......................................................................... 26
4.1. Background on (retro-)standardization of linguistic data ....................... 27
4.2. Rendering the digitized TPPSR data in CLDF ........................................ 28
4.2.1. Languages, concepts, and phrases .................................................... 28
4.2.2. Transliterating TPPSR transcriptions to Broad IPA ...................... 29
4.2.3. Prosodic features ................................................................................. 31
4.3. Deployment with the help of CLLD .......................................................... 32
5. Conclusion and outlook ........................................................................................ 33
References ................................................................................................................. 33
Supplementary material ............................................................................................. 36
Fabio Armand
Du terrain au numérique : évolution du traitement des données
de l’Atlas linguistique et ethnographique du Lyonnais .................................... 37
1. Introduction ........................................................................................................... 37
2. Du terrain aux développements successifs d’une géographie
linguistique régionale ............................................................................................ 37
3. Numérisation de l’Atlas linguistique et ethnographique du Lyonnais ........... 41
4. Problématiques de reconnaissance automatique de caractères et
de transposition ..................................................................................................... 42
5. Limites dans la transposition Gilliéron-Rousselot > API ............................... 44
6. Un outil d’analyse des cartes de l’ALLy en cours de réalisation .................... 45
7. Numérique et sciences participatives : quel futur ? ........................................... 50
Références bibliographiques ...................................................................................... 50
Esther Baiwir
Quel sens ont les unités lexicales des atlas linguistiques ? Une exploration
sémantique dans le domaine (gallo)roman ........................................................ 53
1. Où se cache le sens dans les atlas ? ..................................................................... 53
1.1. Les titres ......................................................................................................... 54
1.2. Les marges : sens et référence ...................................................................... 57
1.3. Bilan provisoire ............................................................................................. 59
2. Les atlas secondaires et le traitement du sens ................................................... 59
VII
ANDR É THIBAULT / MATH IEU AVANZI / NICHOLAS LO VECC HIO / ALICE MILLOUR
2.1. ALiR ............................................................................................................... 60
2.2. THESOC ....................................................................................................... 61
2.3. Verb aA lp in a .................................................................................................. 62
2.4. Atlas pan-picard informatisé (APPI) ......................................................... 65
3. Conclusions .............................................................................................................. 66
Références bibliographiques ...................................................................................... 67
Wim Remysen
Revisiter les données dialectologiques de la Société du parler français
au Canada (1904-1906) : enjeux et perspectives ................................................ 69
1. Introduction ........................................................................................................... 69
2. Réalisation de l’enquête et présentation des données ...................................... 71
3. Numérisation des relevés ...................................................................................... 74
4. Analyse des données : l’exemple de la dialectométrie ...................................... 77
4.1. L’intérêt des méthodes dialectométriques ................................................. 77
4.2. Résultats des analyses avec Gabmap ......................................................... 78
4.2.1. La carte de réseaux ............................................................................. 78
4.2.2. L’analyse par groupe ........................................................................... 79
4.2.3. Le positionnement multidimensionnel ............................................. 81
4.3. Discussion ...................................................................................................... 84
5. Conclusion et perspectives ................................................................................... 86
Références bibliographiques ...................................................................................... 87
Xulio Sousa
Odres nuevos para vino añejo: la edición digital del Atlas Lingüístico
de la Península Ibérica ......................................................................................... 91
1. Introducción ........................................................................................................... 91
2. El proyecto original del Atlas Lingüístico de la Península Ibérica ................ 92
3. El proyecto de edición y elaboración de los materiales del ALPI .................. 98
3.1. La base de datos del nuevo ALPI ............................................................... 99
3.2. La aplicación de consulta ............................................................................. 102
3.3. La visualización cartográca de los datos ................................................. 103
4. Conclusión .............................................................................................................. 104
Referencias bibliográcas .......................................................................................... 105
TABLE DES M ATIÈRES / TABLE OF CONTENTS
VIII
A.2. Combiner numérisation et gains empiriques / Combining digitization
with empirical gains
Michele Loporcaro, Stephan Schmid, Chiara Zanini, Diego Pescarini,
Giulia Donzelli, Stefano Negrinelli and Graziano Tisato
AIS, reloaded: A digital dialect atlas of Italy and southern Switzerland ............ 111
1. Introduction ........................................................................................................... 111
2. From AIS to AISr ................................................................................................. 112
2.1. The AISr database ........................................................................................ 113
2.2. The search, retrieve and display options .................................................... 114
2.2.1. Maps ...................................................................................................... 114
2.2.2. Locations .............................................................................................. 114
2.2.3. Period .................................................................................................... 114
2.2.4. Phonetic ................................................................................................ 114
2.2.5. Download table .................................................................................... 115
2.2.6. Switch to map view .............................................................................. 116
2.3. Behind the database: Digitization and phonetic transcriptions ............. 117
3. What is the AISr database good for? A few examples ..................................... 120
3.1. Convergence and variation in western Surselva ....................................... 120
3.2. The reshaping of lexical areas for some kinship terms ............................ 123
3.3. The morphosyntax of gender agreement in the dialect of Mesocco ....... 125
3.4. The syntax of negation in Swiss-Lombard dialects .................................. 127
3.5. Sound change ................................................................................................. 130
4. Conclusion and further prospects ....................................................................... 132
References ................................................................................................................. 133
Yves Scherrer
Les cartes dialectométriques interactives de dialektkarten.ch ............................. 137
1. Introduction ........................................................................................................... 137
2. La numérisation de l’atlas linguistique de la Suisse alémanique .................... 138
3. La dialectométrie à Salzbourg ............................................................................. 140
4. Description du site de visualisation .................................................................... 141
4.1. Visualisation de cartes de travail ................................................................ 141
4.2. Visualisation de cartes dialectométriques ................................................. 144
IX
ANDR É THIBAULT / MATH IEU AVANZI / NICHOLAS LO VECC HIO / ALICE MILLOUR
5. Conclusion .............................................................................................................. 150
6. Remerciements ...................................................................................................... 150
Références bibliographiques ...................................................................................... 151
Stephan Lücke
VerbaAlpina: Digital geolinguistics dedicated to the lexical analysis of
the Alpine dialects ................................................................................................ 153
1. Scientic approach ................................................................................................ 153
2. Some technical (and other) aspects .................................................................... 157
2.1. General remarks ............................................................................................ 157
2.2. Versioning ...................................................................................................... 157
2.3. Transcription of data taken from language atlases .................................. 158
2.4. The use of crowdsourcing ............................................................................ 161
2.5. Mapping tool .................................................................................................. 164
2.6. Cross-linkage and sustainability ................................................................. 168
3. Administrative details .......................................................................................... 170
References ................................................................................................................. 171
Amélie Deparis
Étude des parlers du Croissant à travers la cartographie informatisée ............... 173
1. Introduction ........................................................................................................... 17 3
2. Le projet ANR-17-CE27-0001-01 : « Les parlers du Croissant :
une approche multidisciplinaire du contact oc-oïl » ......................................... 174
2.1. L’étude dialectale comparative ................................................................... 174
2.2. Informateurs et points d’enquête ................................................................ 176
2.3. Méthode d’enquête et valorisation des données ....................................... 180
2.4. Modélisation de la variation observée via la cartographie ..................... 182
2.5. Mais encore ? ................................................................................................. 182
3. De la sélection des traits à la cartographie informatisée ................................. 183
3.1. Phonétique : la palatalisation des groupes consonne + latérale .............. 183
3.2. Trait morphologique : désinences personnelles des verbes du 1er groupe
à l’imparfait de l’indicatif ............................................................................. 187
4. Conclusion .............................................................................................................. 190
Références bibliographiques ...................................................................................... 191
Sitographie ................................................................................................................. 193
TABLE DES M ATIÈRES / TABLE OF CONTENTS
X
B. Nouveaux projets numériques / New digital projects
B.1. Cartographie basée sur le crowdsourcing / Mapmaking based on
crowdsourcing
Robert Möller
An online atlas of colloquial German: The Atlas zur deutschen Alltagssprache 197
1. Introduction ........................................................................................................... 197
2. AdA: Approach and survey method ................................................................... 198
2.1. Informants ..................................................................................................... 198
2.2. The questionnaires ....................................................................................... 200
2.3. Risks ............................................................................................................... 201
3. Mapping ................................................................................................................. 203
4. Main research questions ....................................................................................... 204
4.1. Documentation of actual language usage .................................................. 204
4.2. Exploration of the evolution of areal distributions .................................. 207
4.2.1. Variation in colloquial German and local dialects ......................... 207
4.2.2. The development of colloquial German: Comparison WDU – AdA 208
4.2.3. WDU – AdA: Combination maps ..................................................... 210
5. Statistical evaluation ............................................................................................. 212
6. Conclusion .............................................................................................................. 212
References ................................................................................................................. 213
Mathieu Avanzi et André Thibault
Cartographier l’amuïssement et la restitution des consonnes nales en français
grâce à la production participative ...................................................................... 217
1. Introduction ........................................................................................................... 217
2. Documenter la variation régionale en galloroman et en français :
des enquêtes de terrain au smartphone .............................................................. 217
2.1. Jules Gilliéron et son legs ............................................................................ 217
2.2. André Martinet ............................................................................................. 218
2.3. Henriette Walter ........................................................................................... 218
2.4. Le français au Canada .................................................................................. 219
2.5. Le DRF de Pierre Rézeau et son équipe ................................................... 219
XI
ANDR É THIBAULT / MATH IEU AVANZI / NICHOLAS LO VECC HIO / ALICE MILLOUR
2.6. Le PFC (Phonologie du français contemporain) ...................................... 219
2.7. Les enquêtes en ligne ................................................................................... 220
3. Français de nos régions : méthodologie .............................................................. 225
3.1. Les enquêtes .................................................................................................. 225
3.2. Le prol des participants ............................................................................. 226
3.3. Cartographie : les étapes de l’élaboration des cartes ............................... 227
4. Chute et restitution des consonnes nales en français ..................................... 228
4.1. Bref panorama historique ............................................................................ 228
4.2. Les causes de la restitution .......................................................................... 229
4.2.1. L’effet « Buben » et ses causes ............................................................ 229
4.2.2. Inuences substratiques et adstratiques ........................................... 231
5. Études de cas dans la francophonie d’Europe contemporaine ....................... 231
5.1. Sans effet de région ni d’âge ........................................................................ 231
5.2. Avec effet de région ...................................................................................... 233
5.3. Avec effet d’âge ............................................................................................. 235
5.4. Effets d’âge et de région combinés ............................................................. 237
6. Bilan et conclusion ................................................................................................ 239
Références bibliographiques ...................................................................................... 240
Sitographie ................................................................................................................. 244
Appendices ................................................................................................................. 245
Philippe Boula de Mareüil, Éric Bilinski, Frédéric Vernier,
Valentina de Iacovo and Antonio Romano
For a mapping of the languages/dialects of Italy and regional varieties of Italian 267
Introduction ................................................................................................................. 267
1. Speaking atlas of the languages/dialects of Italy .............................................. 268
1.1. Material, protocol and mapping .................................................................. 268
1.2. Focus on Ligurian dialects ........................................................................... 270
1.3. Focus on Salentine dialects .......................................................................... 271
1.4. Focus on Calabrian dialects ........................................................................ 273
1.5. Focus on Apulian dialects ........................................................................... 275
1.6. Discussion ...................................................................................................... 278
2. Pronunciation variants in regional Italian ......................................................... 278
2.1. Questionnaire, subjects’ tasks and participants ........................................ 279
TABLE DES M ATIÈRES / TABLE OF CONTENTS
XII
2.2. Visualisation of the results .......................................................................... 280
2.3. Discussion ...................................................................................................... 282
3. Conclusion and future work ................................................................................. 283
Acknowledgements ..................................................................................................... 284
References ................................................................................................................. 284
B.2. Études spéciques basées sur les nouvelles technologies web /
Specic studies based on new web technologies
Miriam Bouzouita, Mónica Castillo Lluch et Enrique Pato
Dialectos del español : une application pour l’étude de la variation linguistique
dans le monde hispanophone ............................................................................... 291
1. Introduction ........................................................................................................... 291
2. Origine du projet, objectifs et méthodologie ..................................................... 292
3. Diffusion médiatique et participation du public ............................................... 296
4. Résultats préliminaires et dés du projet .......................................................... 298
5. Conclusions ............................................................................................................ 301
Références bibliographiques ...................................................................................... 302
David Britain, Tamsin Blaxter and Adrian Leemann
Dialect levelling in England: Evidence from the English Dialects App .............. 305
1. Introduction ........................................................................................................... 305
2. The English Dialects App (EDA) ....................................................................... 306
3. Evidence of lexical levelling ................................................................................. 309
3.1. Snail ................................................................................................................ 309
3.2. Autumn .......................................................................................................... 309
3.3. Splinter ........................................................................................................... 310
4. Evidence of phonological levelling ..................................................................... 311
4.1. The CLOTH vowel ....................................................................................... 311
4.2. Clear /l/ ........................................................................................................... 312
5. Evidence of morphosyntactic levelling ............................................................... 312
5.1. Possessive pronouns: hern ............................................................................ 31 2
5.2. Reexive pronouns: hisself .......................................................................... 313
5.3. Third person present-tense zero ................................................................. 314
XIII
ANDR É THIBAULT / MATH IEU AVANZI / NICHOLAS LO VECC HIO / ALICE MILLOUR
6. Conclusion .............................................................................................................. 315
References ................................................................................................................. 317
Appendices ................................................................................................................. 320
Delphine Bernhard
Corpus annoté en parties du discours pour les dialectes alsaciens :
comparaison avec l’allemand standard et le français ....................................... 335
1. Introduction ........................................................................................................... 335
2. Analyse de l’existant pour les dialectes alsaciens ............................................. 336
3. Corpus analysés ..................................................................................................... 337
3.1. Corpus alsacien ............................................................................................. 337
3.2. Corpus allemands ......................................................................................... 337
3.3. Corpus français ............................................................................................. 338
4. Analyse des corpus ............................................................................................... 338
4.1. Propriétés statistiques de base des corpus ................................................. 338
4.1.1. Phrases .................................................................................................. 338
4.1.2. Vo cabu la ir e .......................................................................................... 340
4.2. Diversité lexicale ........................................................................................... 342
4.3. Variation morphologique et graphique ...................................................... 347
4.4. Distribution des catégories grammaticales ............................................... 350
5. Conclusion .............................................................................................................. 353
Références bibliographiques ...................................................................................... 354
1
Nouveaux regards sur la variation dialectale :
Présentation
Ce volume vise à rassembler des articles de romanistes et germanistes de divers
horizons an d’évaluer comment les nouvelles technologies peuvent améliorer notre
connaissance de la variation dialectale en Europe et au-delà. Au cours des dernières
années, des progrès technologiques rapides et la démocratisation du Web 2.0 ont
conduit à la création et au développement de plusieurs initiatives dialectologiques.
En ce qui concerne le recueil de données, plusieurs alternatives au travail de terrain
traditionnel sont apparues : grâce à Internet et aux réseaux sociaux, il est désormais
possible de réaliser des enquêtes sans avoir à se déplacer ; les téléphones portables
ont des microphones intégrés de haute qualité qui permettent d’enregistrer des
voix à distance partout dans le monde. En termes d’analyse et de visualisation des
données, il est désormais beaucoup moins coûteux de créer des atlas, de les mettre
à la disposition de la communauté universitaire et d’en interpréter le contenu. De
nos jours, les logiciels de statistiques et de visualisation des données permettent
un traitement qui n’aurait jamais été possible il y a seulement quelques décennies.
Il faut également souligner que ces avancées nous ont permis de porter un nouveau
regard sur les matériaux recueillis par les prédécesseurs, à la fois récents et anciens,
et ainsi d’enrichir notre connaissance des changements linguistiques intervenus dans
l’histoire des langues européennes.
Dans ce contexte, il n’est pas surprenant que de nombreuses équipes d’universitaires
aient pu concevoir des projets innovants ces dernières années, dont beaucoup sont
présentés dans cette publication. Les articles de la première moitié du volume (A)
portent sur le développement de cartes géolinguistiques à l’aide de nouveaux outils
numériques. De nombreux projets sont basés sur des travaux existants (A.1) mais
certains d’entre eux ajoutent des données nouvellement recueillies aux ressources déjà
existantes (A.2). Les articles de la seconde moitié du volume (B) traitent de nouveaux
projets numériques entièrement basés sur des données originales récemment
collectées (B.1), dont beaucoup visent des objectifs spéciques (B.2) tels que l’étude
de la variation syntaxique, du nivellement dialectal ou du traitement automatique du
langage naturel.
PRÉSENTATION / PR ESENTATION
2
A. Cartographier à l’aide de nouveaux outils numériques
De nos jours, les dialectologues ont souvent une énorme quantité de données
à leur disposition, recueillies par d’éminents prédécesseurs et généralement
présentées sous forme de cartes, compilées dans des atlas. Mais de tels atlas sont
rarement accompagnés de commentaires analytiques, et même lorsqu’ils le sont, il est
extrêmement long de réutiliser ces sources à d’autres ns : les anciennes transcriptions
phonétiques doivent être modernisées, le matériel doit être numérisé et saisi dans des
tableurs an d’automatiser leur traitement. Bon nombre des atlas les plus célèbres
ont fait l’objet d’entreprises de numérisation : pour n’en nommer que quelques-uns,
l’ALF (Atlas Linguistique de la France), l’AIS (Atlante italo-svizzero), l’ALPI (Atlas
Lingüístico de la Península Ibérica) et le SDS (Sprachatlas der deutschen Schweiz).
Ces projets tentent souvent d’ajouter du nouveau contenu aux données existantes ou
de remettre en question certains choix méthodologiques de leurs prédécesseurs.
1. Numérisation des œuvres traditionnelles
Dans la première contribution (« A digital, retro-standardized edition of the
Tableaux Phonétiques des Patois Suisses Romands (TPPSR) »), Hans Geisler, Robert
Forkel et Johann-Mattis List présentent une édition rétro-standardisée des Tableaux
Phonétiques des Patois Suisses Romands, un recueil de matériaux dialectaux élaboré
par Louis Gauchat, Jules Jeanjaquet et Ernest Tappolet au début du 20e siècle et
publié en 1925. Bien que Gauchat et ses collègues n’aient jamais pu mener à bien
leur ambition de présenter ces matériaux sous forme d’atlas, faute de nancement,
les auteurs montrent comment de solides techniques de numérisation, adossées à des
approches de rétro-standardisation assurant une transparence dans le traitement des
données, permettent de transformer les matériaux des TPPSR en un atlas dialectal
moderne et interactif.
L’ALF, publié au début du siècle dernier, a été suivi un demi-siècle plus tard par
une série d’atlas régionaux français au réseau de localités plus dense. Dans « Du
terrain au numérique : évolution du traitement des données dans l’Atlas linguistique
et ethnographique du Lyonnais », Fabio Armand explique comment un alphabet
phonétique traditionnel a été transposé en API à l’aide d’un processus d’océrisation
automatisée. De nouveaux outils analytiques sont en cours d’élaboration an de tirer
le meilleur parti des données numérisées.
Esther Baiwir, dans « Quel sens ont les unités lexicales des atlas linguistiques ?
Une exploration sémantique dans le domaine (gallo)roman », adopte une perspective
critique sur la gestion de la sémantique lors de l’assemblage de matériaux issus
de travaux géolinguistiques antérieurs. Dans le projet APPI (Atlas pan-picard
informatisé), qui vise à agréger les matériaux picards de trois atlas (ALF, Atlas
linguistique et ethnographique picard et Atlas linguistique de la Wallonie), l’analyse
de la sémantique des formes est fondamentale pour établir l’architecture du projet.
3
ANDR É THIBAULT / MATH IEU AVANZI / NICHOLAS LOVECCHIO / ALICE MILLOUR
Dans certains cas, les enquêtes dialectologiques n’ont pas abouti à la publication
d’un atlas, mais plutôt à celle d’un glossaire. Néanmoins, il est toujours possible
de faire revivre les données et de les transformer en cartes. Telle est l’ambition de
Wim Remysen dans « Revisiter les données dialectologiques de la Société du parler
français au Canada (1904-1906) : enjeux et perspectives ». L’un des avantages de cet
ensemble de données est qu’il comprenait déjà des zones urbaines au début du XXe
siècle. Cela a permis à l’auteur d’identier des processus de nivellement du français en
milieu urbain (en particulier à Montréal), contrairement à ce que l’on peut observer
en milieu rural.
L’atlas linguistique de la péninsule ibérique a été l’une des nombreuses victimes
de la guerre civile espagnole : contrairement à l’ALF, il n’a jamais été entièrement
publié, avec un seul volume paru sous forme imprimée (1962). Dans son article
(« Odres nuevos para vino añejo: la edición digital del Atlas Lingüístico de la Península
Ibérica »), Xulio Sousa présente le projet d’édition numérique de l’ALPI, qui permet
la génération automatique de cartes et l’exportation de données sous d’autres formats.
2. Combiner numérisation et gains empiriques
L’équivalent italo-roman de l’ALF, l’AIS (Atlante italo-svizzero), a été numérisé
à l’Université de Zurich par Michele Loporcaro et al. ; dans « AIS, reloaded: A digital
dialect atlas of Italy and southern Switzerland », l’objectif est double : d’une part,
développer une version numérique consultable de l’atlas ; de l’autre, incorporer de
nouvelles données d’enquêtes menées dans les régions italophones de la Suisse, dans
les mêmes localités et avec le même questionnaire, mais pratiquement cent ans plus
tard.
En Suisse alémanique, le Sprachatlas der deutschen Schweiz a été numérisé dans
une version qui permet la visualisation interactive de nombreuses caractéristiques
dialectales, mais dans « Les cartes dialectométriques interactives de dialektkarten.ch »,
Yves Scherrer présente également d’autres méthodes de visualisation reposant sur
l’analyse dialectométrique, les prototypes de traduction automatique et l’identication
des dialectes ; en outre, l’interface développée pour le SDS est actuellement appliquée
à d’autres conglomérats dialectaux.
En fait, toute la région alpine est bien dotée en matière de ressources dialectales.
Dans « VerbaAlpina: Digital geolinguistics dedicated to the lexical analysis of the
Alpine dialects », Stephan Lücke présente le projet VerbaAlpina, une interface
électronique puissante et polyvalente qui utilise la technologie Web pour stocker
les informations de diverses publications géolinguistiques traditionnelles (atlas, et
glossaires), les rendre disponibles en ligne et les visualiser sur des cartes. De plus, il
enrichit les données traditionnelles avec des techniques de crowdsourcing en ligne.
PRÉSENTATION / PR ESENTATION
4
Une autre région riche en dialectes est le “Croissant”, à la limite nord du Massif
Central en France, où les trois groupes de dialectes fondamentaux de la Galloromania
– Oïl, Francoprovençal et Occitan – convergent. Dans « Étude des parlers du Croissant
à travers la cartographie informatisée », Amélie Deparis montre comment une équipe
de chercheurs travaille actuellement dans une perspective multidisciplinaire sur les
langues de la région, combinant la documentation existante avec de nouvelles données
empiriques.
B. Nouveaux projets numériques
1. Cartographie basée sur le crowdsourcing
Alors que les projets décrits ci-dessus visent principalement la numérisation
et l’enrichissement d’œuvres déjà existantes, d’autres visent à produire des œuvres
entièrement nouvelles à partir de données récentes recueillies en ligne par le biais
d’enquêtes électroniques – l’approche dite du « crowdsourcing ».
Robert Möller (avec Stephan Elspaß) est en charge de « An online atlas of
colloquial German: The Atlas zur deutschen Alltagssprache ». On doit cet atlas en ligne
à la participation régulière d’environ 10 000 informateurs qui ont participé à des
questionnaires en ligne successifs portant principalement sur le lexique, mais aussi
sur la grammaire. Comme les questions sont les mêmes que dans le Wortatlas der
deutschen Umgangssprachen de J. Eichhoff, qui a commencé en 1977, les résultats
permettent des comparaisons diachroniques.
Mathieu Avanzi et André Thibault (« Cartographier l’amuïssement et la restitution
des consonnes nales en français grâce à la production participative ») ont répliqué
la procédure décrite dans l’article précédent et l’ont appliquée aux régions de la
Francophonie d’Europe et du Canada. À ce jour, plus de 15 enquêtes ont été menées
auprès de plusieurs dizaines de milliers de locuteurs. Les premiers résultats sont
disponibles depuis 2016 sous la forme de cartes dans des billets de blog (« Français de
nos régions ») ainsi que dans plusieurs ouvrages grand public. Plus récemment, ils ont
commencé à étendre leurs enquêtes à des territoires insulaires d’outre-mer, et l’objectif
nal est de couvrir l’ensemble du monde francophone. La présente contribution
montre ce que leurs données permettent d’apporter à la question de l’aréologie et de
l’évolution de la prononciation des consonnes nales dans la francophonie d’Europe,
en croisant les axes diatopiques et diagénérationnels.
Philippe Boula de Mareüil, en collaboration avec une équipe binationale, supervise
un double projet : « For a mapping of the languages/dialects of Italy and regional
varieties of Italian ». La première phase traite de la documentation des variétés
dialectales et des langues régionales de l’Italie par l’élicitation d’échantillons de
discours qui peuvent être entendus et téléchargés en ligne, ainsi que des transcriptions.
La deuxième phase se concentre spéciquement sur l’étude de l’italien régional
5
ANDR É THIBAULT / MATH IEU AVANZI / NICHOLAS LOVECCHIO / ALICE MILLOUR
à travers le crowdsourcing, en se basant sur des oppositions phonologiques qui peuvent
être visualisées à l’aide d’un programme dédié (Cartopho).
2. Études spéciques basées sur les nouvelles technologies web
Tous les projets ne visent pas à cartographier de longues listes de caractéristiques
linguistiques diversiées. Les nouvelles technologies peuvent également être utiles
dans l’étude de problèmes linguistiques plus ciblés.
Miriam Bouzouita, Mónica Castillo Lluch et Enrique Pato, par exemple,
présentent un nouveau projet (« Dialectos del español : une application pour l’étude
de la variation linguistique dans le monde hispanophone ») visant spéciquement à
étudier la variation syntaxique de l’espagnol. Bien que cela puisse sembler très ciblé
comme objectif, la portée géographique en est, en revanche, très large : l’enquête est
menée dans l’ensemble du monde hispanophone. Techniquement, elle est gérée par
une application téléphonique qui s’est déjà avérée efcace avec les dialectes du suisse
alémanique et de l’anglais britannique.
Cela nous amène à la contribution de David Britain, Tamsin Blaxter et Adrian
Leemann, « Dialect levelling in England: Evidence from the English Dialects App ». Les
auteurs montrent, grâce aux données recueillies auprès de plus de 50 000 participants
dans toute l’Angleterre, que certaines caractéristiques (lexicales pour la plupart) ont
subi un nivellement considérable au cours des cinquante dernières années, tandis que
d’autres (principalement phonologiques) résistent à cette tendance, en particulier
dans les zones où la mobilité est plus faible.
Enn, dans le dernier article, Delphine Bernhard (« Corpus annoté en parties
du discours pour les dialectes alsaciens : comparaison avec l’allemand standard et le
français ») montre comment une équipe de spécialistes travaillant sur l’alsacien – mais
aussi l’occitan et le picard – réussit à aider à maintenir ces langues minoritaires en
vie sur le Net, en développant l’automatisation de programmes servant à annoter
syntaxiquement les morphèmes des dialectes alsaciens.
Sorbonne Université André THIBAULT
Mathieu AVANZI
Nicholas Lo VECCHIO
Alice MILLOUR
PRÉSENTATION / PR ESENTATION
6
New Ways of Analyzing Dialectal Variation: Presentation
This volume aims to bring together articles from Romance and Germanic
dialectologists with diverse backgrounds in order to evaluate how new technologies
can enhance our knowledge of dialectal variation in Europe and beyond. In the past
few years, rapid technological progress and the democratization of the Web 2.0 have
led to the successful creation and development of several dialectological initiatives.
In terms of data collection, several alternatives to traditional eldwork have emerged:
thanks to the Internet and social networks, it is now possible to conduct dialectological
surveys without having to travel; mobile phones have high-quality built-in microphones
that make it possible to record voices remotely anywhere in the world. In terms of
data analysis and visualization, it is now much less expensive to create atlases, make
them available to the academic community, and interpret the data. Nowadays, data
visualization and statistical software allow processing that would never have been
possible just a few decades ago. It must also be emphasized that these advances have
allowed us to take a new look at materials collected by predecessors, both recent and
historical, and thus to enrich our knowledge of the linguistic changes that have taken
place in the history of European languages.
In this context, it is not surprising that many teams of scholars have been able
to devise innovative projects in recent years, many of which are presented in this
publication. The articles in the rst half of the volume (A) focus on the development
of geolinguistic maps using new digital tools. Many projects are based on existing
works (A.1), but some of them add newly collected data to the already existing
resources (A.2). The articles in the second half of the volume (B) deal with new digital
projects entirely based on recently collected original data (B.1), many of which are
aimed at specic goals (B.2), such as the study of syntactic variation, dialect levelling,
or natural language processing.
A. Mapmaking using new digital tools
Dialectologists nowadays often have an enormous amount of data at their
disposal, collected by prominent predecessors and usually presented in the form of
geolinguistic maps, compiled in atlases. But such atlases rarely come with analytical
commentary, and even when they do, it is extremely time-consuming to reuse the
data for other purposes: old phonetic transcriptions must be modernized, the material
has to be digitized and entered into spreadsheets, so that searches can be conducted
and new maps automatically generated. Some of the most renowned atlases have
7
ANDR É THIBAULT / MATH IEU AVANZI / NICHOLAS LOVECCHIO / ALICE MILLOUR
undergone digitization processes: to name a few, the ALF (Atlas Linguistique de la
France), the AIS (Atlante italo-svizzero), the ALPI (Atlas Lingüístico de la Península
Ibérica), and the SDS (Sprachatlas der deutschen Schweiz). These projects often try
to add new content to the existing data, or to question some of the methodological
choices of their predecessors.
1. Digitizing traditional works
In the rst study, Hans Geisler, Robert Forkel and Johann-Mattis List present
«A digital, retro-standardized edition of the Tableaux Phonétiques des Patois Suisses
Romands (TPPSR)», an early collection of dialect data of the ‘Suisse romande’,
which was compiled by Louis Gauchat, Jules Jeanjaquet and Ernest Tappolet at the
beginning of the 20th century and later published in 1925. While the plan of Gauchat
and his collaborators to turn their data into a dialect atlas could never be realized
due to lack of funding, the authors show how consistent techniques for digitization,
accompanied by transparent approaches to retro-standardization, can be used to turn
the original data of the TPPSR into a modern interactive dialect atlas.
The ALF, published at the beginning of the last century, was followed half a
century later by a series of French regional atlases with a denser network of localities.
In «Du terrain au numérique : évolution du traitement des données de l’Atlas
linguistique et ethnographique du Lyonnais» Fabio Armand explains how a traditional
phonetic alphabet was transposed into IPA using automated OCR. New analytical
tools are on the way in order to make the most out of the digitized data.
Esther Baiwir, in «Quel sens ont les unités lexicales des atlas linguistiques ? Une
exploration sémantique dans le domaine (gallo)roman», adopts a critical perspective
on the handling of semantics when assembling materials from previous geolinguistic
works. In the APPI project (Atlas pan-picard informatisé), which aims to aggregate
Picard materials from three atlases (ALF, Atlas linguistique et ethnographique
picard, and Atlas linguistique de la Wallonie), the analysis of the forms’ semantics is
fundamental for establishing the project’s architecture.
In some cases, dialectological surveys didn’t lead to the publication of an atlas,
but rather to that of a glossary. Nevertheless, it is still possible to revive the data
and turn it into maps. This is Wim Remysen’s ambition in «Revisiter les données
dialectologiques de la Société du parler français au Canada (1904-1906) : enjeux et
perspectives». One of the advantages of this data set is that it already included urban
areas at the beginning of the twentieth century. This has allowed the author to identify
levelling processes in urban settings (particularly in Montreal), in contrast with the
situation in rural areas.
The linguistic atlas of the Iberian Peninsula was one of the many casualties of the
Spanish Civil War: unlike the ALF, it was never fully published, with only one volume
appearing in print (1962). In his paper («Odres nuevos para vino añejo: la edición digital
del Atlas Lingüístico de la Península Ibérica»), Xulio Sousa introduces the digital
PRÉSENTATION / PR ESENTATION
8
edition project of the ALPI, which already enables automatic mapmaking and will,
at last, make the collected documentation available to all.
2. Combining digitization with empirical gains
The Italo-Romance equivalent of the ALF, the AIS (Atlante italo-svizzero), has
been digitized at Zurich University by Michele Loporcaro et al.; in «AIS, reloaded:
A digital dialect atlas of Italy and southern Switzerland», the objective is twofold:
on the one hand, developing a searchable digital version of the atlas; on the other,
incorporating fresh data from surveys conducted in southern Switzerland, in the same
localities and with the same questionnaire—but practically a hundred years later.
In German-speaking Switzerland, the Sprachatlas der deutschen Schweiz has
been digitized in a version that allows interactive visualization of many dialectal
features, but in «Les cartes dialectométriques interactives de dialektkarten.ch», Yves
Scherrer also reveals new initiatives that have been undertaken, such as dialectometric
analyses, prototypes of machine translation, and dialect identication; furthermore,
the interface developed for the SDS is currently being applied to other dialectal
conglomerates.
In fact, the whole Alpine region is well endowed when it comes to dialect
resources. In «VerbaAlpina: Digital geolinguistics dedicated to the lexical analysis of
the Alpine dialects» Stephan Lücke introduces the VerbaAlpina project, a powerful
and versatile electronic interface that uses web technology to store information
from various traditional geolinguistic publications (atlases and glossaries), make
it available online, and visualize it. Moreover, it enriches the traditional data with
online crowdsourcing techniques.
Another region rich in dialects is the so-called “Croissant,” on the northern edge
of the Massif Central in France, where the three fundamental dialect groups of Gallo-
Romania—Oïl, Francoprovençal, and Occitan—converge. In «Étude des parlers du
Croissant à travers la cartographie informatisée» Amélie Deparis shows how a team
of scholars are currently working in a multidisciplinary perspective on the languages
of the region, combining existing documentation with new empirical input.
B. New digital projects
1. Mapmaking based on crowdsourcing
While the projects depicted above mainly pursue the digitization and enrichment
of already existing works, others aim to produce entirely new works based on recent
data collected online through electronic surveys—the so-called crowdsourcing
approach.
9
ANDR É THIBAULT / MATH IEU AVANZI / NICHOLAS LOVECCHIO / ALICE MILLOUR
Robert Möller (together with Stephan Elspaß) is in charge of «An online atlas
of colloquial German: The Atlas zur deutschen Alltagssprache». This has been
driven by the regular participation of about 10,000 informants who have taken part
in successive online questionnaires mainly dealing with the lexicon, but also with
grammar. Since the questions are the same as in J. Eichhoff’s Wortatlas der deutschen
Umgangssprachen, which started in 1977, the results enable a comparison over time.
Mathieu Avanzi and André Thibault («Cartographier l’amuïssement et la
restitution des consonnes finales en français grâce à la production participative») are
doing the same thing, but for the French-speaking European countries, as well as
Canada. More than 15 surveys have been conducted so far, reaching several tens of
thousands of speakers. Initial results have been available since 2016 in the form of a
blog (Français de nos régions) as well as in three published volumes. More recently,
they’ve started extending their surveys to overseas French-speaking islands, and the
nal goal is to cover the whole French-speaking world. In this contribution, they show
what their data can bring to the question of the areal distribution and evolution of
nal consonant pronunciation in European French-speaking countries, by combining
regional and generational gures.
Philippe Boula de Mareüil, together with a binational team, oversees a twofold
project in «For a mapping of the languages/dialects of Italy and regional varieties of
Italian». The rst phase deals with documenting Italy’s dialectal varieties and regional
languages through the elicitation of speech samples that can be heard and downloaded
online, along with transcripts. The second phase focuses specically on the study of
regional Italian through crowdsourcing, based on phonological oppositions, which
can be visualized using a dedicated program (Cartopho).
2. Specic studies based on new web technologies
Not all projects are aimed at mapping long lists of diversied linguistic features.
New technologies can also be useful in the study of more targeted language issues.
Miriam Bouzouita, Mónica Castillo Lluch and Enrique Pato, for instance, intro-
duce a new project («Dialectos del español : une application pour l’étude de la variation
linguistique dans le monde hispanophone») specically aimed at studying Spanish
syntactic variation. While this might seem a narrow focus, the geographic span is
very broad: the survey is being conducted across the entire Spanish-speaking world.
Technically, it is managed by a phone app that has already proved to be quite effective
with Swiss German and British English dialects.
Which brings us to David Britain, Tamsin Blaxter and Adrian Leemann’s contri-
bution, «Dialect levelling in England: Evidence from the English Dialects App». These
authors show, thanks to data collected from more than 50,000 participants all over
England, that certain features (mostly lexical) have undergone considerable levelling
in the last fty years, while others (mainly phonological) resist this tendency, espe-
cially in areas where mobility is weaker.
PRÉSENTATION / PR ESENTATION
10
The last article deals with natural language processing for regional languages in
France. Delphine Bernhard, in «Corpus annoté en parties du discours pour les dialectes
alsaciens : comparaison avec l’allemand standard et le français», shows how a team of
specialists working on Alsatian – as well as Occitan and Picard – have managed to
help keep these minority languages alive on the Net, by developing programs that
allow the grammatical tagging of their constituents.
Sorbonne Université André THIBAULT
Mathieu AVANZI
Nicholas Lo VECCHIO
Alice MILLOUR
91
Odres nuevos para vino añejo: la edición digital
del Atlas Lingüístico de la Península Ibérica 1
1. Introducción
La utilización de recursos informáticos y métodos dependientes de estos ha
supuesto en las últimas décadas una importante mejora y renovación del conjunto
de disciplinas humanísticas. Los avances han repercutido de forma directa en la
obtención, conservación y explotación de los datos y en la difusión de resultados.
No obstante, las disciplinas lológicas y lingüísticas se han beneciado de distinta
manera de estos avances. En las monografías dedicadas a las humanidades digitales
se encuentran muchas referencias a cómo estos dos ámbitos se han visto favoreci-
dos de los formatos digitales en la edición y análisis de textos antiguos y modernos;
más difícil es hallar noticia sobre la repercusión que tienen los progresos en la elabo-
ración, explotación y edición de los atlas lingüísticos, y esto a pesar del número signi-
cativo de proyectos de geografía lingüística que en las últimas décadas han adoptado
los formatos digitales para su publicación.
La segunda edición del Companion to Digital Humanities (Schreibman / Siemens /
Unsworth 2016) incluye una contribución de Todd Presner y David Shepard (Presner /
Shepard 2016) en la que se aborda el uso de sistemas de información geográca en
los estudios humanísticos (historia, demografía, geografía, arqueología, estudios
literarios, etc.). En este capítulo se encuentra un comentario sucinto a cómo la
dialectología se auxilia de estas nuevas aplicaciones. De acuerdo con estos autores,
el primer uso de tecnologías digitales en un proyecto de geografía lingüística se
fecha en 1983, con la generación de algunos mapas del Atlas Linguarum Europae
(ALE; Alinei ed. 1983). En un trabajo previo sobre metodología de proyectos de atlas
lingüísticos tradicionales y modernos, Alfred Lameli sitúa los primeros ensayos de
geolingüística informatizada en la década de 1970 (Lameli 2010). Los tres proyectos
destacados como precursores del empleo de estos recursos son el Computer Developed
Linguistic Atlas of England (Viereck / Ramisch 1991-1997), el Atlas Linguarum
Europae y el Kleiner Deutscher Sprachatlas (Veith / Putschke / Hummel 1984-1999).
1 Este trabajo ha sido realizado en el marco del proyecto de investigación Variación y cambio
en los dominios gallego y portugués en el siglo XX, nanciado por MCIU/AEI/FEDER, UE
(PGC2018-095077-B-C44).
ODRES NUEVOS PARA VINO AÑEJO: LA EDICIÓN DIGITAL DEL ALPI
92
Resulta evidente que la dialectología, como disciplina centrada en el estudio de la
variación lingüística en el espacio, fue incorporando el empleo de la computación
a la explotación de datos al mismo tiempo que el resto de las disciplinas que forman
parte del área denominada humanidades digitales. La geografía lingüística, como
subdisciplina de los estudios dialectales encargada de la visualización y análisis
de información geolingüística, se vio también directamente beneciada por la
reactivación que para los estudios lológicos y lingüísticos supuso la utilización de
sistemas informáticos en el tratamiento de datos dialectales.
Los cambios ocurridos en el ámbito de los estudios lingüísticos con la incorporación
de innovaciones informáticas y metodológicas obligaron a modicar las técnicas de
preservación y explotación de la información dialectal. Los atlas lingüísticos son
proyectos que requieren el almacenamiento y administración de datos de naturaleza
muy heterogénea (documentos de texto, guras, fotos, grabaciones, archivos de
vídeo, etc.). Esta información debe estructurarse de manera que se asegure su
conservación y se facilite la consulta y aprovechamiento de los materiales. Además,
la comunidad cientíca demanda que los datos se pongan a su disposición de forma
libre y en formatos que agilicen el tratamiento y análisis. Todos los interesados en
las investigaciones dialectales conocen lo difícil e ingrato que resulta manejar los
voluminosos tomos de los atlas lingüísticos editados en papel.
En esta contribución pretendo informar sobre las características principales del
proyecto de edición digital en línea del Atlas Lingüístico de la Península Ibérica
(García Mouton et al. 2016). El proyecto inicial, próximo al centenario, se emprendió
con la intención de publicar en formato tradicional un atlas lingüístico de las hablas
romances peninsulares de acuerdo con un plan cimentado en proyectos europeos
iniciados entre nales del siglo XIX y comienzos del XX. El proyecto actual tiene
como objetivo difundir los materiales recolectados, editados e inéditos, para la
empresa original a través de una plataforma de acceso libre, por medio internet, que
facilite la explotación de toda la información y contribuya a la difusión del patrimonio
lingüístico y etnográco albergado en los cuadernos de campo. En las páginas
siguientes se exponen los antecedentes de este proyecto y se muestran las principales
utilidades de las herramientas de consulta, utilizables ya en versión de pruebas desde
2017. Para una completa comprensión de la nueva empresa de edición del ALPI
pueden consultarse como complemento los trabajos de presentación realizados por
los miembros del equipo (ver García Mouton et al. 2016; Sousa 2020) y la minuciosa
revisión publicada por Águila Escobar (2017).
2. El proyecto original del Atlas Lingüístico de la Península Ibérica
El proyecto que se acostumbra a citar como precursor de la geografía lingüística
europea es el Deutscher Sprachatlas, puesto en marcha por Georg Wenker en la
segunda década del siglo XIX con la intención de trascender los estudios parciales
realizados hasta el momento sobre dialectos particulares del alemán (Chambers /
93
XULIO SOUSA
Trudgill 1998, 15). Alrededor de esta investigación monumental se fue formando
la escuela dialectológica de Marburgo, esencial en el desarrollo de la investigación
sobre las variedades germánicas (Scheuringer 2010). En 1913 Ferdinand Wrede,
continuador del proyecto del Deutscher Sprachatlas, recibe en Marburgo la visita
de un joven investigador becado por gobierno español para conocer proyectos de
fonética experimental y geografía lingüística que se desarrollaban en ese momento en
las principales universidades europeas (Cortés / García Perales 2009; Pérez Pascual
2019). El equipo de Wrede estaba trabajando en la continuación de la edición de los
materiales reunidos para el Deutscher Sprachatlas, que se habían obtenido por medio
de cuestionarios escritos enviados por correo a maestros de cerca de cincuenta mil
localidades de habla alemana (Scheuringer 2010). El visitante era Tomás Navarro
Tomás. En una carta a su maestro, el joven investigador reconoce que, a pesar de
que la visita había resultado provechosa, el proyecto de Wenker le parece un modelo
inadecuado de atlas lingüístico para su tiempo.
Con todo esto [el Deutscher Sprachatlas] saldrá incompleto y, sobre todo, anticuado; será
una base para poder hacer sobre él un Atlas más rigurosamente cientíco. Me parece que el
mismo Wrede lo reconoce; pero ¿Quién renuncia ya a publicarlo con lo adelantado que está?
Y ¿Quién se pone a buscar un segundo At[las] de Alem[ania]? En n, ¡creo que nosotros
podremos hacerlo mejor!… (Cortés / García Perales 2009, 60)
En su visita a otros centros universitarios europeos Navarro conoce también ini-
ciativas de proyectos de atlas lingüísticos que marcarán los principios de la dialec-
tología y geografía lingüística cientícas en el continente. El viaje de Navarro había
sido decisión de Ramón Menéndez Pidal, director del Centro de Estudios Históri-
cos y renovador de los estudios lingüísticos en la península. A principios del siglo
XIX Menéndez Pidal había ideado un proyecto de «mapa lingüístico» de las hablas
castellanas y aragonesas para el que contaría con la asistencia de Navarro Tomás,
un destacado discípulo suyo. El interés inicial de Menéndez Pidal era el trazado de
los límites de los dominios castellano y aragonés a partir de la investigación de varia-
bles fonéticas y gramaticales de interés general y regional (Cortés / García Perales
2009, 374). Este propósito fue el germen del atlas lingüístico de los romances peninsu-
lares que Navarro dirigiría y al que a la postre darían el nombre de Atlas Lingüístico
de la Península Ibérica. El conocimiento de los proyectos europeos había convencido
a Navarro de la relevancia de la fonética, de la necesidad de elaborar un cuestiona-
rio y de que el atlas «debía comprender todo el espacio peninsular» (Cortés / García
Perales 2009, 373-376) 2.
El diseño nal del proyecto del ALPI debe más a los atlas de Gilliéron (Atlas
linguistique de la France, ALF) y Jaberg y Jud (Sprach- und Sachatlas Italiens
und der Südschweiz, AIS) que a la obra iniciada por Wenker. Navarro Tomás
y Menéndez Pidal fueron capaces de reconocer que las características de los proyectos
2 La historia de la gestación y desarrollo del proyecto se está conociendo en detalle gracias
a las contribuciones que se dedican a indagar en la documentación pública y privada ligada a
la obra (Cortés / García Perales 2009; Alonso Montero 2011; Pérez Pascual 2016, 2019).
ODRES NUEVOS PARA VINO AÑEJO: LA EDICIÓN DIGITAL DEL ALPI
94
románicos suponían un gran avance metodológico que permitiría investigar con
mayor profundidad y rigor la variación lingüística en las hablas romances rurales de
la península ibérica.
Como otros atlas lingüísticos concebidos en la misma época para dominios
lingüísticos europeos, el proyecto del ALPI pretendía registrar documentación
lingüística de las hablas rurales de los hablantes auténticos con el n de conocer
mejor la historia y evolución de las variedades románicas peninsulares. España
a comienzos del siglo XX era una sociedad eminentemente rural. El proceso de
urbanización todavía no había tomado fuerza: el 90% de los municipios tenía una
población inferior a cinco mil habitantes y solo el 50% superaba el millar; además,
el porcentaje de población activa en agricultura en la década de 1930 era del 46%
(Barciela López / Carreras / Tafunell 2005) 3. En consecuencia, registrar las hablas
rurales suponía documentar las características lingüísticas de las variedades habladas
por la mayor parte de la población peninsular 4. En la distribución de los lugares de
encuesta se atendió al interés lingüístico de la zona (determinado por «noticias»
previas de los hechos dialectales), «los determinantes geográcos» y «los hechos
históricos» (Navarro Tomás et al. 1962, 5). El mapa de calor de la Figura 1 muestra
a través del sombreado las zonas de mayor densidad de puntos de encuesta (áreas más
oscuras). Como se puede apreciar, las áreas extremas de la mitad norte peninsular
son las documentadas con más detalle, como los mismos investigadores reconocen 5.
3 Las migraciones internas comenzaron a despegar en España a inicios de siglo XX, pero su
época de verdadero impulso fue a partir de las décadas de los años cincuenta y setenta.
4 La características demográcas y de ocupación del territorio de Portugal eran en este período
muy similares a las españolas (Barciela López / Carreras / Tafunell 2005).
5 En la introducción del volumen publicado del ALPI se indica que los criterios para la
distribución de las localidades investigadas tienen como consecuencia que «la red es poco
simétrica, pues es más tupida en las zonas de intensa diversidad dialectal, como Asturias,
que en regiones de mayor nivelación lingüística, como el centro de Castilla» (Navarro Tomás
et al. 1962, 5).
95
XULIO SOUSA
Figura 1. Mapa de calor de la densidad de distribución de localidades investigadas en el ALPI.
Las zonas más oscuras suponen una mayor concentración de puntos de encuesta.
La preferencia por «pueblos pequeños […], en los cuales el habla y la cultura
popular tradicionales se mantenían casi incontaminadas de la inuencia de las formas
más regulares y uniformes de las poblaciones importantes» (Navarro Tomás et al.
1962, 4) como lugares de entrevista estaba motivada por la búsqueda de informantes
auténticos, de acuerdo con la idealización de los hablantes rurales común a la
dialectología tradicional de la época (Britain 2014) 6. Por razones de diversa índole
el proyecto no se puso en marcha hasta la década de 1930. A pesar de ser Menéndez
Pidal el inspirador de la investigación, la dirección recae desde sus inicios en Navarro
Tomás, que se encarga de coordinar a un equipo de seis investigadores que iban
a recorrer las tres grandes áreas lingüísticas en que es dividido el territorio peninsular
(Figura 2): zona occidental (gallego y portugués), zona central (variedades castellanas,
aragonés y asturleonés) y zona oriental (variedades del catalán). Los seis eran jóvenes
con formación lingüística y conocedores de las hablas investigadas; además, la mayoría
habían sido discípulos o alumnos de Menéndez Pidal. En estas tres áreas se repartían
las 529 localidades que conforman la red de investigación del ALPI, todas ellas
6 La dialectología tradicional heredó el principio compartido en la lingüística del siglo XIX de
que a cada variedad lingüística le corresponde un territorio histórico soberano (Auer 2005).
En la introducción del volumen editado se indica que se había proyectado un estudio del
habla de «capitales provinciales y de otras ciudades que son focos expansivos de inuencia
lingüística» con el n principal de facilitar la investigación «de las cuestiones relativas a
cantidad y entonación» (Navarro Tomás et al. 1962, 3).
ODRES NUEVOS PARA VINO AÑEJO: LA EDICIÓN DIGITAL DEL ALPI
96
aldeas o villas pequeñas. La red de puntos se extiende por la España peninsular,
Islas Baleares, Portugal, Andorra y el Rosellón francés de habla catalana 7.
Figura 2. Mapa del ALPI en el que se diferencian las áreas de las lenguas peninsula-
res estudiadas tomando como criterio la diptongación de ĕ y ŏ tónicas latinas (isoglosas
oriental y occidental). En algunas localidades se indica el nombre que los entrevistados
dan al habla local (Navarro Tomás et al. 1962).
En el año 1931 se inician los trabajos de campo del proyecto en la provincia de
Cáceres, después de varios ensayos en los alrededores de Madrid (Pérez Pascual
2019). Cuando en el verano de 1936 estalla la Guerra Civil, ya se habían realizado la
mayor parte de las encuestas en territorio español y estaban en marcha las entrevistas
en el norte de Portugal. La contienda española tuvo consecuencias nefastas para el
proyecto. El director acabó exiliado en los Estados Unidos, varios de los investigadores
fueron encarcelados e incluso uno de ellos, el encuestador gallego Aníbal Otero,
fue condenado a «pena de reclusión perpetua» en 1936 y liberado en 1941 (Alonso
Montero 2009).
A nales de la década de los años cuarenta, en el seno del recién nacido Consejo
Superior de Investigaciones Cientícas, se retoma el proyecto, se reúnen los cuader-
nos de las entrevistas ya realizadas y se concluyen los trabajos de campo. Finalmente,
después de mucho esfuerzo y bajo la supervisión desde el exilio del director inicial,
aparece en 1962 el primer y único volumen del atlas, dedicado a la fonética y com-
puesto por 75 mapas, editados siguiendo el modelo de representación de datos sobre
7 En el País Vasco se seleccionaron cuatro localidades en Álava y una en Vizcaya.
97
XULIO SOUSA
el mapa de otros atlas románicos (Figura 3) 8. A pesar de que los trabajos del equipo
continuaron durante algunos años, nalmente el proyecto se abandona y los cuader-
nos quedan repartidos en los domicilios de algunos de los investigadores.
Figura 3. Detalle del mapa 24 (Navarro Tomás et al . 1962);
respuestas en Cantabria a la pregunta 111 del cuestionario (baúl).
A pesar del valor cientíco del ALPI, por diversas razones, tanto los materia-
les editados como los inéditos fueron prácticamente ignorados en los estudios de las
variedades románicas de España. Las publicaciones que sacan provecho de esta rica
información son la mayoría obra del grupo de investigadores que formaron parte de
la empresa desde su inicio y se consagran fundamentalmente a aspectos fonéticos
y léxicos (García Mouton et al. 2016, sección Publicaciones). Donde más relevancia
tuvieron los resultados de la investigación para la determinación de variedades dia-
lectales fue en el estudio de las dialectos europeos del portugués. Las propuestas
de división dialectal que todavía hoy se difunden y estudian tienen como base los
trabajos del investigador colaborador del ALPI Luis Filipe Lindley Cintra y están
fundamentadas en los materiales recogidos en Portugal para el proyecto (Cintra 1983;
cf. Segura 2013).
En el paso entre el siglo XX y el XXI se pone en marcha la primera tentativa de
reunir y poner a disposición de la comunidad cientíca los materiales inéditos del
ALPI. El profesor David Heap, de la Universidad de Western Ontario, después de
localizar los cuadernos, realizar una copia en papel y digitalizarla, creó un sitio web
desde el que era posible consultar la imagen escaneada de las páginas del primer
cuaderno del cuestionario (Heap 2002; 2012). A pesar de la peregrinación de los cues-
8 Los cuatro primeros mapas ofrecen información general sobre el proyecto (lugares estudia-
dos, denominación popular de los lugares, denominación de los habitantes, áreas lingüísticas
y colaboradores de encuesta).
ODRES NUEVOS PARA VINO AÑEJO: LA EDICIÓN DIGITAL DEL ALPI
98
tionarios del ALPI por distintos países, despachos, archivos y viviendas particulares,
los cuadernos se conservaron en buen estado y tanto los textos impresos como las
respuestas anotadas a lápiz o con pluma podían leerse sin dicultad en estas copias
digitales. Gracias a esta forma de difusión, el proyecto recobró nueva vida y fueron
varios los estudiosos que emprendieron trabajos de investigación sobre la informa-
ción inédita (García Mouton et al. 2016).
Casi una década después de emprendido el proyecto del ALPI, el Centro Superior
de Investigaciones Cientícas pone en marcha una iniciativa para la elaboración y
edición completa de los materiales del ALPI. Esta empresa se realiza bajo la direc-
ción de Pilar García Mouton (CSIC) y cuenta con la participación de investigadores
de diferentes universidades, todos ellos especialistas en el estudio de la variación dia-
lectal de los romances peninsulares. Desde el principio se acordó que el proyecto se
serviría de herramientas y técnicas informáticas y de internet para la edición y difu-
sión de toda la documentación de la obra.
3. El proyecto de edición y elaboración de los materiales del ALPI
El propósito del nuevo proyecto es editar y tratar los materiales del ALPI utili-
zando las posibilidades que la tecnología informática proporciona actualmente a los
trabajos geolingüísticos (García Mouton 2010, 169). Los avances en tecnologías digi-
tales y el conocimiento de experiencias similares hacen posible a esta altura el diseño
de un proyecto que aborde el tratamiento y conservación de los materiales originales,
la transcripción de las respuestas en un alfabeto fonético estandarizado, la creación
de una base de datos y la disposición de toda la información en formatos compatibles
y fácilmente accesibles. El objetivo nal es que el investigador interesado en conocer
las variedades rurales peninsulares de la primera mitad del siglo XX tenga acceso no
solo a una imagen digital de los cuadernos originales, sino también que pueda realizar
búsquedas sobre los datos, visualizar la distribución de las variantes de forma simple
y descargar los resultados de las búsquedas en formatos que permitan su posterior
tratamiento y explotación. Las aplicaciones web se emplearían tanto en la edición de
los materiales como en la aplicación de consulta.
En las últimas décadas se han emprendido otros trabajos de edición digital de
materiales geolingüísticos que han servido como modelo para el nuevo ALPI (Sch-
midt / Herrgen / Kehrein 2008; Tisato 2009; Davoine et al. 2015). El diseño infor-
mático de estas empresas se fundamenta en la combinación de cuatro módulos: i)
una base de datos para el manejo de la información; ii) una herramienta GIS; iii) un
módulo de edición y mantenimiento para uso de los administradores y colaboradores
del proyecto; y iv), una aplicación web de consulta. La base de datos alberga la infor-
mación textual de los cuadernos de campo y hace posible la consulta de los materia-
les. La herramienta de cartograado permite la representación de los resultados de
las consultas sobre un mapa y también, en los atlas ya editados de forma completa,
la visualización de las cartas originales publicadas en papel. En el caso del ALPI la
99
XULIO SOUSA
mayor parte de la documentación lingüística y etnográca recogida en los cuadernos
de campo no ha sido todavía editada y publicada. El formato más común de difusión
de los proyectos de geolingüística tradicional es el atlas lingüístico, una colección de
mapas que muestra la distribución de variantes para cada variable en el territorio.
El único volumen editado del ALPI contiene una parte muy pequeña de los datos
registrados en trabajo de campo 9.
3.1. La base de datos del nuevo ALPI
Con el n de hacer posible una explotación completa de los datos textuales
y grácos del ALPI desde diferentes perspectivas (consultas, elaboración de índices,
análisis de la variación, visualización de resultados, análisis diacrónico de datos, etc.),
el primer paso consistió en organizar y estructurar la información de manera que cada
elemento de la documentación recogida pudiese ser transferido a una base de datos
y caracterizado con respecto a todos los parámetros considerados en la investigación
inicial. A pesar de los intentos realizados en los últimos años para establecer un catá-
logo de clases y propiedades de los datos de los proyectos de geografía lingüística, no
existe todavía una ontología estandarizada y aceptada de forma general. Entre las
propuestas más completas destacan la presentada para el Atlante Sintattico d’Italia
(ASIt; Buccio / Nunzio / Silvello 2014) y la utilizada en el Datenbank der bairischen
Mundarten in Österreich (DBÖ; Scholz / Hrastnig / Wandl-Vogt 2018); con todo, estos
modelos todavía no han sido adoptados fuera de los correspondientes proyectos.
Esta carencia y la heterogeneidad de los proyectos de geografía lingüística han
sido utilizadas en ocasiones para justicar la dicultad de reutilización de los datos
y la escasa presencia de este tipo de proyectos en repositorios abiertos de datos
lingüísticos.
9 Para la elaboración de los mapas de fonética del volumen I se utilizaron 70 de las 1,244
preguntas contenidas en los cuestionarios I y IIG. En la página web del proyecto se pueden
consultar una edición digital del primer volumen de la obra (http://alpi.cchs.csic.es/).
ODRES NUEVOS PARA VINO AÑEJO: LA EDICIÓN DIGITAL DEL ALPI
100
Figura 4. Páginas 2 y 3 del cuaderno I de Hermisende (Zamora)
con datos sobre el informador y el lugar.
La información del ALPI se recoge en los cuadernos que los investigadores
utilizaron para registrar las respuestas que proporcionaban los informadores de
cada localidad. Las primeras páginas del cuaderno I contienen datos sobre la
localidad y sobre las personas entrevistadas; en las siguientes, y en todo el cuaderno
II, se transcriben las respuestas dadas para cada pregunta, las anotaciones de los
entrevistadores y los dibujos que ilustran alguna contestación (Figura 4). La base de
datos está diseñada para reunir toda esta información de forma ordenada. Con este
n se distribuye el contenido en cuatro secciones que se corresponden con las cuatro
tablas básicas de la base:
(a) Imagen de los cuestionarios. Los cuestionarios originales se han convertido en archivos
digitales y cada página se ha marcado de manera que desde los módulos de edición y de
consulta es posible acceder al tramo correspondiente a cada respuesta (Figura 5).
(b) Localización de las localidades. Los lugares investigados están georreferenciados y se ha
incorporado a esta tabla la información correspondiente recogida en los cuestionarios
(código de la localidad, nombre, parroquia, municipio, diócesis, provincia, etc.). Estos
datos permiten identicar geográcamente cada una de las repuestas de la base, conocer
toda la información lingüística existente para cada uno de los puntos de encuesta y crear
una visualización cartográca a partir del módulo GIS.
(c) Información textual de los cuestionarios. La estructura básica de los cuestionarios se
ha transformado en una tabla que permite registrar, en ortografía convencional y con
símbolos fonéticos, toda la información introducida por los investigadores: datos del
lugar, datos de los informadores, respuestas y anotaciones complementarias. Además, se
incorporaron un conjunto de registros para uso de los transcriptores (anotaciones sobre
la transcripción, clasicadores semánticos y morfosintácticos, etc.; Figura 5).
101
XULIO SOUSA
(d) Elementos grácos. Los dibujos que acompañan a algunas de las respuestas son
capturados con el módulo de edición y almacenados con referencia a la localidad y a la
pregunta correspondiente.
Las tablas correspondientes a estas secciones están vinculadas entre sí a partir
de los campos número de pregunta y código de localidad. El módulo de edición
utilizado por los transcriptores y revisores aprovecha la organización de la base de
datos para que la introducción de la información y la navegación por cuadernos,
páginas, localidades y preguntas sea cómoda y sencilla. El colaborador del proyecto
accede a la aplicación a través de una página web de uso restringido y selecciona
la localidad y el cuaderno que pretende editar. Una vez escogida la página y la pregunta
deseada, la aplicación muestra la imagen de la pregunta en el cuaderno original
(parte superior de la pantalla) y las celdas en las que debe introducir la información
(Figura 5). Las respuestas de los cuadernos se transcriben con los símbolos del alfabeto
fonético internacional, de acuerdo con una tabla de correspondencias que facilitan la
conversión de los símbolos originales 10, y en ortografía convencional. Desde el módulo
de edición es posible también acceder a una vista de los datos ordenados por pregunta
y por localidad. Esta forma de visualización facilita la búsqueda de incoherencias en
las transcripciones y, si es necesario, la corrección (Figura 5).
Figura 5. Vista completa de la cha correspondiente a la pregunta 502
Aguzanieves en Covas (Lugo).
10 El alfabeto fonético utilizado por los investigadores es un desarrollo del propuesto por
Navarro en la Revista de Filología Española. La complejidad de este sistema de símbolos y el
propósito de facilitar la consulta de los datos determinó que se acordase la adopción de AFI
en las transcripciones.
ODRES NUEVOS PARA VINO AÑEJO: LA EDICIÓN DIGITAL DEL ALPI
102
3.2. La aplicación de consulta
En la página web actual del proyecto se ofrece una demostración de la herramienta
de consulta de los contenidos de la base de datos del ALPI (menú Consulta Mapas).
La consulta puede iniciarse a partir de las preguntas del cuestionario o de las res-
puestas, bien en transcripción fonética 11 o en ortografía normalizada; además, es
posible restringir la búsqueda a una localidad (Cuestionario), a una zona 12 y a una
provincia. En los campos Cuestionario, Zona, Provincia y Pregunta cabe añadir más
de un elemento de consulta (Figura 6); es posible, por ejemplo, buscar las respues-
tas dadas en Galicia y Portugal para las preguntas Llevar a cuestas y Dar volteretas.
Al ejecutar la consulta se obtiene una tabla que contiene la información incluida
para la pregunta solicitada y de acuerdo con los criterios de consulta marcados.
En la versión actual esta tabla muestra información ordenada en siete campos
(Figura 7): Cuestionario (nombre de la localidad), Cuadernillo (cuaderno de campo
correspondiente a la pregunta), Provincia, Respuesta ORTO (transcripción de la res-
puesta en ortografía convencional), Respuesta AFI (transcripción de la respuesta en
caracteres fonéticos) y Opción; en este último campo aparecen tres iconos que dan acceso
a la vista completa de la cha de datos para cada pregunta, a la imagen del cuaderno
(Figura 7) y a la posibilidad de ocultar el registro completo de la tabla. La informa-
ción de la tabla se puede ordenar por cualquiera de los primeros seis campos y ade-
más ltrar segundariamente los datos por localidad, cuaderno, provincia y pregunta.
La versión nal de la aplicación en la que se está trabajando permitirá la descarga de
los datos en un formato estandarizado para que puedan ser reutilizados y analizados
en otras aplicaciones.
11 La aplicación ofrece acceso a un teclado virtual que simplica la escritura de los caracteres
fonéticos.
12 Las 529 localidades se distribuyeron en siete zonas teniendo en cuenta los códigos de puntos
de encuesta: i) Galicia (100-151); ii) Portugal (200-292); iii) Asturias, León y Extremadura
(300-377); iv) las dos Castillas, Álava, Vizcaya y Albacete (400-489); v) Andalucía y Murcia
(500-570); vi) Navarra y Aragón (600 -639); vii) Cataluña, Andorra, el Rosellón, Valencia
y las islas Baleares (700-803).
103
XULIO SOUSA
Figura 6. Vista de la página de consulta de acceso a la consulta
de la base de datos ‹http://alpi.cchs.csic.es/›.
Figura 7. Vista de los resultados de la consulta para la pregunta 502
Aguzanieves en el módulo de edición.
3.3. La visualización cartográca de los datos
En la página de resultados se ofrece también en demostración la herramienta de
representación cartográca de los datos consultados. La visualización se realiza bien
sobre un mapa de puntos bien sobre un mapa de polígonos, creado de acuerdo con
el proceso de teselación de Voronoi. En el mapa de puntos las variantes se presentan
con símbolos que pueden modicarse en forma (8 símbolos) y color (10 colores); en el
mapa de polígonos a cada variante se le atribuye uno de los diez colores disponibles.
A la forma de representación escogida se le añade una leyenda que gurará en el
ODRES NUEVOS PARA VINO AÑEJO: LA EDICIÓN DIGITAL DEL ALPI
104
mapa nal. La aplicación permite que los resultados de distintas búsquedas puedan
acumularse en un mismo mapa (menú Denir consulta), en el que además cabe com-
binar distintas formas de representación. En el mapa de la gura 8 las respuestas paja-
rita, lavandisca y aguzanieves (pregunta 502 Aguzanieves) se representan con las dos
formas disponibles en la herramienta: símbolos (lavandisca y pajarita) y polígonos de
color (aguzanieves). En la versión nal de la aplicación el mapa podrá descargarse en
formato pdf y en formato de imagen.
Figura 8. Vista del mapa generado con la distribución de las variantes
lavandisca, pajarita y aguzanieves (502 Aguzanieves).
4. Conclusión
En el año 1931 se iniciaron los trabajos de campo para la recogida de los materia-
les que permitirían conformar la primera descripción rigurosa de la variación regio-
nal de las variedades romances en la península ibérica. El proyecto del ALPI se gestó
como un atlas de gran dominio, como lo eran el ALF y el AIS en su tiempo. Circuns-
tancias ajenas a la empresa y al propósito de los investigadores participantes impidie-
ron que la documentación lingüística reunida fuese compartida y aprovechada para
el conocimiento de las hablas rurales ibéricas de la primera mitad del siglo XX.
El desarrollo teórico y metodológico de la dialectología en las últimas décadas
está contribuyendo a la renovación y avance de una disciplina que algunos ya consi-
deraban inservible y anacrónica. En este marco la geografía lingüística, y de forma
general los estudios de variación y cambio, se está sirviendo de técnicas que permiten
conocer en vivo como se transforma y distribuyen las variedades, tal y como se mues-
tra en varias de las contribuciones de este volumen. Las tecnologías digitales hacen
posible también que proyectos del pasado, publicados o inéditos, se pongan al alcance
de los investigadores de forma que toda la riqueza que atesoran pueda sea accesi-
105
XULIO SOUSA
ble de forma cómoda y simple en el marco de los principios de la ciencia abierta 13.
Los atlas lingüísticos tradicionales son resultado de proyectos complejos, duraderos
y costosos que tardan en ver reconocida su importancia como fuentes de documenta-
ción lingüística. Los participantes del proyecto de edición y elaboración de los mate-
riales del ALPI trabajamos con el propósito de que esta «acta documental del carácter
y sonomía del habla popular de la Península en los años inmediatamente anteriores
a la guerra civil» (Navarro 1975, 14) se convierta en un acicate para el desarrollo
de nuevas investigaciones sobre el conjunto de hablas peninsulares. Esperamos que
el deseo expresado por Diego Catalán a nales del siglo pasado de que el proyecto del
ALPI llegase a término del mejor modo se cumpla cuanto antes.
Aunque pueda considerarse al ALPI como un atlas lingüístico metodológi-
camente anticuado y su publicación haya sufrido un retraso de un cuarto de siglo,
sus méritos sobrepasan a sus defectos. La imagen de la estructuración dialec-
tal de la Península Ibérica que el ALPI nos proporciona conserva su interés en la
década de los 60, a pesar de los progresos realizados en el conocimiento de las varie-
dades dialectales existentes en los varios dominios lingüísticos que el atlas abarca.
Séanos permitido expresar un voto: que la edición de los próximos volúmenes se lleve a
término sin nuevas y, esta vez, injusticables dilaciones. (Catalán 1989)
Instituto da Lingua Galega, Xulio SOUSA
Universidade de Santiago de Compostela
Referencias bibliográcas
Águila Escobar, Gonzalo, 2017. «Presente y futuro del Atlas Lingüístico de la Península Ibérica:
de la versión impresa a la plataforma electrónica», La corónica 46, 185-205.
Alinei, Mario (ed.), 1983. Atlas linguarum Europae (ALE), Assen/Maastricht/Rome,
Van Gorcum/Istituto Poligraco e Zecca dello Stato.
Alonso Montero, Xesús, 2009. «Para a biografía de Aníbal Otero como lingüista: documentos
e datos inéditos ou descoñecidos», Madrygal, Revista de Estudios Gallegos 12, 11-24.
Alonso Montero, Xesús, 2011. Aníbal Otero. Lingüística e política en España na Guerra Civil
e no franquismo, Vigo, Xerais.
Auer, Peter, 2005. «The construction of linguistic borders and the linguistic construction of
borders», in: Filppula, Markku / Klemola, Juhani / Palander, Marjatta / Penttilä, Esa (ed.),
Dialects Across Borders: Selected Papers from the 11th International Conference on
Methods in Dialectology (Methods XI), Joensuu, August 2002, Amsterdam/Philadelphia,
John Benjamins, 3-30.
13 En la actualidad es posible consultar a través de versiones web varios de los proyectos
que sirvieron como modelo al ALPI: Digitaler Wenker-Atlas (‹https://regionalsprache.de/›),
AIS ‹http://www3.pd.istc.cnr.it/navigais/› y ALF ‹http://lig-tdcge.imag.fr/cartodialect5/#/›.
ODRES NUEVOS PARA VINO AÑEJO: LA EDICIÓN DIGITAL DEL ALPI
106
Barciela López, Carlos / Carreras, Albert / Tafunell, Xavier, 2005. Estadísticas históricas de
España. Siglos XIX-XX, Bilbao, Fundación BBVA.
Britain, David, 2014. «Geographical Dialectology», in: Holmes, Janet / Hazen, Kirk (ed.),
Research Methods in Sociolinguistics: A Practical Guide, Chichester, West Sussex (UK)/
Malden (MA), Wiley-Blackwell, 246-261.
Buccio, Emanuele D. / Nunzio, Giorgio M. / Silvello, Gianmaria, 2014. «A linked open data
approach for geolinguistics applications», International Journal of Metadata, Semantics and
Ontologies 9, 29-41.
Catalán, Diego, 1989. El español: orígenes de su diversidad, Madrid, Paraninfo.
Chambers, Jack K. / Trudgill, Peter, 1998. Dialectology, Cambridge, Cambridge University Press.
Cintra, Luís F. L., 1983. Estudos de dialectologia portuguesa, Lisboa, Sá Da Costa.
Cortés, Santi / García Perales, Vicent, 2009. La historia interna del “Atlas Lingüístico de la
Península Ibérica” (ALPI). Correspondencia (1910-1976), Valencia, Universitat de València.
Davoine, Paule-Annick / Gally, Silvia / Garat, Philippe / Chauvin, Carole / Copi, Oton / Cavalliere,
Camille, 2015. «New approach to explore and to study cartographical heritage in dialectology:
application to the Linguistic Atlas of France», in: Robbi Sluter, Claudia (ed.), Proceedings of
the 27th International Cartographic Conference, Rio de Janeiro, ICC.
García Mouton, Pilar, 2010. «El procesamiento informático de los materiales del Atlas
Lingüístico de la Península Ibérica de Tomás Navarro Tomás», in: Aurrekoetxea, G. /
Ormaetxea, J. L. (coord.), Tools for linguistic variation, Bilbao: Universidad del País Vasco,
Servicio Editorial = Euskal Herriko Unibertsitatea, Argitalpen Zerbitzua, 167-174.
García Mouton, Pilar / Fernández-Ordóñez, Inés / Heap, David / Perea, Pilar / Saramago, João /
Sousa, Xulio, 2016. ALPI-CSIC. Edición digital de Navarro Tomás, Tomás (ed.),
Atlas Lingüístico de la Península Ibérica, ‹http://alpi.cchs.csic.es/›.
Heap, David, 2002. «Segunda noticia histórica del ALPI (a los cuarenta años de la publicación
de su primer tomo)», Revista de Filología Española 82/1, 2, 5-19.
Heap, David, 2012. «Ten years of the online ALPI (Atlas Lingüístico de la Península Ibérica)»,
Dialectologia Special Issue III: Linguistic Atlas of the Iberian Peninsula (ALPI): Progress
and Perspectives, 43-56.
Lameli, Alfred, 2010. «Linguistic atlases. Traditional and modern», in: Auer, Peter / Schmidt,
Jürgen Erich (ed.), Language and Space. An International Handbook of Linguistic
Var iat ionm vol. 1: Theories and Methods, Berlin, De Gruyter Mouton, 567-592.
Navarro Tomás, Tomás 1975. «Noticia histórica del ALPI», in: Navarro Tomás, Tomás, Capítulos
de geografía lingüística de la Península Ibérica, Bogotá, Instituto Caro y Cuervo, 9-21.
Navarro Tomás, Tomás (coord.) et al., 1962. Atlas Lingüístico de la Península Ibérica, Vol. 1:
Fonética, Madrid, CISC.
Pérez Pascual, José I., 2016. Los primeros pasos de un largo caminar. Los comienzos del
Atlas Lingüístico de la Península Ibérica, San Millán de la Cogolla, Cilengua – Centro
Internacional de Investigación de la Lengua Española, Instituto Historia de la Lengua,
Monografías XVII.
Pérez Pascual, José I., 2019. «El inicio de las encuestas del Atlas Lingüístico de la Península
Ibérica», Boletín de la Real Academia Española 98, 573-597.
Presner, Todd / Shepard, David, 2016. «Mapping the Geospatial Turn», in: Schreibman, Susan /
Siemens, Raymond G. / Unsworth, John (ed.), A New Companion to Digital Humanities,
Malden (MA)/Chichester, West Sussex (UK), Wiley-Blackwell, Blackwell Companions
to Literature and Culture 93, 199-212.
107
XULIO SOUSA
Scheuringer, Hermann, 2011. «Mapping the German language», in: Lameli, Alfred /
Kehrein, Roland / Rabanus, Stefan, Language and Space. An International Handbook of
Linguistic Variation, vol. 2: Language Mapping, Berlin, De Gruyter Mouton, 158-179.
Schmidt, Jürgen E. / Herrgen, Jaochim / Kehrein, Roland, 2008. Regionalsprache.de
(REDE). Forschungsplattform zu den modernen Regionalsprachen des Deutschen,
‹https://regionalsprache.de/›.
Scholz, Johannes / Hrastnig, Emanual / Wandl-Vogt, Eveline, 2018. «A Spatio-Temporal Linked
Data Representation for Modeling Spatio-Temporal Dialect Data», in: Ballatore, Andrea /
Clementini, Eliseo / Fogliaroni, Paolo (ed.), Proceedings of Workshops and Posters at the
13th International Conference on Spatial Information Theory (COSIT 2017), Cham (CH),
Springer, Lecture Notes in Geoinformation and Cartography, 275-282.
Schreibman, Susan / Siemens, Raymond G. / Unsworth, John (ed.), 2016. A New Companion
to Digital Humanities, Malden (MA)/Chichester, West Sussex (UK), Wiley-Blackwell,
Blackwell Companions to Literature and Culture 93.
Segura, Luísa, 2013. «Variedades dialectais do Português Europeu», in: Raposo, duardo, Paiva
et al., Gramática do português, Coimbra, Fundação Galouste Gulbenkian, 85-142.
Sousa, Xulio, 2020. «Humanidades digitales y geografía lingüística: la edición digital del Atlas
Lingüístico de la Península Ibérica», in: Gallego, Ángel / Roca, Francesc (ed.), Dialectología
digital del español. Anexo de Verba, Santiago de Compostela, USC.
Tisato, Graziano G., 2009. NavigAIS: AIS Digital Atlas and Navigation Software [Digital version
of Jaberg & Jud, 1928-1940], ‹http://www3.pd.istc.cnr.it/navigais/›.
Veith, Werner H. / Putschke, Wolfgang / Hummel, Lutz, 1984-1999. Kleiner Deutscher Sprachatlas
(KDSA), Tübingen, Niemeyer, 106, 4 vol.
Viereck, Wolfgang / Ramisch, Heinrich, 1991-1997. The Computer Developed Linguistic Atlas
of England (CLAE), Tübingen, Niemeyer, 2 vol.