Article

Linguistische Wikipedistik

Authors:
To read the full-text of this research, you can request a copy directly from the authors.

No full-text available

Request Full-text Paper PDF

To read the full-text of this research,
you can request a copy directly from the authors.

Article
Die beiden zentralen Forderungen des Iconic Turns sind, 1) das Bildhafte an kulturellem Handeln anzuerkennen, aber auch 2) Bilder als Analyseinstrument von Kultur zu nutzen. Es geht um eine Rehabilitierung des Visuellen in seiner weitesten Bedeutung, verbunden mit der Erkenntnis, dass Bilder maßgeblich kulturelles Handeln prägen. Als Korpuslinguist ist man immer wieder mit dem Vorwurf konfrontiert, mit der Analyse von Textkorpora ebendiese Visualität sträflich zu vernachläßigen. Wenn man beispielsweise Diskurse in Sozialen Medien wie Twitter, Facebook, Instagram u.ä. untersucht, sind diese ohne Zweifel von einer reichen Praxis der Bildbenutzung, Bildzitation etc. durchdrungen. Das stellt korpus- und computerlinguistische Untersuchungen von Social-Media-Daten, wie z.B. sog. Sentiment-Analysen, die große Mengen von Twitter-Tweets auf ihre Tonalität hin untersuchen, vor Probleme. Denn, um nur ein Minimalbeispiel zu geben, kann ein Text begleitendes Bild die Tonalität eines Tweets grundsätzlich ändern. Gar nicht erfasst werden zudem textlose, nur aus einem Bild bestehende Tweets, die genauso als Zeichen eine Tonalität entfalten können. Weniger quantitativ ausgerichtete linguistische Analysen berücksichtigen jedoch die Bildlichkeit solcher Daten weit stärker, wie verschiedene multimodale Analysen zeigen (Frank-Job u. a., 2013; Seizov/Wildfeuer, 2017; Zappavigna, 2018; grundsätzlich: Page u. a., 2014, S. 16). Sie können beispielsweise verdeutlichen, wie Tweets als multimodale Zeichen, die zitiert, rekontextualisiert und modifiziert werden, diskursive Kräfte entfalten. Mit den folgenden Überlegungen möchte ich aber einen nochmals anders gelagerten Aspekt von Bildlichkeit in sozialen Medien thematisieren: Dabei geht es nicht um Bilder im Sinne von Fotos, Zeichnungen, Filmen etc. als Bestandteile von Posts, sondern um diagrammatische Bildlichkeit, die die Darstellungen und Ordnungen von Texten, Postings und allen anderen Zeichen in sozialen Medien organisieren. Diese diagrammatische Bildlichkeit geht zurück auf diagrammatische Grundfiguren wie Listen, Netze, Karten oder Partituren. So erscheinen Tweets in einer „Timeline“ als geordnete Liste, die jedoch z.B. über die Auswahl eines Hashtags anders geordnet wird. Der springende Punkt bei den Überlegungen ist dabei, dass die Analysen von Sozialen Medien wiederum selber diagrammatische Operationen vornehmen und so neue Ordnungen rekonstruieren. Verfolgt man ein diskursanalytisches Interesse bei der Analyse solcher Daten, ist das Zusammenspiel von „präanalytischen“ und analytischen diagrammatischen Operationen ein nicht zu trennendes Ensemble der gemeinsamen Rekonstruktion von Diskursen.
Book
Full-text available
In Digital Methods, Richard Rogers proposes a methodological outlook for social and cultural scholarly research on the Web that seeks to move Internet research beyond the study of online culture. It is not a toolkit for Internet research, or operating instructions for a software package; it deals with broader questions. How can we study social media to learn something about society rather than about social media use? Rogers proposes repurposing Web-native techniques for research into cultural change and societal conditions. We can learn to reapply such “methods of the medium” as crawling and crowd sourcing, PageRank and similar algorithms, tag clouds and other visualizations; we can learn how they handle hits, likes, tags, date stamps, and other Web-native objects. By “thinking along” with devices and the objects they handle, digital research methods can follow the evolving methods of the medium. Rogers uses this new methodological outlook to examine such topics as the findings of inquiries into 9/11 search results, the recognition of climate change skeptics by climate-change-related Web sites, and the censorship of the Iranian Web. With Digital Methods, Rogers introduces a new vision and method for Internet research and at the same time applies them to the Web's objects of study, from tiny particles (hyperlinks) to large masses (social media).
Article
Full-text available
Wikipedia is a valuable resource, useful as a lingustic corpus or a dataset for many kinds of research. We built corpora from Wikipedia articles and talk pages in the I5 format, a TEI customisation used in the German Reference Corpus (Deutsches Referenzkorpus-DeReKo). Our approach is a two-stage conversion combining parsing using the Sweble parser, and transformation using XSLT stylesheets. The conversion approach is able to successfully generate rich and valid corpora regardless of languages. We also introduce a method to segment user contributions in talk pages into postings.
Article
Full-text available
This paper describes work in progress on I5, a TEI-based document grammar for the corpus holdings of the Institut für Deutsche Sprache (IDS) in Mannheim and the text model used by IDS in its work. The paper begins with background information on the nature and purposes of the corpora collected at IDS and the motivation for the I5 project (section 1). It continues with a description of the origin and history of the IDS text model (section 2), and a description (section 3) of the techniques used to automate, as far as possible, the preparation of the ODD file documenting the IDS text model. It ends with some concluding remarks (section 4). A survey of the additional features of the IDS-XCES realization of the IDS text model is given in an appendix.
Chapter
Full-text available
With the rise of the Web 2.0, participatory and collaborative content production have largely replaced the traditional ways of information sharing and have created the novel genre of collaboratively constructed language resources. A vast untapped potential lies in the dynamic aspects of these resources, which cannot be unleashed with traditional methods designed for static corpora. In this chapter, we focus on Wikipedia as the most prominent instance of collaboratively constructed language resources. In particular, we discuss the significance of Wikipedi’s revision history for applications in Natural Language Processing (NLP) and the unique prospects of the user discussions, a new resource that has just begun to be mined. While the body of research on processing Wikipedia’s revision history is dominated by works that use the revision data as the basis for practical applications such as spelling correction or vandalism detection, most of the work focused on user discussions uses NLP for analyzing and understanding the data itself.
Article
This paper introduces the research field of Wikipedactics with a focus on the relevance of Wikipedia’s lexicographic aspects for German lessons in higher education: The central issue is to describe one of the most successful digital platforms of the Social Web as a worthwhile teaching and learning subject. It explains Wikipedia’s hypertextual nature, its micro- and macro-structure and details scenarios of use in the classroom and the lecture hall. The paper demonstrates how pupils and students can develop digital skills and information competences when using Wikipedia. Furthermore, the didactic potential of digital tools such as Wikibu and WikiWatchdog enabling the reflected access of Wikipedia users to the online-encyclopaedic content is evaluated.
Chapter
Im Zusammenhang mit Besonderheiten von Text und Interaktion im Web 2.0 stellt der vorliegende Beitrag die Frage in den Vordergrund, ob und inwieweit sich Methoden und Kategorien aus der Textlinguistik und der Gesprächsforschung auf die Analyse kommunikativer Prozesse und sprachlicher Produkte im Web 2.0 übertragen lassen. Am Beispiel der Wikipedia werden die Gemeinsamkeiten und Unterschiede zwischen Text und Hypertext und zwischen mündlichen Gesprächen und internetbasierter Kommunikation erläutert. Es wird gezeigt, dass die an monologischen Texten ausgerichteten Ansätze zur Textanalyse kombiniert werden müssen mit Ansätzen zur Analyse dialogischer Interaktion, wenn man die für das Web 2.0 typischen Prozesse der gemeinschaftlichen Produktion und Aushandlung von Wissen erfassen möchte. Dabei wird auch diskutiert, wie man die digitalen Besonderheiten des Web 2.0 - Nichtlinearität, Multimodalität, Interaktivität, Dynamik, Adaptivität - bei der Datenerhebung berücksichtigen sollte und welche Möglichkeiten korpusbasierte und computergestützte Analysemethoden bieten.
Chapter
Für die mediale Dimension grammatischer Variation spielt die Unterscheidung von Gespräch und Text eine wichtige Rolle. Implizit wird dabei die Kategorie Text mit schriftlich realisierter Sprache und die Kategorie Gespräch mit mündlich realisierter Sprache identifiziert. Diese Zuordnung wird in Anbetracht der mediatisierten, hypermedialen Präsentations-und Kommunikationsformen im Internet zunehmend fragwürdig. Der Beitrag zeichnet die Diskussion um die varietätenlinguistische Einordnung der internetbasierten Kommunikation nach und führt das Oppositionspaar „textorientiert“ vs. „interaktionsorientiert“ ein, das es ermöglicht, auf der schriftlichen (medial graphischen) Ebene zwischen zwei Konstellation zu unterscheiden, in denen nähesprachliche Sprachmerkmale gehäuft auftreten: (1) Das interaktionsorientierte Schreiben in der internetbasierten Kommunikation und (2) die fingierte Mündlichkeit in literarischen Texten, die dem textorientierten Schreiben zuzuordnen ist. Am Fallbeispiel der interaktiven Einheit HM wird illustriert, wie frei verfügbare Korpusressourcen genutzt werden können, um die Gemeinsamkeiten, Unterschiede und Interferenzen zwischen der Verwendungen interaktiver Einheiten in Gespräch, Text und internetbasierter Kommunikation zu untersuchen.
Article
In the last decade, analyzing online interaction rapidly gained in popularity and especially Wikipedia with its collaborative nature is a favored research object in linguistic studies. In discourse (linguistic) studies, there are some studies focusing on Wikipedia's encyclopedic article pages and others concentrating on conversational-like data on Wikipedia's talk pages. While the former can be located in the paradigm of Foucauldian discourse analysis, the latter have a rather conversation analytic approach. This paper gives an impulse to consider the convergence of data - namely the text-text convergence of article and talk pages on Wikipedia - by integrating digital conversation analysis () with Foucauldian discourse analysis (). The paper begins to address this gap by conducting a detailed microanalysis on how discussions on talk pages impact on regimes of meaning on Wikipedia's article pages. The discourse fragment under investigation is the controversially discussed entry Annexation of Crimea by the Russian Federation. The considerations result in an analytic framework that integrates Foucauldian discourse analysis and digital conversation analysis. Therefore, this paper contributes to the discussion about digital conversation analysis by investigating digital discourses on Wikipedia. The microanalysis reveals communicative strategies and practices of interactivity on article pages and on corresponding talk pages. The peculiarities of Wikipedia's data will be explained, modes of analysis discussed and the challenges of the suggested integration of methods will be explored.
Chapter
Dieser Beitrag setzt sich mit der Bildbewertung in den Wikimedia-Commons auseinander. Zunächst wird dazu ein Überblick über das Forschungsfeld mit seinen bisher noch weitgehend unbearbeiteten Fragestellungen gegeben. Insbesondere wird eine Zusammenfassung des internen Regelwerks zum Umgang mit Bildern vermittelt. Dann erfolgt eine Konzentration auf ein konkretes Teilgebiet, nämlich die bewertenden Abstimmungen in den Commons. Eine quantitative Analyse der hier vorgebrachten Argumente erlaubt Rückschlüsse auf Wichtigkeit und Durchsetzbarkeit der im allgemeinen Regelwerk vermittelten Werte.
Di Alemannischi Wikipedia - Di frei Enzyklopedi, wo alli chöi mitschaffe: Eine text- und variationslinguistische Analyse der alemannischen Sprachversion der Wikipedia
  • Eva Gredel
DeReKo - Das Deutsche Referenzkorpus. Schriftkorpora der deutschen Gegenwartssprache am Institut für Deutsche Sprache in Mannheim
  • Harald Lüngen
Die Dynamik sozialer und sprachlicher Netzwerke. Konzepte, Methoden und empirische Untersuchungen am Beispiel des WWW
  • Rainer Hammwöhner
wo alli chöi mitschaffe: Eine text- und variationslinguistische Analyse der alemannischen Sprachversion der Wikipedia
  • Eva Gredel