Project

Linguistic methodology

Updates
0 new
2
Recommendations
0 new
0
Followers
0 new
4
Reads
0 new
52

Project log

Christian Lehmann
added a research item
Ein multilinguales linguistisches Begriffssystem wird in Form einer Datenbank implementiert, die dem Benutzer den semasiologischen und onomasiologischen Zugriff erlaubt, ihn also zu einem gegebenen Terminus den Begriff und seine Definition und zu einem gegebenen Begriff die Termini in den beteiligten Sprachen finden lässt. Die Mehrfachzuordnung von Begriffen zu Termini ist dabei auf interlingualer Ebene nicht wesentlich verschieden von der Situation in einer monolingualen Ontologie. Für die Normierung einer interlingualen Ontologie werden Grundsätze zur Bildung von Begriffen und von Termini vorgeschlagen. Zwischen den Begriffen bestehen eine Menge von vordefinierten konzeptuellen Relationen, die sie in systematische Beziehungen zueinander setzen und es sowohl dem Verwalter ermöglichen, das System konsistent zu halten, als auch dem Benutzer, im Begriffssystem zu navigieren.
Christian Lehmann
added a research item
The question of whether two phenomena should be subsumed under the same concept is a frequent conceptual problem in linguistics and particularly relevant in typology. Questions such as whether a certain Turkish case can be called a dative if the Latin dative is are typical of the general methodological problem of comparative concepts. Recent approaches have tended to play down the relationship of comparative to descriptive categories, as if these belonged to unrelated fields. Quite on the contrary, a fruitful relationship between comparative and descriptive linguistics presupposes that they use the same conceptual framework. This requires that the relation between a language-specific category and a corresponding comparative category be made explicit. This task has often proved elusive. Its solution presupposes the following steps: • many linguistic concepts are prototypical rather than categorical concepts • descriptive and comparative concepts are in a hierarchy of increasing generality and abstractness • grammatical categories of individual languages are “hybrid” semiotic categories, while comparative categories may be purely formal, purely semantic or hybrid. These principles are illustrated by concepts in the vicinity of numeral classification.
Christian Lehmann
added 3 research items
Der Begriff und die Rolle von Daten in einer Wissenschaft hängen eng mit ihrem Selbstverständnis zusammen. Als erstes ist zu überlegen, inwiefern Linguistik eine empirische Wissenschaft ist und also von Daten abhängt. Während in den Philologien ein Korpus die Grundlage einer Disziplin abgibt, die ohne es nicht bestünde, ist in der Linguistik ein Korpus nur ein Weg, an Daten zu kommen. Hier ist zu diskutieren, welche relativen Meriten die alternativen Wege im Hinblick auf die angestrebten Ziele haben. Während manches auf uns gekommene Korpus seine Sprache sicher nicht angemessen repräsentiert, könnte eine heute von Linguisten erstellte Dokumentation diesen Anspruch im Prinzip einlösen. Hier stellt sich die Frage, ob das-angesichts des infiniten Charakters der Sprache-überhaupt möglich ist und in wieweit die Repräsentativität wieder von den angestrebten Zielen abhängt. Dies sind alles Fragen linguistischer Methodologie. Eine Zeitlang hat man in der Linguistik geglaubt, ohne Methodologie zu Theorien gelangen zu können. Seit sich das als irrig herausgestellt hat, ist die Entwicklung von Methoden ein fühlbares Desiderat geworden. Wie man repräsentative Daten erhebt, wie man ein Korpus zusammenstellt und nutzt, wie man eine Sprache dokumentiert, sind alles Fragen, die eigentlich in die Alltagsroutine einer Wissenschaft fallen müssten. Dass sie noch weitgehend ungeklärt sind, ist ein Symptom dafür, dass die Linguistik noch keine erwachsene Wissenschaft ist. 1
Many traditional linguistic terms start out by designating morphological concepts. They are subsequently upgraded to designate syntactic and finally semantic concepts. This is not a controlled terminological operation, but an uncontrolled semantic change.
Basic guidelines for writing a linguistic grammar are proposed.
Christian Lehmann
added a research item
Understanding the differences underlying the scope, usage and content of language data requires the provision of a clarifying terminological basis which is integrated in the metadata describing a particular language resource. While terminological resources such as the SIL Glossary of Linguistic Terms, ISOcat or the GOLD ontology provide a considerable amount of linguistic terms, their practical usage is limited to a look up of a defined term whose relation to other terms is unspecified or insufficient. Therefore, in this paper we propose an ontology for linguistic terminology, called OnLiT. It is a data model which can be used to represent linguistic terms and concepts in a semantically interrelated data structure and, thus, overcomes prevalent isolating definition-based term descriptions. OnLiT is based on the LiDo Glossary of Linguistic Terms and enables the creation of RDF datasets, that represent linguistic terms and their meanings within the whole or a subdomain of linguistics.
Christian Lehmann
added a research item
In Part 1 it is suggested that a concept of semantic complexity that has empirical relevance can be formed if it is regarded as the specificity of meaning. This means that polysemy does not add to, but subtracts from the semantic complexity of a word. Markedness, on the other hand, adds to complexity; and semantic markedness theory can, in fact, be regarded as a part of the theory of semantic complexity. A measure of semantic complexity which depends on semantic representations in a predicate-calculus-type notation is formalized. The empirical correlate of the semantic complexity of a word thus calculated is its amount of information, as determined by checking it in a frequency dictionary. In Part 2 Portuguese kinship semantics is treated as an example. First, a semantic analysis of all the terms is presented; second, the semantic complexity of each of the items is computed; third, the field is ordered according to five semantic relations which emerge as complexity relations; fourth, the frequency of the terms is determined by a Portuguese frequency dictionary, and the figures for the amount of information are calculated; and last, it is seen that there is a nearly 100 percent correlation between semantic complexity and amount of information. This is taken to corroborate the empirical nature of the complexity measure. In Part 3 there is a discussion of some problems related to an improved application of the complexity measure. It is suggested that after some necessary refinements have been made, the check-up in a frequency dictionary will be able to serve as a partial test on the empirical adequacy of proposed semantic descriptions.
Christian Lehmann
added a research item
This is a first attempt to define a format for interlinear morphological glossing. The most recent version is on www.christianlehmann.eu/ling/ling_meth/ling_description/representations/gloss/ which is an updated web version of https://www.researchgate.net/publication/280625403_Interlinear_morphemic_glossing
Christian Lehmann
added a research item
Unter wissenschaftspraktischem Gesichtspunkt ist linguistische Terminologie eine Menge von Schlagwörtern, die z.B. zur Literatursuche nach Sachkriterien benutzt wird. Sie sind durch eine Menge von vordefinierten Relationen miteinander verknüpft, die die Verweisung auf Nachbartermini leisten und formale Aspekte des Begriffssystems wiedergeben. Vermöge ihrer logischen Eigenschaften tragen einige dieser Relationen zur Bildung einer Hierarchie unter den Termini bei. Das entstehende terminologische Netz ist also teilweise systematisch. Es ist, wenn in EDV implementiert, insofern leichter zu pflegen und insbesondere konsistent zu halten als eine Menge von Schlagwörtern, die entweder gar nicht oder bloß durch eine logisch-semantisch leere Verweisrelation verknüpft wären. Dem Benutzer erleichtert es die Orientierung in der Terminologie und unterstützt ihn bei dem Anliegen, einen zusammenhängenden Ausschnitt linguistischer Begrifflichkeit zu bearbeiten.
Christian Lehmann
added a research item
This article aims to be a contribution to the methodological foundations of linguistics. To answer the question of "what are scientific data?", a semiotic conception of data is proposed according to which they are representations of properties of the object area of a science that serve certain purposes for their users. Kinds of data are distinguished by their ontological status, degree of abstractness, the type of sign representing them and their originality. The methodological status of data in the history of linguistic science is briefly reviewed, and their functions in scientific argument are specified. Various methods of data provision by generation of data or by use of available data are discussed. Since data are representations, they are per se a linguistic issue which, however, is even more complicated for linguistic data proper, because here diverse linguistic levels and diverse levels of abstractness have to be controlled. Apart from the principal necessity to have clarity on the methodological bases of a science, the issue of the nature and function of data in linguistics acquires increased urgency in a world where the documentation of endangered languages is, first and foremost, one of adequate data provision.