Article

Construction d'une base de données des collocations bilingue français-espagnol

Authors:
To read the full-text of this research, you can request a copy directly from the author.

Abstract

Our object of study is the description of collocations in French-Spanish dictionaries. We distinguish collocations from other idioms following Mel'cuk's (1995) approach. After examining the treatment of collocations in some traditional bilingual dictionaries, we propose a new model of bilingual dictionary limited to collocations.

No full-text available

Request Full-text Paper PDF

To read the full-text of this research,
you can request a copy directly from the author.

... Además, aunque varios autores destacan la importancia de la elaboración de diccionarios con un enfoque especial en las colocaciones o para la construcción de diccionarios de colocaciones específicos (Alonso- Ramos 2001, Atkins y Rundell 2008, Moon 2008Orenha-Ottaiano 2013, 2016Kilgarriff 2015, etc.), el número de diccionarios de colocaciones en línea o electrónicos disponibles es todavía escaso, especialmente cuando se trata de diccionarios de colocaciones bilingües o multilingües para la lengua general. ...
Article
Full-text available
El objetivo de esta contribución es mostrar algunos resultados de las colocaciones extraídas del idioma chino, así como discutir los problemas que hemos observado al trabajar con esta lengua en la Plataforma Multilingüe de Diccionarios de Colocaciones (PLATCOL). PLATCOL incluirá colocaciones en inglés, portugués, español, francés y chino (AUTOR et al., 2021) y forma parte del proyecto NOMBRE_PROYECTO. En el diccionario se ha seguido una metodología unificada para obtener los datos que poblarán las entradas. Esta metodología que funciona con razonable eficacia en las demás lenguas –aunque requiere una fase supervisada de corrección y validación– conlleva un esfuerzo suplementario en el caso de la lengua china donde, por ejemplo, discrepancias en la asignación de categorías gramaticales pueden afectar a la eficacia del método a la hora de extraer candidatos.
... Additionally, even though several authors emphasise the importance of compiling dictionaries with a special focus on collocations or for the building of specific collocations dictionaries (Alonso-Ramos, 2001;Atkins & Rundell, 2008;Moon, 2008;Orenha-Ottaiano, 2013, 2015Kilgarriff, 2015, etc.), the number of online or electronic collocations dictionaries available is still scarce, especially when it comes to bilingual or multilingual collocations dictionaries for general language. ...
Conference Paper
Full-text available
This paper describes the first steps of a corpus-based methodology for the development of an online Platform for Multilingual Collocations Dictionaries (PLATCOL). The platform is aimed to be customized for different target audiences according to their needs. It covers various syntactic structures of collocations that fit into the following taxonomy: verbal, adjectival, nominal, and adverbial. Part of its design, layout and methodological procedures are based on the Bilingual Online Collocations Dictionary Platform (Orenha-Ottaiano, 2017). The methodology also relies on the combination of automatic methods to extract candidate collocations (Garcia et al., 2019a) with careful post-editing performed by lexicographers. The automatic approaches take advantage of NLP tools to annotate large corpora with lemmas, PoS-tags and dependency relations in five languages (English, French, Portuguese, Spanish and Chinese). Using these data, we apply statistical measures (Evert et al., 2017; Garcia et al., 2019b) and distributional semantics strategies to select the candidates (Garcia et al., 2019c) and retrieve corpus-based examples (Kilgarriff et al., 2008). We also rely on automatic definition extraction (Bond & Foster, 2013) so that collocations can be more effectively organized according to their specific senses.
... Hay otros ejes definitorios importantes (Alonso Ramos, 1995Ramos, , 2017: a) La frecuencia no es necesariamente un factor para determinar una combinatoria restringida, ni tampoco la contigüidad inmediata de las unidades léxicas combinadas, como dijimos anteriormente. Así, el [DECF] considera útil la información de combinatoria, independientemente de su frecuencia, como marca del funcionamiento de la palabra. ...
Article
Corpus-based combinatorial dictionaries are spreading, some for the general public and others for a specialized audience. We have also recently found some recent projects of bilingual combinatorial dictionaries that show the need for a reflection on the interface between the two languages. In our case, our goal is to design a bilingual French-Spanish combinatorial dictionary (TACTICOMB) that serves effectively for production and translation by combining semantic, syntactic and combinatorial elements and by developing the notion of mesostructure, the interface for passing from one language to another. We will illustrate the design of the dictionary through an entry model for combinatory of the noun peur with verbs.
... 5 Para una propuesta de tratamiento de estas colocaciones en el marco de la lexicografía francés-español, cf. Alonso Ramos (2001). ...
Article
Full-text available
Resumen. Este artículo presenta un inventario de las clases sintáctico-semánticas que se han utilizado para la clasificación de los adjetivos predicativos de estado en un diccionario electrónico del español. En primer lugar, se ofrece una tipología general de los distintos tipos de adjetivos, a fin de situar la noción de "adjetivo predicativo". A continuación, se presenta una tipología de situaciones a fin de situar la noción de "estado". Finalmente, se comenta brevemente la metodología de establecimiento de las clases semánticas y se ofrece el inventario de clases, agrupadas según el tipo de sujeto característico. Palabras clave: adjetivo predicativo, clase semántica, tipología de situaciones, diccionario electrónico. AbstRAct. This article presents an inventory of the syntactic-semantic classes that have been used to classify the predicative adjectives of state in an electronical dictionary of Spanish. First, we offer a general typology of the different kinds of adjectives, in order to properly identify the notion of "predicative adjective". Then, we present a typology of situations in order to properly identify the notion of "state". Finally, we briefly discuss the methodology used to establish the list of semantic classes and we propose the inventory of the classes, that have been grouped according to the type of characteristic subject.
Article
Full-text available
We propose here through a corpus of Berber (Kabyle) locutions containing the lexeme ul "heart", drawn mainly from dictionaries, to make the departure between idioms, collocations and free combinations of words. We will first approach the concepts of idiom and collocation, opposed to the free combination of words, trying to give definitions clear enough to be applied rigorously to our corpus, and will end with the analysis of our material and the resulting conclusions.
Article
Full-text available
Uno de los indicios claros de competencia lingüística en una lengua es el dominio de las combinaciones léxicas. El término habitual que se maneja es el de colocación, pero es imposible que haya un consenso total en el tipo o tipos de combinación que corresponden a ese concepto. Un usuario habitual de diccionarios bilingües no se plantea qué es colocación, sin embargo el análisis de la naturaleza de las combinaciones léxicas es muy útil para los lexicógrafos, porque deben adoptar soluciones a la hora de mostrar en el diccionario bilingüe los distintos tipos de combinación. En este trabajo dedicamos un primer apartado a exponer, de un modo resumido, las tres concepciones más importantes de este término (1. la anglosajona, que se apoya en la frecuencia; 2. la de los lingüistas y fraseólogos Mel´čuk y afines, que enfatizan la restricción léxica sobre la semántica; 3. la de Bosque, para quien la mayoría de las combinaciones se rigen por la restricción) para destacar los distintos tipos de combinaciones léxicas (libres, restringidas; estándar, no estándar; de restricción léxica, de restricción semántica). Después se expone la indefinición del concepto de colocación y su difícil distinción de la combinación libre en el ámbito de la lexicografía, especialmente en lo referente a los diccionarios bilingües. Este análisis pone de manifiesto que hay combinaciones léxicas más o menos previsibles, más o menos sistemáticas o generalizables, más o menos restrictivas. A partir de estas consideraciones teóricas se especifican los componentes lexicográficos que pueden mostrar el fenómeno colocacional en sus diferentes manifestaciones: la indicación de contexto para las combinaciones más previsibles y sistemáticas, menos restrictivas, el ejemplo para las colocaciones más restrictivas y las que plantean más dificultades desde una perspectiva bilingüe, y el infralema (subentrada) para combinaciones estables que tienen por lo general un equivalente canónico en otras lenguas.
Thesis
Full-text available
El ejemplo es un componente necesario de todo diccionario de lengua, y especialmente de un diccionario bilingüe destinado a aprender y usar una lengua extranjera. En este trabajo, después de establecer las bases teóricas y la terminología usada (la lexicografía bilingüe, la concepción del diccionario como discurso metalingüístico del léxico y como texto condensado, los conceptos fundamentales de la metalexicografía referidos a la microestructura), se determina la naturaleza y el estatus teórico del ejemplo lexicográfico, y más en concreto, del bilingüe; se ofrece una definición exhaustiva del ejemplo y se especifican los rasgos distintivos del ejemplo bilingüe que se desarrollan a continuación. Se determinan los tipos de ejemplos lexicográficos, prestando una mayor atención a los de diccionarios bilingües. Se estudian las funciones que desempeñan los ejemplos (que son básicamente las de ilustrar la información ofrecida en el artículo y aportar una información complementaria), su valor de modelo a partir del cual el usuario puede formar sintagmas u oraciones y su mayor o menor vinculación al sistema lingüístico (langue) o a realizaciones propias del habla (parole). El ejemplo bilingüe no solo ilustra la palabra lematizada sino el uso del equivalente, por eso se distinguen, de la categoría lexicográfica del ejemplo, las unidades léxicas fijas que en muchos diccionarios bilingües se presentan tipográficamente como ejemplos, pero que en realidad no ejemplifican, sino que pueden ser ejemplificadas: el infralema (subentrada), categoría cuyo contenido se define en términos precisos (como infralema se presentan no solo locuciones, sino también combinaciones estables o piezas léxicas y pragmatemas que tienen un significado preciso y, en la mayoría de los casos, un equivalente canónico en otra lengua). También se analizan los ejemplos cuya traducción no incluye el equivalente presentado o que ilustran un uso de la palabra lematizada de la que no se ha dado siquiera equivalente. Dado que el ejemplo ilustra el uso de la palabra lematizada desde el aspecto gramatical y léxico, son objeto de estudio exhaustivo las informaciones gramaticales y léxicas que aporta el ejemplo. Además de las explicitaciones morfológicas que puede revelar el ejemplo, el ejemplo muestra las implicaciones sintácticas de la palabra y aquí se analiza cuándo el ejemplo ilustra una información ya dada en el artículo y cuándo esta ha de ser explicitada por el usuario. El comportamiento combinatorio de la palabra lematizada es la información más frecuente que aporta el ejemplo, por lo que se presta a este aspecto una atención especial, empezando por el mismo concepto de colocación, que en el ámbito de la lexicografía es bastante indeterminado. Se señala no obstante que la función de mostrar la combinatoria léxica no es exclusiva del ejemplo, ya que la comparte con la indicación de cotexto. También se examina un tipo de ejemplo, el llamado hipercondensado, que comparte rasgos del ejemplo y del indicador de cotexto. También se analiza la información pragmática que puede aportar el ejemplo. Todos los aspectos relativos al ejemplo están debidamente ilustrados con muestras de diccionarios. No obstante se aplica todo el aparato teórico expuesto al análisis de un corpus formado por 3.835 segmentos presentados como ejemplos de la letra L de los diccionarios lituano-español/italiano/francés. Se hace una primera distinción entre aquellas secuencias que corresponden a lo que en la primera parte hemos determinado como ejemplo lexicográfico y las que corresponden a la categoría de infralema. Después se dividen los ejemplos en tres grandes grupos (oraciones finitas, oraciones infinitivas y sintagmas no oracionales) y dentro de cada grupo se dividen a su vez en subgrupos y se analizan los siguientes aspectos: qué tipo de información (gramatical, léxica, pragmática) aporta o puede aportar cada tipo de ejemplo, si el ejemplo ilustra o complementa la información ya presentada, si esa información puede ofrecerla otro tipo de ejemplo u otro componente de la microestructura. Se destacan especialmente los ejemplos cuya traducción ilustra no tanto el uso del equivalente, sino las diferencias expresivas de las dos lenguas emparejadas en el diccionario bilingüe. Los segmentos considerados infralemas también se clasifican, pero no se analizan. El análisis de las secuencias del corpus a la luz de la teoría expuesta tiene una aplicación muy práctica en la elaboración de diccionarios bilingües, por lo que consideramos que es una aportación muy útil tanto a la lexicografía, como técnica de elaboración de diccionarios, como a la metalexicografía. ABSTRACT The example is an essential component of a dictionary of any language, and especially of a bilingual dictionary intended to learn and use a foreign language. In this thesis, after stablishing the theoretical basis and the terminology used (bilingual lexicography, the conception of the dictionary as a metalinguistic discourse of the lexicon and as a condensed text, the fundamental concepts of metalexicography referred to the microstructure), the nature and the theoretical status of lexicographic example, and more specifically, the bilingual one, is determined; a comprehensive definition of the example is provided and the distinctive features of the bilingual example − developed below − are specified. The types of lexicographic examples are specified, paying a greater attention to those of bilingual dictionaries. The functions of the examples (which are basically to illustrate the information offered in the article and provide complementary information), their value as a model from which the user can form phrases or sentences, and their greater or lesser links to the linguistic system (langue) or realizations of speech (parole) are studied. The bilingual example not only illustrates the lemmatized word but may also illustrate the use of the equivalent, for that reason, the fixed lexical units, which in many bilingual dictionaries are typographically presented as examples, but in fact do not exemplify and may be exemplified, are distinguished from the category of the dictionary example: the infralemma (subentry), a category whose content is defined in precise terms (not only idioms but also stable lexical combinations or lexical pieces and pragmathemes that have a precise meaning and, in most cases, a canonical equivalent in another language, are presented as infralemmas). Another important topic is also analyzed - examples whose translation does not contain the given equivalent, or which illustrate the use of the lemmatized word, even if no equivalent is given. Since the example illustrates the use of the lemmatized word in the grammatical and lexical aspect, the grammatical and lexical information provided by the example is the object of an exhaustive study. In addition to the morphological explanations that the example may reveal, it shows the syntactic implications of the word and, in this thesis, it is analyzed when the example illustrates information already given in the article and when it has to be made explicit by the user. The combinatorial behavior of the lemmatized word is the most frequent information in the example, and hence special attention is paid to this aspect, starting with the concept of collocation, which is quite indeterminate in the field of lexicography. It should be noted that the lexical-combinatory information is not exclusive to the example, since the cotext indication also conveys this information. A type of example, the so-called hypercondensed one, which shares features with the example and the cotext indication is examined as well. The pragmatic information that the example may provide is also discussed. All aspects related to the example are thoroughly illustrated with samples of dictionaries. However, the entire proposed theoretical apparatus is applied to the analysis of a corpus comprised of 3 835 segments presented as examples of the letter L of the Lithuanian-Spanish/Italian/French dictionaries. A first distinction is made between those sequences that correspond to what has previously been determined as a lexicographic example and those that correspond to the category of infralemma. The examples are then divided into three large groups (finite sentences, infinitive clauses and non-sentence phrases) and, within each group, they are in turn divided into subgroups and then the following aspects are analyzed: what type of information (grammatical, lexical, pragmatic) each type of example provides or may provide, whether the example illustrates or complements the information already given, whether that information may be provided by another type of example or another component of the microstructure. The examples whose translation illustrates not so much the use of the equivalent, but the expression differences of the two paired languages in the bilingual dictionary, are highlighted. Segments considered infralemmas are also classified, but not analyzed. Considering the proposed theory, the analysis of the sequences collected in the corpus has a very practical application for compiling bilingual dictionaries. Therefore, it is considered that it is a very useful contribution both to lexicography, as a practice of dictionary making, and to metalexicography, as a theory of dictionaries.
Article
Full-text available
Dans la mesure où le saint Coran constitue incontestablement la parole de Dieu inspirée par l'ange Gabriel au prophète Mohammed, il n'est pas traduisible par l'être humain, étant d'un caractère inimitable. Cependant un grand nombre de traducteurs orientalistes arabophones ont tenté de donner une interprétation plutôt qu’une traduction du Coran. C'est donc ces interprétations du Coran qui nous intéressent dans notre présente étude. Il s'agit pour nous donc de démontrer comment les combinaisons langagières ont été traitées par ces traducteurs. Dans cet article, nous avons pour objectif d'essayer d'analyser les différentes formes de traduction des combinaisons langagières telles que les combinaisons intermédiaires, du type [VN], relevées dans sept traductions choisies. Mots-clés: combinaisons langagières, combinaisons intermédiaires, collocation, traduction, Saint Coran.
Thesis
Le principal enjeu de notre recherche est d’aboutir à un modèle intégratif fonctionnel pour l’analyse des verbes d’affect en français et en arabe. Nous avons choisi d’étudier quatre V_affect : deux verbes d’émotion (étonner et énerver en français et leurs équivalents [ʔadhaʃa], [ʕaɣḍaba] en arabe]) et deux verbes de sentiment (admirer et envier et leurs équivalents [ʔaʕʒaba] et [ħasada]) appartenant aux champs sémantiques de la surprise, la colère, l’admiration et la jalousie. Plus concrètement, l’analyse se situe :– au niveau sémantique et syntaxique : les dimensions sémantiques véhiculées par les collocatifs verbaux comme étonner tellement, énerver prodigieusement, en français, et [ʔaʕʒaba ʔiʕʒāban kabīran] (admirer admiration grand) , [ɣaḍaba ɣaḍabaan ʃadīdan] (énerver colère sévère), en arabe, sont systématiquement reliées à la syntaxe (les constructions grammaticales récurrentes) (Hoey, 2005).– au niveau syntaxique et discursif : les emplois actifs, passifs, et pronominaux des V_affect sont étudiés dans la perspective des dynamiques informationnelles au sein de la phrase (Van Valin et LaPolla, 1997).D’un point de vue méthodologique, l’étude s’appuie sur une démarche quantitative et qualitative de la combinatoire verbale et privilégie la démarche contrastive. Elle est fondée sur le corpus journalistique français de la base de données EmoBase (projet Emolex 100 M de mots) et du corpus journalistique ArabiCorpus (137 M de mots).La thèse contribue ainsi à l’étude des valeurs sémantiques, du comportement syntaxique et discursif de la combinatoire des V_affect, en arabe et en français, ce qui permet de mieux structurer le champ lexical des affects par rapport à ce que proposent les études existantes en lexicologie. Les principaux résultats de l’étude peuvent être appliqués en didactique des langues, en traductologie et en traitement automatisé du lexique des affects dans les deux langues comparées.
Article
Full-text available
In this paper the author propose to make an overview of the problems raised by the collocations in terms of their translation. On the basis of the French adjectives analyzed for the purpose of present study, following the object classes, the author demonstrates the interest of contrastive approach to collocations. A contrastive description allows show the main difficulty posed by the collocations with a view to improving a lexicographical approach to this type of linguistic items. The document summarizes definitions of collocation and presents some particularities of this concept for the translation machine system.
Article
The paper aims to contribute data to the subservient habitus hypothesis explored in Interpreting and Translation Studies, where interpreters and translators are said to be especially sensitive and keen to reproduce social and textual norms, usually dictated by other agents in the field. After exploring the use of this hypothesis in the field, the case study is preceded by a brief account of special features of translation in international organizations and the key elements of the use of legal translation at the World Trade Organization (WTO). The selection of the corpus of study and the target-oriented approach are justified before briefly comparing the traditions in the study of phraseology in English and Spanish. A method drawing from both traditions is explained and then applied to two subcorpora of legal texts in order to establish patterns that can help us see how subservient or subversive translators’ behavior can be. http://repositori.uji.es/xmlui/bitstream/handle/10234/158881/70107.pdf;jsessionid=BF539FCBC754AA243642E0ACC1BE8222?sequence=1
Article
Full-text available
This paper takes issue with the traditional notion that collocation is a binary combination. Theoretical and methodologically, the study is informed by the Lexical Constellation Model (LCM). This model has shown that the strength of syntagmatic attraction between two words in a collocation can be determined by associative relations involving more than two words. Therefore, the LCM proposes to complement the node-collocate distinction by incorporating the notion of co-collocate. In this study we examine evidence suggesting that the distinction between collocates and co-collocates can contribute to gaining a better understanding of the relations between meaning and context. The data analyzed consist of co-occurrences of face and decision/choice in the enTenTen12 corpus.
Article
Full-text available
This article explores a type of co-occurrence pattern which cannot be adequately described by existing models of collocation, and for which combinatory dictionaries have yet failed to provide sufficient information. The phenomenon of “oblique inter-collocation”, as I propose to call it, is characterised by a concatenation of syntagmatic preferences which partially contravenes the habitual grammatical order of semantic selection. In particular, I will examine some of the effects which the verb cause exerts on the distribution of attributive adjectives in the context of specific noun classes. The procedure for detecting and describing patterns of oblique inter-collocation is illustrated by means of SketchEngine corpus query tools. Based on the data extracted from a large-scale corpus, this paper carries out a critical analysis of the micro-structure in Oxford Collocations Dictionary.
Article
Resumen En este trabajo abogamos por el fin del debate terminológico sobre el término colocación. Ya ha llegado el momento de pasar a la descripción. Por esa razón, hemos emprendido la tarea de desarrollar un Diccionario de colocaciones del español (DiCE). Tomamos como punto de referencia al usuario de diccionario, especialmente al aprendiz de español. Asimismo, nos guía una perspectiva de codificación, por lo que no nos centramos en la opacidad o en la transparencia de una colocación, sino en la selección restringida de ciertas unidades léxicas para expresar un sentido dado en combinación con otras unidades léxicas. El formato electrónico y la posibilidad de explotar el DiCE como una herramienta de enseñanza de español lengua extranjera será también algunos de los aspectos abordados. Palabras clave: colocaciones, fraseología, diccionarios, adquisición de L2, corpus de aprendices.
Article
Full-text available
L’article que nous présentons a pour objectif l’analyse de la problématique que soulèvent les collocations du point de vue de leur traduction. En prenant le français comme langue de départ, nous nous proposons de procéder, dans un premier temps, à l’analyse d’un corpus de différentes catégories de collocations pour étudier les diverses restrictions et combinaisons. Dans la deuxième partie de notre étude, nous adopterons une perspective contrastive pour mettre en relief les principales difficultés que posent les collocations dans le passage du français à l’espagnol. Le traitement que la lexicographie monolingue et bilingue accorde à ces unités lexicales, nous aidera à compléter notre analyse et nous permettra de poser d’autres propositions de traitement lexicographique en vue de la pratique de traduction.
ResearchGate has not been able to resolve any references for this publication.