About
96
Publications
47,356
Reads
How we measure 'reads'
A 'read' is counted each time someone views a publication summary (such as the title, abstract, and list of authors), clicks on a figure, or views or downloads the full-text. Learn more
1,063
Citations
Introduction
Current institution
Publications
Publications (96)
Reference corpora, situated in the middle of a spectrum with massive corpora on one end and spe-cialized corpora on the other, constitute a widely used resource in linguistic research. In this paperwe aim to point out their most prominent characteristics, identify the factors that show their advan-tages and disadvantages compared to other types of...
The primary objective of this work is to present a general vision of the distribution of the lexicon in the different Hispanic countries. The data come from the Diccionario de Frecuencias Léxicas, incorporated into version 1.1 of CORPES, built on 180 million words from the press texts of this corpus. The results obtained, which are also based on th...
El desarrollo de las computadoras y de las ciencias computacionales ha tenido un fuerte impacto en la investigación lingüística y, más en general, en todas las disciplinas vinculadas a las Humanidades. Aunque no es el principal, uno de los factores que tienen mayor repercusión en la práctica investigadora es la existencia de cantidades ingentes de...
La presencia de la palabra lercha en los diccionarios españoles se ha apoyado casi exclusivamente en el texto del Quijote. La extrañeza que suscitó en lectores y editores de la obra ha producido dudas acerca de su existencia real en la lengua y, como consecuencia de ello, una larga e interesante serie de propuestas de sustitución. Al tiempo, lercha...
El volumen Sintaxis del español/The Routledge Handbook of Spanish Syntax proporciona una visión general de los temas fundamentales de la sintaxis del español, basada en datos extraídos de corpus textuales, sensible a los fenómenos de variación y conectada con otros componentes de la lengua.
La obra, escrita en español, reúne perspectivas teóricas...
RESUMEN
Este capítulo tiene un objetivo doble. En primer lugar, tras una breve introducción delimitadora del tema, trataremos de describir las características de los corpus de aprendices (CA) de español como lengua extranjera o segunda (LE/L2) existentes en la actualidad y facilitar a los lectores todos los datos pertinentes: denominación, responsa...
1. INTRODUCCIÓN E n los últimos años, incluso desde antes de que el Pleno de ASALE aprobara en el congreso de Ciudad de México (2015) la propuesta de emprender la elaboración del Diccionario panhispánico de fraseología (DPF), he tenido ocasión de hablar con Alfredo Matus y con algunos otros colegas (entre los que ocupa un lugar destacado Francisco...
This article provides an overview of the design and composition of the corpus ESLORA and shows its usefulness in analysing social and situational variation. The corpus also contributes to the study of the processes of change related to the geographical variation of Spanish, since it records its use in a region with its own distinctive language. Thi...
1. INTRODUCCIÓN Aunque no se les ha venido prestando demasiada atención hasta el momento, las formas de superlativo en-ísimo (y formaciones asociadas) constituyen un aspecto de gran interés para analizar el modo en que los fenómenos que se están desarrollando en cada momento son percibidos por los gramáticos y lexicógrafos e incorporados a sus marc...
La estructura estadística de los textos y de los corpus textuales es un tema al que se ha prestado muy escasa atención en la lingüística hispánica. El presente trabajo se propone revisar algunos de sus aspectos más importantes en dos direcciones distintas. Por una parte, mediante la aplicación a los datos procedentes de una versión intermedia del C...
Como se ha venido poniendo de relieve cada vez con mayor intensidad, el Diccionario de Autoridades (DA) es una obra excepcional, que surge de un modo inesperado y que sitúa, de repente, a la lexicografía española en la cima de la europea durante bastantes años. El rasgo externo más característico de esta obra es, sin duda, la utilización de las cit...
1. INTRODUCCIÓN Un corpus es un conjunto de (fragmentos de) textos naturales, almacenados en formato electrónico, representativos en su conjunto de una variedad lingüística, en alguno de sus componentes o en su totalidad, y reunidos con el propósito de facilitar su estudio científico (cf. Rojo 2014). Esta definición muestra explícitamente que los t...
El objetivo del presente trabajo consiste en presentar las características generales más destacadas del Corpus de referencia del español del siglo xxi (CORPES XXI), recurso actualmente en construcción, pero utilizable ya en diversas versiones beta desde diciembre de 2013. El CORPES XXI supone una evolución considerable a partir de los corpus constr...
En los últimos años han aparecido numerosas investigaciones que han puesto de relieve la importancia que tiene la consideración de la frecuencia en los diversos componentes lingüísticos. El presente trabajo, que se inscribe en lamisma dirección, pretende poner de relieve los ajustes conceptuales necesarios para que su aplicación al componente grama...
Aunque conocemos ya bastante bien los aspectos fundamentales de la génesis y el desarrollo del llamado Diccionario de Autoridades (DA), carecemos todavía de una visión suficientemente detallada de su contenido y, más concretamente, de la gran cantidad de obras y autores citados como ejemplos ilustrativos del uso de las palabras y la frecuencia de c...
In recent years, various research works have highlighted the importance of taking the frequency of the different linguistic components into consideration. This paper, which supports the above view, emphasizes the need to make some conceptual adjustements so that frequency can be applied to the grammatical component. The paper establishes as its gen...
Using the great amount of information contained in the Base de datos sintácticos del español (BDS), the present paper analyzes some of the different aspects involved when the relation between the frequency of syntactic constructions and the frequency of verbs is established. In the last section, different methods for quantifying this relation are s...
Report on the current situation of Spanish language in Internet
In recent works, Mark Davies compares the Corpus del Español (CE), which he himself designed, with the CORDE and the CREA, which were designed and developed in the Real Academia Española. According to Davies, CE shows a much better 'architecture' than CREA and CORDE, a fact that entails outstanding advantages when it comes to its use. This paper ar...
La generalització de l’ús d’ordinadors – i, més concretament , de l'ús de corpus textuals - en la investigació lingüística constitueix, en la terminologia de Dyson, una autèntica revolució instrumental, que, a més, té especial incidència en tots els vessants de la lexicografia. Aquest treball pretén identificar les àrees en què aquesta influència t...
El estudio de la presencia del español en Internet muestra una evolución positiva, pero su peso con relación a su importancia mundial parece manifiestamente mejorable y exige esfuerzos urgentes para mejorar todos sus parámetros.
In this paper, we describe the compilation and structure of two linguistic resources, a corpus and a dictionary of terms in the field of economy, developed for Galician. In addition to this, we describe the use of these resources for the automatic extractio n of multi-word terms by means of a combination of linguistic and statistical techniques. Wh...
Descripción del proyecto Gari-Coter para la elaboración de los recursos lingüísticos en gallego necesarios para un re-elaborador de consultas multilingüe. Description of the Gari-Coter project for the development of the necessary linguistic resources in Galician for a multilingual query re-elaborator.
This paper describes the language components of a system for Document Routing in Spanish. The system identifies relevant terms for classification within involved documents by means of natural language processing techniques. These techniques are based on the isolation and normalization of syntactic unities considered relevant for the classification,...
Texto introductorio a la teoría sintáctica del funcionalismo. El primer capítulo desarrolla aspectos de la estructura general de las lenguas. El segundo, centrado en las relaciones sintácticas, habla de los distintos tipos de ellas y sus características. El tercero habla de las unidades gramaticales, del morfema a la oración. El cuarto se refiere a...
Bibliografía p. 283-284 Se trata de conocer las actitudes lingüísticas de los profesores de EGB que ejercen en Galicia. Como punto de partida investigan sobre las características generales y trasfondo lingüístico de los encuestados. Se pretende saber en qué circunstancias emplean el castellano y gallego, conocer sus actitudes hacia la coexistencia...