ArticlePDF Available

Los marcadores de reformulación como localizadores de zonas discursivas relevantes en el discurso especializado

Authors:

Abstract

Basándonos en la teoría de la relevancia, en este artículo analizamos el papel de los marcadores de reformulación (MR) en la localización de zonas discursivas relevantes en el discurso especializado. Con el estudio presentado, demostramos que el uso de los MR puede serde utilidad para la construcción de herramientas que pretendan el reconocimiento automático de la terminología con el mínimo esfuerzo de procesamiento y apuntamos la necesaria continuación de dicho trabajo con el estudio de la densidad reformulativa de los textos especializados y de la posible interrelación entre la densidad terminológica y la densidad de tratamiento de la terminología. http://repositori.upf.edu/handle/10230/6164
LOS MARCADORES DE REFORMULACIÓN COMO LOCALIZADORES DE ZONAS
DISCURSIVAS RELEVANTES EN EL DISCURSO ESPECIALIZADO1
Carme Bach Martorell (Universitat Pompeu Fabra, España)
RESUMEN:
BASÁNDONOS EN LA TEORÍA DE LA RELEVANCIA, EN ESTE ARTÍCULO ANALIZAMOS EL PAPEL DE LOS
MARCADORES DE REFORMULACIÓN (MR) EN LA LOCALIZACIÓN DE ZONAS DISCURSIVAS RELEVANTES EN EL
DISCURSO ESPECIALIZADO.
CON EL ESTUDIO PRESENTADO, DEMOSTRAMOS QUE EL USO DE LOS MR PUEDE SER DE UTILIDAD PARA LA
CONSTRUCCIÓN DE HERRAMIENTAS QUE PRETENDAN EL RECONOCIMIENTO AUTOMÁTICO DE LA
TERMINOLOGÍA CON EL MÍNIMO ESFUERZO DE PROCESAMIENTO Y APUNTAMOS LA NECESARIA
CONTINUACIÓN DE DICHO TRABAJO CON EL ESTUDIO DE LA DENSIDAD REFORMULATIVA DE LOS TEXTOS
ESPECIALIZADOS Y DE LA POSIBLE INTERRELACIÓN ENTRE LA DENSIDAD TERMINOLÓGICA Y LA DENSIDAD
DE TRATAMIENTO DE LA TERMINOLOGÍA.
PALABRAS-CLAVE:
TEORÍA DE LA RELEVANCIA; MARCADORES DE REFORMULACIÓN; CONOCIMIENTO ESPECIALIZADO;
DENSIDAD TERMINOLÓGICA; DENSIDAD DE TRATAMIENTO DE LA TERMINOLOGÍA.
RESUMO:
COM BASE NA TEORIA DA RELEVÂNCIA, ANALISAMOS, NESTE ARTIGO, O PAPEL DOS MARCADORES DE
REFORMULAÇÃO (MR) NA LOCALIZAÇÃO DE ZONAS DISCURSIVAS RELEVANTES NO DISCURSO
ESPECIALIZADO.
COM ESTE ESTUDO, DEMONSTRAMOS QUE O USO DOS MR PODE SER ÚTIL NA COSNTRUÇÃO DE
FERRAMENTAS QUE PRETENDAN O RECONHECIMENTO AUTOMÁTICO DA TERMINOLOGIA COM O MÍNIMO
ESFORÇO DE PROCESSAMENTO E INDICAMOS A NECESSÁRIA CONTINUIDADE DO REFERIDO TRABALHO COM
O ESTUDO DA DENSIDADE REFORMULATIVA NOS TEXTOS ESPECIALIZADOS E DA POSSÍVEL INTERRELAÇÃO
ENTRE A DENSIDADE TERMINOLÓGICA E A DENSIDADE DO TRATAMENTO DA TERMINOLOGIA.
PALAVRAS-CHAVE:
TEORIA DA RELEVANCIA; MARCADORES DE REFORMULAÇÃ; CONHECIMENTO ESPECIALIZADO; DENSIDADE
TERMINOLÓGICA; DENSIDADE DE TRATAMENTO DA TERMINOLOGIA.
1. INTRODUCCIÓN
El papel de la terminología es esencial en campos como la traducción especializada, el estudio del
discurso intradisciplinar —entendido como “discourse within specific professions” (LINELL, 1998)— o
la recuperación de información. Cualquier herramienta que aspire a recuperar eficientemente información
de carácter especializado requiere un entrenamiento previo a partir del cual sea capaz de reconocer la
estructura de conocimiento que subyace en los textos. Para ello es necesario el estudio de la
estructuración del discurso especializado, no sólo a nivel de su organización conceptual sino también
retórica, que es la que permite vehicular la información organizada a recuperar.
A medida que un aprendiz se va convirtiendo en experto, lo que adquiere no son simplemente conceptos
abstractos o patrones lingüísticos, sino también prácticas retóricas de razonamiento empírico y formas
de persuasión propias de la disciplina. (LÓPEZ, C., 2002)
De entre los mecanismos pragmático-discursivos de la retórica especializada, en este artículo nos
fijamos en los marcadores discursivos de reformulación (MR), elementos procedimentales que se utilizan
como pistas ostensivas para una correcta decodificación de la información en los textos especializados
(WILSON y SPERBER, 1993). Defendemos que es necesaria su consideración para el estudio de la
estructura de conocimiento de los textos de especialidad y abogamos para sean tenidos en cuenta por
cualquier herramienta que pretenda representar semiautomáticamente el contenido especializado de los
textos.
En primer lugar, expondremos la visión de la Teoría de la Relevancia sobre la utilidad de los MR
y destacaremos la aplicación del estudio de los MR al estudio del discurso especializado.
En segundo lugar, señalaremos gráficamente en un texto de especialidad los términos detectados
y los marcadores discursivos de reformulación, de modo que se muestre la relación entre marcadores y
términos a lo largo del texto.
A continuación analizaremos el texto en relación tanto a las marcas de relevancia que presenta
como a los términos presentes en él y expondremos las conclusiones a las que hemos llegado.
2. LOS MARCADORES DE REFORMULACIÓN EN LA TEORÍA DE LA RELEVANCIA
Según la Teoría de la Relevancia, los enunciados deberían entenderse como el resultado de un
proceso cognitivo basado en el binomio ostensión/inferencia por oposición a la teoría clásica de la
comunicación —que gira en torno a los conceptos codificación/decodificación de la información. Un
determinado hecho lingüístico es relevante para un individuo si el fenómeno que pone de manifiesto es
relevante para su entorno cognitivo, siempre y cuando el coste del proceso de la información relevante sea
mínimo.
El entorno cognitivo total de un individuo es un compendio de su entorno físico y de su capacidad
cognitiva. No se compone tan sólo de los hechos de los que es consciente, sino también de todos los
hechos de los que puede llegar a ser consciente en su entorno físico. (SPERBER y WILSON, 1994: 55)
Desde un punto de vista relevantista, la nota fundamental de la ostensión lingüística es que capta de
manera intencionada la selectiva atención del oyente y la enfoca sobre una determinada secuencia de
información. (BONILLA, 2001)
Algunas aproximaciones sobre el estudio de los conectores discursivos han analizado estas
piezas léxicas como marcas de relevancia en el discurso. (BROCKWAY, 1982; BLAKEMORE, 1987,
1992, 2001; BONILLA, 2001; PORTOLÉS, 1998; MOESCHLER, 1993 y BACH, 2001)
(...) certain conversational routines need to be monitored by specific discourse devices, in order to guide
the interpretation process in the most efficient way. Connectives in conversation have precisely this
function. (MOESCHLER, 1993: 168)
En relación con los marcadores de reformulación sobre los que centramos nuestro interés en este
artículo, podemos postular que son marcas claras de relevancia en el discurso:
Indeed, according to relevance theory, the identification of an utterance as a reformulation follows from
an aspect of interpretation which is fundamental to the way in which the relevance of all utterances is
established. (BLAKEMORE, 2001: 112)
La reformulación es un proceso de reinterpretación textual, mediante el cual un locutor
determinado retoma algún elemento discursivo anterior para presentarlo de otra forma y con una función
discursiva determinada. En realidad, la reformulación es una operación de autoreflexión sobre la lengua, y
una muestra clara de la función metacomunicativa del lenguaje. De hecho, los manuales de retórica
clásica hablan ya de esta operación lingüístico-cognitiva como una de les estrategias comunicativas y
persuasivas más importantes.
La reformulación garantiza la cohesión textual y, a su vez, facilita la progresión discursiva, de un
lado porque permite la resolución de los posibles defectos comunicativos de un texto y, de otro, porque
permite puntualizar el significado de algunos enunciados presentados anteriormente.
Tal y como señala BONILLA (2001) “tanto en el discurso divulgativo de la comunicación
científica en particular, como en cualquier modalidad de transmisión del conocimiento en general, la
reformulación quizá sea una de las operaciones retóricas básicas por excelencia. Sin ninguna duda, la
operación reformulativa se aplica a los núcleos temáticos más importantes del discurso, de tal suerte, que
puede predecirse, a modo de expectativa interpretativa, que donde aparezca una marca ostensiva de
reformulación se localiza la información discursiva más relevante (la que aporta información que refuta,
confirma o enriquece conocimientos previos)”.
La reformulación textual puede establecerse a partir de un amplio conjunto de mecanismos, que
de ahora en adelante llamaremos “marcadores de reformulación” (en el apartado siguiente —
metodología— apuntamos la lista de marcadores de reformulación que hemos considerado para este
trabajo): la forma sintáctica —en los textos escritos, la pausa discursiva —en los orales, la repetición
léxica, la utilización de verbos que indican una clara referencia metalingüística, y el uso de conectores
reformulativos.
3. METODOLOGÍA
En este trabajo pretendemos validar la hipótesis según la cual los MR son útiles para la
localización efectiva de la información especializada que el productor considera más relevante. Más a
largo plazo, pretendemos mostrar la necesaria consideración de los MR en el diseño de una herramienta
que pretenda recuperar semiautomáticamente la estructura de conocimiento de un texto especializado.2
Para poder validar dicha hipótesis, analizaremos un capítulo de un documento especializado de
carácter expositivo, concretamente de un manual universitario (OLIVIA, R. (1996) Genoma humano.
Masson: Barcelona), incluido en el Banco de Conocimiento GENOMA, material de base para los análisis
realizados para el proyecto TEXTERM. El motivo de la elección del género manual para el análisis es
que la información especializada a recuperar se presenta de forma explícita, hecho que facilita
enormemente la recuperación de la información especializada que contiene:
Que un discurso esté orientado fundamentalmente a proporcionar información implica que se use el
lenguaje con una función referencial —que se centre en el objeto tratado— y que predomine
sustancialmente sobre las demás funciones (expresiva, directiva, argumentativa o fática).
(CALSAMIGLIA y TUSON, 1999: 307)
Para llevar a cabo el trabajo, hemos anotado los marcadores de reformulación y los términos
presentes en el capítulo analizado del manual escogido y hemos puesto en relación ambos marcajes para
estudiar la relación existente entre los términos y los marcadores que éstos llevan asociados a lo largo de
todo el texto.
La metodología seguida para llevar a cabo el estudio que presentamos en este artículo se divide
en cuatro fases:
a) Búsqueda de los marcadores de reformulación más relevantes en el texto seleccionado,3 mediante la
interfaz de explotación del corpus técnico del IULA (bwanaNet).4
El listado de MR buscados y posteriormente anotados en el texto está compuesto por marcadores
que vehiculan un proceso de reinterpretación textual mediante el cual un locutor determinado retoma
algún elemento discursivo anterior y lo presenta de otro modo. Entre la lista de los MR utilizados para el
estudio, encontramos verbos (aludir, definir, designar, llamar o sobreentender), verbos que rigen
preposición (conocer como, definir como, entender por, entender como, referirse a), sintagmas verbales
(querer decir, recibir el nombre de), conjunciones (o), conectores con distintos niveles de
gramaticalización (es decir, esto es, p. ej.) y elementos propiamente tipográficos (comillas, paréntesis).
La detección de estos marcadores de reformulación en el texto ha permitido anotarlos
gráficamente en el documento que se va a estudiar.
b) Procesamiento del documento escogido con la herramienta Mercedes (desarrollada por el grupo
IULATERM), sistema de reconocimiento de unidades terminológicas nominales a partir de un
diccionario de términos de un dominio determinado (en nuestro caso hemos utilizado el glosario de
genoma del cuál dispone la herramienta).
Este sistema detecta en el texto todas las unidades terminológicas nominales que aparecen en su
diccionario de referencia y las marca dentro del texto donde aparecen.
c) Solapamiento gráfico de ambos resultados. De la anotación, tanto de los marcadores como de la
unidades terminológicas nominales detectadas por Mercedes, hemos obtenido un nuevo documento con el
marcaje de ambos tipos de informaciones.
d) Observación de la relación existente entre los marcadores de reformulación y los términos detectados.
A partir de dicha información hemos realizado el análisis de los datos que presentamos en el siguiente
apartado.
4. ANÁLISIS DE LOS DATOS
Tal como hemos mencionado en el apartado anterior, la anotación de los MR (215 ocurrencias en
total) y de las UT detectadas por la herramienta Mercedes (2224) permite analizar la relación que se
establece entre ambos.
Los ejemplos que ofrecemos a continuación deben leerse como sigue:
En color verde se marcan las unidades terminológicas detectadas por la herramienta Mercedes.
En color rojo se marcan los MR.
En primer lugar, observamos que algunos de los MR detectados en el texto marcan la relevancia
de los términos ya detectados por la herramienta Mercedes, como a priori sería de esperar, ya que el
especialista es el que domina la estructuración del conocimiento en su área, el que sabe qué términos
están consensuados entre sus colegas y, por tanto, quién los utiliza.
La palabra «genoma» contiene la raíz griega gen, que significa origen, y la
extensión también griega oma empleada en sustantivos del vocabulario biológico y
médico.
El conjunto de cromosomas metafásicos de una célula se denomina cariotipo (fig.
, 1-1).
Durante la división celular, los cromosomas forman estructuras típicas
observables por microscopia óptica que en su conjunto se
denomina cariotipo.
En segundo lugar, observamos algunos casos en que, aunque los MR señalen la relevancia de
algunos términos detectados por Mercedes, se manifiesta también en el texto la “especificación
terminológica” del término originalmente referenciado en el diccionario de la herramienta. La
especificación se produce a nivel de expansión formal del término, que en la mayoría de los casos es una
unidad terminológica poliléxica, no referenciada en Mercedes.
Para ejemplificar estos casos, hemos marcado las expansiones del término en color azul, junto a
la base terminológica originariamente detectada por Mercedes, marcada en color verde:
Normalmente se sobrentiende por gen una secuencia de DNA con todos sus
elementos reguladores.
El Genoma Humano está compuesto por 23 pares de moléculas de DNA contenidas
en estructuras llamadas cromosomas , que se localizan en el núcleo de la célula
(genoma nuclear) , y por una pequeña molécula de DNA circular contenida en un
órgano de la célula denominado mitocondria (genoma mitocondrial).
La localización cromosómica del gen causante de una enfermedad hereditaria
mediante análisis de ligamiento (cuando no se tienen más datos que el propio
fenotipo de la enfermedad) se realiza por tanteo.
Este fenómeno que hemos denominado “especificación terminológica” es dinámico en el sentido
en que se produce en el texto y nunca puede darse en los diccionarios, entes estáticos depositarios de la
terminología (o al menos no puede producirse sincrónicamente, aunque; sí diacrónicamente a través de las
reediciones futuras del diccionario en cuestión).
La especificación es justamente una de las funciones básicas de la reformulación, tal como
indican Gülich y Kotschi:
Paraphrases need to be subdivided even further: the paraphrase type of expansion is broken down into
specification and explication, while the paraphrase type of reduction is subdivided into résumé and
denomination. This takes account of cases where paraphrases are used to introduce new aspects, to
define an abstract concept, to make a summary, or to find a conceptualising expression for some complex
matter. (GÜLICH y KOTSCHI, 1995: 7)
En tercer lugar, los MR manifiestan la relevancia de ciertos términos no incluidos en el
diccionario utilizado por Mercedes (a) por ser siglas, (b) por ser términos de carácter verbal no detectados
por la herramienta que hemos usado o (c) por no haber sido documentados con anterioridad en ninguno de
los glosarios sobre genoma que tienen implementada la herramienta Mercedes.5
Cromosoma metafásico visualizado mediante microscopia electrónica al que se le
han quitado las histonas que normalmente organizan o empaquetan el DNA
(1.1.31.1)
Proceso de traducción o síntesis proteica a partir de la información contenida en el
mRNA (1.2.14.1)
Como un ejemplo de este tipo cabe mencionar una región secuenciada de 680 kb. ,
que contiene los genes del complejo mayor de histocompatibilidad (MHC o
HLA) localizados en xxx en una banda Giemsa-negativa y donde la densidad
génica es de 1 gen por cada 19 kb. (1.2.32.1)
Finalmente, creemos que es muy interesante observar que la distribución de los MR a lo largo
del texto no es uniforme. Vemos que hay una mayor presencia de marcadores en la primera parte del
documento, que corresponde al primer capítulo del manual titulado “Composición del genoma humano”.
Consideramos que es probable que el autor del manual haya querido llamar la atención de sus receptores
acerca de la terminología básica que va a usarse en el documento y que por ello en este primer capítulo
marque de forma relevante las nociones que quiere comunicar.
En el anexo a este artículo puede verse una muestra del documento analizado para este trabajo,
con los MR y los términos resaltados, que incluye además información sobre el número de términos, el
número de marcadores, la densidad terminológica de las distintas partes estructurales del texto, el número
de candidatos a término finalmente encontrados gracias a los MR y el número de modificaciones de
términos previamente reconocidos por la herramienta Mercedes.
5. CONCLUSIONES
A modo de conclusión, el análisis realizado demuestra que el uso de los MR puede ser de gran
utilidad para la construcción de herramientas que pretendan el reconocimiento automático de la
terminología con el mínimo esfuerzo de procesamiento y, a su vez, la construcción de la estructura
conceptual de los documentos de especialidad a partir de la densidad terminológica de los textos.
Finalmente queremos señalar la necesaria continuación de este trabajo en la construcción de una
herramienta que mida la densidad reformulativa a lo largo de los textos de especialidad y la relacione con
la densidad terminológica, a partir de la hipótesis de que existe una relación entre la densidad de
reformulación de un texto y la densidad terminológica del mismo.
En un futuro próximo, nos proponemos analizar la relación entre la densidad terminológica de
los textos (calculada actualmente por la herramienta Mercedes —ver gráfico 1) y la densidad de la
relevancia informativa, que podría calcularse a través de los MR.
Gráfico 1 (proporcionado por la herramienta Mercedes)
Creemos que la comprobación de dicha relación permitiría demostrar que la reformulación
terminológica es un elemento que debe tenerse en cuenta para el estudio de la estructuración y
transmisión del conocimiento especializado y también en la detección de las zonas terminológicas de
relevancia en los textos para facilitar la representación automática del contenido especializado. Podría
incluso hablarse del grado de relevancia de las relaciones establecidas por los MR “que podría medirse a
partir de la mayor o menor imbricación (intrínseca o extrínseca) en relación con el núcleo central”
(CABRÉ, 2002: 96).
De confirmarse esta hipótesis, creemos que podría revisitarse la noción de “densidad
terminológica” de modo que no se considere únicamente el número de términos que aparecen en un texto
para su cálculo (DOMÈNECH,1998) sino también la densidad de tratamiento que dichos términos
reciben.6
NOTAS:
1. Este artículo se ha desarrollado en el marco del proyecto TEXTERM: Textos especializados y terminología: selección y
recuperación automática de la información (BFF2000-0841), financiado por el Ministerio de Educación y Cultura, cuyo
investigadora principal es la Dra. M. Teresa Cabré Castellví.
2. Éste es uno de los objetivos aplicados del proyecto de investigación Fundamentos, estrategias y herramientas para el
procesamiento y extracción automáticos de información especializada (TEXTERMII). Núm. BFF2003-2111, dirigido por la Dra. M.
Teresa Cabré.
3. La lista de marcadores de reformulación relevantes parte de un estudio anterior realizado con otros miembros del grupo de
Investigación IULATERM; BACH, C.; FREIXA, J. y SUÁREZ, M. (2003), aunque ha sido ampliada para este artículo.
4. Esta herramienta es de uso público y puede utilizarse desde la dirección http://brangaene.upf.es/bwananet/index.htm
5. Creemos muy importante destacar que dichos términos han sido marcados según nuestro criterio lingüístico-terminológico, que es
uno de los perfiles posibles de los usuarios de la terminología. Sería necesario consultar especialistas de diversos perfiles para ver
qué secuencias de entre las marcadas como relevantes son consideradas terminológicas.
6. GÜLICH i KOTSCHI (1995: 39) hablan de treating expressions para referirse a las operaciones de reformulación del discurso.
ABSTRACT:
IN THIS ARTICLE, THE ROLE OF REFORMULATION MARKERS (RM) IN LOCALIZING RELEVANT DISCURSIVE
AREAS IN SPECIALIZED DISCOURSE IS ANALYZED BASED ON THE RELEVANCE THEORY AS THE STARTING
POINT.
IN THIS STUDY, WE PROVE THE USAGE OF RM TO BE USEFUL FOR THE CONSTRUCTION OF SEMIAUTOMATIC
TOOLS AIMED AT RECOGNIZING TERMINOLOGY WITH A MINIMUM PROCESSING EFFORT. WE ALSO POINT
OUT THE NEED OF CONTINUING WITH THIS RESEARCH AS A NEXT STEP, FOCUSING ON THE ANALYSIS OF
REFORMULATIVE DENSITY IN SPECIALIZED TEXTS AND THE STUDY OF A POSSIBLY INTERRELATION
BETWEEN TERMINOLOGICAL DENSITY AND THE DENSITY OF TERMINOLOGICAL TREATMENT.
KEYWORDS:
RELEVANCE THEORY; REFORMULATION MARKERS; SPECIALIZED KNOWLEDGE; TERMINOLOGICAL DENSITY,
DENSITY OF TERMINOLOGICAL TREATMENT.
REFERENCIAS BIBLIOGRÁFICAS:
Bach, Carme. Els connectors reformulatius catalans: Anàlisi i proposta d’aplicació lexicogràfica. Tesis
doctoral dirigida por M. Teresa Cabré y Lluís Payrató – Universitat Pompeu Fabra: Barcelona, 2001.
[Versión en CD: Barcelona: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra.
Serie Tesis, 6. 2004].
Bach, Carme; Freixa, Judit; Suárez, Mercedes. Equivalencia conceptual y reformulación parafrástica en
terminología. En Correia, M. (ed.). Terminología e industria de língua. Lisboa: ILTEC, 2003, p. 173-184.
Blakemore, D. Relevance and coherence: discourse connectives. En Blakemore, D. Semantic constraints
on relevance. Oxford: Basil Blackwell, 1987, p. 105-144.
Blakemore, D. Understanding utterances. An introduction to Pragmatics. Oxford: Basil Blackwell, 1992.
Blakemore, D. Discourse and Relevance Theory. En Schiffrin, D., Tanen, D. y Halton, H. E. (ed.). The
handbook of Discourse Analysis. Oxford: Blackwell Publishers, 2001, p. 100-118.
Bonilla, S. Marcas de relevancia en el discurso oral de la comunicación científica. En De Bustos Tovar, J.
J. y Charedau, P. (ed.). Lengua, discurso, texto. Madrid: Visor Libros, 2001.
Brockway, D. Connecteurs pragmatiques et principe de pertinence. Langages, v. 67, 1982, p. 7-22.
Cabré, Maria Teresa. Análisis textual y terminología, factores de actuación de la competencia cognitiva
en la traducción. En Alcina, A. y Gamero, S. (ed.). La traducción científico-técnica y la terminología en
la sociedad de la información. Universitat Jaume I: Castellón de la Plana, 2002, p. 87-106.
Calsamiglia, H. y Tusón, A. Las cosas del decir. Manual de análisis del discurso. Barcelona: Ariel, 1999.
Domènech, M. Unitats de coneixement i textos especialitzats. Primera proposta d’anàlisi. Treball de
recerca. Barcelona: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra, 1998.
Gülich, E. y Kotschi, T. Discourse production in oral comunication. En Quasthoff, U. M. (ed.). Aspects of
oral comunication, Research in text theory. Berlín-Nueva York: Walter de Gruyter, 1995, p. 30-66.
Linell, P. Discourse across boudaries: On recontextualizations and the blending voices in professional
discourse. Text, an interdisciplinary journal for the study of discourse, v. 18, n. 2, 1998, p. 143-157.
López, C. Aproximación al análisis de los discursos profesionales. Signos, v. 35, n. 51-52, 2002, p. 195-
215.
Moeschler, J. Relevance and conversation. Lingua, v. 90, 1993, p. 149-171.
Portolés, J. Marcadores del discurso. Barcelona: Ariel, 1998.
Sperber, D. y Wilson, D. La relevancia. Madrid: Visor, 1994. [Original inglés: Relevance. Oxford:
Blackwell, 1986.]
Wilson, D. y Sperber, D. Linguistic form and relevance. Lingua, v. 90, 1993, p. 1-25.
ANEXO
Elemento
textual Posición Texto #
términos
detectados #MR #
terminos
finales
#
cambios Densidad
terminológica
head 1.1.1 COMPOSICIÓN DEL GENOMA HUMANO 1 0 1 0 0.50
head 1.1.2 DEFINICIÓN DEL GENOMA HUMANO 1 0 0.50
s 1.1.3.1
La palabra «genoma» contiene la raíz griega gen , que
significa origen, y la extensión también griega oma
empleada en sustantivos del vocabulario biológico y
médico.
2 1 2 0 0.25
s 1.1.3.2
El término «gen» aplicado a la herencia fue acuñado por
Johansen en 1909 para designar a las unidades de
herencia asociadas a un carácter transmisible
específico.
5 1 5 0 0.71
s 1.1.3.3
Previamente, los genes habían sido designados como
«elementos»por Mendel (1866) , gemmules por Darwin
(1868) ,«pangenes» por De Vries (1889) ,«unidades
fisiológicas» por Spencer (1864) , osimplemente
«carácter unidad»,«factor unidad» o «factor».
5 9 10 2 0.36
s 1.1.3.4 El concepto de gen ha ido cambiando a medida que se
ha avanzado en su conocimiento. 1 0 1 0 0.25
s 1.1.3.5 Una de las definiciones actuales más amplia de gen
sería:«secuencia de información que produce un
producto funcional». 2 1 2 0 0.50
s 1.1.3.6 Normalmente se sobrentiende por gen una secuencia
de DNA con todos sus elementos reguladores de la
transcripción que da lugar a una proteína o a un RNA. 4 2 6 1 0.50
s 1.1.3.7 En el capítulo 2 se analizará con mayor detalle el
concepto de gen 1 0 1 0 0.25
s 1.1.3.8 «Genoma» puede definirse como el contenido total de
material genético característico de un organismo. 2 2 2 0
0.67
s 1.1.3.9 También se utiliza el término para indicar el material genético
presente en virus. 2 0 2 0
0.67
head 1.1.4 GENOMA NUCLEAR Y GENOMA MITOCONDRIAL 2 0 2 0 1.00
head 1.1.5 NOMENCLATURA DE LOS CROMOSOMAS 0 0 0 0 0
s 1.1.6.1
El Genoma Humano está compuesto por 23 pares de
moléculas de DNA contenidas en estructuras llamadas
cromosomas , que se localizan en el núcleo de la célula
(genoma nuclear) ,y por una pequeña molécula de DNA
circular contenida en un órgano de la célula denominado
mitocondria (genoma mitocondrial)
11 4 12 1 0.79
s 1.1.6.2 Cuando las células se dividen por mitosis, los cromosomas
se condensan, haciéndose visibles con el microscopio óptico
y apareciendo como unidades discretas. 6 0 6 0 1
s 1.1.6.3 El conjunto de cromosomas metafásicos de una célula se
denomina cariotipo (fig. , 1-1) . 4 2 4 0 0.80
s 1.1.7.1 El genoma nuclear está formado por 22 pares de
cromosomas autosómicos y por los cromosomas sexuales
designados X e Y. 4 1 6 0 1
s 1.1.7.2 Los cromosomas autosómicos se enumeran según su
tamaño: 1 0 1 0 0.50
s 1.1.7.3 el cromosoma más grande es el 1 , el siguiente en tamaño
decreciente es el 2 y así sucesivamente. 1 0 1 0 1.00
s 1.1.7.4 Una excepción es la del cromosoma más pequeño, que es el
21 en lugar del 22 . 1 0 1 0 0.33
s 1.1.7.5
Esta excepción se debe al hecho de que inicialmente se pensó
que el cromosoma 22 era el más pequeño, y aunque
actualmente se sabe que esto no es así, la nomenclatura se
ha mantenido.
1 0 1 0 0.20
head 1.1.8.1 Representación esquemática de un cariotipo humano 1 0 1 0 0.50
s 1.1.9.1 A efectos de claridad solamente se ha representado uno de los
dos cromosomas homólogos de cada autosoma existentes en
una célula diploide en metafase. 6 0 6 0 1
s 1.1.10.1
Cada cromosoma tiene una constricción central denominada
centrómero que divide al cromosoma en dos brazos,
designados «p» (para el brazo pequeño) y «q» (para el brazo
grande; «q» sigue a «p» en el alfabeto).
4 8 5 1 0.50
S 1.1.10.2 Mediante distintas tinciones es posible subdividir los brazos en
bandas con niveles crecientes de resolución. 2 0 2 0 0.40
S 1.1.10.3 Estas bandas se designan con números, empezando por la
banda más centromérica. 2 0 2 0 0.67
Carme Bach es doctora en lingüística por la Universitat Pompeu Fabra y licenciada en Filología Catalana por la Universitat
de Barcelona. Es investigadora del grupo IULATERM, grupo de investigación consolidado en la Universitat Pompeu Fabra
(Barcelona, España).
Su investigación se concentra en análisis del discurso general y especializado, en la lingüística de corpus y la lexicografía.
Entre sus publicaciones, destaca su tesis doctoral sobre conectores de reformulación, que incluye un prototipo de implementación
lexicográfica para estas unidades léxicas, así como numerosos artículos sobre conectores, reformulación y la importancia de los
procesos reformulativos en la construcción de discurso especializado.
... 16 h) Desde el punto de vista estilístico, el empleo de los reformuladores está determinado por factores situacionales, como el tipo de texto en que se produce su aparición, así como el grado de formalidad. Los estudios de Ciapuscio (1993de Ciapuscio ( , 2003, Bach (2001aBach ( , 2001bBach ( , 2005 y Guerrero (2008) han demostrado la existencia de un claro vínculo entre la frecuencia de uso de la reformulación como estrategia discursiva y el contexto en que se genera el discurso, así como una preferencia en la selección de ciertos marcadores en determinadas clases de textos. Como apunta Bach (2005), los reformuladores son instrumentos esenciales en la estructuración del discurso especializado, "no solo a nivel de la organización conceptual, sino también retórica, que es la que permite vehicular la información organizada a recuperar". ...
... Los estudios de Ciapuscio (1993de Ciapuscio ( , 2003, Bach (2001aBach ( , 2001bBach ( , 2005 y Guerrero (2008) han demostrado la existencia de un claro vínculo entre la frecuencia de uso de la reformulación como estrategia discursiva y el contexto en que se genera el discurso, así como una preferencia en la selección de ciertos marcadores en determinadas clases de textos. Como apunta Bach (2005), los reformuladores son instrumentos esenciales en la estructuración del discurso especializado, "no solo a nivel de la organización conceptual, sino también retórica, que es la que permite vehicular la información organizada a recuperar". Es habitual que los "conectores reformulativos" tengan asignadas en los textos especializados funciones discursivas muy precisas, como la definición, la designación, la denominación, la ejemplificación o la corrección (Thoiron y Béjoint 1991;Bach 2001b: 249-254) . ...
Article
Full-text available
Reformulation is a process of textual re-interpretation by means of which a speaker refers back to a previous discourse segment which he re-elaborates in a different way. The elements that signal this discourse function are the so-called reformulators: words and phrases which are formally and semantically heterogeneous and share the ability to undertake connective and argumentative functions at the textual level. This paper primarily intends to define and characterize the German reformulation markers. Furthermore, it proposes a preliminary classification of these units on the base of their double function as elements of text cohesion with deictic meaning and markers of argumentative strategies. The use of a perspective based on cognitive grammar will help us to overcome the limits of an analysis model based on the presence/absence of a limited set of discrete constitutive features and will allow us to define this pragmatic category on the basis of functional criteria which are directly related to the particular behaviour of these units in discourse.
... L'exemplification est aussi une claire opération de reformulation: le marqueur est utilisé pour paraphraser un énoncé A en un énoncé A' en apportant des exemples éclaircissant le premier. C'est fréquent dans des textes de divulgation écrits par des spécialistes: s'adressant à un public non spécialisé, ils doivent illustrer ce qu'ils expliquent pour en faciliter la compréhension (Bach: 2005). Comme l'explique García Negroni (2009), c'est aussi un mécanisme utilisé dans la divulgation des textes académiques. ...
Article
Full-text available
Paraphrastic reformulative markers in Catalan establish certain semantic equivalences between the utterances they connect. The general aim of this paper is to analyse them and discuss to what extent they can be considered a homogenous category of markers. In particular, the goals of the present study are: (i) to analize four paraphrastic reformulative markers in Catalan: és a dir, o sigui, dit d’una altra manera and en altres paraules; (ii) to discern the similarities and differences between them; (iii) to discuss whether their pragmatic differences can be attributed to their morphological patterns and to their degree of grammaticization. Findings suggest that, even though the main role of these markers is to primarily establish a semantic equivalence between prior and following utterances, there exist differences as far as their degree of grammaticization and the instructions that each of them carries out. This study proves that, in practice, the four reformulative markers are not exchangeable in any discourse situation, and thus cannot be considered a homogenous class, in Catalan.
... This idea has been reinforced by Meyer (2001), who states that definitional patterns can also provide keys that allow the identification of the kind of definition present in DCs, which is a helpful task in the elaboration of ontologies. Other interesting theoretical-descriptive works can be found in Bach (2005) and Sierra et al. (2003). ...
Article
Full-text available
In this paper we present a pattern-based approach to the automatic extraction of definitional knowledge from specialised Spanish texts. Our methodology is based on the search of definitional verbal patterns to extract definitional contexts related to different kinds of definitions: analytic, extensional, functional and synonymic. This system could be a helpful tool in the process of elaborating specialised dictionaries, glossaries and ontologies. http://hdl.handle.net/10230/23552
... This idea has been reinforced by Meyer (2001), who states that definitional patterns can also provide keys that allow the identification of the kind of definition present in DCs, which is a helpful task in the elaboration of ontologies. Other theoretical-descriptive works can be found in Feliu (2004) and Bach (2001 Bach ( & 2005). Applied investigations, on the other hand, leave from theoretical-descriptive studies with the objective of elaborate methodologies for the automatic extractions of DCs, more specifically for the extraction of definitions in medical texts (Klavans & Muresan, 2001), for the extraction of metalinguistic information (Rodríguez, 2004), and for the automatic elaboration of ontologies (Malaisé, 2005). ...
Article
Full-text available
One of the main goals of terminological work is the identification of knowledge about terms in specialised texts. In order to compile dictionaries, glossaries or ontologies, terminographers use to search definitions about the terms they intend to define. The search of definitions can be done in specialised corpus, where they usually appear in definitional contexts, i.e. text fragments where an author explicitly defines a term. In this paper we present a research focused on the automatic extraction of those definitional contexts. Our methodology includes three different processes: the extraction of definitional patterns, the automatic filtering of non definitional contexts, and the automatic identification of constitutive elements, i.e., terms and definitions.
... Meyer [2] reinforced this idea and also states that definitional patterns can provide keys that allow the identification of the definition type occurring in DCs, which is a helpful task in the elaboration of ontologies. Other theoretical-descriptive works can be found in [3] and [4]. ...
Conference Paper
Full-text available
Terminological work aims to identify knowledge about terms in specialised texts in order to compile dictionaries, glossaries or ontologies. Searching for definitions about the terms that terminographers intend to define is therefore an essential task. This search can be done in specialised corpus, where they usually appear in definitional contexts, i.e. text fragments where an author explicitly defines a term. We present a research focused on the automatic extraction of those definitional contexts. The methodology includes three different processes: the extraction of definitional patterns, the automatic filtering of non-relevant contexts, and the automatic identification of constitutive elements, i.e., terms and definitions. http://hdl.handle.net/10230/24631
... Este tipo de conectores o patrones sintácticos, que denominamos como marcadores reformulativos, conforman un proceso de reformulación en el que se explica el significado de un término a partir de estructuras sintácticas no verbales y, en el caso de los CDs, sirven para referirse a los términos como elementos del propio lenguaje. Estos marcadores permiten retomar elemento de un discurso para presentarlo de otra forma, garantizan la cohesión textual y puntualizan el significado de algunos enunciados presentados anteriormente [27]. En el grupo de marcadores reformulativos podemos encontrar, entre otras estructuras: por ejemplo, es decir, esto es, en otras palabras, dicho de otra manera. ...
Article
Full-text available
La extracción automática de definiciones a partir de textos de especialidad es una tarea cada vez más demandante para diferentes aplicaciones del Procesamiento de Lenguaje Natural, tales como lexicografía computacional, extracción de información, semántica computacional, sistemas pregunta-respuesta, minería de textos, Web semántica y aprendizaje automático. Este artículo presenta un panorama de los trabajos realizados en el Grupo de Ingeniería Lingüística en el tema, desde los aspectos teóricos, la revisión del estado del arte, los estudios lingüísticos sobre definiciones y contextos definitorios, la metodología para la extracción automática y hasta diversas aplicaciones.
Thesis
Full-text available
En este trabajo presentamos un esquema de anotación pragmática para corpus (Pragmatext), un etiquetador semi-automático de marcadores del discurso (DiMaSTagger) y, finalmente, una aplicación web (Alter Alia) para lingüistas, informáticos y hablantes no nativos del español, a través de la cual se pueden consultar ejemplos de los marcadores del discurso del corpus oral del español C-ORAL-ROM y acceder a sus frecuencias según el género discursivo. El modelo de anotación pragmática con el que se han etiquetado los marcadores discursivos es un modelo basado en rasgos, donde cada rasgo hace referencia a uno de los siguientes fenónomenos semántico-pragmáticos: modalización discursiva, deixis, actos de habla, evidencialidad y relaciones discursivas. Este trabajo se inserta dentro de un discurso interdisciplinar en el que se relacionan las siguientes parcelas de conocimiento: Marcadores del discurso, Pragmática, Lingüística Cognitiva, Lingüística Computacional e Inteligencia Artificial.
Article
Full-text available
In this paper we present a description of the role of definitional verbal patterns for the extraction of semantic relations. Several studies show that semantic relations can be extracted from analytic definitions contained in machine-readable dictionaries (MRDs). In addition, definitions found in specialised texts are a good starting point to search for different types of definitions where other semantic relations occur. The extraction of definitional knowledge from specialised corpora represents another interesting approach for the extraction of semantic relations. Here, we present a descriptive analysis of definitional verbal patterns in Spanish and the first steps towards the development of a system for the automatic extraction of definitional knowledge. http://repositori.upf.edu/handle/10230/6177
Article
Resumen:El desarrollo de herramientas computacionales de ayuda en tareas lexicográficas y terminográficas es un creciente interés dentro delcampo del procesamiento del lenguaje natural. Algunas herramientas se han desarrollado para la extracción automática detérminos en textos especializados. Además, algunos estudios se han enfocado en el desarrollo de métodos para adquirir conocimientodefinitorio sobre términos, tomando en cuenta la idea de que los términos suelen definirse en estructuras denominadas contextosdefinitorios, donde se emplean una serie de patrones que pueden ser reconocidos automáticamente.Partiendo de esta premisa, en esta tesis presentamos un sistema basado en reglas lingüísticas para la extracción de contextosdefinitorios sobre textos especializados en español. Este sistema esta formado por cuatro procesos: la extracción de ocurrencias depatrones definitorios; el filtro de contextos no relevantes; la identificación de los elementos constitutivos en los candidatos, esdecir, el término y la definición; y la organización jerárquica de los resultados con el fin de encontrar los mejores candidatos.Abstract:The development of computational tools to help on lexicography and terminography tasks is indeed a growing interest on naturallanguage processing field. Some tools have been developing for the extraction of terms from specialised texts. In addition, some studieshave been focused on developing methods for acquiring definitional knowledge about terms, considering that the terms are commonlydefined in structures called definitional contexts, which employ some patterns that can be automatically identified.Taking into account this premise, in this thesis we present a system based on linguistic rules for the extraction of definitional contexts inSpanish specialised texts. The system includes four processes: the extraction of textual fragments with definitional patterns; thefiltering of non-relevant contexts; the identification of the constituent elements in the candidates, i.e., terms and definitions;and the ranking of the results to identify the best candidates.
Thesis
Full-text available
L'objectiu d'aquest treball de recerca de doctorat és fer un estudi lingüístic d'un conjunt de textos amb diferents nivells d'especialització, seleccionats a partir de les seves característiques externes, que permeti detectar elements interns, de tipus lingüístic o freqüencial, que en confirmin la condició i el nivell d'especialització, amb la finalitat darrera de contribuir a l'estudi i a la caracterització dels textos i dels llenguatges especialitzats. Partint de la consideració que la condició i el nivell d'especialització d'un text depenen del grau de concentració del coneixement especialitzat que transmet, l'objecte d'anàlisi d'aquesta recerca han estat aquelles unitats que vehiculen aquest tipus de coneixement i que s'han anomenat unitats de coneixement especialitzat (UCE). És evident que les unitats portadores de coneixement especialitzat per excel·lència són les unitats terminològiques. Ara bé, la rigidesa amb què la Teoria General de la Terminologia (TGT) defineix el concepte d'unitat terminològica obliga a bandejar determinades unitats que, tot i que no es poden considerar termes en sentit estricte, representen i transmeten efectivament coneixement especialitzat. Així, en vista de les insuficiències que presenta per a aquesta recerca la perspectiva terminològica clàssica, el treball adopta una perspectiva més cognitiva que permet considerar com a objecte d'estudi qualsevol unitat del text que transmeti coneixement especialitzat, independentment de la forma que adopti. La identificació i l'anàlisi d'aquestes unitats permeten d'establir un conjunt de característiques internes dels textos del corpus que poden constituir criteris de validació de la condició i el nivell d'especialització d'un text. El fet de prendre les UCE com a unitats d'anàlisi és, segurament, la característica més important del treball, ja que, d'una banda, apunta noves perspectives de consideració de la unitat terminològica, centrades en l'aspecte cognitiu dels termes, que enllacen amb la demanda que fan alguns autors, com Cabré, sobre la necessitat d'elaborar una teoria cognitiva de la terminologia. I, d'altra banda, fa que s'enceti una recerca innovadora en l'ambit d'estudi dels llenguatges d'especialitat: les aportacions de l'anàlisi de les unitats de coneixement en la caracterització dels textos especialitzats, a fi de comprendre millor el funcionament dels llenguatges especialitzats i, en últim terme, de millorar el coneixement que tenim del llenguatge amb caràcter general.
Article
Full-text available
This paper presents a general argument for a relevance-based approach to the problem of connectivity in conversation. First, the potential relevance of conversation for pragmatic theory is discussed, as examples in pragmatic theory generally consist of small conversations. A typical problem for conversation analysis and pragmatic analysis is the description of uses of pragmatic connectives. The French connective parce que is described using first a model of coherence (Ducrot's theory of argumentation) and second an inferential approach. With a view to improving these models, conversational uses of parce que are presented, which show some difficulties which coherence-based approaches face in attempting to make the correct predictions about common uses of connectives in conversation.This is explained in terms of, first, an implicit theory of conversation underlying Ducrot's theory of argumentation and second, relevance theory. The less discourse oriented approach (relevance theory) is better-equipped to account for conversation in general, and to solve the sequencing problem and the interpretive problem in conversation in particular.
Article
Full-text available
Introduction Our book Relevance (Sperber and Wilson 1986a) treats utterance interpretation as a two-phase process: a modular decoding phase is seen as providing input to a central inferential phase in which a linguistically encoded logical form is contextually enriched and used to construct a hypothesis about the speaker’s informative intention. Relevance was mainly concerned with the inferential phase of comprehension: we had to answer Fodor’s challenge that while decoding processes are quite well understood, inferential processes are not only not understood, but perhaps not even understandable (see Fodor 1983). Here we will look more closely at the decoding phase and consider what types of information may be linguistically encoded, and how the borderline between decoding and inference can be drawn. It might be that all linguistically encoded information is cut to a single pattern: all truth conditions, say, or all instructions for use. However, there is a robust intuition that two basic types of meaning can be found. This intuition surfaces in a variety of distinctions: between describing and indicating, stating and showing, saying and conventionally implicating, or between truth-conditional and non-truth-conditional, conceptual and procedural, or representational and computational meaning. In the literature, justifications for these distinctions have been developed in both strictly linguistic and more broadly cognitive terms.
Article
Resumen El análisis de los discursos profesionales ha sido abordado desde distintas perspectivas. Destacamos tres enfoques fundamentales en este campo: la aproximación lingüístico-textual, la aproximación retórica, y el enfoque pragmático y sociocognitivo más actual. Para dar cuenta de la complejidad de la construcción e interpretación de los géneros producidos en contextos profesionales, es necesario establecer puentes entre las distintas metodologías. En este trabajo consideramos las categorías de análisis que pueden permitir la integración de los enfoques presentados. Abstract Different approaches have been adopted to analyse professional discourses. We focus on three relevant perspectives in this field: the textual linguistic approach, the rhetorical approach, and the current pragmatic and sociocognitive perspective. To explain the complexity of producing and understanding genres in professional contexts, it is required to throw bridges over the different methodologies. In our paper we consider the analysis categories which enable the integration of the discussed approaches. http://hdl.handle.net/10230/23425
Article
Dans un numero thematique consacre au discours produit au-dela des frontieres professionnelles, c-a-d au discours impliquant des professionnels qui communiquent avec des individus issus d'autres professions ou avec des personnes non expertes, l'A. propose ici un article introductif dans lequel il presente quelques notions-cle liees a ce genre de communication : notamment, la recontextualisation, une strategie discursive consistant a recadrer le discours pour qu'il soit compris par des personnes issues d'un contexte different ; l'intertextualite, qui se refere a la reconstruction, la reformulation et la recontextualisation d'un meme sujet dans differentes situations de communication et entre differents locuteurs ; et la polyphonie, qui designe le melange de perspectives dans un meme texte a propos d'un meme sujet
Relevance and coherence: discourse connectives. En Blakemore, D. Semantic constraints on relevance
  • D Blakemore
Blakemore, D. Relevance and coherence: discourse connectives. En Blakemore, D. Semantic constraints on relevance. Oxford: Basil Blackwell, 1987, p. 105-144.