ArticlePDF Available

Estudo preliminar da anáfora num corpus de interpretação simultânea

Authors:

Abstract

In this paper, we propose an exploratory study about the usefulness of multilingual corpora in areas related to the study of language, translation and, in particular, of simultaneous interpreting. After a brief overview of corpus-based interpreting studies as well as of some existing electronic interpreting corpora, we move on to describe the compilation stages of a bidirectional multimedia corpus (PT--EN/EN--PT). This is followed by an example of how the corpus can be explored, which focuses on the issue of anaphoric relations. The aim of this study if twofold: on the one hand, to convey the relevance of this type of resource as a repository of authentic simultaneous interpreting data; and, on the other hand, to demonstrate that by analysing it from a linguistic perspective it may be possible to identify sensitive areas in simultaneous interpreting (e.g. anaphora), which may prove an important contribution for interpreter training.
Simões, Barreiro, Santos, Sousa-Silva & Tagnin (eds.) Linguística, Informática e Tradução: Mundos
que se Cruzam, Oslo Studies in Language 7(1), 2015. 39–56. (ISSN 1890-9639 / ISBN 978-82-91398-
12-9)
http://www.journals.uio.no/osla
estudo preliminar da anáfora num
corpus de interpretação simultânea
SÍLVIA ARAÚJO E ANA CORREIA
abstract
In this paper, we propose an exploratory study about the usefulness of mul-
tilingual corpora in areas related to the study of language, translation and,
in particular, of simultaneous interpreting. After a brief overview of corpus-
based interpreting studies as well as of some existing electronic interpreting
corpora, we move on to describe the compilation stages of a bidirectional
multimedia corpus (PT–EN/EN–PT). This is followed by an example of how
the corpus can be explored, which focuses on the issue of anaphoric rela-
tions. The aim of this study if twofold: on the one hand, to convey the re-
levance of this type of resource as a repository of authentic simultaneous
interpreting data; and, on the other hand, to demonstrate that by analysing
it from a linguistic perspective it may be possible to identify sensitive areas
in simultaneous interpreting (e.g. anaphora), which may prove an impor-
tant contribution for interpreter training.
[1] linguística de corpus aplicada à interpretação
Após o comprovado êxito da linguística de corpus aplicada ao estudo da tradução,
seguiram-se vários trabalhos de investigação com o intuito de aplicar esta meto-
dologia ao contexto específico da interpretação1, incidindo maioritariamente nos
modos consecutivo e simultâneo, até ao momento. Do conjunto de estudos sobre
interpretação baseados em corpora, refira-se, a título de exemplo, o de Timarová
(2005) sobre a densidade lexical dos discursos, o de Russo et al. (2006) sobre pa-
drões lexicais e, finalmente, o de Shlesinger (2009) sobre as características ditas
universais do discurso interpretado ou interpretese. Importa ressalvar que exis-
tem, para além dos corpora de interpretação eletrónicos apresentados na secção
seguinte, várias compilações manuais (Maia 2000,2008) de discurso interpretado
que também constituem corpora — a diferença reside no facto de não estarem or-
ganizados numa plataforma eletrónica. O estudo de Setton (1999), por exemplo,
baseia-se num corpus ad hoc compilado manualmente. Uma parte significativa
destes corpora não informatizados é composta pelas produções orais de alunos a
frequentar pós-graduações de interpretação, que são gravadas e posteriormente
[1] O termo interpretação deve ser entendido aqui como a atividade de natureza oral que implica a passagem
de uma mensagem de uma língua para outra, quer em modo simultâneo, quer em modo consecutivo
(Bendazzoli 2010).
[40] araújo & correia
transcritas. Este tipo de coletânea tem vindo a ser utilizado para identificar, com
maior ou menor grau de sistematicidade, os erros cometidos pelos alunos, che-
gando mesmo a culminar na criação de tipologias de erro. A título de exemplo,
citamos os estudos de Gile (1987,1992) e Falbo (1998) sobre os erros cometidos
por estudantes de interpretação simultânea durante o seu período de aprendiza-
gem. Estes estudos baseiam-se na premissa de que o trabalho de reflexão sobre
a prática da interpretação através de dados reais, i.e., de um corpus (informati-
zado ou não), promove a consciência metalinguística nos estudantes e pode, por
conseguinte, ajudar a desenvolver estratégias de antecipação e resolução de pro-
blemas (Sandrelli 2010). Uma das áreas que pode beneficiar deste tipo de refle-
xão diz respeito, como veremos na secção 4, às relações anafóricas e às conexões
semântico-pragmáticas por elas desencadeadas. Estas podem, de facto, afetar a
inteligibilidade do discurso se não forem devidamente processadas, quer ao nível
da produção, quer ao nível da receção.
[2] corpora de interpretação em formato eletrónico
Como vimos, a metodologia da linguística de corpus tem sido usada, ainda que
de forma artesanal, para estudar a interpretação. Devido à natureza intrínseca da
interpretação, os corpora compilados com material interpretado, manuais ou ele-
trónicos, são necessariamente paralelos, isto é, contêm pelo menos duas versões
linguísticas de um mesmo texto (original e tradução). Daqui se depreende que
o corpus paralelo seja de grande utilidade para o estudo da tradução, podendo
— e devendo — esta inferência ser alargada ao contexto da interpretação (Ginezi
2014).
Desde o apelo lançado por Shlesinger (1998), foram desenvolvidos diversos
projetos dedicados à compilação de corpora de interpretação eletrónicos, entre
os quais se destaca o pioneiro European Parliament Interpreting Corpus (EPIC). O EPIC
foi indubitavelmente um forte catalisador de investigação nesta área, tendo ser-
vido de base a inúmeros projetos de dissertação no contexto académico italiano
(Russo 2010). Os membros da equipa que esteve na origem do EPIC têm-se dedi-
cado ao estudo da direcionalidade e seu impacto no desempenho dos intérpre-
tes, associado às eventuais diferenças decorrentes da interpretação entre línguas
românicas, por um lado, e entre uma língua românica e uma germânica, por ou-
tro lado (Monti et al. 2005). Outro estudo que merece destaque resulta do Eu-
ropean Parliament Translation and Interpreting Corpus (EPTIC), projeto derivado do
EPIC, que reequaciona o conceito de simplificação lexical enquanto universal de
tradução/interpretação através de medida quantitativas fornecidas pelo corpus
(Bernardini et al. 2013).
Na senda do EPIC (Bendazzoli & Sandrelli 2005), surgiram outros corpora de
interpretação que cobrem uma maior variedade de línguas, modos e contextos
de interpretação. É de destacar o trabalho desenvolvido pelo Hamburger Zentrum
OSLa volume 7(1), 2015
estudo preliminar da anáfora num corpus de interpretação simultânea [41]
für Sprachkorpora no âmbito da compilação de corpora orais. No seu repositório,
incluem-se também alguns corpora de interpretação, nomeadamente o corpus
Dolmetschen im Krankenhaus (DiK) (House et al. 2012) e o corpus Consecutive and Si-
multaneous Interpreting (CoSi) (Bührig et al. 2012). O primeiro visa a interpretação
comunitária num contexto hospitalar e o segundo está direcionado para a inter-
pretação em situação de conferência, quer em modo consecutivo quer em modo
simultâneo. Os três corpora mencionados resultaram de projetos financiados de
larga escala. Existem outros, resultantes de projetos individuais de investigação,
que constituem também importantes ferramentas para o estudo da interpretação.
Um exemplo é o corpus DIRSI-C, composto por discursos de natureza médica em
inglês e italiano, que permitiu chegar a importantes conclusões sobre o impacto
da direcionalidade (i.e., interpretar de ou para a língua materna) no desempenho
dos intérpretes (Bendazzoli 2010).
[3] corpus de interpretação/per-fide
O corpus de interpretação que constitui a base empírica do estudo sobre a aná-
fora que apresentamos na secção seguinte decorre do corpus Per-Fide (Araújo et al.
2010;Almeida et al. 2014). Para dar continuidade a este corpus composto exclu-
sivamente por textos (escritos) paralelos, pretende-se agora acrescentar uma di-
mensão oral através da compilação de um corpus de interpretação. Este corpus
será composto pelas transcrições das intervenções, em sessão plenária, dos eu-
rodeputados portugueses e ingleses. Convém, aqui, realçar que as transcrições
por nós realizadas são diferentes das transcrições que integram o corpus Europarl
(Koehn 2005). Com efeito, para o corpus de interpretação, partimos do Compte-
Rendu in Extenso (CRE), i.e., o relato integral das sessões plenárias do Parlamento
Europeu, que deu origem ao Europarl, mas procurámos aproximá-lo daquilo que
é efetivamente proferido pelos deputados e intérpretes. Apesar de se limitar às
línguas portuguesa e inglesa, este corpus de interpretação tem a vantagem de es-
pecificar a língua-fonte de cada intervenção.
Além de ser um produto derivado do projeto Per-Fide, este corpus que agora
apresentamos é diretamente influenciado pelo EPIC, projeto que lhe serviu de ins-
piração. De seguida, passamos então a descrever o Corpus de Interpretação/Per-
Fide, salientando algumas das suas características e elencando as várias etapas de
compilação, sem nos adentrarmos nos detalhes mais técnicos. Porém, antes ainda
dessa descrição, apresentamos um resumo visual do processo, que poderá contri-
buir para uma melhor compreensão dos procedimentos envolvidos na compilação
do corpus na figura 1.
Conforme assinalado na figura 1, a criação do corpus pode ser decomposta em
três grandes etapas: pré-processamento, processamento e pós-processamento.
Antes de o material a incluir no corpus poder ser processado, é necessário levar a
cabo a transcrição do material, ainda em formato audiovisual (pré-processamento).
OSLa volume 7(1), 2015
[42] araújo & correia
figura 1: Etapas de compilação do corpus
De seguida, é necessário segmentar, alinhar e anotar esses dados transcritos (pro-
cessamento), para que possam ser depois pesquisados na rede através de uma in-
terface construída para o efeito (pós-processamento). Abaixo, apresentamos estas
três fases de forma um pouco mais detalhada.
Pré-processamento
Conforme mencionado acima, o Corpus de Interpretação/Per-Fide é um corpus de
interpretação composto pelas transcrições dos discursos proferidos pelos euro-
deputados portugueses e ingleses e das respetivas interpretações. Os discursos
reunidos correspondem a um período de seis meses de intervenções dos deputa-
dos portugueses, desde janeiro a junho de 2011. A fim de equilibrar quantitati-
vamente os dados, as intervenções dos homólogos ingleses limitam-se a apenas
três desses seis meses. Este é um corpus bidirecional na medida em que inclui
discursos originais em ambas as línguas. Podemos, aliás, dividi-lo em dois sub-
corpora para melhor ilustrar o seu caráter bidirecional: subcorpus 1) português
original — inglês interpretado; subcorpus 2) inglês original — português inter-
pretado. Cria-se, assim, uma estrutura cruzada que, como se pode ver abaixo na
figura 2, demonstra a natureza simultaneamente paralela e comparável (a dois
níveis) do corpus.
Os discursos (i.e., originais e interpretações) que integram este corpus apre-
sentam especificidades decorrentes do contexto em que ocorrem. Com efeito, o
sistema de atribuição da palavra no Parlamento Europeu é bastante rígido, o que
faz com que cada deputado tenha, em média, dois minutos para as suas interven-
ções. Para garantir a máxima rentabilização de um tempo de antena mínimo, os
OSLa volume 7(1), 2015
estudo preliminar da anáfora num corpus de interpretação simultânea [43]
figura 2: Esquema de combinatórias linguísticas.
deputados leem os seus discursos, que são previamente redigidos. Naturalmente,
a leitura dos discursos traduz-se num débito e densidade elevados, que tipica-
mente não se encontrariam numa produção espontânea. No que toca aos intér-
pretes, não sabemos se estes têm acesso prévio aos discursos que vão interpretar,
assim como não dispomos de informação sobre a sua formação e experiência pro-
fissional.
Os discursos que vão integrar o corpus foram descarregados em bruto a partir
do sítio web do serviço audiovisual do Parlamento Europeu, que disponibiliza as
gravações das sessões plenárias desde abril de 2006 em todas as línguas oficiais da
União Europeia. Estes discursos foram posteriormente armazenados no servidor
do projeto Per-Fide. Cada discurso corresponde a um ficheiro wmv, que por sua vez
integra 22 pistas de áudio (uma para cada língua oficial, à exceção do croata e do
irlandês). Assim, o passo seguinte consistiu em isolar para cada vídeo o material
áudio relevante, i.e., as pistas portuguesa e inglesa. No que respeita aos direitos
de autor, importa referir que o serviço audiovisual permite que o material dis-
ponibilizado no seu sítio web seja utilizado gratuitamente para fins educativos,
conforme se pode ler no separador Copyright desse mesmo sítio.
Depois de recolher e processar os discursos, deu-se início à etapa de transcri-
ção. Contámos, para isso, com o apoio dos alunos do 3º ano da licenciatura em
Línguas Aplicadas (2013/14) da Universidade do Minho que transcreveram, no
âmbito da unidade curricular de Princípios de Interpretação, a quase totalidade
dos discursos a integrar no corpus. Nesta etapa, o investigador é confrontado
com a necessidade de tomar decisões metodológicas que orientem o trabalho de
transcrição. Estas decisões devem estar firmadas na identificação clara da(s) fi-
OSLa volume 7(1), 2015
[44] araújo & correia
nalidade(s) do corpus. No nosso caso, por exemplo, o esforço adicional de anotar
pausas e hesitações ao transcrever os discursos não acrescentaria valor ao estudo
das relações anafóricas, que é o fenómeno que pretendemos estudar através deste
corpus. Contudo, devemos ressalvar que, embora concebido para o estudo de um
fenómeno particular, este corpus não se limita ao estudo da anáfora. Será um
recurso aberto à comunidade académica, podendo servir de base a inúmeras pes-
quisas sobre aspetos linguísticos e cognitivos da linguagem em uso. O trabalho
de transcrição pautou-se por uma preocupação constante em refletir o mais fiel-
mente possível aquilo que é efetivamente pronunciado pelos oradores e intérpre-
tes. Assim, a par da transcrição ortográfica, optou-se por anotar casos de auto-
correção e reformulação, utilizando uma barra (/). As transcrições basearam-se
nas convenções HIAT (Halbinterpretative Arbeitstranskriptionen), integradas no EX-
MARaLDA Partitur-Editor (Schmidt 2004). HIAT é um sistema de transcrição para a
representação escrita da língua falada, projetado nos anos 70 no âmbito da análise
do discurso e que foi retomado pelos criadores do Partitur-Editor EXMARaLDA. As
transcrições propriamente ditas foram elaboradas no referido software,Partitur-
Editor, que permitiu ainda a integração de metadados relativos aos oradores e aos
discursos através dos separadores Speakertable eMetainformation, respetivamente.
No primeiro separador, inclui-se o nome do deputado e o grupo político ou o sexo
do intérprete (M/F), conforme se trate de um discurso original ou interpretação.
No segundo separador, inclui-se a data do discurso e a fonte (i.e., original vs. in-
terpretação). A escolha deste software foi determinada pelo seu caráter livre e,
sobretudo, pelo facto de codificar os ficheiros transcritos em XML. Cabe assinalar
que o EPIC, tratando-se de um projeto com mais recursos humanos e financeiros,
apresenta transcrições mais detalhadas do ponto de vista da anotação paralinguís-
tica (e.g. pausas e disfluências). Note-se que a tentativa de produzir transcrições
que sejam user/annotator-friendly é comum a ambos os corpora. O nível de deta-
lhe é também superior no que concerne à anotação paralinguística, já que cada
transcrição é acoplada a um cabeçalho de metadados que inclui abundante infor-
mação sobre o contexto, orador e o discurso (e.g. tema, tema específico, duração,
número de palavras, palavras por minuto, etc.). A inclusão de metadados, tam-
bém prevista no nosso corpus, garante que outros investigadores possam utilizar
estes recursos de uma forma adequada, já que a origem e a natureza dos dados
estão devidamente identificadas.
Processamento
Como se disse, neste momento, encontramo-nos em fase de revisão das transcri-
ções já elaboradas pelos alunos da licenciatura em Línguas Aplicadas. Após esta
etapa, passar-se-á a um conjunto de procedimentos técnicos que visam a estru-
turação e disponibilização do corpus na rede, em livre acesso. Feitas as trans-
crições, será necessário alinhar os originais com as respetivas transcrições. Este
OSLa volume 7(1), 2015
estudo preliminar da anáfora num corpus de interpretação simultânea [45]
alinhamento implica uma segmentação ao nível frásico, passível de automatiza-
ção graças aos códigos XML gerados pelo Partitur-Editor. Esta segmentação servirá
de base ao alinhamento dos bi-textos (i.e., original + interpretação) mas também
à própria segmentação dos ficheiros vídeo/áudio correspondentes que serão de-
pois sincronizados com o texto. Daqui decorre o caráter multimédia deste corpus,
à semelhança do corpus multimédia Veiga de legendagem (Dios & Guinovart 2012),
desenvolvido no Centro de Linguística da Universidade de Vigo. Este corpus irá, as-
sim, permitir ao utilizador efetuar pesquisas em bitextos alinhados, com acesso ao
material audiovisual correspondente. Com efeito, estes dois aspetos representam
um salto evolutivo face ao EPIC, embora, no âmbito deste último, esteja já pre-
vista a inclusão de bitextos alinhados e de material audiovisual como sugestão de
trabalho futuro. É importante referir que os bitextos serão alinhados e etiqueta-
dos morfossintaticamente, aumentando as potencialidades do corpus para fins de
investigação. Estas duas tarefas serão executadas de forma semiautomática, com-
binando software de alinhamento (Simões & Almeida 2007) e etiquetação (Schmid
1994;Brants 2000) cujos resultados serão alvo de uma revisão manual.
Pós-processamento
A última etapa prende-se com a disponibilização do corpus e prevê a construção de
uma interface de pesquisa própria, que a seu tempo poderá ser consultada através
do sítio web do corpus Per-Fide.
Neste momento, o corpus ainda não se encontra disponível para consulta.
Contudo, foi possível analisar um subconjunto de discursos, já transcritos, que
farão parte do corpus. Esta análise revelou que a anáfora é um fenómeno linguís-
tico importante na interpretação, uma vez que pode afetar os discursos produzi-
dos pelos intérpretes em termos de coesão e coerência.
[4] a anáfora na interpretação simultânea
Toda a comunicação significativa usa a linguagem e, se quisermos saber como esta
funciona, temos que analisar atos concretos de comunicação, i.e., textos (orais
e/ou escritos). Compreender um texto implica ser capaz de construir uma repre-
sentação mental coerente desse mesmo texto (Morais 2011, pg. 17). Como refere
(Lopes 2008, pg. 62), há duas dimensões que se afiguram cruciais na construção de
uma representação mental de um texto. Em primeiro lugar, a coerência referencial,
basicamente suportada pelas anáforas discursivas e, em segundo lugar, a coerência
relacional que envolve relações semânticas que conectam segmentos discursivos.
São muitos os trabalhos dedicados a esta dimensão da coerência discursiva, que
permite estabelecer uma fronteira entre uma sequência aleatória e desconexa de
frases e um produto com sentido em termos semântico-pragmáticos (Jaubert 2005;
Kostopoulou 2007;Sanders et al. 2007;Lopes & Rodrigues 2013, entre muitos ou-
tros). Ao produzir um discurso, um determinado locutor utiliza mecanismos de
OSLa volume 7(1), 2015
[46] araújo & correia
coesão e coerência que lhe permitem assinalar a interdependência semântica en-
tre os diferentes elementos que o compõem. Tanto quanto é do nosso conheci-
mento, não foi ainda realizado um estudo especificamente centrado na compre-
ensão da anáfora e ancorado em dados extraídos de um corpus de interpretação
simultânea. Nas linhas que se seguem, pretendemos demonstrar que os processos
anafóricos são pistas fortes para a ativação e orientação das operações cognitivas
conducentes à compreensão do discurso original e da sua interpretação.
[4.1] A relação anafórica: uma relação binária assimétrica
Uma relação anafórica caracteriza-se pela dependência interpretativa entre dois
termos ou segmentos textuais, o termo antecedente (ou termo anaforizado) e o
termo anafórico (ou termo anaforizante). A anáfora é pois uma relação binária as-
simétrica entre um antecedente previamente identificado referencialmente e um
termo anafórico que só ganha identidade referencial pela sua integração naquele
contexto (Campos & Xavier 1991, entre outros). A título meramente exemplifi-
cativo, podemos dizer que o excerto do discurso original que se segue entrelaça
duas cadeias de referência (uma cadeia com três anéis — excelente trabalho…que
(efectuou)…que (se traduz) e uma outra cadeia com quatro anéis — relatório…que (per-
mite)… elipse de que (constitui)…este (é um relatório)):
(1a) Muito obrigado, Senhor Presidente, caros Colegas. Quero felicitar os rela-
tores pelo excelente trabalho que efectuou e que se traduz num relatório
que permite dar um bom início à construção do próximo quadro financeiro
plurianual e [que] constitui um desafio para a Comissão e para o Conselho.
Este é um relatório ambicioso e em simultâneo um relatório realista.
Cada uma destas cadeias referenciais faz uso de procedimentos léxico-gramaticais
(Oliveira 1987;Kleiber 1994;Corblin 1995;Perdicoyanni-Paléologou 2001, entre
outros) que instauram a dependência de um conjunto de termos anafóricos rela-
tivamente a uma expressão nominal plena que inicia a cadeia referencial. Todos
estes termos anafóricos pronominais retiram a sua referência exclusivamente da
relação que têm com o seu antecedente. É interessante notar que, ao restituir este
discurso original, o intérprete inglês elimina a marca de plural (‘the rapporteur’)
que o deputado aplica por engano no actante agentivo (‘os relatores’) do verbo efec-
tuou acima transcrito:
(1b) Yes, colleagues, I would like to congratulate the rapporteur for his ex-
cellent work because he permits us to really do things in the right way. A
good start, financially speaking, within the framework of the MFF and of
course what we have here is a very ambitious report, but a very realistic
one as well.
OSLa volume 7(1), 2015
estudo preliminar da anáfora num corpus de interpretação simultânea [47]
Neste discurso interpretado, mantém-se a significação global do discurso origi-
nal, apesar de a cadeia de referência mais saliente ((the rapporteur)…his (excellent
work)…he (permits)) incidir sobre a expressão nominal the rapporteur e já não so-
bre os termos antecedentes estipulados em (1a). Ou seja, o discurso interpretado
deixa de dar primazia ao produto (i.e., ao relatório) para abrir com o autor desse
produto (i.e., o relator) a cadeia de referência que percorre o excerto (1b). Trata-
se, na realidade, de uma restituição da informação por modulação metonímica
(Chuquet & Paillard 1987, pg. 31) que consiste em privilegiar a relação de causa
(rapporteur) pelo efeito (report) e não o inverso.
A referência anafórica é, sem dúvida, uma condição básica para a construção
de qualquer ato comunicativo. É ela que contribui para a organização textual, na
medida em que assegura a progressão temática. Importa assinalar, contudo, que o
uso excessivo de elementos anafóricos pode constituir um obstáculo à clareza. De
facto, os deputados portugueses tendem a alongar as frases através de mecanis-
mos recorrentes de subordinação (com o uso do pronome relativo que), conforme
ilustrado no exemplo (2a):
(2a) O longo processo de trabalho que este importante relatório exigiu, in-
cluindo os muitos compromissos alcançados, tornou-o num documento
bastante amplo e equilibrado dos diversos interesses que a PAC tem de
dar resposta. Este relatório constitui uma boa orientação para as propos-
tas legislativas, pelo que felicito o seu relator.
Esta concatenação de que exige um esforço cognitivo adicional e maior tempo de
processamento, dado que frequentemente está associada a verbos com diferentes
tipos de transitividade. Por exemplo, a colocação dar resposta mencionado em (2a)
seleciona um complemento introduzido por intermédio da preposição a. Mas este
traço sintático nem sempre é respeitado, sobretudo com alguns complementos de
natureza oracional, nomeadamente nas orações relativas, como podemos ver no
exemplo anterior (‘dos diversos interesses que a PAC tem de dar resposta’ em vez
de ‘dos diversos interesses aque a PAC tem de dar resposta’). Nestes casos, a omis-
são da preposição tem vindo a generalizar-se. Para adaptar este discurso aos mol-
des sintáticos da língua inglesa, o intérprete opta por dividir este parágrafo em
orações coordenadas assindéticas (‘we’ve been through […]’; ‘there’s been many
[…]’; ‘now we have […]’) ou sindéticas (‘and I would like […]’) de forma a evitar a
cascata de pronomes relativos do discurso original:
(2b) We’ve been through a long procedure, there’s been many amendments
that have been tabled and compromises reached. Now we have a balan-
ced report taking into account different interests. This report is a good
guideline for proposals, legislative proposals, and I would like to congra-
tulate the rapporteur.
OSLa volume 7(1), 2015
[48] araújo & correia
Ao optar maioritariamente por um esquema paratático (Duarte 2003) que con-
siste em verter o conteúdo das orações relativas dentro de orações coordenadas
(as)sindéticas, o intérprete é necessariamente levado a segmentar o seu discurso
em blocos de informação mais circunscritos que preservam a ordem canónica da
frase (sujeito — verbo — objeto(s)). Esta forma aparentemente mais simples (por-
que mais atomizada) de processar e restituir o discurso original faz com que o
intérprete tenha de atribuir ao verbo de cada uma das orações coordenadas um
sujeito, pois o inglês distingue-se do português por ser necessariamente uma lín-
gua de sujeito foneticamente realizado. Em (2b), os dois pronomes pessoais we são
suficientemente impessoais para que o intérprete possa atribuir, sem se compro-
meter, um sujeito sintático a cada uma das orações independentes que constituem
o seu discurso. Uma alternativa à introdução destes pronomes poderia ser o re-
curso a estruturas passivas curtas que dispensam precisamente qualquer explici-
tação do agente do processo. É isso que acontece num dos segmentos discursivos
presentes em (2b): ‘there’s been many amendments that have been tabled and com-
promises reached’. A mobilização de esquemas diatéticos impessoais (quer ativos
quer passivos) pode implicar uma menor sobrecarga da memória, pois, como se
pode ver, por exemplo, no discurso interpretado que se segue, o uso do pronome
se evita que se tenha de explicitar os agentes mencionados no original (a saber:
‘the UK media’/‘reporters’):
(3a) UK law is being made in Strasbourg, a monster red-tape factory is closing
industry, now we have tax, but because it isn’t football, the people aren’t
informed. The UK media avoid EU reality, brains are fed with TV soaps,
reporters say the EU does not affect local issues. The EU is not news.
(3b) Mas porque não é futebol, as pessoas não estão informadas. Foge-se à
realidade. Diz-se que a União Europeia não afeta as questões locais. A
União Europeia não faz parte das notícias.
Como vimos, os termos de uma relação anafórica surgem, na linearidade do texto,
como uma cadeia anafórica: o termo antecedente é referencialmente indepen-
dente do termo anafórico, ao passo que este é referencialmente dependente do
termo antecedente. Importa referir que a escolha errada de um destes termos no
discurso interpretado pode originar alterações de sentido mais ou menos profun-
das. Apresentamos abaixo dois pares de exemplos que ilustram, respetivamente,
uma identificação errónea do termo antecedente e do termo anafórico.
Identificação errónea do termo antecedente
No discurso original que se segue, a sigla AU (precipitadamente proferida antes do
seu equivalente por extenso: African Union) foi apreendida pelo intérprete como
sendo a sigla referente à União Europeia. Esta confusão entre AU e EU terá levado
OSLa volume 7(1), 2015
estudo preliminar da anáfora num corpus de interpretação simultânea [49]
o intérprete a introduzir no seu discurso uma cadeia de referência relativa à União
Europeia que não figura de todo no discurso original:
(4a) The AU, the African Union, could do far more. We have heard many pla-
titudes from the AU but we’ve seen little concrete action so far.
(4b) A União Europeia, a União Africana com certeza que poderiam fazer
mais. Ouvimos já belas declarações da UE mas até agora poucas acções.
A análise deste exemplo exibe uma conexão interfrásica bem-sucedida do ponto
de vista da coesão e da coerência. Contudo, em (4b), o antecedente único do dis-
curso original (‘a União Africana’) passa a assumir uma entidade dupla (‘a União
Europeia’ e a ‘União Africana’) no discurso interpretado, que despoleta a retoma
parcial da entidade errada, devido provavelmente à semelhança fonética entre
‘AU’ e ‘EU’.
Identificação errónea do termo anafórico
Em português, o termo anafórico pronominal pode ser um pronome pessoal de 3ª
pessoa, sujeito ou complemento, com ou sem realização lexical. Quando, na re-
lação anafórica, o termo anafórico não tem realização lexical, i.e., corresponde a
uma categoria vazia, falamos de elipse e de termo elíptico (Marques 2009, pg. 38).
No discurso original que se segue, estamos perante um sujeito nulo subentendido,
que, apesar de não estar foneticamente realizado, pode ser identificado pelas mar-
cas de concordância verbal (‘[eles] trabalharam bem’):
(5a) Desde a sua adesão à União, em 2007, que quer a Bulgária, quer a Romé-
nia tinham a expectativa legítima dos seus cidadãos se tornarem cidadãos
comunitários de pleno direito e poderem usufruir dos mesmos direitos de
todos os outros cidadãos comunitários, onde se inclui a liberdade de cir-
culação no interior do Espaço Schengen. É, pois, a cidadania europeia que
reforçamos ao alargar o Espaço Schengen. Sexta e última nota, Senhor Pre-
sidente: [eles] trabalharam bem. É evidente que ambos os países estão de
parabéns pelo esforço que realizaram para cumprir todos os requisitos de
Schengen.
A interpretação referencial desse pronome [eles] que não está materialmente ex-
presso depende exclusivamente da sua relação anafórica com o SN (‘quer a Bulgá-
ria, quer a Roménia’) que figura no contexto linguístico à esquerda. No discurso
interpretado, assistimos a uma quebra desta progressão temática (antecedente:
‘Bulgária e Roménia’…anafórico: [pro=eles]), pois o intérprete opta por um pro-
nome pessoal de 2ª pessoa (you’ve done a good job) quando se estaria à espera do
pronome de 3ª pessoa (they’ve done…):
OSLa volume 7(1), 2015
[50] araújo & correia
(5b) Since their accession (to the) European Union, Bulgaria and Romania
have legitimately wanted their citizens to become European citizens, with
full rights, and that of course includes the right to move freely within the
Schengen area. So European citizenship is what we are about strengthe-
ning here by enlarging the/ this Schengen area. Sixth point: you’ve done
a good job. It’s clearly that/ it’s clear that these countries should be con-
gratulated for all the efforts they’ve made to comply with the Schengen
requirements, […]
Neste caso, não parece possível a identificação anafórica de you em relação ao SN
Bulgaria and Romania, a não ser que a situação extralinguística permita identificar
referencialmente esse SN. Não parece ser o caso, pois o deputado não interpela
diretamente nenhum representante passível de incarnar esse you.
Para além dos casos anteriormente mencionados de escolha inadequada de um
dos termos da relação anafórica, também detetámos casos de não explicitação do
termo anafórico e, como veremos mais à frente, de dupla identificação do termo
anafórico.
Não identificação do termo anafórico
O discurso original que se segue contém uma relação anafórica, na qual o SN as
devidas ilações é o antecedente e o pronome indefinido uma é o termo anafórico.
Este pronome funciona simultaneamente como termo catafórico (Perdicoyanni-
Paléologou 2001) que anuncia a oração que figura posteriormente na linearidade
textual:
(6a) Espero que todas as instituições tenham retirado as devidas ilações da
crise financeira, económica e social que teima em não nos largar. Uma
para mim é clara: só uma Europa unida, solidária, com uma governação
económica reforçada, concertada e convergente, estará à altura de enfren-
tar com sucesso os desafios políticos que temos pela frente.
No discurso interpretado, perde-se esta dupla cadeia referencial (anafórica e ca-
tafórica):
(6b) So I think that all of the institutions have learned their lesson from the
major financial crisis that we’ve experienced. We are a united Europe, a
Europe of solidarity and we are trying to converge, to converge our poli-
cies.
O marcador de negação restritiva que figura, em (6a), no último elemento da ca-
deia referencial (‘uma Europa unida…estará à altura…’) parece-nos importante
para reforçar a ideia de que a ilação apresentada resume, de facto, a principal lição
que se deve reter e aplicar para se conquistar uma Europa melhor. Ao eliminar
OSLa volume 7(1), 2015
estudo preliminar da anáfora num corpus de interpretação simultânea [51]
do seu discurso este marcador e ao optar por uma forma verbal no presente sim-
ples (‘are’), o intérprete não transmite exatamente o mesmo sentido que subjaz
ao original e leva-nos a crer que a Europa já ‘aprendeu a lição’. Aqui, fica claro
que a rutura da cadeia anafórica original tem repercussões, a nível semântico, no
discurso-alvo.
A alteração de sentido decorrente dessa rutura poderia ter sido atenuada se
a forma verbal ‘are’ (‘We are a united Europe’ oração 1) aparecesse precedida,
por exemplo, de um verbo como need (‘We need to be a united Europe’) que marca
uma ‘necessidade’ implicitamente expressa no enunciado original: ‘para que a
Europa possa estar à altura dos seus ideais, precisamos de a tornar mais coesa’.
Imposta pela situação de crise que se faz sentir, esta necessidade de implemen-
tação de uma (maior) concertação económica devia suscitar uma nova forma de
atuação por parte dos agentes europeus. O verbo try usado na forma progressiva
(‘we are trying to converge, to converge our policies’ oração 2) denota, sem dú-
vida, o esforço que tem sido feito nesse sentido. No entanto, a junção das duas
orações resulta, devido aos múltiplos valores que a conjunção and pode adquirir
em contexto, numa ambiguidade semântica entre a leitura de finalidade (’somos
uma europa unida e para tal, estamos a tentar atuar de forma mais concertada’) e
de causalidade (‘como somos uma Europa unida, estamos a tentar atuar de forma
mais concertada’). Por via desta operação, perde-se o valor de condição expresso
no original (‘a Europa só estará à altura se estiver unida’), cuja concretização se
situa no futuro, ao contrário das leituras semânticas acima descritas, ambas an-
coradas no presente (‘are’/‘are trying’).
Dupla identificação do termo anafórico
Ao analisar o discurso original que se segue e a respetiva interpretação, deparamo-
nos com um caso bastante curioso de quebra da progressão temática. Parece-nos,
de facto, que a não especificação do montante atribuído pela UE à Grécia em (7b)
pode levar-nos a interpretar o SN novo financiamento equivalente não à luz desse
montante (como seria expectável) mas sim à luz do sintagma preposicional ‘(fi-
nanciar) de forma inútil’:
(7a) Everyone can now see that a default in Greece is coming, except the euro
zone finance ministers who, 13 months after uselessly committing 110 bil-
lion euros, now seem set to commit a further sum almost as large.
(7b) Hoje todos nós podemos ver quais são as consequências para a economia
grega, excepto os ministros das finanças da União Europeia que após te-
rem financiado de forma inútil a economia grega estão dispostas a fazer
um novo financiamento equivalente.
OSLa volume 7(1), 2015
[52] araújo & correia
Ou seja, ao passo que o adjetivo large (em ‘a further sum almost as large’) apresenta,
em (7a), um valor indubitavelmente quantitativo (que remete para a ideia de que
o novo financiamento poderá aproximar-se dos 110 mil milhões de euros conce-
didos aquando do financiamento anterior), no caso de (7b), o adjetivo equivalente
(em ‘um novo financiamento equivalente’) parece adquirir um valor predominante-
mente qualitativo, dado que o único termo antecedente disponível no contexto
anterior remete precisamente para o sintagma preposicional acima mencionado.
Ao enveredarmos por uma leitura deste tipo, apenas sobressai a ideia de que este
novo resgate não ajudará a resolver a situação financeira de um país como a Gré-
cia. Para reforçar a dimensão quantitativa do adjetivo equivalente, uma solução
possível passaria por substituir este adjetivo por um modificador do tipo: ‘um
novo financiamento quase tão avultado quanto o anterior’.
[5] considerações finais
Apesar de nos encontrarmos ainda na fase de pré-processamento do corpus, foi já
possível isolar alguns exemplos para estudar o fenómeno das relações anafóricas
no contexto da interpretação simultânea. Com efeito, a anáfora é um mecanismo
que condiciona a coerência textual, o que se reveste de especial importância numa
atividade como a interpretação, cujo objetivo último consiste em promover a in-
teligibilidade comunicativa de uma mensagem-fonte. Através deste estudo ex-
ploratório, foi possível identificar as quebras de ligação que podem ocorrer numa
cadeia anafórica aquando do ato interpretativo. Como pudemos constatar, estas
quebras podem igualmente afetar, ainda que em menor grau, a tessitura do dis-
curso original. Os problemas decorrentes da quebra da cadeia anafórica, que en-
volve, como vimos, dois termos, podem ser atribuídos à identificação errónea do
termo antecedente ou anafórico; à não identificação do termo anafórico; e à du-
pla identificação do termo anafórico, que gera ambiguidade na interpretação do
enunciado. Como se pode concluir, a análise de um conjunto reduzido de exem-
plos permitiu extrair indícios de padrões de comportamento anafórico, que serão
alvo de um estudo qualitativo mais aprofundado e complementado com dados
numéricos logo que o corpus esteja pesquisável. A par da anáfora, prevê-se que
a exploração do corpus possa também apontar para a existência de áreas críticas
na interpretação do ponto de vista linguístico. Graças à integração de material
textual e audiovisual neste corpus, os investigadores terão à sua disposição um
recurso multimédia que permitirá a realização de estudos linguísticos, não só de
natureza segmental mas também suprassegmental (e.g. prosódia). Acreditamos
que este tipo de reflexão, baseada em corpora, poderá ser uma fonte de contri-
butos válidos para enriquecer os conteúdos formativos na área da interpretação.
Estes poderão também ter aplicações relevantes ao nível da tradução e do ensino
de línguas.
OSLa volume 7(1), 2015
estudo preliminar da anáfora num corpus de interpretação simultânea [53]
agradecimentos
Este trabalho foi realizado com o apoio da Bolsa de Investigação com a referência
SFRH / BD / 88142 / 2012, financiada pela Fundação para a Ciência e Tecnologia
no âmbito do Programa Operacional Potencial Humano inscrito no Quadro de Re-
ferência Estratégico Nacional (Formação Avançada), comparticipado pelo Fundo
Social Europeu e por fundos nacionais do Ministério da Educação e Ciência.
referências
Almeida, José João, Sílvia Araújo, Nuno Carvalho, Idalete Dias, Ana Oliveira, An-
dré Santos & Alberto Simões. 2014. The Per-Fide corpus: a new resource for
corpus-based terminology, contrastive linguistics and translation studies. Em
Tony Berber Sardinha & Telma São Bento Ferreira (eds.), Working with Portu-
guese Corpora, 177–200. Bloomsbury Academic.
Araújo, Sílvia, José João Almeida, Alberto Simões & Idalete Dias. 2010. Apresen-
tação do projecto Per-Fide: Paralelizando o Português com seis outras línguas.
Linguamática 2(2). 71–74.
Bendazzoli, Claudio. 2010. Il corpus DIRSI: creazione e sviluppo di un corpus elettronico
per lo studio della direzionalità in interpretazione simultanea: Alma Mater Studio-
rum Università di Bologna. Tese de Doutoramento.
Bendazzoli, Claudio & Annalisa Sandrelli. 2005. An approach to corpus-based in-
terpreting studies: Developing EPIC (European Parliament Interpreting Cor-
pus). Em Heidrun Gerzymisch-Arbogast & Sandra Nauert (eds.), MuTra – Chal-
lenges of Multidimensional Translation: Conference proceedings, 1–12.
Bernardini, Silvia, Adriano Ferraresi & Maja Miličević. 2013. From EPIC to EPTIC:
building and using an intermodal corpus of translated and interpreted texts.
Apresentação na 46th Annual Meeting of the Societas Linguistica Europea (SLE 2013).
Brants, Thorsten. 2000. TnT – a statistical part-of-speech tagger. Em 6th Applied
NLP Conference, ANLP-2000, 224–231.
Bührig, Kristin, Ortrun Kliche, Birte Pawlak & Bernd Meyer. 2012. The corpus
“Interpreting in Hospitals”: Possible applications for research and communi-
cation training. Em Thomas Schmidt & Kai Wörner (eds.), Multilingual Corpora
and Multilingual Corpus Analysis. Hamburg Studies in Multilingualism (14), 305–315.
John Benjamins.
Campos, Maria Henriqueta Costa & Maria Francisca Xavier. 1991. Sintaxe e Semân-
tica do Português. Universidade Aberta.
OSLa volume 7(1), 2015
[54] araújo & correia
Chuquet, Hélène & Michel Paillard. 1987. Approche linguistique des problèmes de
traduction anglais - français. Ophrys.
Corblin, Francis. 1995. Les Formes de Reprise dans le Discours. Anaphores et Chaînes de
Référence. Presses Universitaires de Rennes.
Dios, Patricia Sotelo & Xavier Gómez Guinovart. 2012. A multimedia parallel cor-
pus of english- galician film subtitling. Em Alberto Simões, Ricardo Queirós &
Daniela da Cruz (eds.), st symposium on languages, applications and technologies,
255–266.
Duarte, Inês. 2003. Aspectos linguísticos da organização textual. Em Maria He-
lena Mira Mateus, Ana Maria Brito, Inês Duarte & Isabel Hub Faria (eds.), Gra-
mática da língua portuguesa, 87–123. Editorial Caminho.
Falbo, Caterina. 1998. Analyse des erreurs en interprétation simultanée. The In-
terpreters’ Newsletter 8. 107–120.
Gile, Daniel. 1987. Les exercices d’interprétation et la dégradation du français:
une étude de cas. META 32(4). 420–428.
Gile, Daniel. 1992. Les fautes de traduction: une analyse pédagogique. META 37(2).
251–262.
Ginezi, Luciana Latarini. 2014. Desafios para a construção de um corpus de apren-
dizes de interpretação simultânea. TradTerm 23. 165–191.
House, Juliane, Bernd Meyer & Thomas Schmidt. 2012. CoSi - A Corpus of Con-
secutive and Simultaneous Interpreting. Em Thomas Schmidt & Kai Wörner
(eds.), Multilingual Corpora and Multilingual Corpus Analysis Hamburg Studies in
Multilingualism (14), 295–304. John Benjamins.
Jaubert, Anna. 2005. Cohésion et cohérence. Études de linguistique textuelle. ENS édi-
tions.
Kleiber, Georges. 1994. Anaphores et pronoms. Duculot.
Koehn, Philipp. 2005. Europarl: A Parallel Corpus for Statistical Machine Trans-
lation. Em Conference Proceedings: the tenth Machine Translation Summit, 79–86.
Kostopoulou, Georgia. 2007. The role of coherence in text approaching and com-
prehension: Applications in translation didactics. Meta 52(1). 146–155.
Lopes, Ana Cristina Macário. 2008. Texto, gramática e processamento. Em Fá-
tima Oliveira & Isabel Margarida Duarte (eds.), O Fascínio da Linguagem – Actas
do Colóquio de Homenagem a Fernanda Irene Fonseca, 57–68.
OSLa volume 7(1), 2015
estudo preliminar da anáfora num corpus de interpretação simultânea [55]
Lopes, Ana Cristina Macário & Conceição Carapinha Rodrigues. 2013. Texto, coesão
e coerência. Almedina.
Maia, Belinda. 2000. Making corpora: a learning process. Em Silvia Bernardini
& Federico Zanettin (eds.), I corpora nella didattica della traduzione: Corpus Use
and Learning to Translate, 47–60. Cooperativa Libraria Universitaria Editrice Bo-
logna.
Maia, Belinda. 2008. Corpógrafo. Presentation at TaLC at TaLC: Teaching and
Linguateca’s (Portuguese language) Corpora. http://www.linguateca.pt/
documentos/MaiaWorkshopTaLC2008.pdf.
Marques, Isilda Gaspar. 2009. Anáfora associativa - propostas de abordagem em con-
texto escolar: Faculdade de Letras da Universidade de Coimbra. Tese de Mes-
trado.
Monti, Cristina, Claudio Bendazzoli, Annalisa Sandrelli & Mariachiara Russo. 2005.
Studying directionality in simultaneous interpreting through an electronic cor-
pus: EPIC (European Parliament Interpreting Corpus). META 50(4). s/pp.
Morais, Maria da Felicidade Araújo. 2011. Marcadores da estruturação textual: ele-
mentos para a descrição do papel dos Marcadores Discursivos no processamento cog-
nitivo do texto. Centro de Estudos em Letras. Universidade de Trás-os-Montes e
Alto Douro. Coleção Linguística 6.
Oliveira, Fátima. 1987. Cadeias anafóricas: que referência? Revista da Faculdade de
Letras : Línguas e Literaturas, II série 4. 125–136.
Perdicoyanni-Paléologou, Hélène. 2001. Le concept d’anaphore, de cataphore et
de déixis en linguistique française. Revue québécoise de linguistique 29(2). 55–77.
Russo, Mariachiara. 2010. Reflecting on interpreting practice: graduation theses
based on the European Parliament Interpreting Corpus (EPIC). Em Lew Zybatow
(ed.), Translationswissenschaft-Stand und Perspektiven, Innsbrucker Ringvorlesungen
zur Translationswissenschaft VI, (vol 12), 35–50. Peter Lang.
Russo, Mariachiara, Claudio Bendazzoli & Annalisa Sandrelli. 2006. Looking for
lexical patterns in a trilingual corpus of source and interpreted speeches: ex-
tended analysis of EPIC (European Parliament Interpreting Corpus). Forum 4(1).
221–254.
Sanders, Ted, Jentine Land & Gerber Mulder. 2007. Linguistic markers of cohe-
rence improve text comprehension in functional contexts. Information Design
Journal 15(3). 219–235.
OSLa volume 7(1), 2015
[56] araújo & correia
Sandrelli, Annalisa. 2010. Corpus-Based Interpreting Studies and Interpreter Trai-
ning: a Modest Proposal. Em Lew Zybatow (ed.), Translationswissenschaft-Stand
und Perspektiven, Innsbrucker Ringvorlesungen zur Translationswissenschaft VI, (vol
12), 69–90. Peter Lang.
Schmid, Helmut. 1994. Probabilistic part-of-speech tagging using decision trees.
Em Proceedings of the international conference on new methods in language processing,
44–49.
Schmidt, Thomas. 2004. Transcribing and annotating spoken language with EX-
MARaLDA. Em Proceedings of the LREC-Workshop on XML based richly annotated
corpora, ELRA.
Setton, Robin. 1999. Simultaneous Interpretation: A Cognitive-pragmatic Analysis.
John Benjamins.
Shlesinger, Miriam. 1998. Corpus-based Interpreting Studies as an offshoot of
Corpus-based Translation Studies. Meta 43(4). 486–493.
Shlesinger, Miriam. 2009. Towards a definition of Interpretese: An intermo-
dal, corpus-based study. Em Gyde Hansen, Andrew Chesterman & Heidrun
Gerzymisch-Arbosgast (eds.), Efforts and models in interpreting and translation re-
search: A tribute to Daniel Gile, 237–254. John Benjamins.
Simões, Alberto & José João Almeida. 2007. Avaliação de alinhadores. Em Diana
Santos (ed.), Avaliação conjunta: um novo paradigma no processamento computacio-
nal da língua portuguesa, 219–230. IST Press.
Timarová, Šárka. 2005. Corpus linguistics methods in interpreting research: A
case study. The Interpreters’s Newsletter 13. 65–70.
contactos
Sílvia Araújo
Instituto de Letras e Ciências Humanas, Universidade do Minho
saraujo@ilch.uminho.pt
Ana Correia
Instituto de Letras e Ciências Humanas, Universidade do Minho
ana.moutinho@ilch.uminho.pt
OSLa volume 7(1), 2015
ResearchGate has not been able to resolve any citations for this publication.
Article
Full-text available
Translation errors are analyzed on the basis of an operational translation Model. They can be classified either according to their location in the Model's components (knowledge base, hypothesis formulation, plausibility, fidelity and acceptability tests), or according to functional criteria. Isolation and explicitation strategies help locate their sources. Two practical strategies are suggested for remedial action against errors arising from weak motivation in the students: one aims at heightening their awareness of the importance of particular aspects of translation, and the other puts pressure on specific components of translation through marking tactics.
Article
Full-text available
Os Estudos da Interpretação, vinculados aos Estudos da Tradução, são ainda novos no Brasil e, por conseguinte, poucas pesquisas experimentais são publicadas na área. Este estudo apresenta parte de uma pesquisa empírica que está sendo conduzida em âmbito de doutoramento na Universidade de São Paulo, cuja proposta alia os Estudos da Interpretação à metodologia da Linguística de Corpus. Nele, discutimos questões conceituais e metodológicas da Linguística de Corpus aplicadas à Interpretação. A descrição detalhada da construção de um corpus de aprendizes de interpretação simultânea, denominado CAIS – Corpus de Aprendizes de Interpretação Simultânea –, nos leva a refletir sobre os problemas que ainda permeiam a construção de corpora falados, bem como desafios para o futuro a serem enfrentados por pesquisadores. A proposta, assim, esclarece dúvidas quanto à pertinência em realizarmos pesquisas experimentais com a metodologia da Linguística de Corpus aplicada aos Estudos da Interpretação, como também engrandece ambas as áreas, no sentido de abrir possibilidades de novas pesquisas em Interpretação e oferecer um roteiro para a elaboração de corpus de aprendizes em língua falada.
Article
Full-text available
Cet article vise a faire une breve esquisse du fonctionnement de l’anaphore, de la cataphore et de la deixis telles qu’elles sont definies dans les travaux des linguistes francais et francophones. Dans la premiere section, nous avons etudie l’anaphore en regard de la deixis et de la theorie de la localisation referentielle. Cela nous a permis de demontrer que cette theorie presente le texte comme element central de la definition de l’anaphore et etablit une relation structurelle, pas forcement coreferentielle, entre antecedent et anaphorique. A l’oppose de ce procede referentiel se trouve la deixis, procede spatiotemporel qui necessite la presence du referent dans l’espace de renonciation au moment ou l’occurrence est prononcee. Dans la seconde section, nous avons examine l’opposition texte-situation et la theorie memorielle, qui met en valeur le mode de donation du referent. Enfin, l’opposition cataphore/anaphore a fait ressortir l’asymetrie totale entre ces deux procedes.
Article
Full-text available
Parallel corpora have long been awaited in simultaneous interpreting studies in order to validate existing theories and models. The present paper illustrates the development of the European Parliament Interpreting Corpus (EPIC), an open, parallel, multilingual (English, Italian and Spanish), POS-tagged corpus of European Parliament source speeches and simultaneously- interpreted target speeches. The aim of the project is to study recurrent lexical patterns and morpho- syntactical structures across all the possible language combinations and directions, and verify empirically whether different strategies can be detected when interpreting from a Germanic language into a Romance one and vice-versa, or between two Romance languages. EPIC is freely available on-line for the research community to use and contribute to. MOTS-CLÉS/KEYWORDS directionality, parallel corpora, simultaneous interpreting, EPIC, electronic corpus
Book
Simultaneous Interpretation A cognitive-pragmatic analysis Robin Setton Hardbound – Available ISBN 9789027216311 (Eur) | EUR 130.00 ISBN 9781556197123 (USA) | USD 195.00 e-Book – Buy from our e-platform Buy from our e-platform ISBN 9789027285478 | EUR 130.00 | USD 195.00 Also available on Google Play Simultaneous interpretation is among the most complex of human cognitive/linguistic activities. This study, which will interest practitioners and trainers as well as linguists, draws more on linguistics-based theories of cognition in communication (cognitive semantics and pragmatics) than on the traditional information-processing approaches of cognitive psychology, and shows SI to be a valuable source of data on language and cognition. Starting from semantic representations of input and output in samples of professional SI from Chinese and German into English, the analysis explains the classic phenomena – anticipation, restoration of the implicit-explicit balance, and communicative re-packaging (‘re-ostension’) of the discourse – in terms of an intermediate cognitive model in working memory, allowing a more unitary view of resource management in the SI task. Relevance-theoretic analysis of the input discourse reveals rich pragmatic information guiding the construction of the appropriate contexts and the speaker’s underlying intentionalities. The course of meaning assembly is reconstructed in annotated synchronised transcripts.
Article
The communicative text-linguistic approach to the study of texts and their theoretical and methodological problems plays an important role in Translation Studies and in Translation Didactics. The need to use and utilise the textual factors in the translation process and teaching is apparent in various linguistic and translational theories given that Translation, an act of speech and communication, is not performed at the level of language, but at the level of the text and discourse, utilising both linguistic and extralinguistic devices. This paper examines one of the seven textual factors, according to the basic theory of de Beaugrande and Dressler, i.e., the factor of coherence. Given that coherence expresses the logical consistency of utterances in terms of content - and therefore the construction of meaning - concepts such as knowledge, patterns and types of knowledge, frames and scripts, memory, are crucial for describing and examining this factor when approaching and understanding a text. Moreover, the interconnection of text linguistics, translation and cognition is evident, considering de Beaugrande's argument (1999) that "text linguistics has always had a resolutely cognitive orientation because the text must be described as both product and process". Furthermore, we shall examine how teachers of translation courses may take into account these concepts and elements when choosing texts for translation purposes, and utilise the theory of high-coherence and low-coherence texts (D. McNamara) in order to assist translator trainees in enhancing their extralinguistic knowledge and in using their prior knowledge during the comprehension/decoding phase of the translation act.
Article
Résumé Cet article traite des avantages et inconvénients liés à l'application d'une méthodologie basée sur le corpus à l'étude de l'interprétation. L'auteur explore deux voies qui permettent d'utiliser avec profit l'étude de corpus pour la recherche en interprétation. La première est directe et demande l'élaboration de nouveaux types de corpus parallèles et de corpus compara-bles. La seconde consiste à utiliser un corpus monolingue pour l'extraction de données exploi-tables par la recherche expérimentale en interprétation. Abstract This article looks at the problems and benefits that may arise from applying a corpus-based methodology to the study of interpreting. It explores two ways in which interpreting could be fruitfully investigated with the aid of corpora. The first is direct and involves the design of new types of parallel and comparable corpora. The second consists of employing existing monolingual corpora to extract material that can be used in experimental research into inter-preting.