ArticlePDF Available

Abstract and Figures

We analyze the effect of speaker sex, speaking style and language (English, Estonian, French, German, Italian, Portuguese, Swedish) on global statistical measures of the voice fundamental frequency. The styles studied are interview, sentence reading and word list reading. Typical F0 values used by speakers among languages differ both in male and female speakers. Sentence reading has slightly higher values than interview, but the effect is not uniform among languages. In few cases word reading and interview values differ significantly. All central tendency estimators are affected by the variables tested. Three out of five estimators of dispersion show slightly higher values for male than for female speakers. Among styles, the interview has higher standard deviation and coefficient of variation. Languages do not differ among themselves in terms of F0 variability.
Content may be subject to copyright.
LETRAS DE HOJE LETRAS DE HOJE LETRAS DE HOJE LETRAS DE HOJE LETRAS DE HOJE LETRAS DE HOJE LETRAS DE HOJE
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
Este artigo está licenciado sob forma de uma licença Creative Commons Atribuição 4.0 Internacional,
que permite uso irrestrito, distribuição e reprodução em qualquer meio, desde que a publicação
original seja corretamente citada. http://creativecommons.org/licenses/by/4.0/deed.pt_BR
http://dx.doi.org/10.15448/1984-7726.2017.1.25419
Efeito da língua, estilo de elocução e sexo do falante
sobre medidas globais da frequência fundamental1
Effect of language, speaking style and speaker sex on global measures of fundamental frequency
Pablo Arantes
Maria Érica do Nascimento Linhares
Universidade Federal de São Carlos – São Carlos – São Paulo – Brasil
Resumo: Analisamos o efeito do sexo, do estilo de elocução e da língua (alemão, estoniano,
francês, inglês, italiano, português e sueco) sobre estimadores de tendência central e dispersão
da frequência fundamental da fala. Os estilos são entrevista, leitura de frases e de palavras. As
línguas diferem entre si em termos do valor típico de F0 usado por seus falantes. O estilo leitura
de frases apresenta valores maiores do que a entrevista, mas o efeito não é uniforme entre as

Todos os estimadores de tendência central estudados sofreram efeitos dos três fatores testados.
Os homens apresentaram variabilidade de F0 ligeiramente maior do que as mulheres de forma

As línguas não diferem em termos de variabilidade de F0.
Palavras-chave: Frequência fundamental; Fonética acústica; Estilos de fala; Sociofonética
Abstract: We analyze the effect of speaker sex, speaking style and language (English,
Estonian, French, German, Italian, Portuguese, Swedish) on global statistical measures of the
voice fundamental frequency. The styles studied are interview, sentence reading and word
list reading. Typical F0 values used by speakers among languages differ both in male and
female speakers. Sentence reading has slightly higher values than interview, but the effect is not


of dispersion show slightly higher values for male than for female speakers. Among styles, the

among themselves in terms of F0 variability.
Keywords: Fundamental frequency; Acoustic phonetics; Speaking styles; Sociophonetics
Introdução
1
Existem diversos trabalhos de natureza descri-
tiva a respeito dos efeitos de variáveis de natureza
sociolinguística, estilística, paralinguística e extra-
linguística sobre a caracterização da variação de longo
termo da frequência fundamental (doravante F0) da
voz. O tema interessa a muitas áreas de investigação,
como a sociofonética, fonoestilística, síntese de fala e
fonética forense.
1 Os autores agradecem ao professor Anders Eriksson, da Universidade
de Estocolmo, pela cessão do corpus analisado no trabalho. A segunda

2014/21161-5).
     
  
estudos dessa natureza interessam na medida em que
valores típicos de F0 e sua dispersão são dimensões
que falantes podem explorar de maneira sistemática
para produzir distinções no interior de comunidades
linguísticas e entre línguas diferentes.
No campo da síntese de fala, o estudo da variabi-
lidade acústica encontrada na fala natural, como a que
é motivada por diferentes estilos de elocução, fornece
dados importantes para o aperfeiçoamento de sistemas de


Ainda pensando em aplicações de natureza
prática, dados dessa natureza, especialmente o estudo
Efeito da língua, estilo de elocução e sexo do falante ... 27
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
         
muito importantes para pesquisadores e praticantes do
campo da fonética forense (JESSEN, 2008). A F0 é uma
informação muito usada em tarefas de comparação de
 
comum na prática forense é aquele em que a amostra de
fala questionada, aquela cuja autoria se quer atribuir a um
entre um conjunto de falantes suspeitos, foi produzida em
um estilo e a amostra de que o perito forense dispõe para
análise foi produzida em outro estilo. Esse cenário, que é
chamado de incongruência estilística, coloca o seguinte
problema: origem das diferenças observadas na F0 podem
ser atribuídas à mudança no estilo ou à possibilidade de
que outra pessoa tenha produzido a amostra questionada

Apesar de numerosos, os estudos de natureza
descritiva já publicados deixam lacunas importantes no
campo. Muito frequentemente, fornecem poucos detalhes
técnicos a respeito das condições testadas, analisam
amostras pequenas (poucos estudos têm amostras de
mais de 50 falantes), nem sempre fazem uso de estatística
inferencial, e abrangem pouca diversidade linguística
(predomina um conjunto pequeno de línguas germânicas,
sobretudo inglês e alemão). Procuramos, com o presente
estudo, preencher algumas dessas lacunas.
Os dois estimadores da variabilidade mais presentes
nos estudos a respeito da caracterização estatística de
amostras de F0 são a média aritmética, usada como
indicador do valor de tendência central da F0 de um falante
e o desvio padrão como indicador de dispersão. Esses
dois estimadores serão analisados no presente trabalho
para que os resultados obtidos possam ser comparados
com os reportados na literatura existente. Apesar da
popularidade, esses dois estimadores são conhecidos
pela sua sensibilidade à presença de valores extremos
ou de assimetrias nas amostras a que são aplicados, que
pode conduzir a resultados enviesados e eventualmente
não representativos da amostra que se quer caracterizar.
Uma vez que as amostras de F0 muito frequentemente
 
determinadas situações podem apresentar um número
não desprezível de valores extremos (quando um
falante produz qualidades de voz não modais, como voz
laringalizada ou registro de falsete, por exemplo) a falta
de robustez pode ser inconveniente. No presente estudo
estudamos três estimadores de tendência central e cinco
     
tendo em vista amostras de F0.
No que toca a análise dos resultados, todas as
comparações passaram por testes estatísticos. Tomamos
o cuidado de reportar, sempre que possível, além dos
valores de p dos testes, o tamanho do efeito. Essa é uma
informação frequentemente negligenciada, embora seja
relevante para um entendimento mais completo dos testes
estatísticos e útil, por exemplo, para o planejamento de
tamanho de amostras de estudos futuros.
Em termos de diversidade linguística, contemplamos
sete línguas, seis da família indo-europeia (três do ramo
românico e três do ramo germânico) e uma da família
urálica (estoniano).

de uma tabela, que sistematiza resultados de mais de 30
estudos sobre o tema do efeito de variáveis como estilo de
elocução (principalmente “fala espontânea” e “fala lida”)
e outras de natureza paralinguística (fala em ambiente
ruidoso) sobre estatísticas globais da F0.
O trabalho reportado aqui tem um caráter emi-
nentemente descritivo e seu principal objetivo é fornecer
estimativas de valor e de variabilidade para uma série
de estimadores estatísticos disponíveis para o analista
da língua e também para o perito envolvido em tarefas
de comparação de vozes. Não buscamos testar nenhuma
   
teórico, mas sim detectar a presença ou não de efeitos
nos padrões de F0 causados pelas variáveis linguísticas
controladas. Os resultados descritos e analisados aqui
devem ser encarados a partir dessa perspectiva.
1 Metodologia
1.1 Material de fala
Usamos gravações feitas no âmbito do projeto
internacional “A typology for word stress and speech
rhythm based on acoustic and perceptual considerations”,
coordenado por Anders Eriksson, da Universidade de
Estocolmo. O corpus de gravações foi desenhado para
permitir a comparação, em condições semelhantes, de
diferentes línguas, três estilos de elocução e o sexo dos
falantes. O corpus abrangia sete línguas até o momento
em que foi cedido aos autores do presente artigo:
alemão, estoniano, francês, inglês britânico, italiano,
português brasileiro e sueco. As amostras das línguas
individuais foram coletadas por pesquisadores integrantes
do projeto em países em que cada uma das línguas
é falada.
Os estilos de elocução coletados no âmbito do corpus
são: entrevista, leitura de frases e leitura de palavras. No
estilo entrevista, um entrevistador (em geral um membro
da equipe do projeto) faz perguntas ao participante
sobre assuntos diversos, como trabalho, estudos e outros
interesses do entrevistado, visando obter uma narrativa
não planejada e de extensão variável. Para o estilo leitura
de frases, um membro da equipe do projeto selecionou
frases ditas pelo participante na entrevista, transcre-
       
lesse em voz alta. As frases selecionadas são declarativas
28 Arantes, P., Linhares, M. É. N.
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
e interrogativas, embora predominem as primeiras2, lidas
com foco amplo, isto é, com escopo na frase inteira. No
estilo leitura de palavras, o procedimento consistiu na
escolha de uma palavra de cada frase presente da etapa
anterior e na sua apresentação ao participante na forma
de uma lista a ser lida. Uma amostragem aleatória dos
dados desse estilo mostra que nas sete línguas do corpus
a entoação predominante na leitura das palavras foi
declarativa, isto é, um contorno descendente, embora
existam alguns falantes que produzem contornos com


de lista”.
Os resultados reportados por Arantes e Eriksson
(2014) mostram que um intervalo de tempo entre 10 e
    
estimativa de estimadores de tendência central como
a média aritmética, mediana e valor de base se torne
estável em torno do seu valor de longo termo. A adição
de mais material após esse intervalo tende a não provocar

estimadores. Uma vez que as gravações utilizadas neste
estudo têm duração superior a esse limiar, assumimos
que os valores dos estimadores, obtidos levando em

efeito do comportamento de longo termo dos falantes e as

minimamente por fatores que impactam os contornos de
F0 em escala local, como a composição segmental das
palavras, a modalidade dos enunciados e o assim “efeito
de lista” na leitura de palavras.
Os falantes gravados para o corpus têm idades que
variam entre 20 e 30 anos, aproximadamente. Para cada
língua foram selecionados falantes que os entrevistadores
julgaram ter o mesmo dialeto regional. No caso dos dados
do português brasileiro, por exemplo, os falantes são
todos do interior de São Paulo, de cidades próximas a
Campinas.
Analisamos os dados de dez falantes de cada língua,
cinco do sexo masculino e cinco do feminino, uma
amostra de cada estilo, totalizando 210 amostras de fala

1.2 Análise acústica
A extração dos contornos de F0 e das medidas
estatísticas de interesse foi feita usando o programa de

de scripts elaborados pelo primeiro autor do presente
trabalho. Para a extração inicial dos contornos de F0 das
2 Em função dos seus objetivos, os organizadores do corpus não tiveram a
preocupação de fazer uma seleção balanceada em termos de modalidade.
amostras de fala utilizamos o script better_f0, que otimiza
a escolha dos parâmetros oor e ceiling da função To Pitch
do programa Praat, baseada na técnica de autocorrelação.

tem como objetivo diminuir os erros de estimação de F0
mais comuns produzidos pela função To Pitch, como
erros de oitava (quando a função sugere um valor que é o
dobro ou metade do valor correto) e falsos vozeamentos
e desvozeamentos.
Após a extração do contorno por meio do script
better_f0, os arquivos são processados por um segundo
script, chamado f0_outliers, que analisa candidatos
      
suspeitos, ajudando na detecção de erros não eliminados
pelo procedimento aplicado na primeira etapa. O
procedimento implementado pelo script
um candidato cujo valor pode ser considerado suspeito é
analisar a razão entre os valores de F0 de um candidato
e seu sucessor no tempo. Se a razão entre o maior e o
menor dos dois valores ultrapassa um limiar estipulado
pelo usuário e os candidatos estiverem separados por um
intervalo de tempo menor do que um limiar de tempo

segundo elemento do par como suspeito a ser examinado
posteriormente pelo usuário. Para o presente estudo,
adotamos os limiares 1,5 e 80 ms. A adoção do primeiro
limiar implica que se o segundo valor do par analisado
é 50% maior ou menor do que o primeiro e os dois
estiverem separados no tempo por menos do que 80 ms,
então o segundo candidato será marcado para análise
posterior pelo usuário.
Os pontos no tempo onde se localizam os valores de
F0 suspeitos indicados pelo algoritmo são armazenados
em um arquivo no formato TextGrid do Praat. Nos casos
em que o script    
do arquivo de som correspondente ao contorno de
F0 em questão foi examinado visualmente para que
se decidisse se os valores estimados pelo programa
 
visualmente.
1.3 Estimadores estatísticos coletados
Apresentamos a seguir a lista de estimadores
cujo valor foi calculado a partir dos valores de F0 das
amostras de cada uma das 210 amostras de fala do corpus.
      

delas. O cálculo do valor dos estimadores foi feito por
meio de um script do programa Praat, elaborado pelo

Os estimadores de tendência central ou valor
típico são:
Efeito da língua, estilo de elocução e sexo do falante ... 29
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
 
 
 b
Os estimadores de dispersão coletados são:
 
 P / M.
    3): med(|xi
med(x)|).4
       
base (MADb): med(|xi – Fb(x)|).5
 2(fmax / fmin).6
Os valores da média aritmética e do desvio padrão
        
      . É natural que as
mulheres apresentem valores de F0 maiores do que os
homens em função da dependência do valor de F0 em
       
o comprimento e a massa das pregas vocais (TITZE,



contornos produzidos por mulheres e homens. Por isso,

bastante previsível nas comparações envolvendo a média


seja possível comparar conjuntamente dados de média da
F0 de homens e mulheres observamos, para cada falante,
não os valores de cada estilo, mas as diferenças entre as

No caso do desvio padrão, comparações diretas
entre falantes de ambos os sexos são possíveis após a
      
para a de semitons porque o valor de desvio padrão em
semitons será o mesmo qualquer que seja o valor escolhido

exemplo. Isso se dá em função da natureza do cálculo
desse estimador, que toma os desvios de cada observação
da amostra relativamente a um valor de tendência central.
Em função disso, os valores de desvio padrão da F0 de
homens e mulheres podem ser comparados diretamente
sem recurso a nenhum artifício.
3 Da expressão em inglês median absolute deviation.
4 Na fórmula, med( ) é a função mediana, x representa uma amostra
qualquer e xi é cada uma das observações que compõem a amostra x.
O MAD é a mediana do conjunto de valores, tomados em seu valor
absoluto, formado pelos desvios de cada valor de uma amostra em
relação ao valor mediano dessa mesma amostra.
5 O MADb é semelhante ao MAD, mas os desvios são calculados
relativamente ao valor de base da amostra e não à sua mediana.
6 Na fórmula, fmax e fmin são respectivamente os valores máximo e mínimo
     
oitavas.
     
viada que os valores em semitons são calculados relativamente à

O valor de base (base value ou base line em inglês)
é um estimador estatístico de localização, proposto
por Traunmüller e Eriksson ([S.d.]) que leva em conta
        
variabilidade causada por fatores paralinguísticos – atitude
ou estado emocional do falante, por exemplo. O valor de
base (Fb) de uma determinada amostra de F0 é obtido pela
aplicação da fórmula Fb = Fmédia - kmédia
respectivamente, o valor da média aritmética e do desvio-
padrão da F0 da amostra em questão e k é uma constante
determinada empiricamente. Os autores sugeriram a
princípio o valor de 1,5 para a constante, mas, em estudo

1,43 e sugerem uma formulação alternativa para o cálculo
do valor de base. Nessa nova formulação, chamada de
alternative base value  
     
distribuição, assumindo-se uma distribuição normal para

formulação alternativa é mais robusta do que a original a
fatores como a distorção causada pelo canal de gravação e
mudanças na distância comunicativa entre interlocutores.
Por esse motivo a formulação alternativa foi usada para o
cálculo do valor de base neste estudo.
1.4 Análise estatística
A manipulação dos dados produzidos na etapa
anterior e sua análise estatística reportadas nas seções a
seguir foram feitas no ambiente de computação estatística

Empregamos o teste estatístico paramétrico análise
       
variáveis independentes controladas no estudo sobre as
variáveis dependentes, descritas na seção anterior, quando
a variável independente cujo efeito se queria estabelecer
tinha mais do que dois níveis. O teste-t de amostras
independentes foi usado para comparar as médias de
variáveis independentes com dois níveis. O teste-t de
amostra única foi usado quando foi preciso comparar a
   
situação de análise. Antes da aplicação dos testes de
comparação entre médias testamos sempre o pressuposto
da homogeneidade de variância por meio do teste Fligner-

em que esse pressuposto não era satisfeito: testes de

teste-t
Adotamos um nível de rejeição da hipótese nula de
 
apontados por todos os testes, paramétricos ou não.
     
tamanho de efeito em conjunto com os valores de p de cada
30 Arantes, P., Linhares, M. É. N.
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
teste. Os indicadores calculados foram o g


versão não enviesada do d
pode ser entendido como a distância entre duas médias,
escalonada em termos de seus respectivos desvios-padrão.
   g 
e é robusta à presença de heterogeneidade de variância
e não normalidade nas amostras analisadas. Denota a
probabilidade de um valor qualquer retirado de uma das
duas amostras comparadas ser maior ou menor do que um

1 e quanto mais próximo dos extremos, maior o tamanho
       
é imaginar que ele mede o grau de sobreposição entre
as duas amostras: 0 indica sobreposição completa e
     
tamanho do efeito medido por d (e, por extensão, g) seja
interpretado como pequeno caso o índice tenha valor até
0,2, médio para valores em torno de 0,5 e grande a partir
de 0,8.
1.5 Estratégias de análise para
os estimadores
Esperamos um efeito do sexo dos falantes sobre
    

       
F0. Por conta disso, testamos separadamente na amostra
de mulheres e homens o possível efeito combinado do
sexo dos falantes e da língua sobre a média da F0. No
caso do estudo do efeito do estilo de elocução e de sua
interação com o sexo dos falantes, a variável dependente
a ser analisada é a diferença, na escala dos semitons, entre
as médias da F0 dos três estilos, tomados em dois pares:
leitura de frases-entrevista e leitura de palavras-entrevista.
As amostras de falantes de ambos os sexos poderão ser
analisadas conjuntamente neste caso porque as diferenças
serão calculadas entre os valores na escala de semitons.
O valor do desvio padrão foi calculado a partir da
   
Por conta disso, nas análises desse estimador os dados dos
falantes dos dois sexos serão analisados conjuntamente.
Os valores da gama tonal também são expressos em
oitavas relativas ao valor mínimo de F0 de cada contorno,
uma escala não linear assim como os semitons. Os dados
de mulheres e homens foram analisados conjuntamente.
2 Resultados
A seção 2.1 começa descrevendo o efeito do sexo dos
falantes sobre os três estimadores de tendência central. As
seções 2.1.1 a 2.1.3 explora a interação entre o sexo dos
falantes e as línguas nos três estimadores de tendência
central.
A seção 2.2 trata do efeito dos estilos de elocução
sobre os três estimadores de tendência central e de suas
interações com o sexo dos falantes e as línguas.
A seção 2.3 trata dos efeitos das três variáveis sobre
os estimadores de dispersão.
2.1 Efeito do sexo dos falantes sobre
os estimadores de tendência central
Tabela 1. Valores médios dos estimadores de tendência
central, em Hertz, separados pelo sexo dos falantes e pelas
línguas. Na última linha indica-se entre parênteses os
valores dos estimadores em semitons.
Língua
Média Mediana Valor de base
Fem. Masc. Fem. Masc. Fem. Masc.
Alemão 206 118 200 109 165 92
Estoniano 215 113 212 11 0 185 97
Francês 207 113 202 109 177 93
Inglês 202 112 202 11 5 177 97
Italiano 201 127 198 135 166 107
Português 212 142 208 137 180 11 0
Sueco 191 11 6 188 114 161 98
Total 205
(91,9)
120
(82,5)
201
(91,7)
117
(82,2)
173
(89)
99
(79,4)
O efeito do sexo dos falantes sobre o valor médio
   
pode ver a seguir.
 
 2p < 0,001];
  2 (1) = 154,6 p < 0,001]
 
  g 
 
 p < 0,001];
  2p < 0,001]
 g 
  g 
 
 2 (1) = 140,1 p < 0,001];
semitons [F(1, 208) = 616,5 p < 0,001]
 g 
  g 
A magnitude do efeito do sexo dos falantes sobre a
média dos três estimadores de tendência central pode ser
considerada extremamente alta de acordo com os critérios
apresentados na seção 2.4.
Efeito da língua, estilo de elocução e sexo do falante ... 31
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
2.1.1 Média
2p 2 (6) = 13,4
p < 0,05]. O português é a língua com valor médio mais
alto. A diferença mais expressiva é em relação ao sueco:
g 
st: g 
do ponto de vista estatístico segundo as comparações
múltiplas (p < 0,01 em ambas as escalas).
2 (6) = 28,5 p 2
p < 0,001]. O valor médio da F0 do português é apro-



maior do que o valor do italiano. Comparações pareadas
indicam que o português e o italiano são as línguas que
mais diferem das demais, conforme a listagem abaixo
    

    p < 0,01), francês
(p < 0,05), alemão, sueco (p < 0,10).
    p < 0,05), francês
(p < 0,10).
Com base nos resultados das comparações pareadas
é possível dividir as línguas em dois grupos homogêneos:
de um lado português, alemão e italiano, com médias mais
altas, e o restante das línguas, que apresentam médias
mais baixas. A diferença de média entre os dois grupos
   g = 0,88
g 
2.1.2 Mediana
2 (6) = 12,8 p 
p < 0,05]. Comparações múltiplas mostram que as
      
sueco e português (p      
estoniano na escala de semitons (p < 0,05). A magnitude

[g  
[g     
com a interpretação das métricas.
2p 2
p < 0,001]. Comparações pareadas indicam que o português
tem média estatisticamente diferente do estoniano, inglês
(p < 0,01) e francês (p < 0,05) e marginalmente diferente do
alemão e sueco (p < 0,10) e o italiano tem média diferente
do inglês (p < 0,01), estoniano e francês (p < 0,05). Os
resultados das comparações pareadas permitem dividir
as línguas em dois grupos sem sobreposição: de um
lado português, e italiano, com medianas mais altas, e
estoniano, francês e inglês, que apresentam as medianas
mais baixas. A diferença no valor médio da mediana entre
    
grupo. As métricas de tamanho de efeito indicam que
essa diferença pode ser considerada de magnitude alta
g g 
2.1.3 Valor de base
  2 (6) = 12,8 p < 0,05; st: F(6,
p < 0,05]. Comparações múltiplas mostram que
       
sueco e português (p      
estoniano na escala de semitons (p < 0,05). A magnitude

[g  
[g 
2p 2
p < 0,001]. Comparações pareadas indicam que o português
tem média estatisticamente diferente do estoniano, inglês
(p < 0,01) e francês (p < 0,05) e marginalmente diferente do
alemão e sueco (p < 0,10) e o italiano tem média diferente
do inglês (p < 0,01), estoniano e francês (p < 0,05). Os
resultados das comparações pareadas permitem dividir
as línguas em dois grupos sem sobreposição: de um lado
português, e italiano, com valores de base mais altos, e
estoniano, francês e inglês, que apresentam os valores
de base mais baixos. A diferença no valor médio entre
    
grupo. As métricas de tamanho de efeito indicam que
essa diferença pode ser considerada de magnitude alta
g g 
2.2 Efeito dos estilos de elocução sobre
os estimadores de tendência central
2.2.1 Média
Tabela 2. Diferença entre a média dos três estilos (st).
O símbolo que segue o número na coluna “Todos” indica
se aquele valor pode ser considerado signicativamente
diferente de zero (** indica p < 0,01, * p < 0,05 e p < 0,1).
Língua
Estilos de elocução
frases-entrevista palavras-entrevista
Fem. Masc. Todos Fem. Masc. Todos
Alemão 0,01 1,17 0,59
-1 -0.16 -0,58
Estoniano 0,52 1,52 1,02 * 0,04 1,03 0,54
Francês 0,28 1,95 1,12 * 0,22 1,31 0,77
Inglês 1,44 0,87 1,16 0,14 -0,03 0,05
Italiano 2,03 1,24 1,63 * 1,17 0,82 0,99
Português -1 -0.15 -0,57
-1,48 -1,34 -1,41 **
Sueco 0,42 1,28 0,85
0,18 1,31 0,74
Geral 0,53 1,31 0,83 * -0,1 0,42 0,16
   
estilo: a diferença frases-entrevista (0,83 st) e palavras-
32 Arantes, P., Linhares, M. É. N.
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
p < 0,05],


     
níveis da variável diferença entre estilos de elocução para
testar o efeito da variável língua mostram os resultados
a seguir:
 p < 0,1], diferença

   p < 0,05], dife-
 
(p < 0,05). Tamanho do efeito de 2,4 st em favor
do italiano [g 


   
seguir:
 ns].
 ns].

em favor do estilo leitura de frase em relação ao estilo
entrevista é distinta de zero, aplicamos um teste-t de
   
[t p < 0,001]. A diferença global de 0,16 st em

diferente de zero [t ns]. Testes semelhantes
foram realizados separadamente por língua (os resultados
estatísticos são mostrados na Tab. 2). A diferença frases-
entrevista é estatisticamente diferente de zero em três das
sete línguas da amostra: estoniano, francês e italiano. A
diferença é positiva e maior do que 1 st em todos os casos.
   
diferente de zero no caso do português (a leitura de
palavras tem média 1,41 st abaixo da média da entre-
vista).
2.2.2 Mediana
Tabela 3. Diferença entre a mediana dos três estilos (st).
O símbolo que segue o número na coluna “Todos” indica
se aquele valor pode ser considerado signicativamente
diferente de zero (** indica p < 0,01, * p < 0,05 e p < 0,1).
Língua
Estilos de elocução
frases-entrevista palavras-entrevista
Fem. Masc. Todos Fem. Masc. Todos
Alemão 0,29 1,46 0,87 * -1,12 -0,21 -0,66
Estoniano 0,74 1,62 1,18 * 0,42 0,95 0,68
Francês 0,53 2,12 1,33 * 0,52 1,66 1,09
Inglês 1,11 1,35 1,23 * 0,36 0,78 0,57
Italiano 1,56 1,63 1,60 ** 0,64 1,17 0,90 *
Português -0,69 0,20 -0,25 -1,13 -1,22 -1,17 **
Sueco 0,25 1,35 0,80
0,04 1,39 0,71
Geral 0,54 1,39 0,97 -0,04 0,65 0,30
   

p < 0,01],

relação à de palavras [g 
     
níveis da variável diferença entre estilos de elocução para
testar o efeito da variável língua mostram os resultados
a seguir:
    p < 0,05], com-

entre o português, que apresenta a maior diferença
negativa entre os estilos, e o italiano, que tem a
maior diferença positiva (p < 0,05). Tamanho do
efeito de 1,8 st em favor do italiano [g = 1,81

 p < 0,01], com-
    
cativas entre o português, que apresenta a maior
diferença negativa entre os estilos, e o italiano e o
francês, que têm as maiores diferenças positivas
(p < 0,05). Tamanho do efeito de 2,2 st em favor
do italiano [g 


   
seguir:
   p < 0,01], tama-
nho do efeito de 0,85 st em favor dos falantes
masculinos [g 
  p < 0,01], ta-

masculinos [g 
       
          
favor do estilo leitura de frase em relação ao estilo
entrevista é distinta de zero, aplicamos um teste-t
de amostra única, que indicou uma diferença signi-
 t p < 0,001]. A diferença global de
0,3 st em favor do estilo leitura de palavras não é
    t ns].
Testes semelhantes foram realizados separadamente
por língua (os resultados estatísticos são mostrados
na Tab. 3). A diferença frases-entrevista só não é esta-
tisticamente diferente de zero em duas das sete línguas da
 
a diferença é positiva e maior do que 0,8 st. A diferença
    
de zero no caso do português (a leitura de palavras


entrevista).
Efeito da língua, estilo de elocução e sexo do falante ... 33
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
2.2.3 Valor de base
Tabela 4. Diferença entre o valor de base dos três estilos
(st). O símbolo que segue o número na coluna “Todos” indica
se aquele valor pode ser considerado signicativamente
diferente de zero (** indica p < 0,01, * p < 0,05 e p < 0,1).
Língua
Estilos de elocução
frases-entrevista palavras-entrevista
Fem. Masc. Todos Fem. Masc. Todos
Alemão -0.67 0,51 -0,08 -0,91 -0,34 -0,63
Estoniano -0,13 1,20 0,54 -1,65 1,17 -0,24
Francês 0,69 1,46 1,07 ** 0,89 1,32 1,1
Inglês 2,42 0,84 1,63 0,47 -0,17 0,15
Italiano 2,53 0,77 1,65 2,52 0,71 1,61
Português -0,17 0,37 0,10 -1,89 -1,27 -1,58 *
Sueco 2,24 0,99 1,61 2,31 0,96 1,64
Geral 0,99 0,88 0,93 0,25 0,34 0,29
     


[F(1, 138) = 2 ns]. A diferença é de 0,64 st em favor da lei-
tura de frases em relação à de palavras [g 
     
níveis da variável diferença entre estilos de elocução para
testar o efeito da variável língua mostram os resultados
a seguir:
    ns], diferença

 p < 0,1], diferença
média de 1,5 st entre as seis línguas.


   
seguir:
 ns], tamanho do
efeito de 0,11 st em favor dos falantes masculinos
[g 
 ns], tamanho
        
masculinos [g 
      
 
do estilo leitura de frase em relação ao estilo entrevista
é distinta de zero, aplicamos um teste-t de amostra
t
p < 0,01]. A diferença global de 0,3 st em favor do estilo

zero [tns]. Testes semelhantes foram realizados
separadamente por língua (os resultados estatísticos são
mostrados na Tabela 4). A diferença frases-entrevista só
é estatisticamente diferente de zero no caso do francês
 
   
diferente de zero no caso do português (a leitura de
palavras tem média 1,58 st abaixo da média da entrevista).
2.3 Estimadores de dispersão
2.3.1 Desvio padrão
Tabela 5. Desvio padrão médio (st) agrupado pelos estilos
de elocução, sexo dos falantes e pela língua. A última linha
mostra a média global do DP.
Língua
Sexo Estilos de elocução
Fem. Masc. entrevista frases palavras
Alemão 2,09 2,52 2,26 2,42 2,24
Estoniano 1,9 2,09 1,97 2,1 1,91
Francês 2,05 2,52 2,58 2,28 1,99
Inglês 2,68 2,52 3,19 2,29 2,32
Italiano 2,44 2,11 2,64 2,24 1,95
Português 2,08 3,06 2,92 2,1 2,7
Sueco 2,15 2,27 2,56 2,09 1,99
Geral 2,2 2,44 2,59 2,22 2,16
Análise de variância de 3 fatores (sexo, estilo e
língua), tendo como variável dependente o valor do
desvio padrão, medido em semitons.
    p < 0,05], falantes mas-
culinos apresentam valores médios de desvio-
    
de vista estatístico do que os falantes do sexo
feminino. Tamanho do efeito é 0,24 st em favor
dos falantes masculinos [g 
 p < 0,01]. Testes de com-
paração pareada mostram que o estilo entrevista
tem variabilidade maior do que os outros dois
estilos [frases-entrevista: p < 0,05 g 
palavras-entrevista: p < 0,01 g  
frases-palavras: ns [g 
 p < 0,1], diferença média
de 0,24 st entre as línguas.
2.3.2 Coeciente de variação
Análise de variância de 3 fatores (sexo, estilo e
língua), tendo como variável dependente o valor do

desvio padrão da F0 relativo à média da F0.
   p < 0,001], mulheres 2,4%
 
percentual em favor dos falantes masculinos
[g 
 p 
leitura de frases 2,56% st; leitura de palavras
2,5% st. Testes de comparação pareada mostram
34 Arantes, P., Linhares, M. É. N.
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
que o estilo entrevista tem variabilidade maior
do que os outros dois estilos [frases-entrevista:
p < 0,05 g   
p < 0,05 g    ns
[g 
 ns], diferença média de

2.3.3 MAD
Para testar o efeito do sexo do falante, estilo de
elocução e língua sobre o valor médio do MAD, rodamos
        
      
dependente.
 p < 0,01] falantes femininas
1,32 st; falantes masculinos 1,55 st [g = 0,43

    ns] entrevista 1,45 st;

    p < 0,1] alemão 1,5 st;
estoniano 1,21 st; francês 1,4 st; inglês 1,56 st;

Diferença média de 0,15 st entre as línguas.
2.3.4 MADb
Para testar o efeito do sexo do falante, estilo de
elocução e língua sobre o valor médio do MADb, rodamos
       
 
variável dependente.
 ns
falantes masculinos 2,82 st [g 
    ns] entrevista 2,8 st;
leitura de frases 2,82 st; leitura de palavras 2,8 st.
    ns] alemão 2,68 st;


média de 0,4 st entre as línguas.
2.3.5 Gama tonal
        

de elocução e língua sobre os valores médios de gama
tonal.
    ns], falantes femininas
1,36 8va; falantes masculinos 1,41 8va [g = 0,15

      p < 0,001],
entrevista (1,66 8va), frases (1,35 8va) e palavras
(1,14 8va); frases-entrevista (p < 0,001 g = 0,84
  p < 0,001 g = 1,4
  p < 0,001 g 

    p < 0,001], análise de
agrupamentos homogêneos das comparações
     
o português (1,6 8va), as línguas com menor e
maior gama média, formam grupos sem interseção
[g 
Inspeção visual dos boxplots mostrados na Figura 1
sugere que as línguas não são homogêneas no que
diz respeito às diferenças de extensão da gama tonal
existentes entre os três estilos. É possível propor a
divisão das línguas em dois grandes grupos. De um lado
alemão, francês, inglês, e português, nas quais o estilo
Figura 1. Boxplots mostrando distribuição dos dados de gama tonal (oitavas), das sete línguas do corpus nos três estilos
de elocução.
Efeito da língua, estilo de elocução e sexo do falante ... 35
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
entrevista apresenta valores de gama maiores do que os
demais: em torno de duas oitavas contra valores entre
1 e 1,5 oitavas para os demais. De outro lado, estoniano,
italiano e sueco, nas quais não há diferenças marcantes
entre os três estilos ou o estilo leitura de palavras tem o
menor valor comparado com os demais. Essa análise é
corroborada pelos resultados das comparações pareadas,
apresentadas a seguir.
   
palavras (p < 0,05) e leitura de palavras e leitura
de frases (p < 0,01).
 
os estilos.
    
estilos (p < 0,05)
      
estilos (p < 0,05)
 
de palavras (p < 0,05)
  
(p < 0,05)
 
de palavras (p < 0,05).
3 Discussão
    
e de grande magnitude do sexo dos falantes sobre a
média de F0, reportados na seção 3.1, são previsíveis
  
       
especial o comprimento e a massa das pregas vocais
    
respeito é sabida e bastante descrita na literatura. Os
        
     
semelhantes aos reportados no estudo meta-analítico de


as diferenças observadas nos estimadores mediana e valor
de base, muito embora esses dois sejam muito menos
reportados na literatura do que a média. Note-se que o
tamanho do efeito é um pouco menor no caso do valor
de base, o que pode ser explicado pelo fato do valor
de base ser, entre os três estimadores, o menos afetado
pelos valores extremos introduzidos nas amostras pelas
excursões positivas da F0.
Os resultados relativos aos estimadores de dispersão
  

os valores dos falantes homens são maiores do que os das
mulheres, embora o tamanho do efeito seja pequeno no
caso do DP e médio nos demais. Esses resultados divergem
daquele relatado por Traunmüller e Eriksson, que não
encontram diferenças no DP de homens e mulheres
quando ele é expresso em semitons. A magnitude dos
  
para homens e 2,8 para mulheres), embora não seja
    
e MADb não mostram efeito do sexo dos falantes. O
estudo dos autores suecos não traz dados sobre gama
   
trabalho. Não temos notícia de estudos que tenham
reportado valores de MADb para que se pudesse
comparar os resultados. Os resultados que mostram haver

variabilidade são inesperados se tomarmos o trabalho
dos autores suecos como referência. Essa diferença
de variabilidade não pode ser facilmente atribuída a
     
    
que ela seja produto de diferenças culturais ou sociais
entre os dois sexos.
Os resultados do presente estudo que dizem respeito
ao efeito dos estilos de elocução sobre os estimadores
estatísticos indicam que apenas no caso do estimador
média a diferença entre os estilos leitura de frases e

(0,83 st). A diferença entre a leitura de palavras e a
   
    
Considerando todas as línguas, observa-se que o estilo
leitura de frases tende a apresentar valores mais altos
de tendência central do que o estilo entrevista, embora
essa diferença seja diferente de zero do ponto de vista
estatístico apenas no caso da média. Tomando as línguas
   
casos. O português é uma exceção a esse padrão. Para
essa língua, o estilo entrevista tende a apresentar valores
de tendência central maiores do que o do estilo leitura
de frases. Uma possível explicação para essa diferença
pode estar no procedimento de coleta do material. Nas
gravações do estilo entrevista feitas pela equipe brasileira
do projeto o entrevistador e o entrevistado em geral se
conheciam e tinham algum grau de intimidade. Pode-se
imaginar que a familiaridade entre os interlocutores pode
ter colaborado para um maior grau de coloquialidade e
espontaneidade na gravação, que conduziu à produção
de fala com mais vivacidade no estilo entrevista. No caso
das gravações das outras línguas não havia familiaridade
entre entrevistado e entrevistador.
A maioria dos estudos presentes na amostra
reunida na meta-análise não aplicou testes de infe-
       
diferenças observadas. Em três deles, essa informação
é explicitamente mencionada e apenas em um caso a
36 Arantes, P., Linhares, M. É. N.
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
 
numérico da média de cada estilo é reportado (na maior
      
estilos investigados obteve o maior valor. A F0 média do
estilo leitura é maior do que a do estilo fala espontânea
em 22 dos conjuntos de resultados. O contrário acontece
em sete casos. Nos casos em que o estilo leitura teve
valor maior do que o estilo fala espontânea, a média da

ao valor da média da fala espontânea. Esse resultado é
bastante próximo ao que foi encontrado no presente
estudo para a diferença entre o estilo leitura de frases e
entrevista.
Nenhuma diferença entre leitura de frases e entrevista
   


as diferenças sejam, em termos absolutos, maiores do que
as observadas no caso da média. No caso da mediana, as
    
      
diferente de zero quando tomadas isoladamente.
Os resultados do presente estudo corroboram em
alguma medida os resultados encontrados na literatura
prévia, que sugerem uma diferença positiva de baixa
magnitude na média de F0 do estilo leitura em comparação
ao que neste trabalho chamamos estilo entrevista, isto
é, uma forma de produção verbal de tipo narrativo,
produzido com baixo grau de automonitoramento por
parte do falante.
O sexo dos falantes interagiu com os estilos de forma
   
As diferenças entre estilos foram maiores nos homens
do que nas mulheres. Essa diferença não foi explorada
sistematicamente na literatura prévia.

os valores dos três estimadores de tendência central.
As diferenças entre línguas não são uniformes entre

das mulheres, considerando os três estimadores, foram
encontradas entre o português e o estoniano, com valores
maiores, e sueco, com valores menores. No caso dos
falantes masculinos, o grupo das línguas com valores
maiores nos três estimadores é integrado pelo português e
pelo italiano, enquanto sueco (média), estoniano, francês
e inglês (mediana e valor de base) têm os valores mais
baixos. A magnitude do efeito é muito elevada em todos
g > 1 no mínimo).
O estoniano apresenta uma peculiaridade: os valores
dos estimadores das falantes femininas estão entre os
mais altos e valores dos falantes masculinos entre os
mais baixos no conjunto das sete línguas investigadas.
Esse padrão aconteceu nos três estimadores de tendência
central.
    
   
valores dos estimadores de tendência central. O português
foi a única língua na qual a diferença entre os estilos leitura
  
diferente de zero em todos os estimadores. Apresentou
também diferenças negativas entre os estilos leitura
de frases e entrevista no caso da média e da mediana,

desses casos envolvendo o português, houve ocorrência
de diferença negativa envolvendo o alemão (todos os
   
     

Conclusões
De maneira geral, o que os resultados do presente
estudo sugerem é que, em termos dos estimadores
de tendência central, a mediana e valor de base são
      
O valor de base é um estimador notável na medida
         
fatores. O uso desse estimador no âmbito de aplicações
forenses tem a vantagem de ser menos suscetível ao
problema da incongruência entre estilos, mencionado
na introdução. Entre os estimadores de dispersão,
 
das variáveis estudadas foram o MADb e o MAD. É
interessante observar que a média e o desvio padrão,
os dois parâmetros mais estudados na literatura e
mais usados para a caracterização dos padrões de F0
em cenários forenses, sejam os mais afetados pelas
variáveis estudadas no presente trabalho. Os resultados
sugerem que as práticas no campo devem ser revistas,
especialmente em situações em que é importante que os

como a mudança no estilo de elocução.
Os dados documentam a existência de grande
variabilidade motivada pelas línguas, mostrando que
não é possível assumir a universalidade dos padrões
observados nos dados já coletados e analisados na
literatura. Como sugerem Traunmüller e Eriksson, o valor
típico de F0 (que a literatura reputa ser uma característica

      
interior das comunidades falantes. Por isso é importante
coletar dados de um grande número de línguas para
que seja possível ter uma ideia mais clara a respeito da
diversidade efetivamente existente.
Efeito da língua, estilo de elocução e sexo do falante ... 37
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
Referências
 Temporal stability of
long-term measures of fundamental frequency. 2014, Dublin:

        
computer. Glot International
Statistical Power Analysis for the Behavioral
Sciences
      
http://
>.

 
GIBBON, Fiona (Org.). Handbook of Phonetic Sciences. 2. ed.

       
phonetics and phonology. Journal of Phonetics
438, 2006.
      
forensic speaker comparison. The International Journal of
Speech, Language and the Law
Focalização no português do Brasil.

   Estabilidade de me-
didas estatísticas de frequência fundamental: comparação da
variabilidade intra e interlinguística. São Carlos: Sociedade
Brasileira para o Progresso da Ciência, 2015.

from Data to Models. Journal of Speech Sciences, v. 1, n. 1,
p. 55-83, 2011.

of three parameters on speaking fundamental frequency. Journal
of the Acoustical Society of America

JASSEM, Wiktor. Normalisation of F0 curves. In: FANT,
      Auditory Analysis
and Perception of Speech   
p. 523-530.
JESSEN, Michael. Forensic Phonetics. Language and
Linguistics Compass
       
speaking style on global measures of fundamental frequency.
     
Formal linguistics and law

. Within-speaker variability due to speaking
manners
      
aspects of speaking tempo. Forensic Linguistics, v. 4, n. 1,

Robustness of Long Time
Measures of Fundamental Frequency. Antwerp, Belgium:

  Speaking styles in speech research.

R: A Language and Environment for Statistical
Computing      
Computing, 2016. Disponível em: <
org/>.
TITZE, Ingo. Principles of voice production. Englewood Cliffs:

    The
frequency range of the voice fundamental in the speech of male
and female adults. [S.d.]. Disponível em: <http://www2.ling.
su.se/staff/hartmut/f0_m&f.pdf>.
ANEXO
Meta-análise
Neste anexo apresentamos os resultados de uma meta-análise de parte da literatura a respeito da variação na
média e no desvio padrão da F0 motivada por diferentes estilos de fala. Pesquisas sobre o tema em mecanismos de



Organizamos e apresentamos os dados presentes nesses trabalhos no  a seguir. Informações relevantes
sobre os estudos foram coletadas sempre que estavam disponíveis ou podiam ser inferidas a partir do texto.
São elas: autor da pesquisa, língua investigada, número, sexo e idade de falantes observados, estilos de fala

branco indicam que a informação não estava disponível.

      

38 Arantes, P., Linhares, M. É. N.
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
Autor Idioma N Sexo Idade Estilo Tendência central Dispersão
Snidecor (1943) 6 M L, FE Média: L 132 Hz
FE 120 Hz
DP: L > FE
Hirson et al. (1995) Inglês 20 M 21-37 L, FE Média: L 121,5 Hz,
FE 106,9 Hz
21-37 L e FE por telefone Média: L 121.2 Hz,
FE 108,9 Hz
Hollien et al. (1997) Inglês 324 M 18-30 L, FE Média: L 129 Hz,
FE 123 Hz
DP: L = FE
M 18-30 L, FE Média: L 122 Hz,
FE 116 Hz
DP: L = FE
M 18-30 L, FE Média: L 114 Hz,
FE 110 Hz
DP: FE levemente > L
Laan (1997) Holandês 2 M L, FE Média: L > FE (diferença
signicativa apenas para um
falante)
Gama: L 90% > para o sujeito
com diferença signicativa na
média, o outro sujeito não
apresentou diferença signicativa
Schultz-Coulon (1975) Alemão 11 F, M L, FE, CN Média:
L 117 Hz (apenas homens),
CN 110 Hz,
FE 107 Hz
Batliner et al. (1995) 4 3 F,
1M
L, FE Média: FE > L DP: L > FE para três sujeitos.
FE > L para uma das falantes
Künzel (1997) Alemão 10 5M, 5F L, FE, FS L obteve maior média *
L, FE, FS por telefone L obteve maior média *
Tjaden (2000) Inglês 9 M 50-80 L, FE Gama: L 64 Hz,
FE 55Hz
Köster (2002) Alemão 3 estilos: dentre eles
FE e L
Sem ruído: FE levemente > L **
Com ruído: L levemente > FE **
Interquartis muito parecidos para
L e FE,
Mixdorff and Ptzinger
(2005)
Alemão 4 3F,
1M
L, FE Média: F: FE > L para duas
falantes; para a terceira
praticamente não houve
diferença. H: L > FE
DP: F: FE > L.
H: FE = L
Jessen (2009) Alemão 100 M 21-63 FE e L com ruído Média: FE > L CV: FE > L
FE e L com ruído neutro Média: FE > L** CV: FE > L
FE e L por telefone Média: FE > L** CV: FE > L
Koopmans-van Beinum
(1991)
Holandês L, FE Média: L > FE. Mediana obteve
pequeno aumento nas palavras
em foco
Blaauw (1991) Holandês L, FE Média: L > FE Gama: L > FE
Bhatt e Léon (1991) Francês Noticiários, introduções
a concertos, comentários
esportivos
Gama: noticiários obtiveram o
menor valor
Picheny et al. (1985) Fala clara, conversação F0 máxima:
Fala clara > FE.
Gama:
Fala clara > FE
Koopmans-van Beinum
(1991)
L, FE Mediana: L obteve maior valor
Koopmans-van Beinum
(1992)
L, FE Mediana: L obteve maior valor
Koopmans-van Beinum
(1991)
FE, L Mediana: L > FE
Clark et al. (1987) Mediana: sentenças com ruído
obtiveram maior valor
Eskénazi (1992) L, Fala clara, FE Gama: L obteve maior valor (para
um subconjunto de falantes)
Ayers (1991) L, FE Gama: L = FE. Movimento de F0:
FE apresentou maior variedade
de tipos de contornos que L
Hollien et al. (1973) Inglês 157 M 18-26 L, FE Média: L 129HZ,
FE 123Hz.
Em semitons:
L 35.7, FE 34.8
DP em tons: L 1.6,
FE 1.6
(dados não declarados) 142 M 18-26 L, FE Média: L 122Hz,
FE 116Hz.
Em semitons:
L 34.6, FE 33.8
DP em tons: L 1.6,
FE 1.7
(continua)
Efeito da língua, estilo de elocução e sexo do falante ... 39
Letras de Hoje, Porto Alegre, v. 52, n. 1, p. 26-39, jan.-mar. 2017
Autor Idioma N Sexo Idade Estilo Tendência central Dispersão
Hollien et al. (1997) Inglês 25 M 21-30 L, FE Média: L 114Hz,
FE 110Hz.
Em semitons:
L 33.6, FE 33
DP em tons: L 1.3,
FE 1.3
18 F 21-30 L, FE Média: L 198Hz,
FE 190Hz.
Em semitons:
L 43.2, FE 42.4
DP em semitons: L 1.2,
FE 1.1
Karlsson et al. (1998) Sueco 50 M 22-78 Fala neutra (dados
memorizados), fala com
ruído alto, fala com
estresse (raciocínio
lógico e tarefa de
reconhecimento auditivo
com ruído ao fundo)
Média: sentenças com ruído 5%
@ > neutras. Sentenças com
ênfase diferiram ligeiramente
entre os dois grupos
Künzel (1997) 10 5F, 5H 20-26 FE, FS, L Média:
F: FE 199.1Hz,
FS 208.2Hz,
L 213Hz.
M: FE 126.5Hz,
FS 126.8Hz,
L 132.3Hz.
DP:
F: FE 17.3, FS 19.1,
L 18.9.
M: FE 24.8, FS 29.2,
L 24.8


Contato: pabloarantes@gmail.com
(conclusão)
... At the start, we stated that one of the goals in this article is to bring together the two lines of research we described. This is done by reanalyzing a speech corpus that has already been studied by Arantes and Linhares (2017) with the purpose of finding evidence for the effect of speaking style on f0. In that study, the authors found the effects by looking at differences in a set of measures of central tendency and variability of f0. ...
... Motivated by previous evidence concerning the presence of many cases of bimodality in f0 histograms in the corpus analyzed by Arantes and Linhares (2017), a methodology to identify and analyze REVISTA DA ABRALIN such cases is presented in this study. We also go beyond the previous literature on the statistical characterization of f0 and perform a distribution fitting analysis including other distributions other than the normal. ...
Article
Full-text available
The present study has two main goals. The first is to describe the effects of three speaking styles (spontaneous interview, sentence reading and word list reading) on statistical estimators of fundamental frequency (f0) variability (mean, standard deviation, skewness and kurtosis) in five female and five male speakers of Brazilian Portuguese (BP). Most f0 contours of word reading are bimodal. Analysis of their time-normalized contours suggests this is caused by the time-compressed realization of fast transitions from low to high or high to low tones aligned with stressed syllables. Considering only unimodal distributions, results show that there are no statistically significant effects in the male data for any of the four variability estimators. Effects show up in female data. Spontaneous style has statistically significant higher mean, SD and skewness than read speech. Findings in the previous literature indicate the reverse pattern, though, for languages other than BP. The second goal of the study is to characterize the statistical properties of f0 distributions beyond mean and SD. Results confirm previous observations that most f0 distributions have positive skewness, are left-tailed and have kurtosis values that deviate significantly from the normal because of large deviations from the central or modal value. A distribution fitting procedure tested six distributions. The asymmetric Burr type XII distribution emerges as the one that best fits the data in the corpus. Results show that two of the parameters that determine its shape correlate well with the empirical f0 distribution values of SD and skewness. Important effects of speaking style on f0 seen in female speakers can be reproduced by combinations of the Burr distributions’ parameters.
... Research on speaking styles stems from a general scientific interest in discovering the effects of non-structural linguistic factors on the process of speech production. There is a growing body of research on the subject, a representative sample of which is presented in review papers (see [1,2] and references therein). Knowledge about this subject, nonetheless, can be brought to bear on more applied endeavors, such as in the field of forensic phonetics research and practice. ...
... In a previous work, we analyzed this same corpus in search for effects of language, speaking style and speaker sex on global measures of fundamental frequency [2]. There we focused on measures of central tendency and variability of f0 and a number of statistically significant effects were uncovered. ...
Conference Paper
Full-text available
In this study, we outline a methodology to quantify the degree of similarity between pairs of f0 distributions based on the Anderson-Darling measure that underlies its namesake goodness-of-fit test. The procedure emphasizes differences due to more fine-grained f0 modulations rather than differences in measures of central tendency, such as the mean and median. In order to assess the procedure's usefulness for speaker comparison, we applied it to a multilingual corpus in which participants contributed speech delivered in three speaking styles. The similarity measure was calculated separately as function of speaking style and speaker. Between-speaker variability (different speakers, same style) in distribution similarity varied significantly between styles --- spontaneous interview shows greater variability than read sentences and word list in five languages (English, French, Italian, Portuguese and Swedish); in Estonian and German, read sentences yield more variability. Within-speaker variability (same speaker, different styles) levels are lower than between-speaker in the style that exhibit the greatest variability. The results point to the potential use of the proposed methodology as a way to identify possible idiosyncratic traits in f0 distributions. Also, they further demonstrate the effect of speaking styles on intonation patterns.
... In another recent study [7] that looked into the effect of language, speaking style and speaker sex on a number of statistical measures of f0, the base value and the median deviation from the base value were found to be fairly robust against the influence of these factors. ...
... This may be explained by the significantly greater variation in spontaneous speech. Standard deviation in semitones for the full data set are 2.6 st for the spontaneous versus 2.2 st for the other styles as measured in a study using the same corpus [7]. If the languages are analysed separately, the same pattern appears, SD is systematically greater in spontaneous speech. ...
Article
Full-text available
Resumo: Este trabalho testa a robustez de uma metodologia proposta pelos foneticistas suecos Traunmüller e Eriksson para determinar o valor de base, um estimador estatístico do valor típico da frequência fundamental (F0) de um falante com base na média e no desvio-padrão da F0. A metodologia consiste em estimar uma constante, k, que indica quantos desvios-padrão abaixo da média de F0 do falante o valor de base está. O método para estimar a constante foi criado e testado em amostras de fala atuada. Verificamos neste trabalho se a aplicação da mesma técnica a amostras de fala não atuada produz resultados comparáveis aos reportados por Traunmüller e Eriksson. A investigação usou amostras de fala produzidas por falantes nativos de alemão, estoniano, francês, inglês britânico, italiano, português brasileiro e sueco, em três estilos de elocução: entrevista, leitura de frases e leitura de palavras. Os resultados indicam que a variabilidade causada pelos estilos de enunciação na F0 possibilita a aplicação da metodologia a amostras de fala não atuada. Os valores da constante derivados dos dados não atuados são próximos aos reportados pelos autores suecos, o que indica que ela é robusta tanto do ponto de vista dos falantes quanto das línguas. Palavras-chave: entoação; valor de base; frequência fundamental. Abstract: This paper probes the robustness of Traunmüller and Eriksson’s methodology to determine the base value of the fundamental frequency of speech, an estimator of a speaker’s typical F0 value. The methodology entails the estimation of a constant, k, indicating where the base value for a speaker lies in relation to F0 standard deviations below the F0 mean. The methodology was originally developed from acted speech samples. Here we test if k values can be successfully obtained from non-acted samples and how they compare to the ones reported by Traunmüller and Eriksson. A speech corpus of speech samples differing in speaking styles (spontaneous interview, sentence reading, word list reading) from seven languages (English, Estonian, French, German, Italian, Brazilian Portuguese, Swedish) was used. Results show that k values estimated from non-acted speech are roughly the same as those reported in Traunmüller and Eriksson’s original paper. We speculate that deviations can be explained by the fact that some speakers make extensive use of non-modal register. Keywords: intonation; base value; fundamental frequency.
Article
Full-text available
The morphological phenomenon of nominalization is a lexicalstandard which consists of the fomation of abstract substantivesfrom verbs (consagrar/consagração, fingir/fingimento). Based onthe principles of Generative Morphology, this article aims to betterdefine the phenomenon, as well as to develop some aspects relatedto this linguistic mechanism, such as: the question of the derivationof the zero suffix (the problem of regressives), the study of whatmay be called the iterative -ção suffix and the relation betweennominalization and discourse type.
Article
Full-text available
The results of the first international survey on forensic speaker comparison practices are presented in this article. Thirty-six experts from thirteen countries and five continents responded to a series of questions concerning their practices in casework. Despite the responses revealing a range of differences, there is, nevertheless, a reasonably strong convergence with respect to the importance assigned to particular speech features, methodology and choice of framework for expressing conclusions. Practices and preferences revealed by the survey are discussed in the context of constraints imposed by the institutions and jurisdictions within which the participants are situated, and in relation to contemporary trends and developments within forensic speech science.
Article
Full-text available
This paper describes the application of the analysis by synthesis paradigm to the melody of speech. A complete chain of processes is described from the acoustic analysis of fundamental frequency (f 0), via the phonetic modelling of f 0 using the Momel algorithm, to the surface phonological representation of the curves using the INTSINT alphabet. Each step of the chain is designed as a reversible process which can be used to generate an acoustic output allowing an objective evaluation of the analysis. Finally, the current implementation of ProZed, a prosody editor for linguists, is described. It is argued that an explicit set of modelling tools like this will allow linguists to test different models of phonological structure which, it is hoped, will result in the availability of more and better data on a wide variety of languages.
Article
No PDF available ABSTRACT We investigated long-term mean, median, and base value of the voice fundamental frequency (F0) to estimate how long it takes their variability to stabilize. That information can be useful in the development of F0 contour normalization and forensic applications. Change point analysis was used to locate changes in underlying variance in the mean, median, and base value time-series. In one experiment, stabilization points were calculated in recordings of the same text spoken in 26 languages. Average stabilization points are 5 s for base value and 10 s for mean and median. Variance after the stabilization point was reduced around 40 times for mean and median and more than 100 times for the base value. In another experiment, four speakers read two different texts each. Stabilization points for the same speaker across the texts do not exactly coincide as would be ideally expected. Average point dislocation is 2.5 s for the base value, 3.4 for the median, and 9.5 for the mean. After stabilization, differences in the three measures obtained from the two texts are 2% on average across speakers. Present results show that stabilization points in long-term measures of F0 occur earlier than suggested in the previous literature.
Article
An overview of forensic phonetics is presented, focusing on speaker identification as its core task. Speaker profiling/speaker classification is applied when the offender has been recorded, but no suspect has been found. Auditory speaker identification by victims and witnesses becomes relevant when no speech recording of the offender is available. It can take the form of familiar-speaker identification or unfamiliar-speaker identification, and in the latter case a voice line-up/voice parade can be carried out. When recordings of both the offender and a suspect are available, a voice comparison is done by an expert in forensic speech analysis. Current issues and domains in voice comparison analysis include the Bayesian approach to forensic reasoning and the Likelihood Ratio, the use of formant frequency measurements, non-analytic perception and Exemplar Theory, forensic automatic speaker identification, and the interaction between different methods.
Article
In this article we define and illustrate sociophonetic variation within speech, highlighting both its pervasiveness and also the relatively minor role it has played in the development of phonetic and phonological theory. Reviewing evidence from studies of adults and children, we suggest that cognitive representations of words combine linguistic and indexical information, and that both types of information are present from the first stages of acquisition. We suggest that an exemplar-based model of phonological knowledge offers the most productive means of modeling sociophonetic variation. We discuss some of the characteristics of an exemplar-based account of sociophonetic variability and highlight some strands of investigation which would facilitate its further development.