ThesisPDF Available

Análise Comparativa de Técnicas de Rastreamento de Marcas Acústicas em Imagens de Ecocardiografia

Authors:

Abstract and Figures

O auxílio ao diagnóstico através da visualização de imagens médicas vêm sendo utilizado em diversas áreas da Medicina tais como pneumologia, cardiologia, traumatologia, neurologia, dentre outras. Na área da cardiologia, várias aplicações clínicas têm sido propostas para a análise de doenças cardíacas através da quantificação e avaliação da dessincronia ventricular esquerda durante a deformação do músculo cardíaco (miocárdio). Existem, atualmente, duas técnicas utilizadas na aferição da deformação miocárdica em duas dimensões: Doppler Tecidual (DT) e Strain 2D (St2D). A primeira técnica possui desvantagens quanto à dependência do ângulo de insonação do transdutor durante o exame ecocardiográfico, diminuindo a chance de reprodutibilidade do resultado das medições entre especialistas. A segunda técnica, recentemente introduzida e também chamada de Speckle Tracking, consiste no acompanhamento de marcadores acústicos naturais existentes na imagem produzida pelo ultrassom. Neste sentido, vê-se a importância do estudo de técnicas para rastrear esses marcadores acústicos. A presente dissertação realiza uma análise comparativa entre oito algoritmos de estimação de deslocamento baseados na técnica de Casamento de Blocos (CB) e três algoritmos baseados na técnica de Fluxo Óptico (FO), que são as duas atuais técnicas amplamente citadas na literatura. A análise é realizada mediante vídeos sintéticos e vídeos médicos de exames ecocardiográficos. A avaliação das técnicas em vídeos sintéticos é realizada quanto à trajetória e à deformação. Já a avaliação em vídeos de exames ecocardiográficos é realizada quanto às curvas e taxas de deformação. Na análise da trajetória são aplicadas duas métricas de avaliação das técnicas: correlação média e erro quadrático médio. Para a análise das curvas e das taxas de deformação a métrica usada é o valor do erro quadrático médio em relação à deformação global (global strain) do miocárdio. Os resultados indicam que o desempenho idêntico de alguns estimadores de deslocamento os reduzem de oito para seis algoritmos. A técnica de CB mostra-se viável para o rastreamento de marcas acústicas mas é dependente das dimensões adotadas nos blocos. Em relação às técnicas de FO, o algoritmo de Lucas e Kanade Piramidal é o que obtém melhor resultado nos testes realizados, produzindo curvas de deformação global com erro médio de 0,47%, enquanto os valores de erro dos outros algoritmos de FO estão em torno de 10%. No caso, os erros dos estimadores de CB variam de 1% a 16%.
Content may be subject to copyright.
UNIVERSIDADE FEDERAL DO CEARÁ
CENTRO DE TECNOLOGIA
DEPARTAMENTO DE ENGENHARIA DE TELEINFORMÁTICA
PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA DE TELEINFORMÁTICA
Thomaz Maia de Almeida
ANÁLISE COMPARATIVA DE TÉCNICAS DE
RASTREAMENTO DE MARCAS ACÚSTICAS EM
IMAGENS DE ECOCARDIOGRAFIA
FORTALEZA
2012
Thomaz Maia de Almeida
ANÁLISE COMPARATIVA DE TÉCNICAS DE
RASTREAMENTO DE MARCAS ACÚSTICAS EM
IMAGENS DE ECOCARDIOGRAFIA
DISSERTAÇÃO
Dissertação submetida ao corpo docente da Coordenação do Pro-
grama de Pós-Graduação em Engenharia de Teleinformática da
Universidade Federal do Ceará como parte dos requisitos necessá-
rios para obtenção do grau de MESTRE EM ENGENHARIA DE TE-
LEINFORMÁTICA. Area de concentração: Sinais e Sistemas
Prof. Dr. Paulo César Cortez
(Orientador)
FORTALEZA
2012
Análise Comparativa de Técnicas de Rastreamento de Marcas
Acústicas em Imagens de Ecocardiografia
Thomaz Maia de Almeida
Dissertação de Mestrado aprovada em 01/08/2012.
Prof. Dr. Paulo César Cortez
(Orientador)
Prof. Dr. Eduardo Tavares Costa
Prof. Dr. José Marques Soares
Prof. Dr. Tarcisio Ferreira Maciel
iii
À minha mãe, Luciliane Maia
iv
Sumário
Lista de Figuras vii
Lista de Tabelas xi
Lista de Siglas xii
Resumo xiv
Abstract xvi
Agradecimentos xviii
1 Introdução 1
1.1 Motivação.................................... 6
1.2 Objetivos .................................... 6
1.3 Organização da Dissertação . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 Fundamentação Teórica 8
2.1 ImagemDigital ................................. 8
2.2 ImagensdeUltrassom ............................. 9
2.3 DeformaçãoMiocárdica............................. 10
2.3.1 Doppler Tecidual ............................ 16
2.3.2 Strain Bidimensional.......................... 19
2.4 AnálisedeMovimento ............................. 21
2.4.1 FluxoÓptico .............................. 21
2.4.1.1 Método de Horn e Schunck (1981) . . . . . . . . . . . . . 23
2.4.1.2 Método de Lucas e Kanade (1981) . . . . . . . . . . . . . 25
2.4.1.3 Método de Lucas e Kanade Piramidal . . . . . . . . . . . 26
2.4.2 Casamento de Blocos . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.4.2.1 Estimadores de Deslocamento . . . . . . . . . . . . . . . . 30
3 Metodologia 33
3.1 Implementação ................................. 33
3.1.1 FluxoÓptico .............................. 34
3.1.2 Casamento de Blocos . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.2 SistemadeTestes................................ 37
3.2.1 VídeosSintéticos ............................ 37
3.2.2 Vídeos Sintéticos de Ultrassom . . . . . . . . . . . . . . . . . . . . 39
3.2.3 Vídeos de Exames Ecocardiográficos . . . . . . . . . . . . . . . . . 41
v
vi
3.3 Avaliação das Técnicas Implementadas . . . . . . . . . . . . . . . . . . . . 41
3.3.1 Trajetória ................................ 42
3.3.2 Deformação ............................... 42
3.3.3 Esforço Computacional . . . . . . . . . . . . . . . . . . . . . . . . . 43
4 Resultados e Discussões 45
4.1 Caracterização do Ambiente de Testes . . . . . . . . . . . . . . . . . . . . 45
4.2 Resultados de Trajetória para Vídeos Sintéticos . . . . . . . . . . . . . . . 46
4.3 Resultados de Deformação para Vídeos Sintéticos . . . . . . . . . . . . . . 50
4.4 Resultados de Trajetória para Vídeos Sintéticos de Ultrassom . . . . . . . 52
4.5 Resultados de Deformação para Vídeos Sintéticos de Ultrassom . . . . . . 54
4.6 Resultados de Deformação para Exames Ecocardiográficos . . . . . . . . . 55
4.7 Resultados de Esforço Computacional em Exames Ecocardiográficos . . . . 58
5 Conclusões, Contribuições e Trabalhos Futuros 60
Referências Bibliográficas 63
Apêndices 69
A Modos de imagens ecocardiográficas 70
B Planos e janelas de cortes 73
C Estimador de Correlação Não-Normalizada 77
Lista de Figuras
1.1 representação básica de um sistema ultrassônico, a) sonda e um feixe ul-
trassônico ideal passando por diferentes tipos de tecidos; e b) envelope do
sinal correspondente recebido (adaptado de Jan (2005)). . . . . . . . . . . 3
1.2 diferença entre duas regiões do miocárdio. . . . . . . . . . . . . . . . . . . 5
2.1 imagens em diferentes resoluções, (a) 3x4; (b) 12x16; (c) 48x64; e (d)
192x256 pixels (JäHNE,2002). ......................... 9
2.2 sequência de codificação de um feixe ultrassônico radial em tons de cinza. . 10
2.3 imagem típica de ultrassom do coração. . . . . . . . . . . . . . . . . . . . . 11
2.4 representação básica de um coração helicoidal, a) esquemático e b) real
(TORRENT-GUASP, 1998; TORRENT-GUASP et al., 2004). . . . . . . . . . . . 12
2.5 deformação de uma barra finita de tamanho inicial L0durante os instantes
t0et1(adaptado de (D’HOOGE et al.,2002)). ................. 13
2.6 a) pontos formadores do contorno das paredes miocárdicas; b) loop reali-
zado por cada ponto; e c) segmentos formados pela distância entre cada
pardepontos................................... 15
2.7 imagens de ecocardiograma, a) contorno inicial nas paredes do músculo
cardíaco com o valor da deformação global (GS) em -19,1%; b) valor da
deformação de cada segmento do coração; e c) curvas de deformação dos
segmentos ao longo dos quadros. . . . . . . . . . . . . . . . . . . . . . . . . 16
2.8 a) diagrama ilustrativo da intensidade do sinal ×velocidade no tecido e no
fluxo sanguíneo; e b) o mesmo diagrama separado por um filtro (adaptado
de (FOX et al.,2011))............................... 17
2.9 corte do VE, evidenciando a fase diastólica do ciclo cardíaco pelas diferentes
velocidades do tecido miocárdico (SILVA et al.,2002).............. 18
2.10 gradiente intramiocárdico de velocidade entre dois pontos de um segmento
muscular (V1 e V2) em relação à distância L entre eles (adaptado de (SILVA
et al.,2005)) ................................... 18
vii
LISTA DE FIGURAS viii
2.11 direções dos vetores de velocidade das técnicas, a) DT longitudinal; e b)
St2D, longitudinal e transversal (adaptado de Perk, Tunick e Kronzon
(2007)). ..................................... 20
2.12 técnica de rastreamento de marcas acústicas (speckle tracking) (adaptado
deFoxetal.(2011))............................... 20
2.13 exemplo da técnica de FO, a) com um frame no instante t0; b) frame no
instante t0+ 1; e c) campo de fluxo óptico. . . . . . . . . . . . . . . . . . . 22
2.14 representação esquemática do método PIR. . . . . . . . . . . . . . . . . . . 27
2.15 etapa de redução da imagem, a) com nível 0 com 256x256 pixels; b) nível
1 com 128x128 pixels; c) nível 2 com 64x64 pixels; e d) nível 3 com 32x32
pixels. ...................................... 27
2.16 etapa de reconstrução da imagem, a) com nível 0 com 256x256 pixels; b)
nível 1 com 128x128 pixels; c) nível 2 com 64x64 pixels; e d) nível 3 com
32x32 pixels.................................... 28
2.17 exemplo de estimação de vetor de deslocamento. . . . . . . . . . . . . . . . 29
2.18 aplicação prática da técnica de CB. . . . . . . . . . . . . . . . . . . . . . . 32
3.1 a) quadro 1; b) quadro 1 filtrado; c) quadro 2; d) quadro 2 filtrado; e)
gradiente em x; f) gradiente em y; e g) derivada parcial de t......... 34
3.2 vetores de deslocamento estimados pelo método a) Horn e Schunck (1981)
e b) Lucas e Kanade (1981). . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.3 Configuração de busca e comparação de blocos. . . . . . . . . . . . . . . . 36
3.4 recortes de quadros com diferentes PSNR, a) dB; b) 20 dB; c) 17,8 dB;
d) 14,8 dB; e) 13,1 dB; f) 11,8 dB; g) 10,8 dB; h) 10 dB; i) 9,4 dB; e j) 8,8
dB. ....................................... 38
3.5 primeiro quadro do vídeo sintético, a) trajetória controlada; e b) detalhe
(zoom) do objeto a ser rastreado. . . . . . . . . . . . . . . . . . . . . . . . 38
3.6 primeiro quadro do vídeo sintético, a) objeto a ser deformado; e b) detalhe
(zoom) do vértice a ser rastreado. . . . . . . . . . . . . . . . . . . . . . . 39
3.7 a) quadro do vídeo sintético; b) quadro do vídeo sintético de ultrassom
(phantom) gerado a partir de a); c) outro quadro do vídeo sintético e d)
phantom geradoapartirdec).......................... 40
3.8 a) quadro do vídeo sintético; b) quadro do vídeo sintético de ultrassom
(phantom) gerado a partir de a); c) outro quadro do vídeo sintético e d)
phantom gerado a partir de c). . . . . . . . . . . . . . . . . . . . . . . . . 40
3.9 desenho das trajetórias reais e estimadas. . . . . . . . . . . . . . . . . . . . 42
LISTA DE FIGURAS ix
3.10 fases de sístole e diástole em eletrocardiograma de um ciclo cardíaco. . . . 43
3.11 quadros do vídeo do ciclo cardíaco no instante, a) fim da diástole; e b) fim
dasístole. .................................... 44
4.1 resultados de correlação média com o tamanho de bloco (N) entre 7, 9 e 11. 47
4.2 resultados de erro quadrático médio da análise de trajetória com diferentes
PSNR para estimadores de deslocamento com tamanho de bloco (N) igual
a7......................................... 47
4.3 resultados de erro quadrático médio da análise de trajetória com diferentes
PSNR para estimadores de deslocamento com tamanho de bloco (N) igual
a9......................................... 48
4.4 resultados de erro quadrático médio da análise de trajetória com diferentes
PSNR para estimadores de deslocamento com tamanho de bloco (N) igual
a11. ....................................... 49
4.5 resultados de análise da trajetória, a) correlação média (desvio-padrão em
torno de 3); e b) erro quadrático médio para as técnicas de FO. . . . . . . 49
4.6 resultados de erro quadrático médio da análise de deformação com diferen-
tes PSNR para estimadores de deslocamento para N = 7. . . . . . . . . . . 50
4.7 resultados de erro quadrático médio da análise de deformação com diferen-
tes PSNR para estimadores de deslocamento para N = 9. . . . . . . . . . . 51
4.8 resultados de erro quadrático médio da análise de deformação com diferen-
tes PSNR para estimadores de deslocamento para N = 11. . . . . . . . . . 51
4.9 resultados de erro quadrático médio da análise de deformação com diferen-
tes PSNR para técnicas de FO. . . . . . . . . . . . . . . . . . . . . . . . . 52
4.10 curvas de taxas de deformação das técnicas de FO, a) PSNR = 20 dB; e b)
PSNR=13,1dB ................................ 52
4.11 resultados de correlação média das trajetórias das técnicas aplicadas nos
vídeos sintéticos de ultrassom. . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.12 resultados de erro quadrático médio das trajetórias das técnicas aplicadas
nos vídeos sintéticos de ultrassom. . . . . . . . . . . . . . . . . . . . . . . . 54
4.13 resultados de erro quadrático médio da análise de deformação das técnicas
aplicadas nos vídeos sintéticos de ultrassom. . . . . . . . . . . . . . . . . . 55
4.14 curvas de taxa deformação, a) estimadas; e b) reais. . . . . . . . . . . . . . 56
4.15 erro absoluto entre a deformação global de referência e estimada dentre as
técnicasanalisadas................................ 58
LISTA DE FIGURAS x
A.1 exemplo de imagem em modo B. . . . . . . . . . . . . . . . . . . . . . . . . 70
A.2 exemplo de imagem em modo M (CARMO et al.,2012)............. 71
A.3 exemplo de imagem em modo Doppler. .................... 72
B.1 localização das janelas ecocardiográficas: 1) supraesternal; 2) paraesternal;
3)apicale4)subcostal. ............................ 73
B.2 planos ecocardiográficos: longitudinal, transversal e sagital. . . . . . . . . . 74
B.3 (a) Cortes paraesternais e (b) cortes apicais (SILVA et al., 2004) . . . . . . . 76
B.4 (a) Cortes supraesternais e (b) corte subapical (SILVA et al., 2004) . . . . . 76
C.1 a) bloco original; e b) melhor correspondência com o bloco original. . . . . 78
C.2 duas situações diferentes com valores de correspondências de NNC iguais. . 78
Lista de Tabelas
3.1 melhor correspondência entre estimadores de deslocamento. . . . . . . . . . 37
4.1 configuração do computador. . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4.2 correlação média entre trajetórias (fluxo óptico). . . . . . . . . . . . . . . . 49
4.3 resultados e erros de deformação global. . . . . . . . . . . . . . . . . . . . . 57
4.4 média(µ) e desvio-padrão(σ) do erro de deformação para as nove técnicas
implementadas. ................................. 57
4.5 média(µ) e desvio-padrão(σ) em segundos do esforço computacional para
cada técnica em relação aos exames médicos. . . . . . . . . . . . . . . . . . 58
xi
Lista de Siglas
1D Unidimensional
AB Área de Busca
AC Autocorrelação (Autocorrelation)
AVC Acidente Vascular Cerebral
BA Bloco Âncora
CC Correlação Cruzada (Cross Correlation )
CB Casamento de Blocos
DT Doppler Tecidual
ECOPE Escola de Ecografia de Pernambuco
EDT Ecocardiografia com Doppler Tecidual
FO Fluxo Óptico
HUWC Hospital Universitário Walter Cantídio
HS Horn-Schunck (método)
LK Lucas-Kanade (método)
MAE Erro Médio Absoluto (Mean Absolute Error)
MSE Erro Médio Quadrático (Means Square Error)
NC Correlação Normalizada (Normalized Correlation)
NNC Correlação Não-Normalizada (Non-Normalized Correlation)
OMS Organização Mundial de Saúde
PSNR Relação Sinal Ruído de Pico
PIR Lucas e Kanade Piramidal (método)
RF Radiofrequência
SAD Soma das Diferenças Absolutas (Sum of Absolute Differences)
SSD Soma das Diferenças Quadráticas (Sum of Square Differences)
xii
Lista de Siglas xiii
St2D Srain Bidimensional
UFC Universidade Federal do Ceará
VC Visão Computacional
VE Ventrículo Esquerdo
Resumo
Oauxílio ao diagnóstico através da visualização de imagens médicas vêm sendo uti-
lizado em diversas áreas da Medicina tais como pneumologia, cardiologia, trau-
matologia, neurologia, dentre outras. Na área da cardiologia, várias aplicações clínicas
têm sido propostas para a análise de doenças cardíacas através da quantificação e ava-
liação da dessincronia ventricular esquerda durante a deformação do músculo cardíaco
(miocárdio). Existem, atualmente, duas técnicas utilizadas na aferição da deformação
miocárdica em duas dimensões: Doppler Tecidual (DT) e Strain 2D (St2D). A primeira
técnica possui desvantagens quanto à dependência do ângulo de insonação do transdutor
durante o exame ecocardiográfico, diminuindo a chance de reprodutibilidade do resultado
das medições entre especialistas. A segunda técnica, recentemente introduzida e também
chamada de Speckle Tracking, consiste no acompanhamento de marcadores acústicos na-
turais existentes na imagem produzida pelo ultrassom. Neste sentido, vê-se a importância
do estudo de técnicas para rastrear esses marcadores acústicos. A presente dissertação
realiza uma análise comparativa entre oito algoritmos de estimação de deslocamento ba-
seados na técnica de Casamento de Blocos (CB) e três algoritmos baseados na técnica
de Fluxo Óptico (FO), que são as duas atuais técnicas amplamente citadas na literatura.
A análise é realizada mediante vídeos sintéticos e vídeos médicos de exames ecocardio-
gráficos. A avaliação das técnicas em vídeos sintéticos é realizada quanto à trajetória e
à deformação. a avaliação em vídeos de exames ecocardiográficos é realizada quanto
às curvas e taxas de deformação. Na análise da trajetória são aplicadas duas métricas
de avaliação das técnicas: correlação média e erro quadrático médio. Para a análise das
curvas e das taxas de deformação a métrica usada é o valor do erro quadrático médio em
relação à deformação global (global strain) do miocárdio. Os resultados indicam que o
desempenho idêntico de alguns estimadores de deslocamento os reduzem de oito para seis
algoritmos. A técnica de CB mostra-se viável para o rastreamento de marcas acústicas
mas é dependente das dimensões adotadas nos blocos. Em relação às técnicas de FO, o
algoritmo de Lucas e Kanade Piramidal é o que obtém melhor resultado nos testes rea-
lizados, produzindo curvas de deformação global com erro médio de 0,47%, enquanto os
xiv
xv
valores de erro dos outros algoritmos de FO estão em torno de 10%. No caso, os erros dos
estimadores de CB variam de 1% a 16%.
Palavras-chave: auxílio ao diagnóstico médico, deformação miocárdica, speckle trac-
king, processamento digital de imagens, fluxo óptico, casamento de blocos.
Abstract
Aided diagnosis by visualization of medical images has been used in several medical
fields such as pulmonology, cardiology, traumatology, neurology, and others. In
cardiology, several clinical applications have been proposed for the analysis of heart di-
sease by quantification and evaluation of ventricular dyssynchrony during deformation of
the heart muscle (myocardium). There are currently two techniques used in the mea-
surement of myocardial deformation in two dimensions: Tissue Doppler and 2D Strain.
The first technique has drawbacks regarding the dependence on the angle of insonation
of the transducer during the echocardiographic examination, which reduce the chance of
reproducibility of measurements among experts. The second technique, recently introdu-
ced and also called Speckle Tracking, consists of tracking the natural acoustic markers
in the image produced by ultrasound. In this sense we see the importance of studying
techniques to track these acoustic markers. This thesis performs a comparative analysis of
eight algorithms from time-delay estimators based on the block matching technique and
three algorithms based on the optical flow technique, which are the two current techniques
widely presented in the literature. The analysis is performed using synthetic videos and
medical videos from echocardiographic examinations. The evaluation of the techniques in
synthetic videos is performed on the trajectory and deformation. The assessment in echo-
cardiographic videos is held regarding the strain curves and strain rates. In the analysis
of the trajectory are applied two metrics for evaluating techniques: mean correlation and
mean square error. For the analysis of strain curves and of strain rate the measure used
is the value of the mean square error relative to global strain of myocardium. The results
indicate that the identical performance of some estimators reduce the time-delay estima-
tors from eight to six algorithms. The block matching technique appears to be a viable
technique for tracking acoustic marks but is dependent on the dimensions adopted in the
blocks. Regarding optical flow techniques, the Lucas and Kanade Pyramidal algorithm is
the one which gets the best results in the tests performed herein and produce global strain
curves average error of 0.47 %, while the error values of the other optical flow algorithms
are around 10 %. In case, the block matching time-delay estimators errors vary from 1%
xvi
xvii
to 16%.
Keywords: aided medical diagnosis, myocardial deformation, speckle tracking, digital
image processing, optical flow, block matching.
Agradecimentos
À minha mãe, Maria Luciliane Maia de Almeida, por seu meu maior exemplo. Por
mostrar sempre caminhos certos me dando a confiança necessária para segui-los.
À minha namorada, Luciana Gurgel, por estar comigo desde o início da caminhada.
Obrigado pela ajuda e paciência em todos os momentos.
Ao professor Auzuir Ripardo de Alexandria pela oportunidade depositada durante a
graduação, pela orientação na monografia e pela parceria e ajuda na pós-graduação.
Ao professor Paulo César Cortez pela confiança em meu trabalho, pelo aprendizado,
pela orientação, pela disponibilidade e condição que me proporcionou para a realização
dessa dissertação.
Aos médicos José Sebastião de Abreu e José Maria Del Castillo que tornaram possível
a validação desta dissertação graças aos exames ecocardiográficos fornecidos.
Aos companheiros e amigos do Laboratório de Teleinformática (LATIN/UFC) pela
amizade, pelos conselhos e ensinamentos durante essa jornada. Em especial agradeço aos
amigos Tarique da Silveira Cavalcante, Alyson Bezerra Nogueira Ribeiro, John Hebert da
Silva Félix e Rodrigo Carvalho Souza Costa.
À Fundação Cearense de Apoio ao Desenvolvimento Científico e Tecnológico (FUN-
CAP), pelo suporte financeiro.
A todos que colaboraram de forma direta ou indireta para a realização deste trabalho.
xviii
Capítulo 1
Introdução
Ométodo de diagnóstico por imagens médicas tem se mostrado uma área promissora
na pesquisa científica que tem possibilitado avanços para a medicina atual. Con-
tudo, uma grande parte de médicos e técnicos especialistas ainda elaboram diagnóstico
por meio de análise visual de películas de filmes ou papéis especiais de forma bastante
subjetiva (FELIX, 2007). Isto pode conduzir a morosidade e erros no processo de elabo-
ração de diagnósticos, além da dependência do grau de conhecimento e de experiência do
especialista. Assim, na prática, é comum a divergência de diagnósticos em tais análises.
Neste sentido, diversos estudos foram realizados visando diminuir essa subjetividade e
auxiliar o diagnóstico médico.
O auxílio ao diagnóstico através da visualização de imagens médicas vem sendo utili-
zado em diversas áreas da Medicina tais como pneumologia, cardiologia, traumatologia,
neurologia, dentre outras. Estas imagens são obtidas através de equipamentos de to-
mografia computadorizada, ressonância magnética, ultrassonografia, etc. A partir desses
equipamentos, o operador pode manipular a imagem visando a busca de informações
contidas nela.
Sistemas de visão computacional (VC) são criados a fim de extrair e/ou realçar in-
formações presentes em imagens que não podem ser vistas a olho nu mas podem ser
detectadas pelo computador. Desta maneira, o diagnóstico por imagens contribui com
as diversas áreas que empregam imagens com o objetivo de: detecção, reconhecimento,
classificação de objetos, estimativa de parâmetros, análise de formas e descrição de cenas
(GONZALEZ; WOODS, 2008).
Um sistema de VC se subdivide em várias etapas, sendo a primeira etapa geralmente
a mesma: a aquisição de imagens. Esta etapa consiste no processo de captura da imagem
(ou das imagens) a ser processada.
1
Capítulo 1: Introdução 2
O processo de aquisição de imagens médicas iniciou-se em 1895 quando da descoberta
dos raios-X pelo físico Wilhelm Conrad Röntgen na Universidade de Würzburg, Alemanha
(HENDEE; RITENOUR, 2002). Este físico descobriu um tipo de raio capaz de atravessar
determinados tipos de materiais e, a partir disso, obter imagens do interior do corpo
humano. Essas imagens são formadas quando um feixe de raio-X atinge um objeto e este,
por sua vez, absorve parte de sua energia (efeito fotoelétrico). A energia remanescente
é, então, registrada em um negativo de filme sensível a luz. Assim, é possível obter a
imagem da região específica onde os feixes de raios-X não foram totalmente absorvidos.
O princípio do ultrassom se deu em 1880 com a descoberta do efeito piezoelétrico
pelos físicos Pierre e Jacques Curie, mas foi somente no ano de 1928, durante a Segunda
Guerra Mundial, que esse efeito obteve aplicações práticas: detectar submarinos através de
ultrassom por SONAR1. Dois anos depois, em 1930, o ultrassom teve a primeira aplicação
médica em tratamento de câncer e terapia física para várias doenças (HENDEE; RITENOUR,
2002). Entretanto, as primeiras observações em estruturas cardíacas através de ultrassom
datam de 1954 (EDLER; HERTZ, 1954) mas foi somente em 1963 quando Joyner e Reid
(1963) observaram pela primeira vez o movimento do sistema cardiovascular utilizando
feixes ultrassônicos.
A imagem de ultrassom, diferentemente da imagem de raio-X, é formada pelos ecos de
ondas de ultrassom refletidos em estruturas e órgãos. As ondas incidentes são produzidas
por um transdutor piezoelétrico que, quando alimentado pela fonte de energia, que é
geralmente contínua, excita um cristal piezoelétrico capaz de emitir e captar pulsos de
ondas ultrassônicas. Parte dessas ondas travessa os tecidos e outra parte é refletida
(ecoada) de volta ao transdutor. O equipamento de ultrassom armazena o tempo decorrido
desde a emissão das ondas até a recepção do eco para obter a distância percorrida pelo
pulso ultrassônico. A reflexão dessas ondas faz o transdutor vibrar e essas vibrações
são convertidas em pulsos elétricos para ser formada a imagem. Um arranjo simples da
obtenção de um feixe refletido é ilustrado na Figura 1.1. A imagem gerada por essa
maneira de processar os ecos refletidos é denominada modo B (também conhecida como
modo “brilho” (brightness) ou modo “bidimensional”). De posse dessas imagens em modo
B surgiu a possibilidade de uma melhor investigação para ajudar a diagnosticar e prevenir
diferentes tipos de doenças cardiovasculares.
Segundo a Organização Mundial de Saúde (OMS, 2011), as doenças cardiovasculares,
sobretudo as doenças coronárias causadoras de ataques cardíacos, representam a princi-
pal causa de morte na população mundial. A OMS estima que morreram 17 milhões de
1SONAR: Sound Navigation And Ranging (navegação por som)
Capítulo 1: Introdução 3
(a)
(b)
Figura 1.1: representação básica de um sistema ultrassônico, a) sonda e um feixe
ultrassônico ideal passando por diferentes tipos de tecidos; e b) envelope
do sinal correspondente recebido (adaptado de Jan (2005)).
pessoas, representando 30% de todas as mortes no ano de 2008. Dentre essas mortes,
7,3 milhões foram devido às doenças coronárias e 6,2 milhões foram por acidente vascu-
lar cerebral (AVC). Qualquer doença cardíaca pode levar a um AVC, principalmente as
doenças que produzem algum tipo de arritmia (OMS, 2011).
A arritmia cardíaca está ligada a pertubações que alteram o ritmo normal do cora-
ção. Estas pertubações produzem frequências cardíacas rápidas, lentas e/ou irregulares
e podem acarretar batimentos excessivamente rápidos (taquicardia), demasiado lentos
(bradicardia) ou irregulares.
O ciclo cardíaco consiste no período de relaxamento muscular, chamado de diástole,
em que o coração se enche de sangue, seguido pelo período de contração muscular, no
qual ocorre o esvaziamento sanguíneo, chamado de sístole. O período de enchimento
ventricular pode ser dividido em três terços. No primeiro terço ocorre o período de
enchimento rápido ventricular. Durante esse período, a grande quantidade de sangue
acumulada nos átrios durante a sístole ventricular é expelida para os ventrículos devido
à abertura das valvas atrioventriculares. No segundo terço, uma quantidade pequena
de sangue flui para os ventrículos como resultado do enchimento das átrios pelas veias
que chegam ao coração. No terço final da diástole, os átrios se contraem, dando um
impulso adicional ao fluxo sanguíneo para os ventrículos. Quando a pressão no interior
Capítulo 1: Introdução 4
do ventrículo aumenta até pouco acima de 80 mmHg, e a pressão ventricular direita
aumenta pouco acima de 8 mmHg, pressão suficiente para proporcionar a abertura das
valvas semilunares e ocorre o período de ejeção ventricular. Esse período também pode
ser dividido em três terços. Durante o primeiro terço, cerca de 70% do sangue deixa os
ventrículos, sendo os 30% restantes esvaziados nos dois terços finais. É por esse motivo que
o primeiro terço é chamado de período de ejeção rápida e os dois terços finais, período de
ejeção lenta (GUYTON; HALL, 2006). O estudo da função miocárdica é uma questão crucial
em cardiologia. Embora várias técnicas permitam avaliar a função sistólica e diastólica
ventricular, existem, ainda, limitações em relação às metodologias disponíveis na prática
clínica.
Além da arritmia cardíaca, diversos parâmetros convencionais para aferição da função
ventricular podem ser analisados com a deformação provocada pela contração miocárdica
sobre o músculo cardíaco. Objetivando a melhoria do diagnóstico por imagens ecocardi-
ográficas através desta deformação, novas metodologias vêm sendo introduzidas para a
avaliação dessa deformação (DEL CASTILLO; HERSZKOWICZ; FERREIRA, 2010).
Koopman et al. (2010) enumeram alguns dos problemas frequentes que limitam a
implementação da análise da deformação: (1) a tecnologia utilizada na medição está em
constante evolução, (2) empresas concorrentes no ramo da Medicina oferecem diferentes
soluções, e (3) é difícil reproduzir os resultados mediante diferentes técnicas. De tal forma,
a deformação é um processo complexo de ser estudado.
Existem, atualmente, duas diferentes metodologias para calcular a deformação mio-
cárdica: o Doppler Tecidual (DT) e o Strain Bidimensional (St2D). A primeira é uma
modalidade ecocardiográfica baseada no efeito doppler 2capaz de medir diversos parâme-
tros do miocárdio como, por exemplo, velocidade, aceleração, deslocamento, deformação
e taxa de deformação (MARWICK; YU; SUN, 2007).
Apesar de ser uma ferramenta útil na avaliação da contração miocárdica, o DT, assim
como as demais técnicas baseadas no efeito doppler, possui importantes limitações. O DT
se limita a avaliar o feixe de ultrassom que é paralelo ao vetor de movimento da estrutura
(HO; SOLOMON, 2006). Desta forma, o DT possui uma acentuada dependência do ângulo
de feixe ultrassônico: quando este feixe está a 45 graus fora do eixo do ventrículo esquerdo
(VE) a deformação é medida erroneamente e a função miocárdica não é corretamente
avaliada.
2Efeito doppler: alteração da frequência sonora percebida pelo observador devido ao movimento rela-
tivo entre o mesmo e a fonte da frequência.
Capítulo 1: Introdução 5
Um segundo método para calcular a deformação miocárdica, mais recentemente in-
troduzido, baseia-se no rastreamento de marcas acústicas (speckle tracking) e é chamado
de Strain Bidimensional (St2D). Essa técnica baseia-se no acompanhamento, quadro a
quadro, de marcadores acústicos naturais existentes na imagem do miocárdio, produzida
pelo ultrassom em todas as direções do plano da imagem modo B (Apêndice A) durante
o ciclo cardíaco (BOHS; TRAHEY, 1991).
As marcas acústicas representam formações ruidosas (ruído speckle) em níveis de cinza
geradas a partir do espalhamento, reflexão e interferência de feixes de ultrassom no tecido
miocárdico (HELLE-VALLE et al., 2005). Dada a natureza aleatória do ruído speckle, as
marcas acústicas são tidas como padrões acústicos. Logo, cada marca possui uma carac-
terística própria (distribuição dos pixels em níveis de cinza) que a diferencia de outras
marcas. Para ilustrar tais marcas, duas regiões do miocárdio com diferentes distribuições
de níveis de cinza são apresentadas na Figura 1.2.
Figura 1.2: diferença entre duas regiões do miocárdio.
A vantagem do St2D em relação ao DT consiste, principalmente, na independência
do ângulo de incidência do transdutor. Esta independência propicia um rastreamento
em duas dimensões (ao longo da parede do miocárdio). Este fato ocorre porque o DT
analisa as estruturas cardíacas em uma única dimensão (ao longo dos feixes de ultrassom),
não propiciando a obtenção de medidas simultâneas de todos os segmentos contidos num
plano da imagem. Neste sentido, é de fundamental importância a análise comparativa
de técnicas de rastreamento de marcadores acústicos na parede do miocárdio, visando
facilitar a análise do músculo cardíaco através da deformação do mesmo.
Capítulo 1: Introdução 6
1.1 Motivação
Diversos estudos são realizados nas mais diversas áreas multidisciplinares que envol-
vem, por exemplo, engenharia e medicina. Estes estudos avaliam técnicas de obtenção de
parâmetros que auxiliam na avaliação da dinâmica de contratilidade e relaxamento ventri-
cular. A detecção dessa deformação ventricular e, principalmente, a correta interpretação
dos resultados constituem, sem dúvida, uma importante ferramenta para a avaliação de
cardiopatias que promovem modificações geométricas do coração que tende a perder sua
forma elipsóide e, por sua vez, a eficiência mecânica da bomba.
Sistemas de VC têm sido criados para avançar o estudo do acompanhamento de mar-
cadores acústicos e aumentar a reprodutibilidade dos resultados. Existem várias técnicas
utilizadas para rastreamento em geral, contudo, Marwick, Yu e Sun (2007) destacam duas
abordagens para esse propósito: técnicas baseadas em Fluxo Óptico (FO: em inglês optical
flow), e em Casamento de Blocos (CB: em inglês block-matching).
Neste contexto, visando aumentar a concordância entre resultados de diferentes mé-
dicos especialistas e/ou aparelhos médicos, sugere-se a avaliação e o desenvolvimento de
algoritmos utilizando as diferentes técnicas de FO e CB.
1.2 Objetivos
O objetivo geral desse trabalho consiste em desenvolver e comparar algoritmos para
acompanhar pequenos padrões acústicos em vídeos de exames de ecocardiografia. Durante
o desenvolvimento desta dissertação outros objetivos específicos devem ser alcançados:
i. implementação e simulação de diferentes técnicas de FO e CB em Matlab;
ii. implementação de sistema de testes e comparação das técnicas em C++;
iii. simulação e avaliação dos algoritmos pesquisados junto ao médico especialista;
iv. desenvolvimento de produtos científicos na forma de artigos em revistas e congressos.
As técnicas a serem implementadas são os métodos de FO de Horn e Schunck (1981),
Lucas e Kanade (1981) e o de Lucas e Kanade Piramidal (2000). as metodologias
utilizadas em CB para o rastreamento de marcadores acústicos são os diferentes esti-
madores de deslocamento: soma das diferenças absolutas (SAD), soma das diferenças
quadráticas (SSD), erro médio absoluto (MAE), erro médio quadrático (MSE), correlação
Capítulo 1: Introdução 7
não-normalizada (NNC), correlação normalizada (NC), autocorrelação (AC) e correlação
cruzada (CC).
1.3 Organização da Dissertação
Esta dissertação está organizada em 5 capítulos. No Capítulo 2 são apresentados al-
guns conceitos importantes sobre imagens médicas, sobretudo imagens de ultrassom, de-
formação miocárdica, doppler tecidual e strain bidimensional. Ainda no mesmo Capítulo
são apresentados métodos de rastreamento baseados em FO e estimadores de desloca-
mento baseados em CB além de conceitos da área de Processamento Digital de Imagens.
Por fim, é realizada uma breve revisão bibliográfica sobre os trabalhos relacionados a esta
dissertação.
No Capítulo 3 é descrita a metodologia empregada para a implementação de cada
algoritmo. O sistema de testes realizado com os algoritmos também é explicado ao final
desse Capítulo junto à metodologia de avaliação e comparação dos mesmos.
Os resultados de cada método estudado são apresentados no Capítulo 4 e, por fim, no
Capítulo 5 são apresentadas as conclusões e contribuições deste trabalho e os trabalhos
futuros que podem ser desenvolvidos a partir do mesmo.
Capítulo 2
Fundamentação Teórica
Neste Capítulo, inicialmente, é explicada o que é a imagem digital interpretada por
computadores para que, em seguida, sejam detalhadas características de formação
das imagens médicas de ultrassom e, posteriormente, é realizada uma breve revisão bibli-
ográfica sobre a deformação do músculo cardíaco, bem como as atuais técnicas utilizadas
no cálculo dessa deformação. Em seguida, são abordados conceitos básicos sobre a aná-
lise do movimento e, por fim, são detalhadas as técnicas utilizadas nesse trabalho para a
análise do movimento de padrões em imagens de ultrassom.
2.1 Imagem Digital
Uma imagem é definida por uma função bidimensional f(x, y)em que xeyrepre-
sentam as coordenadas espaciais e o valor de f, em qualquer par de coordenadas (x, y),
é proporcional à intensidade luminosa (brilho), ou nível de cinza, da imagem naquele
ponto. Quando os valores de x,ye a amplitude de fsão finitos, tem-se a imagem digital
(GONZALEZ; WOODS, 2008).
Um imagem digital é composta por um número finito de elementos que a compõem.
Esses elementos são chamados de pixels (picture elements), possuem localização específica
e um ou mais valores de irradiação luminosa são associados a este elementos (GONZALEZ;
WOODS, 2008). Com pixels muito grandes, ilustrados nas Figuras 2.1(a) e 2.1(b), obtém-
se uma baixa resolução espacial com uma pobre representação da imagem. Imagens desse
tipo apresentam visíveis descontinuidades dos valores de cinza dos pixels. À medida que os
pixels se tornam menores, percebe-se o efeito contrário até o ponto em que a impressão
de uma imagem espacialmente contínua. Este fato acontece quando os pixels se tornam
menores que a resolução espacial do sistema visual humano e as Figuras 2.1(c) e 2.1(d)
8
Capítulo 2: Fundamentação Teórica 9
ilustram a mesma imagem da Figura 2.1(a) com pixels menores.
(a) (b) (c) (d)
Figura 2.1: imagens em diferentes resoluções, (a) 3x4; (b) 12x16; (c) 48x64; e (d)
192x256 pixels (JäHNE, 2002).
Um tipo de imagem usada para análise e diagnóstico é aquela obtida por equipamentos
denominados ecocardiógrafos. A natureza desta imagem, em geral, apresenta caracterís-
ticas que são intrínsicas a sua formação, destacando-se o ruído speckle.
2.2 Imagens de Ultrassom
A imagem obtida através de aparelhos de ultrassom se baseia no princípio do pulso e
eco, ou seja, um transdutor produz ondas em forma de pulso e o sinal do eco refletido nos
diferentes tipos de tecidos (tecido muscular, por exemplo) forma a representação daquela
região.
O tecido do miocárdio contém diferentes padrões de eco devido à sua estrutura irre-
gular. Logo, o sinal detectado pelo transdutor é a superposição, ou interferência, desses
ecos individuais no miocárdio. O sinal recebido é superposto e a este somatório dá-se o
nome de sinal de radiofrequência (RF). Desta maneira, o envelope deste sinal de RF é
detectado e codificado em tons de cinza. Na Figura 2.2, é representado o envelope como
a linha de cima em negrito, o sinal de RF como a linha de cima tracejada e a codificação
dos ecos de maiores amplitudes, que são representados na imagem por pixels mais cla-
ros, junto com os ecos de baixa amplitude, representados por pixels mais escuros. Desta
maneira, a distribuição espacial dos tons de cinza nas imagens de ultrassom, chamada de
speckle pattern ou marca acústica, pode ser interpretada como interferências construtivas
e destrutivas do sinal ecoado pelo miocárdio (MARWICK; YU; SUN, 2007).
A posição exata de cada transdutor, bem como o local onde houve a reflexão do feixe
de ultrassom, determina a maneira como o eco do sinal interfere e o formato do envelope
do sinal RF que, por sua vez, corresponde aos valores em tons de cinza que formam a
imagem de ultrassom, exemplificada na Figura 2.3 (MARWICK; YU; SUN, 2007).
Segundo Marwick, Yu e Sun (2007), ao longo dos últimos 15 anos os maiores avanços
Capítulo 2: Fundamentação Teórica 10
Figura 2.2: sequência de codificação de um feixe ultrassônico radial em tons de cinza.
em relação às imagens médicas de ultrassom tem acontecido com o desenvolvimento de
técnicas para quantificar a movimentação dos tecidos e, por sua vez, a deformação de
estruturas. O início do estudo da deformação de estruturas cardíacas teve início em 1973
com Mirsky e Parmley (1973).
2.3 Deformação Miocárdica
A análise da deformação miocárdica tem como base as primeiras descrições anatômi-
cas do coração, que se caracterizava por uma disposição espiralada das fibras miocárdicas,
até a demonstração prática de que o músculo cardíaco é formado por uma única banda
Capítulo 2: Fundamentação Teórica 11
Figura 2.3: imagem típica de ultrassom do coração.
enrolada em si mesma, ilustrada na Figura 2.4. A disposição espiralada, aliada à disposi-
ção laminar do miocárdio, confere a este a importante propriedade de incompressibilidade
que permite que o músculo mude de forma sem alterar seu volume (DEL CASTILLO et al.,
2009).
A deformação miocárdica ocorre quando diferentes porções (fibras) da parede do co-
ração se movem com diferentes velocidades, mudando a forma do músculo. A medida
da deformação da fibra miocárdica é expressa como um parâmetro chamado strain (ε).
Este parâmetro define a deformação total de uma estrutura cardíaca normalizada ao seu
formato original durante o ciclo cardíaco.
Em um objeto unidimensional (1D), a única deformação possível é o alongamento e o
encolhimento, que é dada por (D’HOOGE et al., 2000)
ε=LL0
L0
=L
L0
=(x2max x2min)(x1max x1min )
x1max x1min
,(2.1)
em que L0é o comprimento inicial do objeto (com as coordenadas x1min ex1max ), Lé o
comprimento depois da deformação (com as coordenadas x2min ex2max) e Lo quanto
variou seu comprimento. Essa situação é ilustrada na Figura 2.5.
Como a deformação é relacionada ao comprimento inicial, o valor de strain é expresso
em porcentagem e não possui dimensão. Por convenção, adota-se o valor positivo de ε
quando Lé maior que L0, significando que o objeto é alongado, e valor negativo quando
Lé menor que L0, indicando que o objeto é encurtado. Quando Lpermanece igual a L0
não mudança no comprimento do objeto e sua deformação é zero.
Quando o tamanho do objeto não é fixo durante o processo de deformação, o strain
Capítulo 2: Fundamentação Teórica 12
(a)
(b)
Figura 2.4: representação básica de um coração helicoidal, a) esquemático e b) real
(TORRENT-GUASP, 1998; TORRENT-GUASP et al., 2004).
instantâneo é medido por (D’HOOGE et al., 2002)
ε(t) = L(t)L(t0)
L(t0)=L(t)
L(t0),(2.2)
em que L(t)é o comprimento do objeto no instante teL(t0)L0é seu comprimento
inicial. Assim, a deformação instantânea é expressa relativa ao comprimento inicial do
objeto e é chamada de strain de Lagrange1.
Outra maneira de se calcular a deformação é chamada de strain Natural2e pode ser
definido por (D’HOOGE et al., 2002)
1O termo strain de Lagrange (ou strain lagrangiano), utilizado na literatura ecocardiográfica, não faz
referência ao tensor de deformação de Lagrange (MARWICK; YU; SUN, 2007).
2Strain Natural é também chamado de strain logarítmico ou strain verdadeiro.
Capítulo 2: Fundamentação Teórica 13
Figura 2.5: deformação de uma barra finita de tamanho inicial L0durante os instan-
tes t0et1(adaptado de (D’HOOGE et al., 2002)).
εN(t) = ln L(t)
L(t0),(2.3)
em que ln é a função logarítmica natural.
Ostrain Natural (εN) e o strain de Lagrange (ε) possuem uma relação fixa e não
linear, na qual pequenas deformações em ambos são aproximadamente iguais, mas em
grandes deformações a diferença torna-se significante. Esta relação é dada por (MIRSKY;
GHISTA; SANDLER, 1974 apud D’HOOGE et al., 2000)
εN(t) = ln(1 + ε(t)) ou ε(t) = exp(εN(t)) 1.(2.4)
Ao representar a deformação em função do tempo, tem-se a taxa de deformação (strain
rate) naquela região. Esta taxa, representada pelo símbolo ˙ε, indica a velocidade (V) com
que ocorre a deformação e é calculada pela derivada temporal do strain (D’HOOGE et al.,
2002)
˙ε=
dt =d
dt LL0
L0=d
dt L
L0
1=dL
dt 1
L0=VV0
L0
,(2.5)
em que V0indica a velocidade inicial com que ocorre a deformação.
Isto é, enquanto o strain indica a quantidade de deformação, o strain rate indica a
variação desta deformação. A relação entre strain estrain rate pode ser comparada à
relação entre velocidade e deslocamento de um objeto. Assumindo um objeto se movendo
com velocidade constante, seu deslocamento é a multiplicação do tempo por sua veloci-
dade. Similarmente, assumindo uma taxa de deformação constante, a deformação pode
ser dada pela multiplicação do tempo por essa taxa de deformação.
Capítulo 2: Fundamentação Teórica 14
A partir da equação 2.5 pode-se perceber que, ao integrar a taxa de deformação, obtém-
se a própria quantidade deformada. E além disso, esta taxa de deformação é calculada
a partir do gradiente de velocidade em pequenas porções do miocárdio (PERK; TUNICK;
KRONZON, 2007).
Considerando uma deformação total de 20% de um objeto e se essa deformação demora
2s para ocorrer, a taxa de deformação média ( ˙ε) é igual a 0,20/2s, que é 0,1s1. Ou seja,
o objeto deforma cerca de 10% a cada segundo. Quando a mesma deformação ocorre na
metade do tempo a taxa de deformação dobra para 0,20/1s = 0,2s1.
A partir dessa situação, verifica-se que taxa de deformação instantânea não necessa-
riamente é a mesma durante todo o período de deformação. Comparando com a relação
de velocidade e deslocamento, quando um objeto se move por uma determinada distância
(strain) num determinado tempo, a velocidade média (strain rate) pode ser calculada.
Entretanto, isso não implica que a velocidade instantânea do objeto é conhecida durante
todo seu deslocamento e, de forma análoga, não implica que a taxa de deformação ins-
tantânea é conhecida durante todo o ciclo cardíaco.
Uma sequência de operações é necessária para se obter a quantidade de deformação
longitudinal do miocárdio. Deve-se, primeiramente, extrair um único ciclo cardíaco du-
rante o exame ecocardiográfico. O exame é extraído a partir do início da diástole (abertura
das válvulas tricúspide e mitral e enchimento ventricular) até o final da sístole ventricular
(fechamento das válvulas pulmonar e aórtica), que é quando se reinicia o ciclo cardíaco.
De posse do vídeo do ciclo cardíaco, deve-se fazer a delineação de pontos que definem
um contorno sob as paredes cardíacas. Estes pontos se deslocam durante o ciclo cardíaco
formando uma espécie de loop e voltando à sua posição inicial como está mostrado na
Figura 2.6(a). Os pontos formam segmentos que dividem a parede do miocárdio em
três bandas (basal, medial e apical) para cada parede conforme está mostrado na Figura
2.6(b). São estes segmentos que deformam ao longo do ciclo cardíaco e geram a deformação
global longitudinal (global longitudinal strain) e a deformação segmentar do músculo (DEL
CASTILLO; HERSZKOWICZ; FERREIRA, 2010).
A deformação global por speckle tracking foi introduzida por Reisner et al. (2004) e
obedece a equação 2.2 de modo que o comprimento inicial L0é a soma, e não a média,
das distâncias entre os pontos visualizado na Figura 2.6(c), formando um único e extenso
segmento (L(t0) = Pli) em forma de U. Este segmento tem seu tamanho atualizado
à medida que os pontos do contorno mudam de posição ao longo do ciclo cardíaco. As
posições dos pontos do contorno são atualizadas a cada quadro até que se complete o ciclo
cardíaco (CHO et al., 2009).
Capítulo 2: Fundamentação Teórica 15
(a)
(b) (c)
Figura 2.6: a) pontos formadores do contorno das paredes miocárdicas; b) loop re-
alizado por cada ponto; e c) segmentos formados pela distância entre
cada par de pontos.
O valor da deformação instantânea de cada quadro é calculado e indexado em função
dos quadros do vídeo, gerando uma curva de deformação para cada segmento do cora-
ção. Na Figura 2.7 são mostradas duas imagens de ecocardiograma, evidenciando 2.7(a)
contorno inicial nas paredes do músculo cardíaco com o valor da deformação global (GS)
em -19,1%, 2.7(b) valor da deformação de cada segmento do coração e 2.7(c) curvas de
deformação dos segmentos ao longo dos quadros.
Atualmente, existem duas metodologias capazes de realizar o cálculo da deformação
miocárdica através de imagens de ultrassom: DT e St2D (KOOPMAN et al., 2010; TESKE
et al., 2007). Essas metodologias são brevemente explicadas a seguir.
Capítulo 2: Fundamentação Teórica 16
(a) (b)
(c)
Figura 2.7: imagens de ecocardiograma, a) contorno inicial nas paredes do músculo
cardíaco com o valor da deformação global (GS) em -19,1%; b) valor da
deformação de cada segmento do coração; e c) curvas de deformação dos
segmentos ao longo dos quadros.
2.3.1 Doppler Tecidual
O princípio do efeito Doppler tem sido tradicionalmente usado para medir a velocidade
do fluxo sanguíneo, mas pode ser usado também para medir a velocidade do miocárdio
e de outros tecidos (MARWICK; YU; SUN, 2007). Isaaz et al. (1989) foram os pioneiros
ao introduzirem o conceito de Ecocardiografia com Doppler Tecidual (EDT) se referindo
à estimação das velocidades dos tecidos do miocárdio utilizando a técnica de Doppler
pulsátil.
A técnica de Doppler consiste inicialmente no posicionamento de um transdutor de
ultrassom junto ao corpo do paciente para que ondas ultrassonoras sejam emitidas. Ao
atingir células sanguíneas em movimento (fluxo sanguíneo), a onda refletida do ultrassom
retorna ao transdutor. Quando o fluxo sanguíneo se move em direção ao transdutor,
um crescimento na frequência da onda refletida. Em caso contrário, se o fluxo sanguíneo
estiver na direção oposta ao transdutor, um decréscimo na frequência da onda refletida.
Esta variação de frequência é proporcional à velocidade do sangue, permitindo-se aferi-la
Capítulo 2: Fundamentação Teórica 17
(CARVALHO; CHAMMAS; CERRI, 2008).
Assim, o Doppler convencional pode ser utilizado em determinadas circunstâncias
também para medir a velocidade de outros tecidos que também se movimentam como,
por exemplo, o miocárdio. A diferença entre aplicações no tecido sanguíneo e em outros
tecidos está na baixa amplitude dos sinais refletidos no sangue e na alta intensidade
das reflexões em outros tecidos. Isso ocorre devido ao sangue possuir alta velocidade e
baixa densidade (resultando uma baixa amplitude sanguínea) e devido ao tecido possuir
uma alta densidade mas baixa velocidade (resultando em um sinal de alta intensidade),
que pode ser esquematizado na Figura 2.8(a). Para diferenciar uma das duas aplicações
utiliza-se de um filtro passa-altas para o Doppler do fluxo sanguíneo e passa-baixas para o
Doppler tecidual. Isto é ilustrado na Figura 2.8(b) (CARVALHO; CHAMMAS; CERRI, 2008).
(a) (b)
Figura 2.8: a) diagrama ilustrativo da intensidade do sinal ×velocidade no tecido
e no fluxo sanguíneo; e b) o mesmo diagrama separado por um filtro
(adaptado de (FOX et al., 2011)).
O movimento das estruturas é representado por cores: vermelho para tudo que se
movimenta em direção ao transdutor e azul para tudo que se movimenta em direção
contrária. A Figura 2.9, por exemplo, é a imagem de um corte paraesternal transversal
(veja mais no Apêndice B) do ventrículo esquerdo (VE) com DT em que se evidencia a
região anterior do septo em vermelho (movimento no sentido do feixe de ultrassom) e a
parede posterior em azul (movimento contrário ao transdutor), indicando que o coração
está na fase diastólica do ciclo cardíaco (SILVA et al., 2002).
As velocidades nos tecidos podem ser representadas por vetores de velocidade que
apontam em duas possíveis direções: contra e a favor do transdutor. Com base nestes
vetores de velocidade, o DT torna-se uma técnica capaz de realizar o cálculo da deformação
miocárdica, quantificando o alongamento ou encurtamento da fibra e, indiretamente, seu
Capítulo 2: Fundamentação Teórica 18
Figura 2.9: corte do VE, evidenciando a fase diastólica do ciclo cardíaco pelas dife-
rentes velocidades do tecido miocárdico (SILVA et al., 2002).
espessamento. Isto porque quanto mais o músculo cardíaco se alonga, mais diminui sua
espessura e quanto mais se encurta, mais se espessa (SILVA et al., 2002).
A partir disso, a taxa de deformação (strain rate ) pode definida como a medida da
velocidade de deformação do miocárdio equacionado por (V2V1)/L e ilustrada na
Figura 2.10, em que V1eV2são os vetores de velocidade de encurtamento do miocárdio
em dois pontos distintos ao longo do feixe de ultrassom separados por uma distância L.
Esta medida fornece o gradiente intramiocárdico de velocidades por unidade de tempo e
representa o grau de deformidade da fibra. Como este gradiente de velocidade representa a
diferença de velocidades em cm/s entre dois pontos, dividida pela distância em cm destes
mesmos pontos, sua unidade é s-1 [(cm/s)/cm] (SILVA et al., 2004).
Figura 2.10: gradiente intramiocárdico de velocidade entre dois pontos de um seg-
mento muscular (V1 e V2) em relação à distância L entre eles (adaptado
de (SILVA et al., 2005))
Apesar de ser uma técnica largamente utilizada, o DT continua com fortes limitações.
Capítulo 2: Fundamentação Teórica 19
A maior dessas limitações é o fato dos vetores de velocidade e da deformação serem
calculados em uma única dimensão (D’HOOGE et al., 2000). Isto é, somente uma velocidade
e uma deformação de uma única linha da imagem produzida por um feixe do transdutor
de ultrassom pode ser analisada, resultando na dependência do ângulo de insonação do
transdutor (CASTRO et al., 2000).
A dependência angular do DT é, sem dúvida, um grande empecilho para o avanço
do diagnóstico por imagens por diversos fatores. Um dos fatores é a necessidade de uma
maior experiência do operador do aparelho de ultrassom, pois, como visto, o ângulo de
insonação interfere diretamente no resultado do diagnóstico. Outra grande desvantagem
ligada à dependência angular está na difícil reprodutibilidade dos estudos, dos exames
e, consequentemente, dos resultados. Segundo Marwick, Yu e Sun (2007), a principal
desvantagem do DT é a necessidade de um rastreamento manual da região de interesse
durante o ciclo cardíaco, que é uma tarefa custosa e tediosa.
2.3.2 Strain Bidimensional
A fim de superar as limitações do DT citadas anteriormente, uma nova técnica vem
sendo estudada. A técnica de rastreamento de marcas acústica (speckle tracking), diferen-
temente das técnicas baseadas no efeito Doppler, é capaz de medir a velocidade nos tecidos
e, por sua vez, a deformação miocárdica, não ao longo do feixe de ultrassom (longitu-
dinal) como também perpendicular à linha da imagem (transversal). Assim, esta técnica
pode medir a deformação em duas dimensões. Na Figura 2.11 é ilustrada a comparação
do espaço de análise das duas técnicas.
Devido à capacidade de análise em duas dimensões, a metodologia de rastreamento de
marcas acústicas em imagens de ultrassom visando o cálculo da deformação (strain) do
músculo cardíaco foi chamada de strain bidimensional (St2D).
O princípio fundamental do St2D baseia-se fortemente na formação das imagens de
ultrassom, quando o feixe de ultrassom reflete as estruturas cardíacas formando uma
distribuição espacial única em tons de cinza. Essa distribuição, semelhante à uma im-
pressão digital dos tecidos do miocárdio, é comumente chamada de speckle pattern ou
marca/padrão acústico digital (MARWICK; YU; SUN, 2007).
Devido ao padrão único das marcas acústicas para cada estrutura, quando uma porção
do miocárdio se move ao longo do ciclo cardíaco pode-se assumir que a imagem da marca
também se move. Logo, o rastreamento destas marcas acústicas durante a movimentação
do coração indica o real movimento da estrutura que a gerou. O rastreamento de uma
Capítulo 2: Fundamentação Teórica 20
(a) (b)
Figura 2.11: direções dos vetores de velocidade das técnicas, a) DT longitudinal; e b)
St2D, longitudinal e transversal (adaptado de Perk, Tunick e Kronzon
(2007)).
determinada marca acústica durante quatro quadros é ilustrado na Figura 2.12.
Figura 2.12: técnica de rastreamento de marcas acústicas (speckle tracking) (adap-
tado de Fox et al. (2011)).
Ao rastrear uma determinada região de interesse durante uma sequência de quadros,
osoftware embarcado no equipamento de ultrassom responsável pela detecção e rastrea-
mento atualiza a geometria da região, quadro a quadro, e extrai parâmetros de desloca-
mento, velocidade, deformação e taxa de deformação.
Existem várias técnicas utilizadas para rastreamento em geral, contudo, Marwick, Yu
e Sun (2007) destacam duas abordadagens para este propósito com resultados constata-
dos: técnicas baseadas em fluxo óptico (optical flow) e em casamento de blocos (block-
matching). Essas duas abordagens são explicadas a seguir juntamente com a importância
da análise do movimento.
Capítulo 2: Fundamentação Teórica 21
2.4 Análise de Movimento
O processamento e análise de vídeos e imagens vem sendo utilizado em várias aplicações
distintas que vão desde vigilância, estudos geológicos, controle de tráfico às aplicações
médicas (GONZALEZ; WOODS, 2008).
Sistemas de VC possuem fundamental importância na etapa de detecção de objetos
em movimento em vídeo. Muitos desses sistemas empregam técnicas de maior enfoque
nos objetos que estão se movendo a fim separá-los da cena e executar a tarefa para os
quais foram projetados. O rastreamento humano, por exemplo, em circuitos de vigilância,
exige a separação da pessoa em relação à cena ao fundo.
A análise de movimento possui várias aplicações e, por isso, possui inúmeras técnicas
que podem ser utilizadas. Logo, para cada aplicação existe uma determinada técnica espe-
cífica. Para a análise da deformação miocárdica, por exemplo, as técnicas mais utilizadas
são fluxo óptico e casamento de blocos, explicadas a seguir.
2.4.1 Fluxo Óptico
Fluxo Óptico (FO) pode ser definido como a distribuição dos vetores de movimento
aparente dos padrões de intensidade (brilho) em uma imagem (HORN; SCHUNCK, 1981),
ou seja, é um denso campo de velocidade no qual existe um único vetor de velocidade
que está associado a cada pixel no plano da imagem. Um exemplo de visualização de
FO é ilustrado na Figura 2.13, onde uma rotação no sentido horário de dois quadros
subsequentes, mostrado nas Figuras 2.13(a) e 2.13(b), respectivamente. Neste caso, o
FO resultante é o campo de vetores de velocidade ilustrado na Figura 2.13(c) (BARROS,
2009).
Para fins de visualização dos vetores de velocidade é gerado um campo de vetores
de velocidade (chamado mapa de agulhas) do movimento aparente dos pixels (ilustrado
anteriormente na Figura 2.13(c)). De posse dos vetores de velocidade é possível convertê-
los em vetores de deslocamento desde que se conheça o intervalo de tempo entre imagens
subsequentes (BARBOSA et al., 2005).
O campo de velocidade gerado pelo FO contém importantes informações utilizadas
em diversas aplicações, tais como segmentação de regiões ou bordas (ZITNICK; JOJIC;
KANG, 2005), análise de formas (DECARLO; METAXAS, 2002), navegação exploratória
(GIACHETTI; CAMPANI; TORRE, 1998), rastreamento de objetos (YILMAZ; JAVED; SHAH,
2006), codificação de vídeo (KRISHNAMURTHY; MOULIN; WOODS, 1995), entre outras.
Capítulo 2: Fundamentação Teórica 22
(a) (b) (c)
Figura 2.13: exemplo da técnica de FO, a) com um frame no instante t0; b) frame
no instante t0+ 1; e c) campo de fluxo óptico.
A análise de movimento é baseada em uma sequência de imagens (ou uma sequência de
quadros de um vídeo) com uma certa diferença de tempo entre as mesmas. A computação
do FO resulta na direção e velocidade nos pixels da imagem. Apesar do FO nem sempre
corresponder ao verdadeiro movimento de objetos, existe uma considerada aproximação
deste (BARBOSA et al., 2005).
Diversos métodos têm sido propostos para computar o FO e a escolha do método
depende muito do tipo de cena a ser analisada. Embora existam diversos métodos, os mais
utilizados na literatura são os métodos diferenciais, em que é considerada a intensidade do
brilho entre quadros diferentes de uma sequência de imagens aproximadamente constante
em um curto intervalo de tempo, ou seja, o deslocamento é mínimo para um espaço de
tempo pequeno.
Horn e Schunck (1981) assumem, inicialmente, que o padrão de brilho da cena E
permanece constante numa região da imagem em um curto intervalo de tempo t. Logo,
definindo E em suas coordenadas (x, y), tem-se
E(x, y, t) = E(x+δx, y +δy, t +δt),(2.6)
em que (δx, δy)é um deslocamento pequeno de uma região da imagem em um curto
intervalo de tempo δt. Expandindo a parte da direita desta equação através de séries de
Taylor, tem-se
E(x, y, t) = E(x, y, t) + δx E
∂x +δ y ∂E
∂y +δtE
∂t +, (2.7)
em que representa termos de ordem superior, os quais se assume que são desprezíveis.
Assim, esta equação se torna
Capítulo 2: Fundamentação Teórica 23
E(x, y, t) = E(x, y, t) + δx E
∂x +δ y ∂E
∂y +δtE
∂t + 0,(2.8)
e, por sua vez,
∂E
∂x
dx
dt +∂E
∂y
dy
dt +∂E
∂t
dt
dt = 0.(2.9)
Tomando uev, nesta equação, como as derivadas parciais de primeira ordem (u=dx
dt e
v=dy
dt ) de E(x, y, t), obtém-se a equação de restrição do movimento (HORN; SCHUNCK,
1981)
Exu+Eyv+Et= 0,(2.10)
em que ExeEysão os gradientes nas direções xey, respectivamente. O termo Eté a
derivada parcial de primeira ordem de E(x, y, t)em relação ao tempo e, por fim, uev
são os vetores de velocidade nas direções xey.
Contudo, a equação 2.10 não é capaz de determinar as velocidades uev, pois, existe
apenas uma única equação linear com duas variáveis desconhecidas. Este problema, cha-
mado de Problema da Abertura3, tem infinitas soluções. Na literatura especializada, os
métodos mais conhecidos para impor uma restrição adicional para resolver este inconve-
niente foram desenvolvidos por Horn e Schunck (1981) e Lucas e Kanade (1981).
2.4.1.1 Método de Horn e Schunck (1981)
Horn e Schunck (1981) introduziram uma restrição adicional de suavização à equa-
ção 2.10 para que os vetores possam se alterar de maneira suave ao longo dos quadros.
Desta maneira, dado um objeto opaco, os pontos que o compõem possuem velocidades
semelhantes.
Uma maneira de calcular essa restrição de suavização é aproximando o operador La-
placiano de uevconforme as expressões (HORN; SCHUNCK, 1981)
2uk(ux,y,t ux,y,t )e2vk(vx,y,t vx,y,t )(2.11)
em que as médias locais ux,y,t evx,y ,t são definidas por uma máscara quando o fator de
proporcionalidade ké igual a 3. Esta máscara é dada por
3O Problema da Abertura surge quando não informação suficiente para poder medir a velocidade
completa em uma determinada região, mas informação suficiente para medir a componente normal
àquela região.
Capítulo 2: Fundamentação Teórica 24
1/12 1/6 1/12
1/6 -1 1/6
1/12 1/6 1/12
A restrição apresentada, conhecida como restrição de suavização do fluxo óptico, tem
por objetivo limitar o campo de velocidade estimado minimizando a função de energia f
dada por
f=ZZ (Exu+Eyv+Et)2+α2(|∇u|2+|∇v|2)dxdy, (2.12)
em que αé um fator de suavização e |∇u| |∇v|são os módulos da velocidade nas direções
xey. Utilizando a aproximação pelo operador Laplaciano e o método iterativo de Gauss-
Seidel obtém-se os valores estimados das velocidades uevpelas expressões
uk+1 =unEx
Exun+Eyvn+Et
α2+E2
x+E2
y
e (2.13)
vk+1 =vnEy
Exun+Eyvn+Et
α2+E2
x+E2
y
,(2.14)
em que nrepresenta a última iteração calculada e n+ 1 a próxima iteração, uevsão os
valores médios das velocidades da vizinhança de (x, y).
A cada duas imagens consecutivas, o método de Horn e Schunck (1981) realiza um
número pré-determinado de iterações a fim de calcular os gradientes nas direções xeye
a derivada de t. Este método considera as velocidades uevinicialmente iguais a zero e,
para um valor pré-estabelecido de α, os atualiza mediante as equações 2.13 e 2.14.
Mailloux et al. (1987) foram os primeiros a analisar o movimento do coração se base-
ando no método de Horn e Schunck (1981) para estimar vetores de velocidade. Mailloux
et al. (1989) foram, ainda, os pioneiros na análise da deformação do miocárdio através
do método de FO. No trabalho citado, o método foi validado como uma alternativa para
se buscar o contorno do coração. A partir desta análise inicial, outros trabalhos com-
binaram o método de Horn e Schunck (1981) com outras técnicas, tais como contornos
ativos (MIKIC; KRUCINSKI; THOMAS, 1998). Passados mais de 30 anos desde a propo-
sição do método, este ainda é utilizado na formulação de novos estudos no âmbito do
rastreamento do músculo cardíaco (YAACOBI; LIEL-COHEN; GUTERMAN, 2008; FAHMY;
AL-AGAMY; KHALIFA, 2012).
Capítulo 2: Fundamentação Teórica 25
2.4.1.2 Método de Lucas e Kanade (1981)
A solução dada por Lucas e Kanade (1981) para o problema de abertura gerado pela
equação 2.10 consiste na introdução de uma hipótese adicional que assume um FO cons-
tante local. Isto é, dado um vetor velocidade associado a um pixel P, todos os vizinhos
de Ptêm o mesmo vetor de velocidade. Assume-se a vizinhança de Pcomo uma janela
m×mcentrada em P. Logo, a partir da equação 2.10 tem-se
Ex(p1)u+Ey(p1)v=Et(p1)
Ex(p2)u+Ey(p2)v=Et(p2)
.
.
.
Ex(pn)u+Ey(pn)v=Et(pn),
(2.15)
em que p1,p2, ..., pnrepresentam os tons dos pixels vizinhos a P. Essa equação pode ser
reescrita de forma matricial por
Ex(p1)Ey(p1)
Ex(p2)Ey(p2)
.
.
..
.
.
Ex(pn)Ey(pn)
| {z }
A
"u
v#=
Et(p1)
Et(p2)
.
.
.
Et(pn)
.
| {z }
b
(2.16)
Uma possível solução para este sistema de equações utiliza o método dos Mínimos Qua-
drados (LS - Least Squares), através de
ATA"u
v#=AT(b),(2.17)
em que ATrepresenta a matriz transposta de Ae pode ser resolvida utilizando a pseudo-
inversa
"u
v#= (ATA)1AT(b),(2.18)
ou seja,
"u
v#="Pm2
i=1 Ex(pi)2Pm2
i=1 Ex(pi)Ey(pi)
Pm2
i=1 Ex(pi)Ey(pi)Pm2
i=1 Ey(pi)2#1"Pm2
i=1 Ex(pi)Et(pi)
Pm2
i=1 Ey(pi)Et(pi)#.(2.19)
Capítulo 2: Fundamentação Teórica 26
Sabendo que esta equação possui uma inversão de matriz, é necessário verificar a
sua singularidade. Para isto, calculam-se os autovalores da matriz a ser invertida. Os
autovalores são comparados a um limiar de redução de ruído τpara estimar o FO. As
velocidades uevsão consideradas nulas quando os autovalores estão abaixo do limiar τ,
portanto são desprezíveis.
O método de Lucas e Kanade (1981), assim como o de Horn e Schunck (1981), teve suas
primeiras aplicações em imagens de ultrassom por Chunke, Terada e Oe (1996) em que
foi analisado apenas o tempo de processamento nos quadros dos vídeos ecocardiográficos.
Este trabalho resultou na validação real do método no tocante à análise de movimento
do coração. A dessa validação, testes foram realizados combinando o método de Lucas
e Kanade (1981) com outras técnicas, tais como casamento de blocos (VERONESI et al.,
2006). Apesar de se passarem 30 anos desde a proposição do método, este ainda é utilizada
como base para a resolução de problemas ligados ao rastreamento da estrutura cardíaca
(YANG; MURASE, 2010).
2.4.1.3 Método de Lucas e Kanade Piramidal
O método de Lucas e Kanade (1981) pode ser aplicado em um contexto reduzido visto
que se baseia apenas em informações locais derivadas de uma pequena janela em torno
dos pontos de interesse. A desvantagem em se usar pequenas janelas locais é que grandes
movimentos podem mover pontos para fora da janela e, assim, tornam impossível o cálculo
do vetor de velocidade daquele ponto. Este problema conduz à adaptação deste método
para uma nova técnica com multi-resolução: o método de Lucas e Kanade Piramidal
(PIR) (BOUGUET, 2000).
O conceito de métodos de multi-resolução, ou pirâmides, em imagens digitais surgiu
com Burt e Adelson (1983) em aplicações de compressão de imagens. Estes métodos
baseiam-se em uma espécie de pirâmide em que cada setor (ou nível) representa imagens
em diferentes resoluções. A base da pirâmide, por exemplo, representa a imagem em sua
resolução original no nível 0e cada nível acima deste possui metade de sua resolução até
um determinado nível L, conforme ilustrado na parte esquerda da Figura 2.14.
O método PIR consiste em filtrar e sub-amostrar versões de uma determinada imagem
até um nível Lpara que, a partir deste nível, seja aplicado o FO de Lucas e Kanade. O
fluxo resultante no nível Lé utilizado no nível L1como valor inicial para os vetores de
velocidade e, assim, a técnica é aplicada novamente em todos os níveis até atingir o nível
0quando a imagem é reconstruída (Figura 2.14).
Capítulo 2: Fundamentação Teórica 27
Figura 2.14: representação esquemática do método PIR.
Burt e Adelson (1983) decompõem a estrutura piramidal em duas etapas. A primeira,
chamada de etapa de redução e ilustrada na Figura 2.15, consiste na filtragem passa-baixas
e na posterior amostragem para a obtenção do próximo nível da pirâmide (partindo do
nível 0). O processo é similar ao da distribuição de probabilidade gaussiana (com o
objetivo de eliminar altas frequências) e, por isso, é chamado de Pirâmide Gaussiana.
Cada nível λpode ser obtido por
λ(i, j) =
2
X
m=2
2
X
n=2
w(m, n)λ(2i+m, 2j+n),(2.20)
em que wé o filtro da convolução (de tamanho 5×5).
(a) (b) (c) (d)
Figura 2.15: etapa de redução da imagem, a) com nível 0 com 256x256 pixels; b)
nível 1 com 128x128 pixels; c) nível 2 com 64x64 pixels; e d) nível 3
com 32x32 pixels.
A segunda etapa é chamada de expansão, mostrada na Figura 2.16, e é nesta fase que a
imagem é reconstruída. Para isso, cada imagem do nível inferior é subtraída do nível acima
da pirâmide como um filtro passa-altas. Como as imagens possuem resoluções diferentes,
é necessário interpolar os valores dos tons dos pixels da imagem do nível anterior para,
em seguida, realizar a subtração.
Capítulo 2: Fundamentação Teórica 28
A expansão é o processo inverso da redução e se assemelha ao operador laplaciano no
tocante à suavização. Por essa razão, o resultado dessa sequência de operações é chamado
de Pirâmide Laplaciana e a interpolação de cada nível é dado por (BURT; ADELSON, 1983)
λ(i, j)=4
2
X
m=2
2
X
n=2
w(m, n)λim
2,jn
2,(2.21)
em que os termos im
2ejn
2não inteiros são excluídos do somatório.
(a) (b) (c) (d)
Figura 2.16: etapa de reconstrução da imagem, a) com nível 0 com 256x256 pixels;
b) nível 1 com 128x128 pixels; c) nível 2 com 64x64 pixels ; e d) nível 3
com 32x32 pixels.
(MALPICA et al., 2004) utilizaram o método PIR para medir a intensidade do fluxo
sanguíneo no átrio direito a partir de imagens de ressonância magnética. Os métodos de
FO tem se mostrado viáveis no âmbito ecocardiográfico mas estes podem falhar devido a
baixa qualidade da imagem a ser rastreada. Logo, além dos métodos de FO, outra técnica
citada na literatura por Marwick, Yu e Sun (2007), Zamorano, Fernández e Kaul (2004)
como uma solução para a busca de marcas acústicas é chamada de Casamento de Blocos
(CB).
2.4.2 Casamento de Blocos
A técnica de Casamento de Blocos (CB) foi introduzida por Jain e Jain (1981) e é
inicialmente aplicada em codificação de imagens, a partir da similaridade entre pixels de
imagens ou de regiões de imagens. Hoje, esta técnica é largamente utilizada em aplicações
tais como rastreamento visual (GYAOUROVA; KAMATH, 2003), compressão de vídeo (RATH;
MAKUR, 1998), visão estéreo (KOSCHAN; RODEHORST; SPILLER, 1996); entre outras.
Capítulo 2: Fundamentação Teórica 29
Essa técnica CB baseia-se no princípio de que se um bloco é definido como sendo
suficientemente pequeno, então o movimento exibido por este bloco, pode ser caracterizado
por um modelo paramétrico que descreve o movimento de todos os pixels no seu interior
através de um simples vetor de deslocamento (LUKCAC; PLATANIOTIS, 2006).
O vetor de deslocamento é estimado definindo inicialmente dois parâmetros: bloco
âncora (BA) e área de busca (AB). O BA é centrado no objeto de uma cena em um
quatro t0, cujo movimento se deseja acompanhar e, por este motivo, seu tamanho é
bastante variável. O bloco que contém o objeto é então procurado em diferentes posições
dentro da AB de uma cena no quadro seguinte t0+ 1. A posição onde acontecer a melhor
correspondência com o BA é tida como a nova posição do objeto, ou seja, a posição final
do vetor de deslocamento. A Figura 2.17 ilustra o uso desta técnica.
Figura 2.17: exemplo de estimação de vetor de deslocamento.
A dinâmica da técnica CB ocorre ao posicionar o BA no quadro inicial de um vídeo e
está exemplificada na Figura 2.18. A função que define a AB se adapta às coordenadas
centrais do BA. Portanto, se o BA mudar, a AB vai mudar na mesma proporção. Após
posicionar o BA e a AB no quadro inicial, Figura 2.18(a), é realizada uma busca através de
comparações de maior similaridade (ou de menor dissimilaridade) entre o BA do quadro
anterior e todos os possíveis BAs dentro de AB do quadro atual. Esses possíveis BAs
representam todas as possíveis configurações de blocos de mesmo tamanho do BA dentro
da AB. O BA é, então, atualizado para onde ocorrer a melhor correspondência entre os
blocos, conforme mostra a Figura 2.18(b). Da mesma forma a AB é atualizada e o vetor
de deslocamento é encontrado, ilustrado na Figura 2.18(c). O processo se repete quadro
a quadro conforme as Figuras 2.18(d) a 2.18(o) e, ao final, tem-se todos os vetores de
deslocamento formando a trajetória do objeto, mostrada na Figura 2.18(p).
Capítulo 2: Fundamentação Teórica 30
2.4.2.1 Estimadores de Deslocamento
Comparar padrões entre blocos consiste, basicamente, em analisar a similaridade (me-
nor erro) entre os pixels de um bloco com os pixels do outro bloco para, assim, achar
o deslocamento do bloco durante a sequência de quadros. Existem diversos estimado-
res de deslocamento baseado nos tons dos pixels utilizados para rastreamento de marcas
acústicas.
Trahey, Allison e Ramm (1987) foram os pioneiros na utilização de CB em imagens
de ultrassom para rastrear marcas. Em seu trabalho foi utilizado estimador de correlação
normalizada (NC) para detectar o fluxo sanguíneo. Posteriormente, Bohs e Trahey (1991)
utilizaram a soma das diferenças absolutas (SAD) para estimar a posição de marcas
visando detectar, não somente o fluxo sanguíneo, mas também o movimento de tecidos.
Walker et al. (1993) utilizaram ainda o mesmo estimador SAD para medir vibrações em
tecidos.
Uma das primeiras análises comparativas entre estimadores de movimento foi realizada
por Friemel, Bohs e Trahey (1995) ao comparar NC, SAD e correlação não-normalizada
(NNC) em imagens sintéticas em diversas situações como, por exemplo, diferentes níveis de
ruídos e tamanho variado de blocos. Ebbini (2000) utiliza decomposição em autovalores
para determinar automaticamente o tamanho de bloco ideal.
Outros estimadores de deslocamento são analisados por Langeland et al. (2003) e Viola
e Walker (2003), como os abordados SAD, NC, NNC e soma das diferenças quadráticas
(SSD).
Este trabalho avalia o desempenho dos estimadores citados e utilizados na literatura
(SAD, SSD, NC, NNC), bem como a autocorrelação (AC), a correlação cruzada (CC),
o erro médio quadrático (MSE) e o erro médio absoluto (MAE). A equação de cada
estimador é descrita em seguida.
Soma das diferenças absolutas (SAD):
fsad(x, y) = X
(u,w)X
(i,j)
|I0(x+i, y +j)I1(x+i+u, y +j+w)|.(2.22)
Soma das diferenças quadráticas (SSD):
fssd(x, y) = X
(u,w)X
(i,j)
[I0(x+i, y +j)I1(x+i+u, y +j+w)]2.(2.23)
Erro médio absoluto (MAE):
fmae(x, y) = 1
k2X
(u,w)X
(i,j)
|I0(x+i, y +j)I1(x+i+u, y +j+w)|.(2.24)
Capítulo 2: Fundamentação Teórica 31
Erro médio quadrático (MSE):
fmse(x, y) = 1
k2X
(u,w)X
(i,j)
[I0(x+i, y +j)I1(x+i+u, y +j+w)]2.(2.25)
Correlação não-normalizada (NNC):
fnnc(x, y) = X
(i,j)
[I0(x+i, y +j)×I1(x+i+u, y +j+w)] .(2.26)
Correlação normalizada (NC):
fnc(x, y) = P(i,j)I0(x+i, y +j)I0I1(x+i+u, y +j+w)I1
qP(i,j)I0(x+i, y +j)I02I1(x+i+u, y +j+w)I12.(2.27)
Correlação cruzada (CC):
fcc(x, y) = X
(i,j)I0(x+i, y +j)I0I1(x+i+u, y +j+w)I1.(2.28)
Autocorrelação (AC):
fac(x, y) = P(i,j)I0(x+i, y +j)I0I1(x+i+u, y +j+w)I1
P(i,j)I0(x+i, y +j)I02,(2.29)
em que xeysão as coordenadas do pixel central do bloco âncora, u,w,iejsão as
coordenadas dos pixels da AB que possui k×kpixels de dimensão. I0é uma partição da
imagem de um quadro, I1é outra partição da imagem do quadro seguinte. Por fim, I0e
I1são as médias das duas partições anteriores.
Capítulo 2: Fundamentação Teórica 32
(a) (b) (c) (d)
(e) (f) (g) (h)
(i) (j) (k) (l)
(m) (n) (o) (p)
Figura 2.18: aplicação prática da técnica de CB.
Capítulo 3
Metodologia
Este Capítulo contém os detalhes dos algoritmos implementados durante o desenvol-
vimento desse trabalho, bem como o sistema de testes e a metodologia de análise
comparativa. Inicialmente, o ambiente de desenvolvimento das técnicas de fluxo óptico
(FO) e casamento de blocos (CB) é descrito, seguindo com o detalhamento do sistema
de testes (que se em vídeos sintéticos e vídeos reais de ecocardiografia). Finalmente
são descritas as metodologias de avaliação e análise comparativa das técnicas: correlação
entre trajetória, erros de deformação e esforço computacional.
3.1 Implementação
Os algoritmos são primeiramente implementados em Matlab R
. Sua linguagem torna
a codificação das técnicas um trabalho rápido e mais simples no tocante a simulação.
Este software possui pacotes que ajudam na leitura e processamento das imagens através
de um conjunto de funções úteis para a comunidade de processamento de imagens (por
exemplo: possibilita a aquisição de vídeos em vários formatos, tamanhos e formatos de
cores).
Contudo, a facilidade quanto à programação do Matlab R
possui o custo computaci-
onal como desvantagem. Por ser uma linguagem interpretada, um aumento do tempo
de computação dos algoritmos. Este tempo não chegaria a ser influente se o foco do tra-
balho fosse imagens estáticas, mas o trabalho é baseado em vídeos, por isso a linguagem
adotada torna-se o C++.
Neste trabalho é utilizada a biblioteca OpenCV (Open Source Computer Vision Li-
brary) em um sistema operacional Windows através da IDE Microsoft Visual Studio C++
33
Capítulo 3: Metodologia 34
2010 Express Edition. A OpenCV é multiplataforma, totalmente livre para o uso acadê-
mico e comercial, distribuída sob a licença Berkeley Software Distribution (BSD) para o
desenvolvimento de aplicativos na área de Visão Computacional (INTEL, 2000).
A OpenCV possui ainda um vasto número de funções em C/C++ que implementam
alguns dos algoritmos mais comuns de processamento e análise de imagens em diversas
áreas, facilitando a execução do trabalho tanto quanto no Matlab R
.
3.1.1 Fluxo Óptico
A implementação dos algoritmos de FO de Horn e Schunck (1981) e Lucas e Kanade
(1981) possuem a mesma abordagem inicial, isto é, são trabalhadas duas imagens por vez,
cada uma representando dois quadros consecutivos de um vídeo, que podem ser ilustrados
pelas Figuras 3.1(a) e 3.1(c). As duas imagens são, inicialmente, convoluídas por um filtro
gaussiano resultando em imagens suavizadas, mostradas nas Figuras 3.1(b) e 3.1(d). A
partir dessas imagens, são estimadas as derivadas parciais em relação a xe a y, que são
os gradientes e em relação a t:Ex,EyeEt, que estão ilustrados nas Figuras 3.1(e), 3.1(f)
e 3.1(g).
(a) (b) (c) (d) (e) (f) (g)
Figura 3.1: a) quadro 1; b) quadro 1 filtrado; c) quadro 2; d) quadro 2 filtrado; e)
gradiente em x; f) gradiente em y; e g) derivada parcial de t.
De posse desses dados, a técnica de Horn e Schunck (1981) utiliza a aproximação
pelo operador Laplaciano, explicado pela equação 2.11, para o cálculo do valor médio
das velocidades de uevpara, assim, estimá-las de acordo com as equações 2.13 e 2.14
mediante um número empírico de 20 iterações. Os valores das velocidades são utilizados
para a amostragem do fluxo de vetores de deslocamento ilustrados na Figura 3.2(a).
a técnica de Lucas e Kanade (1981) utiliza o método não iterativo dos mínimos
quadrados para resolver a equação 2.19. Da mesma maneira que o método anterior, os
vetores de deslocamento são encontrados a partir de uevque estão exemplificados na
Figura 3.2(b).
Diferentemente das técnicas anteriores, o método de Lucas e Kanade Piramidal não
Capítulo 3: Metodologia 35
(a) (b)
Figura 3.2: vetores de deslocamento estimados pelo método a) Horn e Schunck
(1981) e b) Lucas e Kanade (1981).
apresenta vetores de deslocamento como resultado, pois, este consiste em filtrar e sub-
amostrar (método de multi-resolução) cada imagem visando o cálculo da técnica de Lucas
e Kanade (1981) em uma imagem de baixa resolução. Logo, o grande diferencial desta
abordagem se na sua aplicação, pois esta é utilizada em rastreamento de regiões es-
pecíficas (rastreamento pontual) ao passo que as abordagens anteriores são utilizadas em
estimação de movimento (rastreamento global) em uma cena.
3.1.2 Casamento de Blocos
Para implementar os diversos estimadores de deslocamento da técnica de CB, é criada
uma classe contendo as funções de cada estimador, que se resume na definição de uma
região em torno de um ponto de um quadro de um vídeo e uma busca pela melhor
correspondência entre esta região e outras regiões em quadros posteriores.
Dado um ponto de coordenadas (x, y)em um quadro t0, a região que compõe o bloco
âncora é delimitado pelo usuário ao fornecer o lado deste bloco. Em geral, para qualquer
valor de n, tem-se a seguinte configuração de vértices que é ilustrada pela Figura 3.3.
Neste caso, tem-se:
bloco âncora (BA) - (xn/2, y n/2),(x+n/2, y n/2),(x+n/2, y +n/2) e(xn/2, y +
n/2);
área de busca (AB) - (x3n/2, y 3n/2),(x+ 3n/2, y 3n/2),(x+ 3n/2, y + 3n/2) e
(x3n/2, y + 3n/2).
Capítulo 3: Metodologia 36
Para um bloco de tamanho n= 3 pixels, por exemplo, a região do BA é um quadrado
de vértices (x1, y 1),(x+1, y 1),(x+ 1, y +1) e(x1, y + 1). a AB é delimitada,
para o mesmo exemplo, por um quadrado de vértices (x4, y4),(x+4, y4),(x+4, y+4)
e(x4, y + 4).
Figura 3.3: Configuração de busca e comparação de blocos.
A metodologia de busca é praticamente a mesma para todos os estimadores. Isto é,
são realizadas comparações entre os blocos de acordo com cada estimador. Um pseudo-
código para o método da soma das diferenças absolutas (SAD) está exemplificado no
Algoritmo 1. Neste algoritmo, as coordenadas xey, o tamanho do bloco ne um valor de
referência do BA vSad são utilizados como entrada para o estimador SAD. É realizada
uma busca pela AB, de naté nnos eixos XeYda imagem, e outra, de n/2até
n/2, nos possíveis blocos onde a maior correspondência, que ocorre no valor mínimo
da soma das diferenças absolutas, ou seja, no argmin
x,y
da equação 2.22.
Quando o valor encontrado (aux) é menor do que o valor de referência com o BA
(vSad), este passa a ser o novo valor de referência.
A melhor correspondência entre blocos varia de acordo com o estimador. Para o
estimador SAD ocorre na posição (x, y) que gera a menor soma das diferenças absolutas
(argmin fsad(x, y)). A Tabela 3.1 contém as melhores correspondências para todos os
estimadores.
Capítulo 3: Metodologia 37
Algoritmo 1 Método de busca para o estimador SAD.
Algoritmo SAD
Entrada n, x, y, vS ad: inteiros não-negativos
Saída newX, newY : inteiros não-negativos
1para w n...n faça
2para u n...n faça
3aux 0
4para j n/2. . . n/2faça
5para i n/2. . . n/2faça
6aux aux+abs(Img0(j+y, i +x)I mg1(j+y+w, i +x+u))
7fim para
8fim para
9se aux < vSad então
10 vSad aux
11 newX x+u
12 newY y+w
13 fim se
14 fim para
15 fim para
16 retorne (newX, newY )
fim
Tabela 3.1: melhor correspondência entre estimadores de deslocamento.
SAD argmin
x,y
fsad(x, y)SSD argmin
x,y
fssd(x, y)
MAE argmin
x,y
fmae(x, y)MSE argmin
x,y
fmse(x, y)
NNC argmin
x,y
fnnc(x, y)NC argmax
x,y
fnc(x, y)
CC argmax
x,y
fcc(x, y)AC argmax
x,y
fac(x, y)
3.2 Sistema de Testes
O sistema de testes para análise das técnicas apresentadas na seção anterior consiste na
geração de vídeos sintéticos com diferentes relações sinal/ruído de pico, vídeos sintéticos
de ultrassom e em vídeos de exames ecocardiográficos.
3.2.1 Vídeos Sintéticos
Para avaliação inicial dos algoritmos são gerados vídeos sintéticos junto à presença de
ruído impulsivo do tipo sal e pimenta, variando-se a relação sinal/ruído de pico (PSNR)
de acordo com a equação (FISHER, 1994).
P SN R = 20log10 b
rms ,(3.1)
em que P SN R é a relação sinal/ruído de pico, bé o maior valor possível do sinal (255
para imagens de 8 bits) e rms é a diferença quadrática média entre dois quadros do vídeo.
Capítulo 3: Metodologia 38
A cada quadro do vídeo, um novo padrão aleatório de ruído é gerado sobre um fundo
estático cinza. São gerados cinco vídeos para cada diferente valor de PSNR. São adotados
os valores dB; 20; 17,8; 14,8; 13,1; 11,8; 10,8; 10; 9,4 e 8,8 dB totalizando 50 tipos de
vídeos. A fim de ilustrar o que representa cada valor de PSNR citado são ilustrados, na
Figura 3.4, recortes de um quadro de um vídeo sintético para cada valor de ruído adotado.
(a) (b) (c) (d) (e) (f) (g) (h) (i) (j)
Figura 3.4: recortes de quadros com diferentes PSNR, a) dB; b) 20 dB; c) 17,8
dB; d) 14,8 dB; e) 13,1 dB; f) 11,8 dB; g) 10,8 dB; h) 10 dB; i) 9,4 dB;
e j) 8,8 dB.
Para analisar a trajetória são criados vídeos com um objeto que se move nas direções
vertical e horizontal e nos dois sentidos que são ilustradas por setas mostradas na Figura
3.5(a). O objeto a ser rastreado se trata de um círculo com 9 pixels de diâmetro que se
move com um passo de 5 pixels por quadro, conforme posto na Figura 3.5(b).
São gerados 50 vídeos com as dez diferentes PSNR citadas anteriormente para realizar
a avaliação, sendo cinco vídeos para cada PSNR. Logo, cada algoritmo é executado cinco
vezes em cada configuração. A trajetória final é, enfim, calculada a partir das médias das
cinco trajetórias nos vídeos.
(a) (b)
Figura 3.5: primeiro quadro do vídeo sintético, a) trajetória controlada; e b) detalhe
(zoom) do objeto a ser rastreado.
Para a análise da deformação, é criado um objeto quadrado com arestas de 100 pixels
Capítulo 3: Metodologia 39
de comprimento. Este quadrado possui em seus vértices pequenos quadrados com arestas
de 9 pixels que se movem na diagonal, alongando e comprimindo o objeto de acordo com
as setas mostradas na Figura 3.6(a). Os vértices, ilustrados na Figura 3.6(b), movem-se
1pixel na diagonal a cada novo quadro. Assim, dado o quadro inicial t0com perímetro
igual a 400 pixels, o próximo quadro t1possui um perímetro igual a 408 pixels.
Ao final, os testes de análise sintética são compostos por 100 vídeos, sendo 50 para a
análise de trajetória e 50 para a análise de deformação.
(a) (b)
Figura 3.6: primeiro quadro do vídeo sintético, a) objeto a ser deformado; e b)
detalhe (zoom) do vértice a ser rastreado.
3.2.2 Vídeos Sintéticos de Ultrassom
Posteriormente são gerados vídeos sintéticos de ultrassom (phantom computacional).
Para tal, utiliza-se o software Field II (JENSEN; SVENDSEN, 1992; JENSEN, 1996) que foi
desenvolvido em C e em Matlab R
e é amplamente utilizado na simulação de imagens
em modo B para phantoms de ultrassom devido à capacidade de reprodução do com-
portamento de sistemas de imageamento de ultrassom. Com o Field II é possível simular
diferentes formatos de transdutores e formas de excitação devido à utilização do método de
Tupholme e Stephanishen no cálculo da pressão de campo gerada pelo transdutor. Neste
método, cada transdutor é modelado como um pistão vibrante. Assim, simulam-se trans-
dutores com diversas formas de apodização, excitação e geometria (JENSEN; SVENDSEN,
1992).
A fim de simular vídeos de ultrassom, primeiramente foram gerados vídeos sintéticos
com um objeto branco se movendo em um fundo preto. Cada quadro do vídeo sintético
serviu de entrada para o programa Field II simular um phantom. O vídeo de ultrassom é
criado após todos os quadros do vídeo sintético terem passado pelo mesmo processamento.
Capítulo 3: Metodologia 40
Assim como os vídeos sintéticos da sessão anterior, para analisar a trajetória são cria-
dos vídeos com um objeto que se move nas direções vertical e horizontal e nos dois sentidos
que são ilustradas por setas mostradas na Figura 3.7(a). Esta Figura e a Figura 3.7(c)
exemplificam os quadros antes de serem processados pelo Field II. Após este processa-
mento obtém-se os quadros do vídeo sintético de ultrassom, ilustrado pelas Figuras 3.7(b)
e 3.7(d)
(a) (b) (c) (d)
Figura 3.7: a) quadro do vídeo sintético; b) quadro do vídeo sintético de ultrassom
(phantom) gerado a partir de a); c) outro quadro do vídeo sintético e d)
phantom gerado a partir de c).
Para a analisar a deformação, é criada uma espécie de barra com dois círculos nas
pontas. Estes círculos se movem apenas na direção horizontal e em sentidos opostos,
exemplificados na Figura 3.8(a), a fim de simular a deformação da barra. Outro quadro
do vídeo sintético antes do processamento pelo Field II é ilustrado na Figura 3.7(c). os
phantoms gerados após o processamento das Figuras citadas, são mostrados nas Figuras
3.7(b) e 3.7(d), respectivamente.
(a) (b) (c) (d)
Figura 3.8: a) quadro do vídeo sintético; b) quadro do vídeo sintético de ultrassom
(phantom) gerado a partir de a); c) outro quadro do vídeo sintético e d)
phantom gerado a partir de c).
São gerados, ao todo, cinco vídeos para a análise da trajetória e cinco vídeos para a
análise da deformação. As técnicas descritas nesse capítulo serão aplicadas em todos os
vídeos e, ao final, é obtida uma trajetória média e uma deformação média em relação aos
Capítulo 3: Metodologia 41
vídeos para cada uma das técnicas.
3.2.3 Vídeos de Exames Ecocardiográficos
Os vídeos utilizados nesse trabalho são adquiridos mediante parceria com o setor de
Cardiologia do Hospital Universitário Walter Cantídio (HUWC) da Universidade Federal
do Ceará (UFC) e a Escola de Ecografia de Pernambuco (ECOPE). Os vídeos cedidos
são de exames de ecocardiografia em diversas posições do coração (duas, três e quatro
câmeras) de pacientes sadios e/ou contendo alguma deformação miocárdica.
Para a aquisição do vídeo é necessário um exame com um aparelho ecocardiógrafo para
visualizar a janela cardíaca, gravar o exame e separar apenas um ciclo cardíaco do paciente.
Esses procedimentos são realizados pelo médico operador ainda durante o exame. Depois
de separado apenas o ciclo cardíaco, é possível aplicar a técnica (já existente em grande
parte dos ecocardiógrafos) de strain bidimensional e visualizar curvas de deformação e o
valor da deformação global.
Os vídeos cedidos para a realização desse trabalho foram adquiridos mediante dois
aparelhos ecocardiógrafos, o primeiro da GE MEDICAL SYSTEMS, modelo vivid 7 e o
segundo da SAMSUNG MEDISON, modelo eko 7. No total são 7 vídeos no formato AVI,
3 da GE e 4 da SAMSUNG, com duração entre 60 e 100 milissegundos, que é a duração
normal do ciclo cardíaco. Esses vídeos são capturados antes da aplicação da técnica de
strain bidimensional. Depois da aplicação desta técnica são armazenados os valores da
deformação global para servir de padrão ouro de referência na comparação dos algoritmos
em análise desta dissertação.
Um destes vídeos traz, ainda, a imagem das curvas de deformação ao longo dos quadros
do vídeo. As mesmas curvas são obtidas pelas técnicas testadas e comparadas visualmente,
mostrando suas semelhanças.
3.3 Avaliação das Técnicas Implementadas
Visando a quantificação do rastreamento, os deslocamentos produzidos pelos algorit-
mos implementados são comparados com os deslocamentos que geraram o movimento do
vídeo sintético. para a análise da deformação, são realizadas comparações baseadas
nos perímetros produzidos pelo rastreamento de regiões individuais mediante equação
2.2. Além da análise da trajetória e da deformação, uma análise a respeito do esforço
computacional é realizada com as melhores técnicas aplicadas nos exames médicos.
Capítulo 3: Metodologia 42
3.3.1 Trajetória
Durante as simulações das técnicas implementadas com os vídeos sintéticos, a cada
novo quadro, uma nova posição do objeto rastreado é estimada. Cada posição gera um
par de coordenadas x, y que são comparadas com as coordenadas originais do objeto.
Para a avaliação da trajetória, as coordenadas são comparadas de duas maneiras:
correlação e erro quadrático médio. Na primeira, quanto à correlação entre as trajetórias,
calcula-se o coeficiente de correlação entre as posições reais e estimadas a fim de verificar o
quanto a trajetória real a trajetória gerada pelo método consegue se aproximar. Contudo,
esta metodologia de análise não é suficiente, que casos em que uma correlação
perfeita (ρ= 1) não traduz um rastreamento exato. Esse exemplo é ilustrado na Figura
3.9 pelos desenhos de trajetórias reais e estimadas e ocorre porque a trajetória estimada
é geometricamente igual à trajetória real, porém, transladada.
Figura 3.9: desenho das trajetórias reais e estimadas.
Além da correlação, o erro quadrático médio entre trajetórias também é calculado
para evitar situações como a da Figura 3.9. Desta maneira, obtém-se resultados tanto da
qualidade da trajetória quanto de sua acurácia.
3.3.2 Deformação
Para simulações referentes à deformação em vídeos sintéticos, são armazenado não
as coordenadas das regiões rastreadas, mas os valores dos perímetros do objeto, que é
dependente da capacidade que cada algoritmo possui em rastrear os vértices do objeto.
Os valores dos perímetros de cada quadro são armazenados.
De posse dos valores dos perímetros, são calculadas as taxas de deformações (strain
rate) referentes a cada um, de acordo com a equação 2.2. Por fim, são geradas curvas de
deformação ao longo dos quadros. O erro quadrático médio é utilizado em conjunto para
a aferição da diferença entre os valores das taxas de deformação.
Capítulo 3: Metodologia 43
para vídeos de exames ecocardiográficos não se pode fazer a mesma comparação
de acordo com o erro quadrático médio, pois, não se dispõe de valores das curvas de
deformação para servir como base de comparação. Para estes casos, o valor da deformação
global (global strain) é utilizado como parâmetro de referência para comparação. Este
valor está contido no vídeo do exame médico.
Na análise em vídeos de exames ecocardiográficos não são calculados os valores da taxa
de deformação (strain rate), mas a deformação global (global strain) do músculo cardíaco
mediante a equação 2.1. O parâmetro Lé o comprimento da parede do miocárdio ao final
da sístole e L0é o seu comprimento ao final da diástole. Desta forma, a equação 2.1 pode
ser reescrita como (REISNER et al., 2004)
ε(%) = LL0
L0
×100.(3.2)
Para calcular o comprimento da parede nesses instantes específicos é necessário ad-
quirir as imagens dos quadros onde acontece o final da sístole e da diástole. Logo, a
análise dos diferentes eventos do ciclo cardíaco deve ser feita e, para tal, são apresentadas
as ondas de um sinal de eletrocardiograma de um ciclo cardíaco conforme mostrado na
Figura 3.10.
Figura 3.10: fases de sístole e diástole em eletrocardiograma de um ciclo cardíaco.
O quadro onde ocorre o final da sístole ventricular pode ser capturado no final do
ciclo, no final da onda T, que representa a repolarização dos ventrículos. o final da
diástole ventricular, que ocorre com o fechamento das válvulas, pode ser capturado no
pico do complexo QRS. A partir das duas imagens, ilustradas na Figura 3.11, desses dois
quadros é possível realizar o cálculo da deformação global do miocárdio.
3.3.3 Esforço Computacional
Para avaliar o esforço computacional dos métodos, utiliza-se o mesmo ambiente com-
putacional com o mínimo de interferência de outros programas detalhado no Capítulo
seguinte. Esta análise consiste na medição dos tempos em que o sistema de cada técnica
leva para calcular a deformação do coração. Cada técnica é executada 30 vezes para cada
Capítulo 3: Metodologia 44
(a) (b)
Figura 3.11: quadros do vídeo do ciclo cardíaco no instante, a) fim da diástole; e b)
fim da sístole.
vídeo e seus tempos são coletados. Ao final são mostrados os tempos médios junto com o
desvio-padrão de cada técnica.
Conhecidas as técnicas a serem implementadas e a metodologia de testes utilizada
nesta dissertação, no próximo Capítulo são apresentados os resultados obtidos pela com-
paração das técnicas.
Capítulo 4
Resultados e Discussões
Os resultados detalhados neste Capítulo seguem a disposição dos métodos de avaliação
e comparação dos algoritmos descritos na Seção 3.3, mediante os dois tipos de
vídeos de testes citados na Seção 3.2, sintéticos e reais. Para os primeiros tipos de vídeos
(sintéticos com adição de ruído impulsivo) são mostrados os resultados de trajetória e
deformação nas técnicas de CB: SAD, SSD, MAE, MSE, NNC, NC, CC e AC e das
técnicas de FO: método de Horn-Schunck (HS), Lucas-Kanade (LK) e Lucas-Kanade
Piramidal (PIR) com base nas medidas de correlação e erro quadrático médio.
para o segundo tipo de vídeo, ou seja, vídeos reais do ciclo cardíaco, são apresen-
tados resultados da deformação global miocárdica baseada em valores obtidos junto ao
médico especialista. Esses resultados são expostos em tabelas com seus erros calculados
e ilustrados em gráficos. ainda a análise do erro médio, junto com o desvio-padrão,
de cada técnica em relação aos vídeos ecocardiográficos. As técnicas com melhores re-
sultados são, por fim, comparadas quanto ao esforço computacional e seus resultados são
mostrados ao final do Capítulo.
4.1 Caracterização do Ambiente de Testes
Na geração dos vídeos sintéticos adota-se 10 configurações de PSNR, como foi deta-
lhado no Capítulo anterior: dB; 20; 17,8; 14,8; 13,1; 11,8; 10,8; 10; 9,4 e 8,8 dB. Em
cada quadro do vídeo são gerados pontos ruidosos aleatoriamente sobre o objeto a ser
rastreado. Desta maneira, são gerados cinco vídeos com a mesma intensidade de ruído
para cada configuração de PSNR, totalizando 50 vídeos.
Cada algoritmo é testado cinco vezes produzindo cinco trajetórias diferentes para cada
PSNR. A trajetória resultante adotada é dada pela média das cinco trajetórias. Nesta
45
Capítulo 4: Resultados e Discussões 46
etapa inicial verificou-se um desvio-padrão em torno de 0,0035 para todos os vídeos, o
que mostra trajetórias semelhantes quando em ambientes ruidosos semelhantes.
Todos os testes são realizados no mesmo laptop cujas características são sumarizadas
na Tabela 4.1.
Fabricante: DELL
Modelo: Inspiron 15R (N5010)
Processador: Intel Core i5 (M480) @ 2.67 GHz
RAM: 4GB (DDR3) @ 1333 MHz
Vídeo: Intel HD Graphics
SO: MS Windows 7
Tabela 4.1: configuração do computador.
4.2 Resultados de Trajetória para Vídeos Sintéticos
Primeiramente são testados os 8 estimadores de deslocamento da técnica de CB
variando-se seu tamanho de bloco (N) entre 7, 9 e 11 pixels para cada vídeo. De iní-
cio, é verificado que os estimadores MAE e MSE produzem resultados exatamente iguais
em todos os testes e este fato acontece devido à semelhança de suas equações 2.24 e 2.25,
que diferem no expoente do estimador MSE. Este mesmo fato ocorre com os estimadores
AC e CC que, devido às suas formulações matemáticas dadas pelas equações 2.29 e 2.28,
é possível verificar que o estimador de correlação cruzado é, na verdade, o numerador do
estimador de autocorrelação.
Dessa maneira, os resultados dos estimadores MAE e MSE são descritos em função do
MAE, que possui menos operações matemáticas. De forma semelhante, os resultados dos
estimadores AC e CC são sumarizados como o estimador CC.
A correlação média de cada estimador com as três variações de N está ilustrada na
Figura 4.1, na qual é possível perceber que os resultados do estimador SAD, SSD e MAE
praticamente não variam em função do tamanho do bloco. os estimadores NC, NNC
e CC têm sua correlação aumentada, de forma significante, à medida que se aumenta o
valor de N, principalmente a técnica NNC que possui a pior correlação média quando
N= 7, e as melhores quando N= 9 eN= 11. Uma melhor correlação, acima de 0,8,
indica o quão semelhantes estão as trajetórias reais e estimadas.
Conforme explicado na Seção 3.3.1, a medida de correlação não é suficiente para avaliar
uma técnica, por isso são calculados os erros entre as trajetórias para cada valor de PSNR.
Assim como a correlação, este cálculo do erro é computado para cada tamanho de bloco
gerando as Figuras 4.2, 4.3 e 4.4. Ao analisar estas três figuras de forma geral, percebe-se
Capítulo 4: Resultados e Discussões 47
Figura 4.1: resultados de correlação média com o tamanho de bloco (N) entre 7, 9
e 11.
o comportamento natural do erro: reduzir seu valor em todos os estimadores à medida
que se aumenta a PSNR. Contudo, quando se analisa cada estimador em cada Figura
separadamente é possível se obter resultados diferentes.
Analisando a Figura 4.2 observa-se que o estimador NNC é o único com erros acima de
0,1 para PSNR acima de 13,1 dB. Esse comportamento é divergente dentre os outros al-
goritmos e demonstra o pior estimador para esse tamanho de bloco (N= 7). A explicação
dessa situação é exemplificada e ilustrada no Apêndice C.
Ao analisar o estimador CC verifica-se sua qualidade com erro praticamente zero para
PSNR maior do que 10 dB, o que difere dos demais algoritmos que tem seu erro
diminuído à ordem de 0,05 quando PSNR é superior a 13,1 dB. Este estimador é, ainda,
o que obtém maior correlação com N= 7 ao passo que o estimador NNC, anteriormente
citado, obtém a pior correlação, conforme se observa na Figura 4.1.
Figura 4.2: resultados de erro quadrático médio da análise de trajetória com dife-
rentes PSNR para estimadores de deslocamento com tamanho de bloco
(N) igual a 7.
Ao aumentar o tamanho do bloco para 9 pixels, cujos resultados estão apresentados
na Figura 4.3, é possível perceber a melhora significante do estimador NNC com seu erro
quadrático médio praticamente igual a zero em todos os vídeos com as diferentes PSNR.
Desta forma, o NNC se torna o melhor o estimador para esta configuração, comprovando
Capítulo 4: Resultados e Discussões 48
a melhor correlação da Figura 4.1 com N=9seguido pelo estimador CC.
O estimador CC, assim com o NNC, assume valores de erro praticamente igual a zero
para todos os vídeos, excetuando quando a PSNR é igual a 8,8 dB, conforme ilustrado na
Figura 4.3. Ainda analisando esta Figura, vê-se a melhora de estimadores de uma forma
geral, como os estimadores SAD, SSD, MAE e NC com resultados próximos.
Figura 4.3: resultados de erro quadrático médio da análise de trajetória com dife-
rentes PSNR para estimadores de deslocamento com tamanho de bloco
(N) igual a 9.
Ao analisar a Figura 4.4, com o tamanho de bloco igual a 11, vê-se a melhoria de todos
os estimadores mas não tão significante quando o tamanho do bloco aumentou de 7 para
9pixels. Com o bloco de 11 pixels, tanto o estimador NNC quanto o estimador CC obtém
erros praticamente iguais a zero, seguido pelo estimador NC.
entre os algoritmos SAD, SSD e MAE, que possuem performances idênticas, é o
estimador SAD que obtém menores erros seguido pelo MAE. Esta espécie de ranking entre
as técnicas corroboram os resultados de correlação mostrados na Figura 4.1.
Ainda em relação à Figura 4.4, percebe-se que o NNC continua apresentando taxas
de erros praticamente iguais a zero, mas ainda assim, maior que todos os outros quando
a PSNR possui valor acima de 13,1 . Portanto, o algoritmo NNC possui praticamente o
mesmo erro independente da quantidade de ruído. Uma análise mais detalhada sobre este
algoritmo é realizada no Apêndice C.
Diferentemente da análise dos estimadores da técnica CB, as três técnicas de FO são
analisadas em cinco diferentes PSNR: dB; 20; 17,8; 14,8 e 13,1 dB, pois abaixo desse
valor nenhum método apresentou diferença significante entre seus resultados, ou seja, o
rastreamento não é eficiente para nenhuma técnica de FO.
A princípio, são calculadas as correlações médias e mostradas na Tabela 4.2. É possível
perceber que o FO Piramidal obtém médias melhores, em contraposição aos valores dos
Capítulo 4: Resultados e Discussões 49
Figura 4.4: resultados de erro quadrático médio da análise de trajetória com dife-
rentes PSNR para estimadores de deslocamento com tamanho de bloco
(N) igual a 11.
Tabela 4.2: correlação média entre trajetórias (fluxo óptico).
PSNR
dB 20 dB 17,8 dB 14,8 dB 13,1 dB
Horn-Schunck 1,0000 0,9999 0,3522 0,1545 -0,1215
Lucas-Kanade 0,9999 0,9562 0,5738 0,1146 0,4670
Lucas-Kanade Piramidal 1,0000 1,0000 1,0000 1,0000 0,9983
outros dois métodos. Esta diferença é evidenciada quando mostradas as correlações grafi-
camente na Figura 4.5(a). Percebe-se, ainda, a semelhança entre os valores de correlação
das outras duas técnicas, mostrando que ambas possuem o mesmo nível de dificuldade de
rastreamento, à medida que o valor de PSNR diminui.
Para comprovar os resultados da análise de correlação anterior, são calculados os erros
entre as diferentes trajetórias das técnicas de FO. Observa-se, na Figura 4.5(b), que a
metodologia Piramidal obtém os menores erros. As outras duas técnicas obtém resultados
semelhantes mas erros maiores com o algoritmo de Horn e Schunck, à medida que o
valor de PSNR diminui.
(a) (b)
Figura 4.5: resultados de análise da trajetória, a) correlação média (desvio-padrão
em torno de 3); e b) erro quadrático médio para as técnicas de FO.
Capítulo 4: Resultados e Discussões 50
4.3 Resultados de Deformação para Vídeos Sintéticos
A segunda etapa da obtenção de resultados com vídeos sintéticos consta no cálculo
da deformação mediante o rastreamento dos vértices de um objeto retangular. Primei-
ramente, são mostrados os resultados de erro quadrático médio para a técnica de CB,
variando o tamanho do bloco tal como feito na análise de trajetória. Os resultados estão
mostrados nas Figuras 4.6, 4.7 e 4.8.
De um modo geral, o erro quadrático médio é inversamente proporcional à PSNR. Isto
é, diminui à medida que a PSNR tende a infinito. Comparando-se as escalas dos três
gráficos, percebe-se que o valor do erro praticamente não muda quando o valor da PSNR
em 8,8 dB, 9,4 e 10 dB mas diminui a partir de 10,8 dB chegando praticamente a zero,
quando o tamanho do bloco aumenta para 11 pixels. Excetuando-se o estimador NNC,
que merece uma análise mais detalhada descrita no Apêndice C.
Analisando apenas a Figura 4.6, que representa os resultados com tamanho do bloco
igual a 7 pixels, evidenciam-se erros aproximadamente constantes independente da PSNR
para o estimador NNC, erros muito próximos para SAD, SSD e MAE (sendo os maiores
relacionados ao SSD). Entretanto, os maiores valores de erros ocorrem com o estimador
NC e os menores valores de erro com o estimador CC.
Figura 4.6: resultados de erro quadrático médio da análise de deformação com dife-
rentes PSNR para estimadores de deslocamento para N = 7.
O comportamento dos estimadores continua semelhante quando o tamanho do bloco
aumenta para 9 pixels conforme ilustrado na Figura 4.7. A diferença ocorre na melhoria
das técnicas com os valores de PSNR de 14,8 dB a dB. Esta situação é semelhante
à que ocorre na análise da trajetória, ou seja, quando se aumenta o tamanho do bloco,
melhora o rastreamento e, por sua vez, os cálculos desejáveis de deformação, neste caso.
Ainda nessa Figura, percebe-se o aumento significativo do valor do erro quadrático
médio de alguns estimadores em relação aos outros em cada vídeo. Este é o caso do
SSD, que é o estimador com o maior valor de erro quadrático médio quando analisados os
Capítulo 4: Resultados e Discussões 51
cinco menores valores de PSNR, enquanto nos demais valores de PSNR, o pior estimador
continua sendo o NNC.
Figura 4.7: resultados de erro quadrático médio da análise de deformação com dife-
rentes PSNR para estimadores de deslocamento para N = 9.
Aumentando ainda mais o tamanho do bloco para 11 pixels observa-se, na Figura 4.8,
que o comportamento dos algoritmos tende a estabilizar, com exceção do NNC que teve
seu erro aumentado quando o erro das outras técnicas continua praticamente zero. A
partir desta constatação e do detalhamento deste estimador no Apêndice C, verifica-se
sua instabilidade, pois, quanto maior a PSNR, menos ruidoso é o vídeo. Logo, o estimador
NNC em ambientes sem ruído com blocos maiores que o objeto de interesse não é uma
técnica que produz resultados animadores.
Figura 4.8: resultados de erro quadrático médio da análise de deformação com dife-
rentes PSNR para estimadores de deslocamento para N = 11.
Ao analisar a deformação calculada pelo rastreamento das técnicas de FO, percebe-se
que os menores erros continuam ocorrendo com a técnica Piramidal, conforme ilustrado
na Figura 4.9. Enquanto na análise da trajetória a pior técnica é a de Horn-Schunk, na
análise da deformação a técnica que apresenta maior valor de erro é a de Lucas-Kanade.
Para ilustrar o erro entre as três técnicas de FO, dois gráficos, mostrados nas Figuras
4.10(a) e 4.10(b), representam as curvas de deformação em duas configurações de análise
sintética. A primeira, quando a PSNR é igual 20 dB e as técnicas de Horn-Schunk e de
Capítulo 4: Resultados e Discussões 52
Figura 4.9: resultados de erro quadrático médio da análise de deformação com dife-
rentes PSNR para técnicas de FO.
Lucas-Kanade produzem valores de erros aproximadamente iguais. A segunda, quando
a PSNR é igual a 13,1 dB e a técnica de Lucas-Kanade apresenta um valor de erro
significantemente maior do que as outras técnicas em análise. Analisando esses dois
gráficos percebe-se mais claramente que o erro está intimamente ligado à variação da taxa
de deformação. Assim, os maiores valores de erros representam grandes variações em
torno da real curva de deformação, enquanto os menores erros representam as menores
variações.
(a) (b)
Figura 4.10: curvas de taxas de deformação das técnicas de FO, a) PSNR = 20 dB;
e b) PSNR = 13,1 dB
4.4 Resultados de Trajetória para Vídeos Sintéticos de
Ultrassom
Seguindo a metodologia de análise de trajetória explicada na seção anterior todas as
técnicas são aplicadas e, ao final, é verificada a correlação média e o erro entre as trajetó-
rias. O que foi verificado na seção anterior se repetiu nos vídeos sintéticos de ultrassom: os
estimadores MAE e MSE, assim como os estimadores AC e CC, apresentaram resultados
idênticos durante os testes. Logo, os resultados dos estimadores MAE e MSE são descritos
Capítulo 4: Resultados e Discussões 53
em função do MAE, que possui menos operações matemáticas e, de forma semelhante, os
resultados dos estimadores AC e CC são sumarizados como o estimador CC.
Diferentemente dos testes em vídeos sintéticos normais, não foi necessário variar o
tamanho de bloco para a técnica de CB. Devido à característica do ruído speckle presente
nos phantoms computacionais, verificou-se que blocos menores do que o objeto a ser
rastreado não produziram trajetória alguma. Á medida que se aumentava o tamanho do
bloco ao ponto de envolver o objeto a ser rastreado, mais longo era o rastreamento. Dessa
maneira, o tamanho de bloco ideal encontrado empiricamente e utilizado nos testes foi de
N= 25 pixels, que é bem maior do que o tamanho utilizado nos testes anteriores devido
à deformação causada no objeto pelos phantoms.
O resultado da correlação média entre as três técnicas de FO e os seis estimadores
de CB está ilustrado na Figura 4.11. Ao analisar apenas o estimadores de deslocamento,
percebe-se uma semelhança na sequência dos estimadores com melhores correlações entre
vídeos sintéticos normais. Na seção anterior, o estimador com a melhor correlação média
foi o NNC, seguido pelo CC, NC, SAD, MAE e SSD. nos vídeos sintéticos de ultrassom,
a sequência difere pelo fato do NNC ter apresentado desempenho inferior, indo do melhor
estimador para o pior. Ainda analisando apenas as técnicas de CB, nota-se que houve, de
maneira geral, uma diminuição no valor da correlação média para todos os estimadores,
o que é normal devido ao tamanho do bloco ser maior, gerando maiores variações de
posição.
Analisando as técnicas de FO, ainda na Figura 4.11, percebe-se a alta eficácia da
técnica PIR em relação não às outras técnicas de FO, mas também em relação aos
estimadores de CB. As técnicas de HS e de LK, apesar de possuir valores de próximos de
correlação, têm resultado diferente da correlação média entre os vídeos sintéticos da seção
anterior, onde a técnica LK se sobressaiu.
Figura 4.11: resultados de correlação média das trajetórias das técnicas aplicadas
nos vídeos sintéticos de ultrassom.
Ainda seguindo a metodologia adotada em seções anteriores, é analisado o erro quadrá-
tico médio entre os trajetos estimados pelas técnicas de FO e CB em cada vídeo sintético
Capítulo 4: Resultados e Discussões 54
de ultrassom e, posteriormente, é realizado o cálculo do erro. A Figura 4.12 traz a média
dos valores de erro para cada técnica. Novamente a técnica PIR se destaca com os meno-
res valores de erro em relação a todas as outras técnicas e os métodos HS e LK seguem
com os maiores erros.
Figura 4.12: resultados de erro quadrático médio das trajetórias das técnicas apli-
cadas nos vídeos sintéticos de ultrassom.
Analisando os estimadores de CB percebe-se o menor erro com o CC, seguido pelos
estimadores SAD e NC. Dentre esses, os piores resultados, em rodem crescente de erro,
apareceram com SSD, MAE e NNC, se mostrando a pior técnica na análise de trajetória
e melhor explicada no Apêndice C.
4.5 Resultados de Deformação para Vídeos Sintéticos
de Ultrassom
Para finalizar os testes em vídeos sintéticos, é utilizada a medida de deformação por
quadro como métrica de avaliação através do erro quadrático médio. Diferentemente dos
testes de deformação na seção de vídeos sintéticos normais, para realizar a comparação
nos phantoms computacionais calcula-se a deformação de um objeto em uma dimensão ao
longo de um vídeo. Esse objeto é um tipo de barra constando de dois objetos circulares
unidos por uma linha. A ideia é rastrear os objetos circulares, que se movem no mesmo
sentido mas em direções opostas, e calcular o quanto a linha que os une se deforma em
cada novo quadro.
Os resultados dos valores de erro são mostrados na Figura 4.13. Como último teste em
vídeos sintéticos, pode-se adiantar a conclusão de que a técnica de FO Piramidal é, sem
dúvida, a melhor técnica visto o destaque com erros menores e maior correlação em todos
os testes. Ainda em relação às técnicas de FO, o método HS mostra desempenho bastante
semelhante ao método LK em todas as análises sintéticas, com pequena superioridade do
Capítulo 4: Resultados e Discussões 55
método HS nos testes em vídeos sintéticos de ultrassom. Contudo, esse desempenho é
bem aquém em relação à maioria das técnicas.
Figura 4.13: resultados de erro quadrático médio da análise de deformação das téc-
nicas aplicadas nos vídeos sintéticos de ultrassom.
Ao analisar apenas os seis estimadores de deslocamento da técnica de CB, nota-se o
estimador NNC com pior resultado e o CC novamente com os resultados mais satisfatórios
apresentando os menores valores de erro. Observa-se ainda, pela Figura 4.13, a pouca
diferença entre os valores de erro dos demais estimadores. De um modo geral um
desempenho semelhante entre o SAD e o NC que é superior ao desempenho do MAE e
SSD.
4.6 Resultados de Deformação para Exames Ecocardi-
ográficos
A etapa de análise de deformação em exames ecocardiográficos é semelhante à análise
em vídeos sintéticos. Para cada vídeo são testados os nove métodos (seis estimadores de
deslocamento e três técnicas de fluxo óptico). Primeiramente, são definidos manualmente
12 pontos na parede do miocárdio em cada vídeo, formando um grande segmento em
torno da parede miocárdica que se deforma de acordo com a movimentação destes pontos.
Desta maneira, a cada quadro do vídeo, as posições dos pontos são atualizadas e, por sua
vez, o tamanho do segmento formado por tais pontos.
De posse de todos os valores dos tamanhos de segmentos, ao longo do vídeo de um
ciclo cardíaco, pode-se obter a taxa de deformação previamente apresentada na Seção
2.3. A taxa de deformação, dada pela derivada da deformação em relação ao tempo (dos
quadros do vídeo), é apresentada na Figura 4.14(a) lado-a-lado com a taxa de deformação
real apresentada na Figura 4.14(b) calculada pelo aparelho de ecocardiograma. A partir
destas Figuras, é possível perceber a semelhança não entre o formato das curvas, mas
Capítulo 4: Resultados e Discussões 56
também na escala das mesmas.
(a) (b)
Figura 4.14: curvas de taxa deformação, a) estimadas; e b) reais.
É possível perceber, ainda, que as três técnicas (fluxo óptico de Horn e Chunck, de
Lucas e Kanade e estimador NNC) geraram taxas de deformação bem diferentes da taxa
de deformação real. Essas técnicas não conseguem realizar o rastreamento completo dos
pontos gerando valores que produzem curvas extremamente diferentes das curvas geradas
pelas outras técnicas de CB.
Todos os valores de tamanho do segmento da parede miocárdica são utilizados para
gerar curvas de taxa de deformação. para realizar o cálculo da deformação global é
necessário apenas os tamanhos nos quadros onde ocorreram o fim da fase sistólica e o fim
da fase diastólica, tomando-se como base a equação 3.2.
Os valores da deformação global de cada vídeo, calculada por cada técnica, estão
mostrados na Tabela 4.3 juntamente com os valores de referência (REF) e o erro produzido
pela diferença absoluta entre estes valores e os valores obtidos por cada técnica.
Os maiores erros ocorrem, como esperado, com as técnicas de FO HS (Horn-
Schunck), LK (Lucas-Kanade) e o estimador de deslocamento NNC, que não realizam
o rastreamento correto dos pontos na parede do miocárdio. Visando melhorar a compa-
ração do erro entre as outras seis técnicas, os erros são ilustrados no gráfico de barras da
Figura 4.15.
A partir desse gráfico de barras, observa-se que os menores valores de erros ocorrem
com a técnica de FO Piramidal (PIR) seguida dos estimadores CC e SAD. Para diferenciar
os outros estimadores, são calculados os erros médios (µ) de cada técnica para os sete
vídeos junto com seus desvios-padrão (σ) mostrados na Tabela 4.4. A partir desta Tabela,
é possível comprovar que o menor valor de erro médio absoluto ocorre com a técnica
Capítulo 4: Resultados e Discussões 57
Tabela 4.3: resultados e erros de deformação global.
Vídeo 1 Erro Vídeo 2 Erro Vídeo 3 Erro Vídeo 4 Erro
REF -19,1 - -17,8 - -18,1 - 7,9 -
PIR -19,270 0,1698 -17,992 0,1919 -18,250 0,1497 8,6195 0,7195
HS -0,3034 18,797 -1,6746 16,125 1,07590 17,024 0,7234 7,1766
LK 38,1779 19,078 -0,9162 16,884 -7,0808 11,019 16,587 8,6873
SAD -17,641 1,4587 -16,465 1,3348 -19,262 1,1618 9,4921 1,5921
SSD -18,834 0,2661 -16,147 1,6532 -20,032 1,9322 10,276 2,3764
MAE -23,321 4,2210 -16,603 1,1974 -17,524 0,5760 10,031 2,131
NC -15,413 3,6872 -13,839 3,9609 -16,448 1,6519 11,298 3,3981
NNC -49,150 30,050 -42,171 24,371 22,1564 4,0564 31,991 24,0915
CC -17,965 1,1351 -15,973 1,8267 -19,862 1,7623 9,3462 1,4462
Vídeo 5 Erro Vídeo 6 Erro Vídeo 7 Erro
REF -4,9 - -8,5 - -11,3 -
PIR -4,7287 0,1713 -8,6791 0,1791 -9,5743 1,7257
HS 2,89360 2,0064 -4,0591 4,4409 -20,656 9,3557
LK 0,48580 4,4142 4,54160 3,9584 -18,036 6,7357
SAD -4,7315 0,1685 -8,1567 0,3433 -13,949 2,6491
SSD -5,1474 0,2474 -7,1997 1,3003 -12,934 1,6340
MAE -4,5239 0,3761 -6,3085 2,1915 -13,679 2,3787
NC -5,1575 0,2575 -5,5842 2,9158 -15,743 4,4431
NNC -17,968 13,068 -17,908 9,4080 -2,3922 8,9078
CC -5,0660 0,1660 -8,6214 0,1214 -10,655 0,6445
Piramidal, seguida dos estimadores CC, SAD, SSD, MAE e NC. A menor variação também
aconteceu quando empregada a técnica de FO Piramidal, seguida do estimador SAD, CC,
SSD, MAE e NC.
Tabela 4.4: média(µ) e desvio-padrão(σ) do erro de deformação para as nove técnicas
implementadas.
PIR HS LK SAD SSD MAE NC NNC CC
exame10,1698 18,7966 19,0779 1,4587 0,2661 4,2210 3,6872 30,0503 1,1351
exame20,1919 16,1254 16,8838 1,3348 1,6532 1,1974 3,9609 24,3712 1,8267
exame30,1497 17,0241 11,0192 1,1618 1,9322 0,5760 1,6519 4,0564 1,7623
exame40,7195 7,1766 8,6873 1,5921 2,3764 2,1310 3,3981 24,0915 1,4462
exame50,1713 2,0064 4,4142 0,1685 0,2474 0,3761 0,2575 13,0684 0,1660
exame60,1791 4,4409 3,9584 0,3433 1,3003 2,1915 2,9158 9,4080 0,1214
exame71,7257 9,3557 6,7357 2,6491 1,6340 2,3787 4,4431 8,9078 0,6445
µ(%) 0,4724 10,7037 10,1109 1,2440 1,3442 1,8674 2,9021 16,2791 1,0146
σ(%) 0,4287 5,6672 4,7566 0,5881 0,6341 0,9865 1,1128 8,4788 0,6034
Durante a análise dos estimadores de deslocamento é possível verificar que o tamanho
de bloco ideal é dependente da estrutura que se deseja rastrear. Dessa forma, cada técnica
de CB obtém pontos com diferentes tamanhos de blocos, dependendo das estruturas de
cada vídeo. O estimador NNC teve seu tamanho de bloco variado, mas em nenhum dos
casos pôde realizar o acompanhamento dos pontos na parede do miocárdio.
O comportamento do estimador NNC é, de certa forma, esperado devido aos resultados
Capítulo 4: Resultados e Discussões 58
Figura 4.15: erro absoluto entre a deformação global de referência e estimada dentre
as técnicas analisadas.
inconstantes durante a análise com vídeos sintéticas. Os melhores resultados da técnica
Piramidal e do estimador CC também corroboram com a análise sintética, repetindo-se
os melhores resultados.
4.7 Resultados de Esforço Computacional em Exames
Ecocardiográficos
O último parâmetro de análise é o esforço computacional. A técnica de FO Piramidal
e doo estimadores SAD, SSD, MAE, NC e CC são testadas sob a mesma configuração de
hardware e o mesmo sistema computacional de testes. Cada técnica é executada 30 vezes
para cada vídeo e cada tempo de execução é armazenado. Na Tabela 4.5 são mostrados
os tempos médios (µ) de execução e os desvios-padrão (σ), em segundos, para cada caso.
PIR SAD SSD MAE NC CC
µ(s) 1,5186 6,4459 6,1737 6,1517 11,3629 5,2209
σ(s) 0,0698 0,1933 0,1913 0,1336 0,0731 0,1204
Tabela 4.5: média(µ) e desvio-padrão(σ) em segundos do esforço computacional para
cada técnica em relação aos exames médicos.
Finalizando a análise das técnicas, na Tabela 4.5 de esforço computacional percebe-se
a técnica Piramidal como a menos custosa dentre as seis estudadas. Esta ainda possui o
menor desvio-padrão, seguida pelo estimador CC, com quase 1 segundo a menos que os
estimadores SAD, SSD e MAE. o estimador NC é o que exige maior esforço computa-
cional com aproximadamente o dobro do tempo médio dos outros quatro estimadores.
Capítulo 4: Resultados e Discussões 59
Com base no conjunto de resultados das diferentes análises e nas discussões apresenta-
das neste Capítulo, algumas conclusões, contribuições e sugestões para trabalhos futuros
podem ser evidenciadas.
Capítulo 5
Conclusões, Contribuições e Trabalhos
Futuros
Nesta dissertação é realizada uma análise comparativa entre os algoritmos de rastre-
amento de Fluxo Óptico (FO) e Casamento de Blocos(CB). Estes algoritmos são
divididos em três técnicas de FO: Piramidal, técnica de Horn e Schunk, técnica de Lucas
e Kanade; e em oito estimadores de deslocamento de CB: SAD, SSD, MAE, MSE, NNC,
NC, CC e AC.
O processo de análise comparativa é realizado em três situações: em vídeos sintéticos,
vídeos sintéticos de ultrassom e em vídeos reais, obtidos de ecocardiografia. Os vídeos
sintéticos são analisados quanto à trajetória e à deformação em diferentes valores de PSNR
e, para os vídeos sintéticos de ultrassom, com phantoms computacionais. os vídeos
reais são analisados quanto à deformação global e ao esforço computacional.
Na análise da trajetória são aplicadas duas métricas de avaliação das técnicas: corre-
lação média e erro quadrático médio. nas primeiras análises percebe-se que os estima-
dores MAE e MSE produzem resultados iguais em todos os testes. O mesmo ocorre com
os estimadores AC e CC. Desta forma, adota-se apenas um estimador de cada (aqueles
com menores números de operações matemáticas: MAE e CC). Os algoritmos da técnica
de CB são comparados, ainda, variando-se o tamanho do bloco de cada um.
Ainda em relação aos resultados de trajetória obtidos pelos algoritmos usando vídeos
sintéticos normais, os estimadores podem ser organizados em ordem do que possui a tra-
jetória com ordem crescente no valor de correlação: SSD, MAE, SAD, NC, CC e NNC.
Das três técnicas de FO, a abordagem Piramidal obtém uma correlação média aproxi-
madamente igual a 1, ou seja, a trajetória encontrada é praticamente igual à trajetória
original independente da variação de valores da PSNR, seguida pela técnica de Lucas e
60
Capítulo 5: Conclusões, Contribuições e Trabalhos Futuros 61
Kanade e, por último, Horn e Schunck. O erro quadrático médio segue essa mesma ordem
para as técnicas de FO. para os estimadores de CB, os menores erros ocorrem com a
técnica CC.
Analisando o valor de erro entre a deformação dos vídeos sintéticos normais observa-se
que as melhores técnicas das duas abordagens permaneceram as mesmas: CC e Piramidal.
os outros algoritmos variam os resultados entre si. A técnica de Horn e Schunck, por
exemplo, produz erros menores que a técnica de Lucas e Kanade. Entre os estimadores,
o NNC se destaca por possuir comportamento instável durante a variação de valores de
PSNR.
A segunda etapa da análise comparativa é realizada em phantoms computacionais
produzidos pelo software Field II. Na análise de trajetória, onde são avaliadas a correlação
média e o erro quadrático médio, observa-se que, diferentemente do análise em vídeos
sintéticos normais, é necessário blocos de tamanho maiores do que o objeto a ser rastreado.
Para tal, é utilizado tamanho de bloco N= 25 pixels. Em relação à correlação média
entre as técnicas, a que obteve maior desempenho permaneceu a técnica de FO Piramidal,
seguida dos estimadores CC, NC, SAD, MAE, SSD, dos métodos HS, LK e finalizando a
pior técnica como o estimador NNC. Situação semelhante ao resultado de correlação média
entre vídeos sintéticos normais senão fosse o resultado do estimador NNC. Este estimador
foi o único que obteve comportamento diferente entre a análise sintética em vídeos normais
e de ultrassom e isto é devido ao aumento do tamanho de bloco, aumentando também as
possibilidade de casamentos entre blocos.
Ao analisar o erro das trajetórias e o erro da deformação nos vídeos dos phantoms,
percebem-se gráficos semelhantes no tocante às melhor e piores técnicas, mostrando uma
tendência de estabilidade entre as técnicas avaliadas. Para tal, a técnica PIR continua
como a técnica com menor valor de erro, seguido pelo estimador CC. As piores técnicas
também continuam as mesmas: o estimador NNC, seguido pelos métodos de FO HS e
LK.
A terceira análise comparativa é realizada com exames reais de ciclos cardíacos, extraí-
dos de exames de ecocardiografia. Nesta etapa, as técnicas são comparadas todas juntas
sob as mesmas métricas de avaliação: em relação às curvas das taxas de deformação e os
valores dos erros em relação à deformação global do miocárdio. Conclui-se, nesta etapa,
quais técnicas são realmente propícias a serem implementadas em um sistema dedicado
para o estudo da deformação miocárdica.
Os algoritmos de FO de Horn e Chunck e de Lucas e Kanade apresentam resultados
insatisfatórios no rastreamento de pontos específicos. Contudo, podem ser combinadas à
Capítulo 5: Conclusões, Contribuições e Trabalhos Futuros 62
outras abordagens para gerar novas possíveis técnicas. O estimador NNC é o único que não
realiza o rastreamento em vídeos reais de ecocardiografia, independente de qual tamanho
de bloco é utilizado ou qual região do miocárdio é selecionada para o rastreamento.
A abordagem Piramidal e os estimadores SAD, SSD, MAE, NC e AC apresentam
resultados coerentes com o objetivo do trabalho, mostrando-se como técnicas adequadas
para o rastreamento pontual de imagens de ecocardiografia. Ao comparar as técnicas em
relação ao esforço computacional, tem-se como resultado o algoritmo Piramidal produ-
zindo o menor tempo médio, totalizando cerca de 1,5 segundos para rastrear e calcular
a deformação do músculo cardíaco. Os estimadores SAD, SSD e MAE consomem cerca
de 6,3 segundos, o NC 11,3 segundos e o AC 5,2 segundos para fazer o mesmo procedi-
mento. Conclui, desta forma, que o algoritmo Piramidal é a técnica que obtém os melhores
resultados nesta dissertação, considerando o conjunto específico de vídeos usados.
Outra importante conclusão está no tamanho dos blocos que devem ser utilizados.
Conclui-se também que blocos com dimensões maiores que os objetos de estudo produzem
rastreamento com menores erros. Evidenciando-se, desta maneira, a dependência da
técnica de CB em relação ao tamanho da estrutura a ser rastreada.
A partir deste trabalho, outros trabalhos futuros podem ser desenvolvidos. Neste
sentido, são propostos para desenvolvimentos futuros:
utilização de mais exames de ecocardiografia;
diferenciação de exames de pacientes com cardiomiopatias e sadios;
implementação de sistema dedicado para o cálculo da deformação miocárdica;
desenvolvimento de sistema de busca automática por pontos significativos na parede
do miocárdio;
adição de funções para controle de erro.
Referências Bibliográficas
BARBOSA, R. L. et al. A computação do fluxo óptico em imagens obtidas por um
sistema móvel de mapeamento terrestre. Revista Brasileira de Cartografia, v. 57, n. 2, p.
72–78, 2005.
BARROS, A. C. S. Análise Comparativa de Técnicas de Detecção de Movimento e
Rastreamento de Objetos em Vídeo Digital usando Dispositivos Móveis. Dissertação
(Mestrado) Universidade Federal do Ceará, 2009.
BOHS, L. N.; TRAHEY, G. E. A novel method for angle independent ultrasonic imaging
of blood flow and tissue motion. IEEE Transactions on Biomedical Engineering, v. 38,
n. 3, p. 280–286, 1991.
BOUGUET, J.-Y. Pyramidal implementation of the lucas kanade feature tracker:
Description of the algorithm. Intel Corporation Microprocessor Research Labs, 2000.
BURT, P. J.; ADELSON, E. H. The laplacian pyramid as a compact image code. IEEE
Transactions on Communications, v. 31, n. 4, p. 532–540, 1983.
CARMO, P. et al. Terapêutica de ressincronização na miocardiopatia induzida pelo
pacing ventricular direito em doente pediátrico. Revista Portuguesa de Cardiologia, v. 31,
p. 43–47, 2012.
CARVALHO, C. F.; CHAMMAS, M. C.; CERRI, G. G. Princípios físicos do doppler
em ultra-sonografia. Revista Ciência Rural, Scielo, v. 38, p. 872 879, 06 2008. ISSN
0103-8478.
CASTRO, P. et al. Potential pitfalls of strain rate imaging: angle dependency. Biomedical
Sciences Instrumentation, v. 36, p. 197–202, 2000.
CHO, G.-Y. et al. Global 2-dimensional strain as a new prognosticator in patients with
heart failure. Journal of the American College of Cardiology, v. 54, n. 7, p. 618–624,
2009.
63
Referências Bibliográficas 64
CHUNKE, Y.; TERADA, K.; OE, S. Motion analysis of echocardiograph using optical
flow method. IEEE International Conference on Systems, Man and Cybernetics, v. 1, p.
672–677, 1996.
COSTANZO, L. S. Fisiologia. España: Elsevier, 2011.
DECARLO, D.; METAXAS, D. Adjusting shape parameters using model-based optical
flow residuals. IEEE Transactions on Pattern Analysis and Machine Intelligence, IEEE
Computer Society, Washington, DC, USA, v. 24, n. 6, p. 814–823, jun. 2002. ISSN
0162-8828. Disponível em: <http://dx.doi.org/10.1109/TPAMI.2002.1008387>.
DEL CASTILLO, J. M. et al. Deformação miocárdica tangencial (shear strain) em
indivíduos normais: o seu significado. Revista brasileira de ecocardiografia e imagem
cardiovascular, v. 22, n. 4, p. 20–26, 2009.
DEL CASTILLO, J. M.; HERSZKOWICZ, N.; FERREIRA, C. Speckle tracking - a
contratilidade miocárdica em sintonia fina. Revista brasileira de ecocardiografia e imagem
cardiovascular, v. 23, n. 3, p. 46–54, 2010.
D’HOOGE, J. et al. Echocardiographic strain and strain-rate imaging: a new tool to
study regional myocardial function. IEEE Transactions on Medical Imaging, v. 21, n. 9,
p. 1022 –1030, sept. 2002. ISSN 0278-0062.
. Regional strain and strain rate measurements by cardiac ultrasound: Principles,
implementation and limitations. European Journal of Echocardiography, v. 1, n. 3, p. 154
–170, 2000.
EBBINI, E. S. Region-adaptive motion tracking of speckle imagery. IEEE International
Conference on Acoustics, Speech, and Signal Processing, v. 4, p. 2075–2078, 2000.
EDLER, I.; HERTZ, C. H. The use of ultrasonic reflectoscope for the continuous
recording of the movements of heart walls. Kungl Fysiogr Sallsk Lund Forh, Blackwell
Science Ltd, p. 24–40, 1954.
FAHMY, A.; AL-AGAMY, A.; KHALIFA, A. Myocardial segmentation using contour-
constrained optical flow tracking. In: CAMARA, O. et al. (Ed.). Statistical Atlases
and Computational Models of the Heart. Imaging and Modelling Challenges. Toronto,
Canada: Springer Berlin / Heidelberg, 2012, (Lecture Notes in Computer Science,
v. 7085). p. 120–128. ISBN 978-3-642-28325-3.
Referências Bibliográficas 65
FELIX, J. H. S. Sistema de visão computacional para detecção e quantificação de
enfisema pulmonar. Dissertação (Mestrado) Universidade Federal do Ceará, 2007.
FISHER, Y. Fractal Image Compression: Theory and Application. London, UK: Springer,
1994.
FOX, K. et al. The Eae Textbook of Echocardiography. Oxford, NY: OUP Oxford, 2011.
FRIEMEL, B. H.; BOHS, L. N.; TRAHEY, G. E. Relative performance of two-
dimensional speckle-tracking techniques: normalized correlation, non-normalized
correlation and sum-absolute-difference. IEEE Ultrasonics Symposium Proceedings, v. 2,
p. 1481–1484, 1995.
GIACHETTI, A.; CAMPANI, M.; TORRE, V. The use of optical flow for road
navigation. IEEE Transactions on Robotics and Automation, IEEE, v. 14, n. 1, p. 34–48,
1998.
GONZALEZ, R. C.; WOODS, R. E. Digital Image Processing. Upper Saddle River, NJ:
Prentice-Hall, Inc., 2008. ISBN 9780131687288.
GUYTON, A. C.; HALL, J. E. Tratado de Fisiologia Médica. [S.l.]: Elsevier, 2006.
GYAOUROVA, A.; KAMATH, C. Block matching for object tracking. Computer and
Information Science, 2003.
HELLE-VALLE, T. et al. New noninvasive method for assessment of left ventricular
rotation: Speckle tracking echocardiography. Circulation, v. 112, p. 3149–3156, 2005.
HENDEE, W. R.; RITENOUR, E. R. Medical Imaging Physics. Wiley-Liss, 2002.
Disponível em: <http://onlinelibrary.wiley.com/book/10.1002/0471221155>.
HO, C. Y.; SOLOMON, S. D. A clinician’s guide to tissue doppler imaging. Circulation,
v. 113, p. e396–e398, 2006.
HORN, B. K. P.; SCHUNCK, B. G. Determining optical flow. Artificial Iinteligence,
v. 17, p. 185–203, 1981.
INTEL. Open source computer vision library. [S.l.]: Estados Unidos, 2000.
ISAAZ, K. et al. Doppler echocardiographic measurement of low velocity of the left
ventricular posterior wall. American Journal of Cardiology, v. 64, n. 1, p. 66–75, 1989.
Referências Bibliográficas 66
JAIN, J.; JAIN, A. Displacement measurement and its application in interframe image
coding. IEEE Transactions on Communications, v. 29, n. 12, p. 1799–1808, 1981.
JAN, I. Medical Image Processing, Reconstruction and Restoration: Concepts and
Methods. Michigan: CRC Press, 2005. ISBN 9780824758493.
JENSEN, J. A. Field: A program for simulating ultrasound systems. In: 10TH
NORDICBALTIC CONFERENCE ON BIOMEDICAL IMAGING, VOL. 4,
SUPPLEMENT 1, PART 1:351–353. [S.l.: s.n.], 1996. p. 351–353.
JENSEN, J. A.; SVENDSEN, N. B. Calculation of pressure fields from arbitrarily shaped,
apodized, and excited ultrasound transducers. IEEE Transactions on Ultrasonics,
Ferroelectrics and Frequency Control, v. 39(2), p. 262–7, 1992.
JäHNE, B. Digital Image Processing, 5th revised and extended edition. Heidelberg:
Springer, 2002. Disponível em: <http://stacks.iop.org/0957-0233/13/i=9/a=711>.
JOYNER, C. R.; REID, J. M. Applications of ultrasound in cardiology and cardiovascular
physiology. Progress in Cardiovascular Diseases, v. 5, n. 5, p. 482 497, 1963. ISSN
0033-0620.
KOOPMAN, L. P. et al. Comparison between different speckle tracking and color tissue
doppler techniques to measure global and regional myocardial deformation in children.
Journal of the American Society of Echocardiography, v. 23, n. 9, p. 919–928, 2010.
KOSCHAN, A.; RODEHORST, V.; SPILLER, K. Color stereo vision using hierarchical
block matching and active color illumination. In: Proceedings of the 1996 International
Conference on Pattern Recognition (ICPR ’96) Volume I - Volume 7270. Washington,
DC, USA: IEEE Computer Society, 1996. (ICPR ’96), p. 835–. ISBN 0-8186-7282-X.
Disponível em: <http://dl.acm.org/citation.cfm?id=844381.845267>.
KRISHNAMURTHY, R.; MOULIN, P.; WOODS, J. Optical flow techniques applied to
video coding. In: Proceedings of the 1995 International Conference on Image Processing
(Vol. 1). Washington, DC, USA: IEEE Computer Society, 1995. (ICIP ’95), p. 570–. ISBN
0-8186-7310-9. Disponível em: <http://dl.acm.org/citation.cfm?id=839282.841037>.
LANGELAND, S. et al. Comparison of time-domain displacement estimators for
two-dimensional rf tracking. Ultrasound in Medicine & Biology, v. 29, n. 8, p. 1177–1186,
2003.
Referências Bibliográficas 67
LUCAS, B. D.; KANADE, T. An iterative image registration technique with an
application to stereo vision. In: International Joint Conference on Artificial Intelligence.
San Mateo, CA: [s.n.], 1981.
LUKCAC, R.; PLATANIOTIS, K. N. Color Image Processing: Methods and Applications.
Boca Raton, FL: CRC Press / Taylor & Francis, 2006.
MAILLOUX, G. E. et al. Computer analysis of heart motion from two-dimensional
echocardiograms. IEEE Transactions on Biomedical Engineering, v. 34, p. 356–364, 1987.
. Restoration of the velocity field of the heart from two-dimensional
echocardiograms. IEEE Transactions on Medical Imaging, v. 8, p. 143–153, 1989.
MALPICA, N. et al. Tracking of regions-of-interest in myocardial contrast
echocardiography. Ultrasound in Medicine and Biology, v. 30, p. 303–309, 2004.
MARWICK, T. H.; YU, C.-M.; SUN, J. P. Myocardial Imaging: Tissue Doppler and
Speckle Tracking. Malden, Massachusetts: Wiley-Blackwell, 2007.
MIKIC, I.; KRUCINSKI, S.; THOMAS, J. D. Segmentation and tracking in
echocardiographic sequences: Active contours guided by optical flow estimates. IEEE
Transactions on Medical Imaging, v. 17, p. 274–284, 1998.
MIRSKY, I.; GHISTA, D. N.; SANDLER, H. Cardiac Mechanics: Physiological, Clinical
and Mathematical Considerations. Hoboken, New Jersey: John Wiley & Sons Ltd, 1974.
MIRSKY, I.; PARMLEY, W. W. Assessment of passive elastic stiffness for isolated heart
muscle and the intact heart. Circulation, v. 33, p. 233–243, 1973.
OMS. Fact sheet N317. Janeiro 2011. Disponível em:
<http://www.who.int/mediacentre/factsheets/fs317/en/index.html>.
OTTO, C. M. Textbook of clinical echocardiography. Philadelphia, PA: Elsevier, 2004.
PERK, G.; TUNICK, P. A.; KRONZON, I. Non-doppler two-dimensional strain imaging
by echocardiography from technical considerations to clinical applications. Journal of the
American Society of Echocardiography, v. 20, n. 3, p. 234–43, 2007.
RATH, G. B.; MAKUR, A. A backward segmented-block matching algorithm for
video compression. Signal Process., Elsevier North-Holland, Inc., Amsterdam, The
Netherlands, v. 70, n. 1, p. 75–79, out. 1998. ISSN 0165-1684. Disponível em:
<http://dx.doi.org/10.1016/S0165-1684(98)00155-8>.
Referências Bibliográficas 68
REISNER, S. A. et al. Global longitudinal strain: a novel index of left ventricular
systolic function. Journal of the American Society of Echocardiography, v. 17, n. 6, p.
630–633, 2004.
SILVA, C. et al. Doppler tecidual, tissue tracking, strain rate e strain. para que serve isso
tudo? Revista Brasileira de Ecocardiografia, v. 19, p. 79–81, 2002.
SILVA, C. E. S. et al. Avaliação da contratilidade segmentar na doença de chagas
utilizando a integral do gradiente intramiocárdico de velocidade (strain miocárdico)
obtida pela ecocardiografia com doppler tecidual. Arquivos Brasileiros de Cardiologia,
scielo, v. 84, p. 285 291, 04 2005. ISSN 0066-782X.
. Normatização dos equipamentos e técnicas de exame para realização de exames
ecocardiográficos. Arquivos Brasileiros de Cardiologia, scielo, v. 82, p. 1 10, 00 2004.
ISSN 0066-782X.
TESKE, A. et al. Echocardiographic quantification of myocardial function using tissue
deformation imaging, a guide to image acquisition and analysis using tissue doppler and
speckle tracking. Cardiovascular Ultrasound, v. 5, n. 1, p. 27, 2007. ISSN 1476-7120.
Disponível em: <http://www.cardiovascularultrasound.com/content/5/1/27>.
TORRENT-GUASP, F. Structure and function of the heart. Revista Espanola de
Cardiologia, v. 51(2), p. 91–102, 1998.
TORRENT-GUASP, F. et al. Systolic ventricular filling. European Journal of
Cardiothoracic Surgery, v. 25(3), p. 376–86, 2004.
TRAHEY, G. E.; ALLISON, J. W.; RAMM, O. T. V. Angle independent ultrasonic
detection of blood flow. IEEE Transactions on Biomedical Engineering, v. 34, n. 12, p.
965–7, 1987.
VERONESI, F. et al. Tracking of left ventricular long axis from real-time three-
dimensional echocardiography using optical flow techniques. IEEE Transactions on
Information Technology in Biomedicine, v. 10, p. 174–181, 2006.
VIOLA, F.; WALKER, W. F. A comparison of the performance of time-delay estimators
in medical ultrasound. IEEE Transactions on Ultrasonics, Ferroelectrics and Frequency
Control, v. 50, n. 4, p. 392–401, 2003.
Referências Bibliográficas 69
WALKER, W. F. et al. Real-time imaging of tissue vibration using a two-dimensional
speckle tracking system. IEEE Ultrasonics Symposium Proceedings, v. 2, p. 873–877,
1993.
YAACOBI, M.; LIEL-COHEN, N.; GUTERMAN, H. Simultaneous left atrium volume
tracking from echocardiographic movies. In: Electrical and Electronics Engineers in
Israel, 2008. IEEEI 2008. IEEE 25th Convention of. Israel: [s.n.], 2008. p. 403 –407.
YAMATO, R. J. Avaliação ecocardiográfica com Doppler tecidual, Strain Rate e Strain de
cães da raça Golden Retriever com distrofia muscular (GRMD). Dissertação (Mestrado)
Universidade de São Paulo, 2008.
YANG, X.; MURASE, K. A multi-scale phase-based optical flow method for motion
tracking of left ventricle. In: Bioinformatics and Biomedical Engineering (iCBBE), 2010
4th International Conference on. Chengdu, China: [s.n.], 2010. p. 1 –4. ISSN 2151-7614.
YILMAZ, A.; JAVED, O.; SHAH, M. Object tracking: A survey. ACM Comput. Surv.,
ACM, New York, NY, USA, v. 38, n. 4, dez. 2006. ISSN 0360-0300. Disponível em:
<http://doi.acm.org/10.1145/1177352.1177355>.
ZAMORANO, J. L.; FERNáNDEZ, M. A. G.; KAUL, S. Contrast Echocardiography in
Clinical Practice. Milan: Springer, 2004.
ZITNICK, C. L.; JOJIC, N.; KANG, S. B. Consistent segmentation for optical
flow estimation. In: Proceedings of the Tenth IEEE International Conference
on Computer Vision - Volume 2. Washington, DC, USA: IEEE Computer
Society, 2005. (ICCV ’05), p. 1308–1315. ISBN 0-7695-2334-X-02. Disponível em:
<http://dx.doi.org/10.1109/ICCV.2005.61>.
Apêndice A
Modos de imagens ecocardiográficas
As imagens extraídas a partir dos ecos de sinais ultrassônicos podem ser apresentadas
basicamente em três modalidades: Modo B (bidimensional / brilho), Modo M (movi-
mento) e Doppler (OTTO, 2004; COSTANZO, 2011).
Modo B: Também conhecida como modo “brilho” (brightness) ou modo “bidimensi-
onal”. Este modo se baseia no princípio físico do ultrassom que forma uma imagem
em duas dimensões a partir do eco de sinais ultrassônicos. Esta imagem gerada
é observada em um monitor no qual é possível extrair informações a respeito da
anatomia cardíaca, tais como a localização dos átrios, dos ventrículos, das valvas
cardíacas e do movimento das estruturas durante a sístole e diástole cardíaca. Esta
modalidade auxilia de forma significativa no estudo do coração. Um exemplo de
uma imagem ecocardiográfica em modo B é ilustrado na Figura A.1.
Figura A.1: exemplo de imagem em modo B.
70
APÊNDICE A. MODOS DE IMAGENS ECOCARDIOGRÁFICAS 71
Modo M: Também conhecido como modo de “movimento”, é a modalidade que
avalia o movimento das valvas e paredes cardíacas para obtenção de medidas das
câmeras e grandes vasos da base do coração. Imagens no modo M são obtidas pelo
mesmo princípio do modo B e permitem uma análise precisa de forma quantitativa.
Contudo, imagens desse tipo possuem uma única dimensão e são obtidas por um
transdutor mantido em uma posição fixa numa linha reta imaginária que pode ser
posicionada sobre a região ou estrutura cardíaca que se deseja avaliar (YAMATO,
2008). O gráfico obtido por este transdutor possui a velocidade de movimento das
estruturas no eixo X e a profundidade da distância entre a estrutura cardíaca e o
transdutor no eixo Y. Esta configuração está ilustrada na Figura A.2.
Figura A.2: exemplo de imagem em modo M (CARMO et al., 2012).
Modo Doppler : Esta modalidade se baseia no princípio do efeito Doppler e per-
mite a avaliação das funções cardíacas através da análise da direção e da velocidade
do fluxo sanguíneo dos grandes vasos através das valvas cardíacas. Nas imagens
em modo Doppler, existe uma linha base que representa o transdutor. Quando a
frequência Doppler é positiva, é formado um espectro acima dessa linha base (re-
presentando o fluxo na direção do transdutor). Quando a frequência Doppler é
negativa, é formado um espectro abaixo da linha base (representando o fluxo na
direção contrária ao transdutor). Esse tipo de imagem pode ser visto na Figura
A.3.
APÊNDICE A. MODOS DE IMAGENS ECOCARDIOGRÁFICAS 72
Figura A.3: exemplo de imagem em modo Doppler.
Apêndice B
Planos e janelas de cortes
O coração localiza-se na cavidade torácica atrás do osso externo e acima do músculo
do diafragma. Sua maior porção encontra-se à esquerda do tórax na região conhecida
como mediastino médio. As imagens do coração (ecocardiográficas) são obtidas por cor-
tes padronizados chamados de janelas ecocardiográficas. São regiões onde se obtém as
imagens de melhor qualidade para avaliação funcional e estrutural do músculo cardíaco.
As janelas ecocardiográficas, ilustradas na Figura B.1, são: supraesternal, paraes-
ternal, apical, subcostal. Cada janela é dividida por meio da variação da posição do
transdutor através de movimentos de modo que a imagem cardíaca se estabelece para o
entendimento do examinador.
Figura B.1: localização das janelas ecocardiográficas: 1) supraesternal; 2) paraester-
nal; 3) apical e 4) subcostal.
Os planos de cortes recomendados na ecocardiografia bidimensional transtorácica são
baseados nos ângulos em que o feixe do ultrassom incide no coração. Esse planos estão
ilustrados na Figura B.2 e são:
plano longitudinal: plano de corte perpendicular à parede torácica e paralelo ao eixo
73
APÊNDICE B. PLANOS E JANELAS DE CORTES 74
longo do coração, numa linha imaginária que, geralmente, une o ombro direito ao
flanco esquerdo no paciente normolíneo;
plano transversal (eixo curto): plano de corte perpendicular à parede torácica e ao
plano longitudinal;
plano sagital: plano de corte aproximadamente paralelo à parede torácica e perpen-
dicular aos planos longitudinal e transversal
Figura B.2: planos ecocardiográficos: longitudinal, transversal e sagital.
De acordo com Silva et al. (2004), a nomeclatura dos diversos tipos de corte deve
incluir não a localização do transdutor mas também o plano de corte. Os cortes
transtorácicos são divididos de acordo com sua janela ecocardiográfica: paraesternais,
apicais, supraesternais e subcostais.
Os planos de cortes paraesternais, mostrados na Figura B.3(a), se dividem em lon-
gitudinal e transversal. Nos planos de cortes paraesternais longitudinal (eixo longo) e
transversal (eixo curto). No corte paraesternal longitudinal, o ápex aparece à esquerda e
a aorta à direita do monitor (A). No corte paraesternal ao nível dos músculos papilares,
o septo anterior aparece na parte superior do monitor, o músculo papilar póstero-medial
à esquerda e o ântero-lateral à direita, enquanto que a parede posterior do VE, na região
inferior do monitor (B). No corte paraesternal transversal ao nível da válvula aórtica, o
tronco pulmonar fica à direita e a válvula tricúspide, à esquerda do monitor (C).
os cortes apicais podem ser de duas, quatro ou cinco câmaras, como pode ser visto
na Figura B.3(b), e mostram o ápex cardíaco na parte superior do monitor (câmaras
APÊNDICE B. PLANOS E JANELAS DE CORTES 75
ventriculares) e a base na parte inferior (câmaras atriais).
Os cortes supraesternais mostrados na Figura B.4(a), assim como os cortes paraes-
ternais, se dividem em longitudinal e transversal. O corte no plano longitudinal (A)
mostra o plano em relação à aorta torácica. Nesse corte, o arco aórtico está localizado
superiormente no monitor, enquanto que a aorta ascendente fica a esquerda e o início da
descendente, à direita. No eixo transversal (B), com uma rotação anti-horária de, aproxi-
madamente, 90, pode-se observar a aorta transversalmente, o tronco pulmonar à direita
do monitor, a veia cava superior e a bifurcação da artéria pulmonar direita, à esquerda
do monitor.
Por fim, os cortes subcostais são obtidos com o índex (recomenda-se que todo aparelho
de ecocardiografia bidimensional tenha uma marcação como índex, o qual deve indicar
a borda do plano de imagem à direita do monitor) voltado para a esquerda do paciente.
Nesta imagem, o ventrículo direito fica na região superior do transdutor, o ventrículo
esquerdo aparece na região inferior e à direita e o átrio esquerdo, na região inferior e à
esquerda. Quando o corte é obtido ao nível dos músculos papilares, o ventrículo direito
aparece na parte superior do monitor, sendo que a parede posterior do ventrículo esquerdo
é visualizada na região inferior e à esquerda, o músculo papilar ântero-lateral, na região
inferior e à direita e a parede anterior do ventrículo esquerdo, à direita do monitor.
Mediante o corte dos átrios (Figura B.4(b)), são visualizados apenas as câmaras atriais,
estando o átrio direito na parte superior e o esquerdo, na inferior.
APÊNDICE B. PLANOS E JANELAS DE CORTES 76
(a) (b)
Figura B.3: (a) Cortes paraesternais e (b) cortes apicais (SILVA et al., 2004)
(a) (b)
Figura B.4: (a) Cortes supraesternais e (b) corte subapical (SILVA et al., 2004)
Apêndice C
Estimador de Correlação
Não-Normalizada
Durante a análise sintética dos estimadores de deslocamento da técnica de Casamento
de Blocos, verifica-se um comportamento peculiar com o estimador de Correlação Não-
Normalizada (NNC). Na presença de elevada quantidade de ruído este estimador obtém
um determinado comportamento parecido com os outros estimadores.
Era de se esperar que o mesmo estimador mantivesse o comportamento na presença
de níveis menores de ruído. Acontece o contrário, com baixa quantidade de ruído o
estimador NNC apresenta erros consideráveis em relação às demais técnicas. Visando
apurar o porquê desse comportamento, este algoritmo foi analisado separadamente e aqui
descrito.
A análise é feita mediante quadros do vídeo sintético com PSNR = . Um bloco
é definido sobre um objeto e este objeto é rastreado ao longo dos quadros buscando a
melhor correspondência baseado na equação
fnnc(x, y) = X
(i,j)
[I0(x+i, y +j)×I1(x+i+u, y +j+w)] .(C.1)
O menor valor da função fnnc entre o bloco original, que está mostrado na Figura
C.1(a), ocorre com a correspondência 1, ilustrada pela Figura C.1(b), quando, na verdade,
deveria ocorrer com o próprio bloco original. Ou seja, a Figura C.1(b) é mais parecida com
a Figura C.1(a) do que a Figura C.1(a) com ela mesma. Desta maneira, a correspondência
1 é utilizada como bloco referência para ser procurado no quadro seguinte.
Esse comportamento é devido à sua formulação matemática que nada mais é do que o
somatório do produto dos pixels dos blocos. Ou seja, a função pode ser representada pela
77
APÊNDICE C. ESTIMADOR DE CORRELAÇÃO NÃO-NORMALIZADA 78
união dos blocos de referência e os blocos que representam as melhores correspondências.
(a) (b)
Figura C.1: a) bloco original; e b) melhor correspondência com o bloco original.
É por esse motivo que o estimador NNC tem comportamento inconstante, pois existem
duas situações que produzem o mesmo resultado. A cada quadro essas situações variam
entre si e, por sua vez, o ponto de rastreamento também varia. Essas duas situações
ocorrem quando a melhor correspondência ocorre na parte de cima (Situação 2) e a parte
de baixo (Situação 1) do bloco original (que contém o objeto a ser rastreado) e são
ilustradas na Figura C.2.
Figura C.2: duas situações diferentes com valores de correspondências de NNC
iguais.
Dessa maneira, o rastreamento por esse estimador torna-se inconstante e impreciso,
independente do nível de ruído apresentado na cena.
ResearchGate has not been able to resolve any citations for this publication.
Article
Full-text available
Em um sistema móvel de mapeamento terrestre (SMMT), o posicionamento é obtido por processamento do sinal GPS. Entretanto, pode ocorrer a perda do sinal por conta da obstrução causada por construções ou vegetação, por exemplo. Há sistemas de mapeamento móvel que possuem um sensor inercial também para orientar as imagens. Tanto o posicionamento quanto a orientação (atitude) podem resultar degradados devido à deriva do mecanismo inercial causada pelo acúmulo de erros durante o intervalo de tempo que perdurar a falta de recepção do sinal GPS. As imagens de um SMMT obtidas durante a ausência dos sinais GPS ficam então mal orientadas. Uma alternativa para orientar as imagens, quando não se têm o posicionamento e a orientação dados por sensores externos, é a utilização das informações sobre o movimento interno das imagens, através do fluxo óptico binocular. Este trabalho apresenta a computação do fluxo óptico pelo método diferencial no contexto de um SMMT, com vários testes combinando-se a quantidade de imagens de uma seqüência com a variável de regularização do fluxo óptico para determinar as configurações que devem ser utilizadas com este tipo de imagem. Em trabalhos futuros, espera-se que o fluxo óptico possa, combinado com técnicas fotogramétricas e de navegação, contribuir com a automação do caminhamento fotogramétrico, baseando-se apenas nas imagens.
Article
Full-text available
Models which describe road traffic patterns can be helpful in detection and/or prevention of uncommon and dangerous situations. Such models can be built by the use of motion detection algorithms applied to video data. Block matching is a standard technique for encoding motion in video compression algorithms. We explored the capabilities of the block matching algorithm when applied for object tracking. The goal of our experiments is two-fold: (1) to explore the abilities of the block matching algorithm on low resolution and low frame rate video and (2) to improve the motion detection performance by the use of different search techniques during the process of block matching. Our experiments showed that the block matching algorithm yields good object tracking results and can be used with high success on low resolution and low frame rate video data. We observed that different searching methods have small effect on the final results. In addition, we proposed a technique based on frame history, which successfully overcame false motion caused by small camera movements.
Book
It is essential that differently oriented specialists and students involved in image processing have a firm grasp of the necessary concepts and principles. A single-source reference that can provide this foundation, as well as a thorough explanation of the techniques involved, particularly those found in medical image processing, would be an invaluable resource to have. Medical Image Processing, Reconstruction and Restoration: Concepts and Methods is that resource. It not only explains the general principles and methods of image processing, but also focuses on recent applications specific to medical imaging - providing a theoretical yet clear explanation of underlying generic concepts. The content of this book is divided into three parts: ∂ Part I, Images as Multidimensional Signals, provides the introduction to basic image processing theory, explaining it for both analogue and digital image representation. ∂ Part II, Imaging Systems as Data Sources, offers an alternative view on imaging modalities, with emphasis placed on analyzing internal signals and (pre)image data that are consequently processed. ∂ Part III, Image Processing and Analysis, focuses on such vital image processing topics as tomographic image reconstruction, image fusion, methods of image enhancement, and image restoration techniques. This section also explains concepts of fundamental-level image analysis - detailing local feature analysis, image segmentation, and generalized morphological transforms. It also addresses what is needed within the image processing environment by noting necessary hardware and software and processes for image archiving and communications.
Article
Left ventricular (LV) function evaluation is an integral part of every echocardiographic examination of the heart. Left atrial (LA) evaluation provides valuable clinical information that can contribute greatly to LV function evaluation. An automatic method for simultaneous tracking of LV and LA volumes through cardiac cycle is presented. The proposed method provides an extended framework for LV function analysis.
Article
We sought to evaluate whether global 2-dimensional (2D) strain offers additional benefit over left ventricular ejection fraction (LVEF) to predict clinical events in heart failure. Although 2D strain based on speckle tracking has been proposed as a simple and reproducible tool to detect systolic dysfunction, the relationship of 2D strain and prognosis has not been studied. Two hundred one patients (age 63 +/- 11 years, 34% female, LVEF 34 +/- 13%) hospitalized for acute heart failure underwent clinical evaluation and conventional and tissue Doppler echocardiography. Using dedicated software, we measured the global longitudinal strain (GLS) in apical 4- and 2-chamber views and the global circumferential strain (GCS) in a parasternal short-axis view. Cardiac events were defined as readmission for heart failure or cardiac death. There were 23.4% clinical events during 39 +/- 17 months of follow-up. In univariate analysis, age, left atrial volume, left ventricular volume, LVEF, ratio of early transmitral flow to early diastolic annular velocity (E/e'), and both GLS and GCS were predictive of cardiac events. In multivariate Cox models, age (hazard ratio [HR]: 1.06, 95% confidence interval [CI]: 1.01 to 1.10, p = 0.017) and GCS (HR: 1.15, 95% CI: 1.04 to 1.28; p = 0.006) were independently associated with cardiac events. By Cox proportional hazards model, the addition of GCS markedly improved the prognostic utility of a model containing ejection fraction, E/e', and GLS. GCS is a powerful predictor of cardiac events and appears to be a better parameter than ejection fraction in patients with acute heart failure.
Article
W shall describe a new technique for removing image correlation which combines features of predictive and trans- form methods. The technique is noncausal, yet computations are relatively simple and local. The predicted value for each pixel i s computed as a local weighted average, using a unimodal Gaussian-like (or related trimodal) weighting function centered on the pixel itself. T h e predicted values for all pixels are first obtained by convolving this weighting function with the image. The result is a low- pass filtered image which is then subtracted from the original. Let g 0 ( ij) be the original image, and g 1