Technical ReportPDF Available

AVALIAÇÃO DA FUNCIONALIDADE DE SOFTWARE DE MODELOS NUMÉRICOS DE ESCALA GLOBAL PARA O PROJETO MONAN -PARTE I: ANÁLISE QUALITATIVA, QUANTITATIVA E MULTIVARIADA

Authors:
sid.inpe.br/mtc-m21d/2024/02.28.19.16-NTC
AVALIAÇÃO DA FUNCIONALIDADE DE SOFTWARE
DE MODELOS NUMÉRICOS DE ESCALA GLOBAL
PARA O PROJETO MONAN PARTE I: ANÁLISE
QUALITATIVA, QUANTITATIVA E MULTIVARIADA
Ariane Frassoni
Julio Pablo Fernandez
Marcelo Barbio Rosa
José Roberto Rozante
Bárbara Alessandra Gonçalves Pinheiro Yamada
Relatório referente ao Trabalho de
Definição do Núcleo Dinâmico do
MONAN-Atmosférico
URL do documento original:
<http://urlib.net/8JMKD3MGP3W34T/4AR4SDS>
INPE
São José dos Campos
2024
PUBLICADO POR:
Instituto Nacional de Pesquisas Espaciais - INPE
Coordenação de Ensino, Pesquisa e Extensão (COEPE)
Divisão de Biblioteca (DIBIB)
CEP 12.227-010
São José dos Campos - SP - Brasil
Tel.:(012) 3208-6923/7348
E-mail: pubtc@inpe.br
CONSELHO DE EDITORAÇÃO E PRESERVAÇÃO DA PRODUÇÃO
INTELECTUAL DO INPE - CEPPII (PORTARIA No176/2018/SEI-
INPE):
Presidente:
Dra. Marley Cavalcante de Lima Moscati - Coordenação-Geral de Ciências da Terra
(CGCT)
Membros:
Dra. Ieda Del Arco Sanches - Conselho de Pós-Graduação (CPG)
Dr. Evandro Marconi Rocco - Coordenação-Geral de Engenharia, Tecnologia e
Ciência Espaciais (CGCE)
Dr. Rafael Duarte Coelho dos Santos - Coordenação-Geral de Infraestrutura e
Pesquisas Aplicadas (CGIP)
Simone Angélica Del Ducca Barbedo - Divisão de Biblioteca (DIBIB)
BIBLIOTECA DIGITAL:
Dr. Gerald Jean Francis Banon
Clayton Martins Pereira - Divisão de Biblioteca (DIBIB)
REVISÃO E NORMALIZAÇÃO DOCUMENTÁRIA:
Simone Angélica Del Ducca Barbedo - Divisão de Biblioteca (DIBIB)
André Luis Dias Fernandes - Divisão de Biblioteca (DIBIB)
EDITORAÇÃO ELETRÔNICA:
Ivone Martins - Divisão de Biblioteca (DIBIB)
André Luis Dias Fernandes - Divisão de Biblioteca (DIBIB)
sid.inpe.br/mtc-m21d/2024/02.28.19.16-NTC
AVALIAÇÃO DA FUNCIONALIDADE DE SOFTWARE
DE MODELOS NUMÉRICOS DE ESCALA GLOBAL
PARA O PROJETO MONAN PARTE I: ANÁLISE
QUALITATIVA, QUANTITATIVA E MULTIVARIADA
Ariane Frassoni
Julio Pablo Fernandez
Marcelo Barbio Rosa
José Roberto Rozante
Bárbara Alessandra Gonçalves Pinheiro Yamada
Relatório referente ao Trabalho de
Definição do Núcleo Dinâmico do
MONAN-Atmosférico
URL do documento original:
<http://urlib.net/8JMKD3MGP3W34T/4AR4SDS>
INPE
São José dos Campos
2024
Esta obra foi licenciada sob uma Licença Creative Commons Atribuição-NãoComercial 3.0 Não
Adaptada.
This work is licensed under a Creative Commons Attribution-NonCommercial 3.0 Unported Li-
cense.
Informar aqui sobre marca registrada (a modificação desta linha deve ser feita no arquivo publica-
cao.tex).
Informar aqui sobre fontes financiadoras (a modificação desta linha deve ser feita no arquivo pu-
blicacao.tex).
AGRADECIMENTOS
Agradecemos ao Dr. José Roberto Garcia por ter contribuído com o presente traba-
lho por meio da obtenção e organização dos dados de reanálise do ERA5.
RESUMO
O Instituto Nacional de Pesquisas Espaciais (INPE) tem como uma de suas missões
desenvolver novas soluções tecnológicas para reduzir os danos associados à ocorrên-
cia de eventos climáticos e ambientais extremos. Uma nova iniciativa busca envolver
a academia, os setores privado e público, entre eles tomadores de decisão e agên-
cias meteorológicas regionais para apoiar a transformação de conhecimento científico
e tecnológico em melhores produtos e serviços derivados de modelagem numérica.
Como meta, tem-se o desenvolvimento de um modelo comunitário do Sistema Ter-
restre - o Model for Ocean-laNd-Atmosphere predictioN (MONAN). O INPE lidera o
desenvolvimento do MONAN, que produzirá previsões operacionais adaptadas para
a América do Sul, fornecendo informações climáticas em diferentes escalas espaciais
e temporais. Para desenvolver um modelo do Sistema Terrestre de última geração, é
necessário o uso de novas técnicas em computação de alto desempenho, um núcleo
dinâmico de última geração e a análise de toda a gama de dados ambientais dis-
poníveis. Portanto, será necessário empregadar técnicas inovadoras em Inteligência
Artificial (IA) e análise de dados, oferecendo oportunidades de pesquisa e inova-
ção ao longo do fluxo de trabalho com o MONAN. O primeiro passo na construção
do novo sistema envolve a escolha de um núcleo dinâmico não-hidrostático que in-
corporará códigos de parametrizações físicas adaptadas às características climáticas
sul-americanas, que podem ser derivados de sistemas de modelagem existentes atual-
mente em operação ou adaptados de outros modelos numéricos. O presente trabalho
tem por objetivo descrever o primeiro passo na construção do MONAN, que con-
siste na avaliação dos principais modelos numéricos de escala global de código aberto
ii
disponíveis gratuitamente e que fazem parte da nova geração de modelos, visando
a escolha da sua componente atmosférica. Busca-se melhor entender as principais
características dos modelos analisados, seus pontos favoráveis e limitações quanto
à simulação das características meteorológicas sul-americanas. Dentre os modelos
avaliados quanto à qualidade de software, apenas o SHiELD/FV3 e MPAS se mos-
traram aptos a fornecer um núcleo dinâmico hidrostático para a composição da
componente atmosférica do MONAN. Estas duas ferramentas compõem o estado-
da-arte em modelagem dos processos físicos e dinâmicos da atmosfera. Verificou-se
que ambos os modelos são preparados para o acoplamento com outros componentes
do Sistema Terrestre e com um sistema de assimilação de dados. O SHiELD leva
vantagem por ser um modelo cujo núcleo dinâmico é utilizado em modo operacional
nos Estados Unidos, e diversas funcionalidades são preparadas para o ambiente
operacional. Por outro lado, a interação com a equipe de desenvolvimento do MPAS
é um ponto positivo e importante a se levar em consideração, uma vez que facilita
o intercâmbio do conhecimento e resolução de problemas de aspecto técnico no uso
do modelo em ambiente operacional. Em termos quantitativos, o SHiELD e MPAS
também apresentam destreza semelhante. ambos os modelos mostram um limite de
previsibilidade de até 8 dias para o domínio global nos Hemisférios Norte e Sul. O
uso de diferentes condições iniciais para o processo de inicialização do FV3-SHiELD
indicou ligeiras diferenças e desempenho superior das reanálises do ERA5.
Palavras-chave: Avaliação de modelos. Modelos globais. MONAN. Previsão Numé-
rica de Tempo. Verificação de previsões numéricas.
SOFTWARE QUALITY EVALUATION OF NUMERICAL GLOBAL
MODELS FOR THE MONAN PROJECT PART I: QUALITATIVE,
QUANTITATIVE, AND MULTIVARIATE ANALYSIS
ABSTRACT
The National Institute for Space Research (INPE) aims to develop new technological
solutions to mitigate the impacts of high-impact weather and environmental events
through a National Program for Research, Development, and Innovation. The initia-
tive seeks to engage academia, private and public sectors, including decision-makers
and regional meteorological agencies, to support the transfer of scientific and tech-
nological knowledge into products and services derived from numerical modeling.
The focus of the initiative relies on the development of a unified community-based
Earth system model the Model for Ocean-laNd-Atmosphere predictioN (MONAN).
INPE, in collaboration with national and international partners, leads the initiative
to develop MONAN, that will provide operational predictions tailored for South
America, providing climate information at different spatial and temporal scales.
To develop a state-of-the-art Earth System model, it is necessary to leverage new
techniques in high-performance computing, physical and biogeochemical processes,
a cutting-edge dynamical core, and advance in the application of available envi-
ronmental data. This means that MONAN will employ innovative techniques in
iii
Artificial Intelligence (AI), Machine Learning (ML), and data analysis, offering re-
search and innovation opportunities throughout the numerical prediction workflow.
The initial step towards the development of MONAN involves selecting a dynamical
core that incorporates physical parameterization codes tailored to South American
climatic characteristics. These codes can be derived from existing modeling systems
currently in operation or adapted from other numerical models. This work aims to
describe the efforts undertaken to evaluate the main open-source numerical global
models freely available, which are part of the new generation of global modeling
systems, to select the atmospheric component for MONAN. This work facilitates a
better understanding of the key features, strengths, and limitations of the analyzed
models concerning the simulation of the South American atmosphere. Among the
models assessed concerning software quality, only SHiELD/FV3 and MPAS proved
to be capable of providing a hydrostatic dynamical core for the composition of the
atmospheric component of MONAN. These two tools represent the state-of-the-art
in modeling the physical and dynamical processes of the atmosphere. It was found
that both models are prepared to be coupled to other components of the Earth
System and with a data assimilation system. SHiELD has an advantage as its dy-
namical core is operational in the United States, and various functionalities are
already prepared for operational environment. On the other hand, the interaction
with the MPAS development team is a positive and important aspect to consider,
as it facilitates the exchange of knowledge and the resolution of technical issues
in using the model in operations. The objective evaluation indicated SHiELD and
MPAS with comparable skill. Both models have a predictability limit of up to 8
days for the global domain in the Northern and Southern Hemispheres. The use of
different initial conditions for the initialization process of FV3-SHiELD indicated
slight differences and superior performance when initialized with ERA5 reanalyses.
Keywords: Model evaluation. Global models. MONAN. Numerical Weather Predic-
tion. Forecast verification.
iv
LISTA DE FIGURAS
Pág.
3.1 Áreas para avaliação da precipitação sobre a América do Sul ....... 13
4.1 Diagrama de desempenho para as previsões de precipitação de a) 24h b)
36h, c) 48h, d) 60h, e) 120h (132h) e f) 240h. As esferas representam os
diferentes limiares de precipitação: 0,5mm, 2mm, 5mm, 10mm, 15mm,
20mm, 35mm, sendo a cor vermelha representativa do modelo MPAS e
preto, do modelo SHiELD. .......................... 30
4.2 Idem à Figura 4.1, exceto para a área B5 .................. 31
4.3 Idem à Figura 4.1, exceto para a área B1 .................. 32
4.4 Métricas das sub-características da Manutenibilidade com os modelos
FV3, GEF e MPAS. ............................. 33
4.5 Series temporais da ACC do geopotencial a 500 hPa dos modelos MPAS
(vermelho) e SHiELD (azul), para o Hemisfério Norte (painel superior),
trópicos (médio) e Hemisfério Sul (painel inferior). Previsões de 120 h (5
dias) para o período de junho 2021 a maio 2022 (74 casos). ........ 34
4.6 Distância de MH para o MPAS e FV3 e diferença normalizada (DifMH)
para os prazos de previsão de 24h (a), 48h (b), 72h (c), 120h (d) e 240h (e) 35
4.7 Idem que a Figura 4.6 mas para os meses de verão austral sobre a América
do Sul. ..................................... 36
4.8 Idem que a Figura 4.7 mas para os meses de inverno austral sobre a
América do Sul. ................................ 37
LISTA DE TABELAS
Pág.
2.1 Subcaracterísticas de Funcionalidade (pergunta chave: Satisfaz a neces-
sidade do projeto MONAN?). ........................ 5
3.1 Características dos modelos e das integrações numéricas realizadas. wall-
clock time - tempo de processamento para 24h de previsão ........ 12
3.2 Parametrizações físicas dos modelos SHiELD e MPAS ........... 12
4.1 Pontuações atribuídas às métricas de avaliação da qualidade de software. 18
4.2 Pontuações atribuídas às métricas de avaliação da qualidade de software. 18
v
4.3 Pontuações atribuídas às métricas de avaliação da qualidade de software. 19
4.4 Pontuação total atribuída às métricas de avaliação da qualidade de soft-
ware. ...................................... 19
4.5 Comportamento dos índices para as previsões dicotômicas dos modelos
MPAS e SHiELD. As setas no sentido para baixo representam desempe-
nho inferior em comparação com o outro modelo comparado, enquanto a
seta para cima representa o comportamento oposto. Os símbolos =e
e>representam o seu real significado. ................... 21
4.6 Idem à Figura 4.5, exceto para o limiar menor ou igual a 35mm. ..... 21
LISTA DE ABREVIATURAS E SIGLAS
ACC Anomaly Correlation Coefficient (correlação de anomalias)
AS América do Sul
CPTEC Centro de Previsão do Tempo e Estudos Climáticos
CSI Critical Success Index
DIMNT Divisão de Modelagem Numérica do Sistema Terrestre
ECMWF European Centre for Medium-Range Weather Forecasts
ERA5 the fifth generation ECMWF atmospheric reanalysis
ETS Equitable Threat Score
FAR False Alarm Ratio
bias Frequency Bias
FV3 Finite-Volume Cubed-Sphere Dynamical Core
GAM Grupo de Avaliação de Modelos
GDPFS Global Data-processing and Forecasting System
GEF Global Eta Framework
GFDL Geophysical Fluid Dynamics Laboratory
GFS Global Forecast System
GPM Global Precipitation Measurement Mission
IA Inteligência Artificial
INPE Instituto Nacional de Pesquisas Espaciais
MH Distância de Mahalanobis
MONAN Model for Ocean-laNd-Atmosphere predictioN
MPAS Model for Prediction Across Scales
NASA National Aeronautics and Space Administration
NCAR National Center for Atmospheric Research
NCEP National Centers for Environmental Prediction
NWP Numerical Weather Prediction
OMM Organização Meteorológica Mundial
PNT Previsão Numérica de Tempo
vi
PQPF Probabilistic Quantitative Precipitation Forecasting
POD Probability of Detection
QPF Quantitative Precipitation Forecasts
SHiELD System for High-resolution modeling for Earth-to-Local Domains
RMSE Raiz do Erro Quadrático Médio
SR Razão de sucesso
SS Skill Score
SVN Subversion
WGNE Working Group on Numerical Experimentation
WIPPS WMO Integrated Processing and Prediction System
WMO World Meteorological Organization
SUMÁRIO
Pág.
1 Introdução ................................ 2
2 Qualidade de produto de software .................. 3
3 Avaliação da qualidade de software .................. 6
3.1 Métricas de avaliação da qualidade de software ............... 8
3.1.1 Avaliação da acurácia dos modelos globais ................ 10
3.1.1.1 Desenho dos experimentos ........................ 10
3.1.1.2 Dados de referência ........................... 11
3.1.1.3 Avaliação estatística objetiva ...................... 12
3.1.1.4 Análise multivariada Distância de Mahalanobis ........... 15
4 Resultados ................................ 17
4.1 Métricas de avaliação da qualidade de software Pontuação ....... 17
4.2 Avaliação estatística da precipitação .................... 17
4.3 Avaliação estatística da altura geopotencial ................. 22
4.4 Análise Multivariada de Mahalanobis .................... 24
5 Considerações Finais .......................... 25
6 Contribuição dos autores ........................ 27
1
1 Introdução
Para uma compreensão abrangente do sistema acoplado oceano-superfície-atmosfera-
criosfera/gelo marinho em diferentes escalas espaciais e temporais, é essencial inte-
grar e expandir o conhecimento sobre a dinâmica atmosférica, os processos oceânicos
que modulam ou impactam a atmosfera e os possíveis mecanismos de retroalimen-
tação. O Centro de Previsão do Tempo e Estudos Climáticos (CPTEC), sediado
na Coordenação–geral de Ciências da Terra do Instituto Nacional de Pesquisas Es-
paciais (CGCT/INPE), busca aumentar sua liderança nacional e internacional em
ciência e tecnologia. Em um mundo mais quente e em transformação, o INPE visa
desenvolver novas estratégias nacionais de resposta à sociedade brasileira, oferecendo
soluções eficazes para reduzir problemas associados à ocorrência de eventos climáti-
cos, climáticos e ambientais de alto impacto por meio de um Programa Nacional de
Pesquisa, Desenvolvimento e Inovação. A iniciativa busca envolver diferentes partes
interessadas, como academias, setores públicos, formuladores de políticas e agências
meteorológicas regionais, para apoiar a transferência de conhecimento científico para
serviços em uma abordagem do Sistema Terrestre.
Com o objetivo de fornecer uma gama mais ampla de produtos numéricos meteoro-
lógicos e ambientais mais precisos, o foco da iniciativa é o desenvolvimento de um
modelo unificado baseado na comunidade do sistema terrestre - o Model for Ocean-
laNd-Atmosphere predictioN (MONAN). O MONAN produzirá previsões contínuas
adequadas para a América do Sul, fornecendo informações úteis para diferentes seto-
res econômicos e sociais, por meio de previsões mais confiáveis em diferentes escalas
espaciais e temporais. O INPE lidera o desenvolvimento do MONAN, planejado
para substituir os modelos atmosféricos atualmente aplicados. Um corpo científico
de direção, composto por destacados cientistas nacionais, é responsável pela gestão
do desenvolvimento e operação do MONAN. Para desenvolver um modelo terrestre
de última geração, é necessário aproveitar as novas técnicas em computação de alto
desempenho, processos físicos e biogeoquímicos, um núcleo dinâmico de última ge-
ração e tornar-se centrado em dados. Isso significa que o MONAN utilizará técnicas
inovadoras em Inteligência Artificial (IA), Aprendizado de Máquina (ML) e volume
de dados, oferecendo ótimas oportunidades ao longo do fluxo de trabalho da previ-
são numérica. O primeiro passo na construção do MONAN envolve a escolha de um
núcleo dinâmico que incorpora códigos computacionais que incorporam física adap-
tada às características climáticas sul-americanas. Esses códigos podem ser derivados
de sistemas de modelagem existentes em operação ou adaptados de outros modelos
modernos.
2
Para identificar qualitativa e quantitativamente o desempenho dos modelos avaliados
em prover a base do MONAN, formulou-se um processo de avaliação em ponto de
grade que tem como base as recomendações da WMO para o Global Data-processing
and Forecasting System (GDPFS) (??), atualmente denominado WMO Integrated
Processing and Prediction System (WIPPS), e para o Verification and Intercompari-
son of QPFs and PQPFs from Operational NWP Models (??). As métricas, variáveis
dos modelos avaliadas foram extraídas das referidas documentações. Para avaliar de
forma quantitativa os modelos selecionados, fez-se uso da suíte de avaliação de mo-
delos disponível no CPTEC. A área de interesse é a América do Sul, de modo que
avaliações em regiões específicas serão apresentadas. Aspectos de grande escala serão
também abordados, tendo em vista a escala global dos modelos analisados.
O presente documento tem por objetivo apresentar a primeira etapa do processo de
avaliação, considerando os critérios estabelecidos pela norma 9126 (??), que medem
a qualidade do produto de software. Existe uma série de Atributos de Qualidade
que pode ser analisada, dividida em seis características principais, sendo estas ainda
subdivididas em subcaracterísticas (??). Entre os Atributos de Qualidade, o Grupo
de Avaliação de Modelos da Divisão de Modelagem Numérica do Sistema Terrestre
(GAM-DIMNT) está preocupado com o Aspecto da Funcionalidade e da Usabili-
dade.
2 Qualidade de produto de software
A norma ISO/IEC 9126 é um padrão internacional que trata da qualidade de pro-
dutos de software. Seu propósito é estabelecer um conjunto de parâmetros para
uniformizar a avaliação da qualidade desses produtos, integrando-se ao modelo de
qualidade das normas da família 9000 (??).
A ISO/IEC 9126, intitulada “Engenharia de Software - Qualidade do Produto”, é
composta por diversas partes, incluindo:
a) Modelo de qualidade;
b) Métricas externas;
c) Métricas internas;
d) Métricas de qualidade em uso.
3
No contexto brasileiro, a norma correspondente é a NBR 13596, que foi substi-
tuída pela NBR ISO/IEC 9126-1, por sua vez, substituída pela Norma ISO/IEC
25010:2011 (??).
Esta seção da NBR ISO/IEC 9126 descreve um modelo de qualidade para produtos
de software, dividido em duas partes: a) qualidade interna e externa e b) qualidade
em uso. Na primeira parte, são especificadas seis características para qualidade in-
terna e externa, cada uma subdividida em subcaracterísticas. Essas subcaracterís-
ticas são evidenciadas externamente quando o software é utilizado em um sistema
computacional, resultando de atributos internos do software. Essa parte da norma
não detalha o modelo além do nível de subcaracterísticas.
A segunda parte do modelo especifica quatro características para qualidade em uso,
mas não aprofunda o modelo além do nível de características. A qualidade em uso
representa, para o usuário, o impacto combinado das seis características de qualidade
do produto de software.
Essas características são aplicáveis a todos os tipos de software, incluindo programas
de computador. Elas fornecem terminologia consistente para abordar a qualidade de
produtos de software e uma estrutura para especificar requisitos e realizar compa-
rações entre esses produtos.
A norma 9126 foca na qualidade do produto de software, propondo Atributos de
Qualidade, distribuídos em seis características principais, com cada uma delas di-
vididas em subcaracterísticas. Entre elas, destaca-se por sua importância para o
presente trabalho as características de Funcionalidade eUsabilidade.
Funcionalidade
Entende-se por Funcionalidade a capacidade de um software de satisfazer as neces-
sidades de seu usuário, sejam elas declaradas ou implícitas, por meio do provimento
de funcionalidades, dentro de um determinado contexto de uso (ISO/IEC 9126, Wi-
kipedia, 2022).
O Aspecto da Funcionalidade possui as seguintes subcaracterísticas (??):
Adequação: Capacidade do produto de software de prover um conjunto
apropriado de funções para tarefas e objetivos do usuário especificados.
Acurácia: Capacidade do produto de software de prover, com o grau de
4
precisão necessário, resultados ou efeitos corretos ou conforme acordados.
Interoperabilidade: Capacidade do produto de software de interagir com
um ou mais sistemas especificados.
Conformidade: Capacidade do produto de software de estar de acordo com
normas, convenções ou regulamentações previstas em leis e prescrições si-
milares relacionadas à funcionalidade.
Segurança: Capacidade do produto de software de proteger informações e
dados, de forma que pessoas ou sistemas não autorizados não possam lê-los
nem modificá-los e que não seja negado o acesso às pessoas ou sistemas
autorizados.
As subcaracterísticas mencionadas são resumidas na Tabela 2.1, na qual são associ-
adas a uma pergunta chave para melhor entendimento do leitor.
Tabela 2.1 - Subcaracterísticas de Funcionalidade (pergunta chave: Satisfaz a necessidade
do projeto MONAN?).
Subcaracterística Pergunta Chave
Adequação Propõe-se a fazer o que é apropriado?
Acurácia Faz o que foi proposto de forma correta?
Interoperabilidade É capaz de interagir com os sistemas especificados?
Conformidade Está de acordo com as normas, leis, entre outros?
Segurança Evita acesso não autorizado a programas e dados?
Fonte: Adaptado de Bianchi (2022).
Usabilidade
A Usabilidade é definida como a capacidade do produto de software de ser com-
preendido, aprendido, operado e atraente ao usuário, quando usado sob condições
especificadas. Note que este conceito é bastante abrangente e se aplica mesmo a
programas que não possuem uma interface para o usuário final. Por exemplo, um
programa batch executado por uma ferramenta de programação de processos tam-
bém pode ser avaliado quanto a sua usabilidade, no que diz respeito a ser facilmente
compreendido, aprendido etc.
O Aspecto da Usabilidade possui as seguintes subcaracterísticas (??):
Inteligibilidade: É a capacidade do produto de software de possibilitar ao
5
usuário compreender se o software é apropriado e como ele pode ser usado
para tarefas e condições de uso específicas.
Apreensibilidade: É a capacidade do produto de software de possibilitar ao
usuário aprender sua aplicação.
Operacionalidade: É a capacidade do produto de software de possibilitar
ao usuário operá-lo e controlá-lo.
Proteção frente a erros de usuários: Se refere a como o produto consegue
prevenir erros dos usuários.
Atratividade: É a capacidade do produto atrair um potencial usuário para
o sistema, o que pode incluir desde a adequação das informações prestadas
para o usuário até os requintes visuais utilizados na sua interface gráfica
(se houver).
Acessibilidade: Refere-se à prática inclusiva de fazer softwares que possam
ser utilizados por todas as pessoas que tenham deficiência ou não.
Conformidade: Relacionado à capacidade do produto de apresentar norma-
lidade quanto às convenções, guias ou regras/regulamentações relacionadas
à usabilidade.
3 Avaliação da qualidade de software
Os modelos globais selecionados para avaliação foram o System for High-resolution
modeling for Earth-to-Local DomainsFinite-Volume Cubed-Sphere Dynamical Core
(SHiELD–FV3) (??), desenvolvido pelo Geophysical Fluid Dynamics Laboratory
(GFDL), versão 202210, o Model for Prediction Across Scales–Atmosphere (MPAS-
A, a partir de agora denominado apenas como MPAS) (??), desenvolvido pelo Na-
tional Center for Atmospheric Research (NCAR), versão 6.3, e o modelo Global
Eta Framework (GEF) (????). Os candidados são os principais modelos de código
aberto, disponíveis gratuitamente, que embarcam núcleos dinâmicos da nova geração
de sistemas de modelagem global.
Para avaliar os modelos de acordo com a proposta de qualidade de software, um con-
junto de métricas foi desenvolvido a partir da análise de características esperadas
ou desejadas dos modelos. As subcaracterísticas selecionadas como potenciais para
6
impactar a qualidade dos softwares analisados foram Adequação, Acurácia, Intero-
perabilidade, Inteligibilidade e Operacionalidade. Além destas, tornou-se necessário
elaborar uma nova subcaracterística, denominada de Capacidade de Colaboração,
definida a seguir::
Capacidade de colaboração: É interpretada como a interação e colaboração
com o(s) grupo(s) de modelagem responsável(ies) pelo desenvolvimento dos
modelos numéricos selecionados.
Vale destacar que a avaliação da qualidade de software fazendo uso das métricas de-
senvolvidas é um processo subjetivo, pois nem todas as métricas estão estabelecidas
na literatura. Entretanto, conforme será apresentado ao longo do texto, é possível
encontrar subsídios na literatura específica dos modelos para identificar a melhor
resposta para o que cada métrica se propõe a analisar.
O MONAN deverá ser um modelo comunitário, desenvolvido com apoio de diversas
instituições, sob a liderança do INPE, que envolverá a participação de diferentes ato-
res, como os setores acadêmico e público, formadores de políticas públicas e agências
de meteorologia regionais. Os produtos numéricos a serem gerados com o MONAN
serão utilizados como base para a oferta de uma série de serviços ambientais, em
uma abordagem do Sistema Terrestre, em diferentes escalas espacial e temporal. A
Adequação deverá indicar qual núcleo dinâmico embarcado nos modelos avaliados
tem a capacidade de compor o MONAN, visando cumprir a necessidade de atender
às escalas global, regional e futuramente, à escala local.
Centros de Previsão Numérica de Tempo (PNT) operacionais têm utilizado modelos
numéricos abaixo do limite de espaçamento horizontal de 10 km (??), o que não mais
permite que a aproximação hidrostática seja utilizada (????). Com o crescimento
contínuo do poder computacional, centros de meteorologia e grupos de modelagem
numérica têm empenhado esforços para permitir a simulação da circulação geral da
atmosfera em domínios não hidrostáticos (??). Para a região tropical, onde grande
parte do território brasileiro está localizado, representar numericamente a convecção
tropical e todos os processos físicos associados é fundamental, e para tal, a aproxi-
mação não-hidrostática é uma exigência.
O modelo a ser avaliado deverá também estar preparado para interagir com ou-
tras componentes do Sistema Terrestre e com outros softwares. O sistema terrestre
é composto por várias partes, como a atmosfera, os oceanos, as camadas de gelo,
7
a terra e outros. Cada uma dessas componentes é modelada separadamente para
simular os processos físicos específicos que ocorrem em cada parte. A avaliação de
qualidade de software indicará se o modelo numérico está preparado para ser co-
nectado a um acoplador, responsável por facilitar a comunicação bidirecional entre
as componentes de um modelo do sistema terrestre, garantindo que as informações
relevantes sejam trocadas entre eles em intervalos regulares durante uma simula-
ção. Ele sincroniza os diferentes modelos de cada componente e garante que suas
interações sejam adequadamente representadas no sistema como um todo.
Outra importante componente de um sistema de modelagem numérica é o sistema
de Assimilação de Dados, essencial para fornecer as condições iniciai a partir do uso
de observações obtidas de diferentes fontes. A Assimilação de Dados é também fun-
damental para a produção de previsões de tempo e clima por conjunto. A avaliação
de qualidade de software indicará se o modelo numérico está preparado para ser
integrado a um sistema de Assimilação de Dados.
Por fim, o CPTEC/INPE é um centro operacional de previsão numérica, e requer
que os softwares selecionados estejam o mais preparados possível para atuar opera-
cionalmente. É fundamental que o software avaliado possibilite ao usuário operá-lo
e controlá-lo, mantendo a proteção frente a erros de usuários.
3.1 Métricas de avaliação da qualidade de software
Uma série de métricas e ferramentas foram consideradas na avaliação de Funciona-
lidade de software dos modelos globais. São elas:
a) Núcleo dinâmico não-hidrostático;
b) Facilidade de interação com grupo desenvolvedor do modelo;
c) Formato de saída dos dados dos modelos;
d) Topo do modelo;
e) Capacidade de regionalização;
f) Coordenada vertical;
g) Manual técnico disponível e de fácil acesso;
h) Endendimento do uso do modelo;
i) Estabilidade numérica;
8
j) Capacidade de aplicações em:
Ondas oceânicas
Clima urdano
Qualidade do ar
Agricultura
Previsão de Tempo
Previsão subsazonal
Previsão sazonal
Projeções climáticas
Eventos extremos/raros
k) Parametrizações físicas adequadas para a América do Sul;
l) Possuir acoplamento com outras componentes:
Superfície continental
Oceano/criosfera
Ondas
Química atmosférica
Hidrologia
Assimilação de Dados
m) Possuir acoplador
n) Nível de acurácia dos modelos adequados para o projeto MONAN.
Exceto para os itens “a” e “n”, todas as demais métricas foram avaliadas seguindo
os critérios de pontuação definidos pelas normas ISO, a saber:
Três pontos para o modelo que melhor atende as métricas listadas
Um ponto para o modelo que atende de forma insatisfatória as métricas
listadas
9
Os modelos que atenderam a métrica receberam três pontos, enquanto que aqueles
que não atenderam, receberam um ponto. Para casos de empate, os melhores avali-
ados receberam três pontos. Analogamente, os empatados com desempenho inferior
receberam um ponto.
Para o item “a”, foram também aplicadas as pontuações estabelecidas na normas
ISO, porém, estabeleceu-se que a aproximação não-hidrostática para o projeto MO-
NAN é de fundamental importância, e portanto, não seria justificável avaliar os mo-
delos, em termos de acurária, caso não pudessem atender a esta métrica. Isto porque
a demanda por recurso computacional (tempo de processamento e armazenamento)
seria alta para atender a métrica “n” para os três modelos avaliados. Assim, os mo-
delos que não possuíssem núcleo dinâmico não-hidrostático seriam eliminados das
demais etapas de avaliação.
3.1.1 Avaliação da acurácia dos modelos globais
A primeira etapa que atecedeu o desenho dos experimentos e a definição da meto-
dologia de análise de acurácia foi a avaliação dos modelos selecionados com base da
métrica “a”.
O núcleo dinâmico dos modelos MPAS e SHiELD/FV3 é nativamente não-
hidrostático, enquanto que o GEF possui um núcleo dinâmico hidrostático. o modelo
GEF foi o que recebeu menor pontuação, sendo considerado inapto para as aplica-
ções a que se destina o MONAN. Como resultado, o modelo GEF foi eliminado das
seguintes etapas de avaliação.
Para a análise da Acurácia (item “n”), foi utilizado um conjunto de métricas e ferra-
mentas estatísticas com base em experimentos numéricos. A seguir, serão detalhados
os experimentos numéricos realizados bem como as métricas estatísticas aplicadas
nesta etapa do trabalho.
3.1.1.1 Desenho dos experimentos
Foram realizados dois experimentos numéricos para cada um dos modelos avali-
ados. A diferença entre os experimentos reside na fonte da condição inicial. Fo-
ram utilizadas as análises do Global Forecast System (GFS) no National Centers
for Environmental Prediction (NCEP) e as reanálises ERA5 do European Centre
for Medium-Range Weather Forecasts (ECMWF) (the fifth generation ECMWF at-
mospheric reanalysis). Para reduzir o custo computacional, os modelos foram inte-
grados a cada 5 dias a partir do dia 01/06/2021. Para cada data de inicialização,
10
os modelos foram integrados até 240h (10 dias), com saídas a cada 6h. As para-
metrizações físicas utilizadas foram aquelas embarcadas nos modelos numéricos.
Nesta etapa do trabalho, foi realizado nenhum teste de sensibilidade ou mudanças
nas parametrizações físias. As integrações foram realizadas no cluster EGEON do
CPTEC/INPE. As previsões dos modelos foram interpoladas à grade 0.25 x 0.25
do ERA5 para as comparações. A seguir são apresentadas as características dos
experimentos realizados para avaliação.
a) Espaçamento de grade horizontal de 15 km para o modelo MPAS e 13
km para o SHiELD (núcleo dinâmico FV3); 55 e 64 níveis verticais,
respectivamente, sendo 0,2 hPa assumido como o topo dos modelos;
b) Condições iniciais da reanálise ERA5 e GFS;
c) Período: 01/06/2021 a 01/06/2022;
d) Análise de 74 casos para da experimento
e) Prazo de previsão de até 10 dias (240 h), com início às 00:00UTC;
f) Resolução temporal das saídas: 6 h.
As características e especificações das integrações numéricas realizadas são apresen-
tadas na Tabela 3.1.
As parametrizações físicas dos modelos SHiELD e MPAS utilizadas nos experimentos
são listadas na Tabela 3.2.
3.1.1.2 Dados de referência
A reanálise do ERA5 foi utilizada como dado de referência no processo de avaliação.
A exceção é a precipitação, que foi avaliada considerando os dados de precipitação
do Global Precipitation Measurement Mission (GPM) da National Aeronautics and
Space Administration dos Estados Unidos (NASA). Para as áreas avaliadas sobre a
América do Sul, foi utilizado o dado MERGE (??), um produto de precipitação que
combina dados de precipitação estimados por sensoriamento remoto e dados in situ.
Como os modelos foram inicializados às 00:00 UTC, a precipitação do modelo foi
acumulada a partir das primeiras 12h de integração considerando os prazos de pre-
visão de 36h, 60h, ..., até 240 dias.
11
Tabela 3.1 - Características dos modelos e das integrações numéricas realizadas. wal l-clock
time - tempo de processamento para 24h de previsão
Características SHiELD MPAS
Computador/cluster (XE, XC, etc) EGEON EGEON
Resolução Horizontal (Km) 15 13
Coordenada Vertical σ-P Z
Domínio GLB GLB
Passo de Tempo (s) 150 90
No. de Pontos de Grade 3.538.944 2.611.442
Fonte das Condições Iniciais ERA5 ERA5
Topo do Modelo 20 Pa 30 km
Prazo da Previsão (h) 240 240
Compilador intel intel
Formato dos Outputs nc nc
Frequência dos Outputs (h) 6/3 6
Espaço total para Rodada (Gb) 50 70
Espaço total Pós-Processado (Gb) 12 6
Nºde núcleos de processadores 1156 1024
wall-clock time 15min 20min
Fonte: Produção própria.
Tabela 3.2 - Parametrizações físicas dos modelos SHiELD e MPAS
Parametrizações físicas SHiELD MPAS
Radiação Atmosférica RRTMG RRTMG
Superfície Continental NOAH NOAH
Fluxos superficiais ar-mar SLAB -
Microfísica de Nuvens GFDL WSM6
Convecção Rasa/Profunda SAS New Tiedtke
Camada limite Planetária EDMF YSU
Gravity Wave Drag GWD YSU
Química Desligada Desligada
Aerossóis Desligada Desligada
Fonte: Produção própria.
3.1.1.3 Avaliação estatística objetiva
A acurácia dos modelos globais foi analisada por meio de avaliações estatísticas
objetivas da precipitação e altura geopotencial, na escala de tempo, em escala global
e sobre a América do Sul.
Foram consideradas diferentes áreas geográficas do globo e subdomínios do conti-
12
nente sul-americano. A avaliação de subdomínios da América do Sul foi realizada
conforme ??) (Figura 3.1).
Figura 3.1 - Áreas para avaliação da precipitação sobre a América do Sul
Fonte: Figueroa et al. (2016)
A avaliação em escala global e subdomínios tem como base as recomendações da
Organização Meteorológica Mundial para o WIPPS, antigo GDPFS (??), e para
oVerification and Intercomparison of QPFs and PQPFs from Operational NWP
Models (??). As métricas, variáveis dos modelos avaliadas e as áreas para avaliação
foram extraídas das referidas documentações, e forneceram as principais informações
para o presente estudo.
As previsões de precipitação, consideradas como previsões dicotômicas (sim/não)
foram analisadas por meio de métricas baseadas na tabela de contingência. São elas:
Frequency Bias (bias);
Equitable Threat Score (ETS);
13
Probability of Detection (POD);
Critical Success Index (CSI);
False Alarm Ratio (FAR).
Os índices ETS, bias, POD, FAR (ou o seu oposto, a razão de sucesso, SR, ou 1-FAR),
e CSI foram analisados por meio da plotagem do diagrama de performance (??), que
resume as medidas SR, POD, bias e CSI. Em uma abordagem que é conceitualmente
semelhante ao diagrama de ??), é possível explorar a relação geométrica entre POD,
FAR, bias score e CSI. As previsões com melhores desempenhos apresentam POD,
SR, bias e CSI próximo de 1, e a previsão perfeita seria aquela posicionada no
canto superior direito do diagrama. Os desvios em uma dada direção indicam as
diferenças relativas no POD e SR, e consequentemente no bias e CSI. É possível
visualizar rapidamente as diferenças nos desempenhos dos modelos avaliados. Na
posição de 45 graus no diagrama são encontrados os melhores resultados, mantendo
as previsões sem viés e simultaneamente aumentando a detecção e a redução do
alarme falso.
As métricas estatísticas utilizadas para avaliar as previsões de altura geopotencial
no domínio global foram aquelas indicadas para a avaliação de variáveis contínuas.
São elas:
Coeficiente de correlação de anomalia (do inglês (Anomaly Correlation Co-
efficient, ACC);
Viés;
Raiz do Erro Quadrático Médio (RMSE).
O ACC é um índice utilizado para avaliar os limites de previsibilidade das previsões
dos modelos numéricos de tempo. Valor de 1 indica previsões perfeitas e usa-se o valor
de 0.6 como limite útil das previsões dos modelos. Abaixo deste limiar se considera
não existir utilidade prática das previsões numéricas. A ACC é uma métrica com
variações ruidosas nas diferentes escalas temporais e espaciais, então normalmente
em escala global são definidas áreas para avaliar valores médios para verificar o
desempenho dos modelos: Global (Glb), Hemisfério Norte e Sul (NH, NS), Trópicos
(TRP) e América do Sul. Em geral, são avaliadas as variáveis: altura geopotencial,
temperatura e vento no níveis de 200hPa, 500hPa e 850hPa. Destaca-se que as
14
previsões de MPAS fornecem como saída altura geométrica, a qual foi convertida
para geopotencial, portanto, é necessário cautela em sua análise. Foram utilizados
dados da reanálise ERA5 como referência e a climatologia do período de 1991-2021.
3.1.1.4 Análise multivariada Distância de Mahalanobis
Além das métricas estatísticas apresentadas, foi realizada uma análise multivariada
dos campos de circulação atmosférica utilizando a Distância de Mahalanobis (MH).
A MH é uma medida que se assemelha a distância euclidiana, porém leva em conta
a covariância dos do conjunto de dados. Em outros termos, a distância MH é uma
correlação multivariável que permite comparar dois tipos de população representada
por um conjunto de variáveis. MH é útil para se obter uma medida objetiva de quanto
um conjunto de variáveis, i.e. população, se distância de outro conjunto, dando uma
visão uma visão holística dos resultados. MH não tem por objetivo indicar a causa
do problema, mas sim o de quantificar o quanto este problema está afetando os
resultados, a partir de valores numéricos. Quanto menor for MH, a população em
teste (i.e. a previsão) estará se aproximando da população de controle (i.e. a análise).
A aplicação da MH propicia uma análise geral sobre a destreza dos modelos sobre
os domínios analisados, fazendo uso de um conjunto de campos de circulação at-
mosférica que possuem uma correlação multivariável que permite comparar modelo
e dado de referência.
A distância MH de uma população é definida matematicamente, por um conjunto de
variáveis (x) e que possam ser categorizadas em p categorias. Dada uma coordenada
de ponto de grade (i,j) com múltiplas variáveis (temperatura, geopotencial, vento
zonal etc.), pode-se definir um vetor X1(l,p), onde l representa a variável prevista
e p sua categoria, que pode ser o perfil vertical, a variação no tempo ou qualquer
outro tipo de categoria. No presente estudo, levar-se-á apenas a distribuição vertical
das variáveis. Define-se, com os mesmo critérios, uma população que servirá de
comparação, ou seja, a análise do modelo, definido por X2(l,p). Os vetores X1eX2
tem que ter as mesmas categorias, porém, não necessariamente todas as categorias
de um mesmo vetor precisam estar definidas.
Faz-se a média de cada categoria, ou seja, µ1(l) eµ2(l). Em seguida-, calcula-se a
anomalia de cada par de vetores, tal como segue:
A1(l, p) = X1(l, p)µ1(l)(3.1)
15
e
A2(l, p) = X2(l, p)µ2(l).(3.2)
A seguir, calcula-se a covariância das anomalias de cada um dos vetores. As matrizes
de covariância geradas (Cov1(l,l) e(Cov2(l,l) e as respectivas somatórias (Som1(l,l)
e(Som1(l,l) terão o tamanho do número de variáveis usadas. Se duas variáveis, ter-
se-á uma matriz 2x2 e se forem três, 3x3 e assim sucessivamente. Em seguida faz-se
a média ponderada dos dois vetores, onde o fator ponderador é a somatória definida
acima. Gerando uma covariância conjunta definida como segue:
Cov(l, l) = [Cov1(l, l)×Som1(l, l)] + [Cov2(l, l)×Som2(l, l)]
Som1(l, l) + Som2(l, l).(3.3)
Calcula-se a matriz inversa da covariância conjunta, ou seja, Cov(l,l)1. MH será
definido pela raiz quadrada do somatório do produto matricial entre a matriz da
diferença das médias µ1(l) eµ2(l) e transposta [µ1(l)]Te[µ2(l)]T, e da matriz inversa
das covariâncias. Ou seja:
MH =rX[µ1(l)µ2(l)] [µ1(l)µ2(l)]TCov(l, l)1.(3.4)
A distância MH é calculada para cada ponto de grade do modelo e é sempre positivo.
A fim de condensar a análise de várias variáveis, a distância MH foi calculada para as
previsões feitas a cada cinco dias, totalizando 74 casos para os prazos de previsão de
24h até 240h, com passo de tempo de 24h. As variáveis utilizadas foram temperatura,
vento meridional e vento zonal em três níveis verticais (850, 500 e 250). A média de
cada horário tanto para o ano como para as estações de DJF e JJA foi calculada. A
análise do domínio global é apresentada e a análise regional fica restrita à América
do Sul, com foco nas estações de verão (DJF) e inverno (JJA).
Definiu-se uma diferença ponderada para comparação entre os modelos MPAS e
FV3, definida como:
Dif M H =M H(M P AS)M H(F V 3)
MH(M P AS) + M H (F V 3) 100,(3.5)
em que Dif M H < 0implica que o MPAS apresenta menor distância se comparado
16
ao FV3.
4 Resultados
Nesta Seção, são apresentados os resultados obtidos a partir das pontuações esta-
belecidas na norma ISO, bem como os resultados da avaliação estatística objetiva e
multivariada.
4.1 Métricas de avaliação da qualidade de software Pontuação
Um dos grandes diferenciais entre os modelos MPAS e FV3, reside na métrica “b”
apresentada na Seção 3.1, que dispõe sobre interação com grupo de desenvolvimento
do modelo. As interações com colaboradores do NCAR, desenvolvedores do MPAS,
foram consideradas mais acessíveis que as interações com os colaboradores do GFLD,
desenvolvedores do FV3. A possibilidade de interação e troca de experiências é fun-
damental para o melhor entendimento das particularidades do software e também da
possibilidade de estabelecimento de acordos de cooperação bilateral. Portanto, para
esta métrica, o FV3 recebeu pontuação 1 enquanto que o MPAS recebeu pontuação
3.
As pontuações atribuídas às métricas listadas na Seção 3.1 são indicadas nas Tabelas
4.1 4.3. As pontuações recebidas pelos modelos globais indicam que o MPAS e
SHiELD atendem aos requisitos formulados, com pontuação total similar.
Somadas as pontuações atribuídas, tem-se 66 pontos para o SHiELD e MPAS. Adi-
cionando 3 pontos para os modelos SHiELD e MPAS referente à métrica “a”, e 1 e
3 pontos para o SHiELD e MPAS referente à métrica “b”, respectivamente, a tota-
lização para cada um dos modelos é, respectivamente, de 70 e 72 para o SHiELD e
MPAS. Estes resultados são apresentados na Tabela 4.4.
4.2 Avaliação estatística da precipitação
O desempenho das previsões de precipitação produzidas pelos modelos MPAS e
SHiELD é analisado a partir dos diagramas de desempenho apresentados na Figura
4.1 para o domínio global. Optou-se por apresentar o desempenho dos modelos por
prazo de previsão, e portanto, cada gráfico apresenta a nuvem de desempenho, sendo
cada ponto um limiar de precipitação.
À medida em que os limiares de precipitação aumentam, o desempenho do modelo
17
Tabela 4.1 - Pontuações atribuídas às métricas de avaliação da qualidade de software.
Fonte: Produção própria.
Tabela 4.2 - Pontuações atribuídas às métricas de avaliação da qualidade de software.
Fonte: Produção própria.
diminui, que se torna mais difícil que o modelo preveja valores elevados de preci-
pitação que ocorrem em um número menor de pontos de grade (eventos). O modelo
SHiELD tende a superestimar os eventos de precipitação abaixo de 15mm, indicado
pelo bias acima de 1. Para casos acima de 35mm, o modelo gera subestimativa (bias
inferior a 1). O modelo apresenta desempenho perfeito para eventos de precipitação
18
Tabela 4.3 - Pontuações atribuídas às métricas de avaliação da qualidade de software.
Fonte: Produção própria.
Tabela 4.4 - Pontuação total atribuída às métricas de avaliação da qualidade de software.
Modelo Pontuação total
SHiELD 70
MPAS 72
Fonte: Produção própria.
de até 20mm (bias próximo de 1). O MPAS também superestima eventos de precipi-
tação leve, porém, de até 5mm. Para os casos de precipitação acima de 10mm, ocorre
subestimativa da precipitação global. Para as previsões de 36h, houve o aumento da
superestimativa dos eventos de precipitação até 15mm e aumento da subestimativa
dos eventos de precipitação acima de 20mm por parte do SHiELD, enquanto que o
MPAS apresentou desempenho semelhante, porém, o aumento da superestimativa
ocorre para eventos de até 5mm. a subestimativa que ocorre com o MPAS foi
reduzida para eventos acima de 10mm, sendo que o bias para eventos de até 10mm
é próximo de 1.
Para previsões a partir de 60h, não se observou mudanças importantes no bias do
MPAS, enquanto o bias do SHiELD apresentou maior superestimativa dos eventos
de precipitação até 20mm. Para eventos acima de 35mm, a partir de 96h o seu bias
se aproxima de 1.
19
Até 132h de previsão, observou-se que a subestimativa do MPAS foi reduzida, indi-
cado pela movimentação dos pontos no diagrama em direção às previsões sem bias,
e mantendo, simultaneamente, maior detecção e reduções de falsos alarmes (mudan-
ças em POD e FAR) se comparado ao SHiELD. Por outro lado, a probabilidade
de detecção é maior para liminares mais baixos de precipitação. O SHiELD tende
a prever mais eventos de precipitação que não ocorrem mas apresenta melhor de-
sempenho em prever os eventos que realmente ocorrem para os limiares maiores de
precipitação.
O CSI representa o quão os eventos de chuva previstos correspondem aos eventos
de chuva observados. Este índice considera apenas aquelas previsões corretas, sendo
sensível ao número de acertos. Ele também é fortemente depende da frequência
climatológica dos eventos, e gera pontuações mais baixas para eventos mais raros,
pois alguns acertos podem ocorrer aleatoriamente.
A análise do CSI indica que, embora o modelo MPAS tenha um menor número de
acertos se comparado ao SHiELD (POD maior), ele apresenta maior CSI para todos
os limiares de precipitação para até 240h de integração (exceto para de eventos de
até 0,5mm). Este resultado indica que os eventos de chuva previstos pelo MPAS
têm maior correspondência aos eventos de chuva observados se comparado ao SHi-
ELD. Este resultado pode estar associado ao SHiELD prever eventos de precipitação
aleatoriamente, o que estaria associado à superestimativa observada pelo modelo.
Nas Tabelas 4.5 e4.6 são mostrados os resumos, em termos qualitativos, da aná-
lise realizada dos diagramas de desempenho dos modelos MPAS e SHiELD para o
domínio global, considerando os limiares de até 10mm e 35mm, respectivamente.
Na análise dos diagramas de desempenho para as regiões da América do Sul, destaca-
se a área B5, que corresponde à grade parte da região amazônica, de grande impo-
rância para o clima global. Diferente da análise global, que considera como referência
oa dados do GPM, aqui são considerados os dados do MERGE (??).
Ambos os modelos apresentaram superestimativa dos eventos de precipitação até
15mm ao longo do tempo de integração, sendo o MPAS o modelo que apresentou
uma maior frequência de eventos de precipitação, que se traduz em maior número
de falsos alarmes. Menor número de eventos superestimados foi observado nas simu-
lações de até 15mm para até 136h de previsão. A partir deste prazo de integração,
houve redução de superestimativa e as previsões passaram a tender para bias próximo
a 1 para todos os prazos de integração mais longos. O modelo SHiELD apresentou
20
Tabela 4.5 - Comportamento dos índices para as previsões dicotômicas dos modelos MPAS
e SHiELD. As setas no sentido para baixo representam desempenho inferior
em comparação com o outro modelo comparado, enquanto a seta para cima
representa o comportamento oposto. Os símbolos =ee>representam o
seu real significado.
10mm
MPAS SHiELD
h BIAS POD SR CSI BIAS POD SR CSI
24 <1 >1
48 1 >1
72 1 >1
98 1 >1
120 1 >1
144 1 >1
240 1 =>1 =
Fonte: Produção própria.
Tabela 4.6 - Idem à Figura 4.5, exceto para o limiar menor ou igual a 35mm.
35mm
MPAS SHiELD
h BIAS POD SR CSI BIAS POD SR CSI
24 <1 <1
48 <1 =<1 =
72 <1 <1
96 <1 <1
120 <1 =<1 =
144 <1 =<1 =
240 <1 =1 =
Fonte: Produção própria.
21
comportamento inverso, subestimando todos os eventos de precipitação acima de
2mm e até 35mm para até 132h, quando passou a tender ao bias de 1 a partir deste
prazo. Devido à superestimativa dos eventos previstos de precipitação, o MPAS apre-
senta POD mais elevado comparado ao SHiELD para eventos de até 10mm ao longo
de todo o tempo de integração. Para os eventos de precipitação cujos limiares são
acima de 20mm, o SHiELD apresentou POD mais elevado, acompanhado de maior
frequência de SR a partir de 60h de integração. Este modelo também apresentou
maior probabilidade de ter eventos previstos de precipitação com limiares superi-
ores a 20mm correspondentes aos observados (CSI mais elevado), não indicando,
portanto, resultado de inflação devido ao POD.
A região 1 também é de sensível importância, tendo em vista que abrange parte
da região sul da América do Sul onde é influenciada por sistemas frontais e pela
formação de sistemas convectivos de mesoescala.
Para previsões de 36h, o MPAS apresentou bias próximo de 1 para os eventos com
limiares de até 20mm. Para estes casos, o SHiELD apresentou subestimativa. Para
até 180h, o MPAS tende a superestimar estes casos, enquanto que ocorre redução
da subestimativa pelo SHiELD. Os valores de POD acompanharam o desempenho
observado no bias, enquanto SR apresentou maior frequência para o modelo SHi-
ELD. Como o SR indica qual a fração das previsões de precipitação foi realmente
observada, fornecendo informações da probabilidade de um evento observado ser re-
almente previsto, o que ocorre é que devido aos falsos alarmes, o SR acaba sendo
reduzido, sendo, portanto, também uma consequência da superestimativa da precipi-
tação de limiares mais baixos. Em termos de CSI, ambos os modelos se comportaram
de forma semelhante ao longo do tempo de integração, sendo que para alguns prazos,
o MPAS apresentou maior CSI, enquanto para outros prazos, o SHiELD apresentou
os valores mais elevados.
4.3 Avaliação estatística da altura geopotencial
Na Figura 4.4ae4.4b, painéis superiores, são apresentados os coeficientes de ano-
malia de correlação (ACC) médios da altura geopotencial em 500hPa em função do
horizonte de previsão (até 10 dias) para os modelos FV3-SHiELD e MPAS, respecti-
vamente, inicializados com as reanálises ERA5. Adicionalmente, o FV3-SHiELD foi
inicializado usando as análises do GFS/NCEP (linhas tracejadas da Figura 4.4a).
Ambos os modelos mostram um limite de previsibilidade de até 8 dias para as regiões
GBL, HN e HS e ligeiramente menor para as regiões TPR e América do Sul.
22
Destaca-se que o ACC mede as correlações entre anomalias, sendo mais sensível às
semelhanças entre os padrões das previsões e análises que seus valores absolutos.
Por exemplo, um erro de fase pode afetar a correta interpretação do desempenho
dos modelos (??).
O RMSE (Figuras 4.4ae4.4b, painéis centrais) e BIAS (Figuras 4.4ae4.4b, painéis
inferiores) dos modelos também foram avaliados. Conforme aumenta o horizonte de
previsão, o RMSE também cresce, em maior grau no HS que no HN e na escala
global. Menores valores são observados em TPR e AS, lembrando que as variações
de geopotencial nessas regiões são menores às que acontecem em latitudes médias e
altas. Em geral, o BIAS indica subestimativa da altura geopotencial em 500 hPa nas
previsões do SHiELD (Figura 4.4a) conforme se afasta da condição inicial. De forma
semelhante ao RMSE, o BIAS apresenta menores valores nos TPR e AS comparado
a HN, HS e GLB. Entretanto, os valores de BIAS do MPAS (Figura 4.4b) diferem do
SHiELD, com menores valores no HN e HS. É possível que o método de conversão
da altura geométrica para a altura geopotencial tenha interferido nos resultados do
MPAS, o que pode justificar esse comportamento.
As previsões do SHiELD inicializado com dados do GFS/NCEP ((Figura 4.4a, li-
nhas tracejadas), apresentaram um desempenho ligeiramente inferior àquelas com as
condições iniciais do ERA5. Esse resultado evidencia que as reanálises do ECMWF
são superiores à análise do NCEP, independente do modelo considerado. Testes de
significância estatística indicaram que não são diferentes as médias das previsões de
ambos os modelos.
As séries temporais da ACC das previsões de 120h (5 dias) são mostradas na Figura
4.5 para as regiões HN (painel superior), HS (painel inferior) e TRP (painel central)
comparando os modelos MPAS e SHiELD. Pode-se notar que ambos modelos apre-
sentam pouca variação sazonal ao longo do período. Por outro lado, como esperado,
encontrou-se maior correlação média nas regiões de médias e altas latitudes (HN e
HS) em comparação aos trópicos (TRP). Entre os modelos, as diferenças médias são
mínimas no HN e HS e o SHiELD é ligeiramente superior nos trópicos. Também,
as análises das séries temporais das previsões para além de cinco dias mostraram
comportamento semelhante entre ambos modelos com valores menores de ACC, mas
em geral não diferem segundo a análise estatística de significância ao nível de 95
23
4.4 Análise Multivariada de Mahalanobis
Na Figura 4.6, são apresentadas as médias dos resultados obtidos da análise multi-
variada de MH para o período completo de simulação.
Em 24h (Figura 4.6a) observa-se valores baixos (<1,5) de MH em quase todo o
globo tanto para o MPAS como para o FV3. Este padrão é rompido sobre regiões
de mais altas latitudes e sobre regiões continentais elevadas. Nesta última, é evidente
a diferença entre o MPAS e o FV3, com o último mostrando menor distância de MH.
A diferença entre ambos mostra que o MH do MPAS é maior sobre os Andes, as
montanhas Rochosas, sobre o platô tibetano, no sul da África, Antártida e no Mar de
Weddell. Esta diferença pode ser relacionada a processos físicos não satisfatoriamente
resolvidos em regiões de topografia elevada.
Em 48h (Figura 4.6b), a distância MH tende a aumentar nas regiões polares, prin-
cipalmente sobre o continente Antártico e no oceano Ártico. O valor MH também
aumenta rapidamente nos extratrópicos sobre os oceanos. Este aumento ocorre em
ambos os modelos, sendo que a diferença entre eles se mantém constante, apesar do
valor médio do MH (0,01) ter subido.
O valor de MH tende a aumentar nas horas seguintes de integração (Figuras 4.6c
e4.6e), a partir das altas latitudes em ambos os modelos, mas em especial sobre
os oceanos. O MH global médio cresce rapidamente, com valor médio de 3,987 para
o MPAS e 3,722 para o FV3 (Figura 4.6e). O campo DifMH também mostrou um
aumento, com o MPAS se distanciando mais do campo de observação em relação ao
FV3.
Na Figura 4.7 apresenta-se o comportamento dos modelos na estação de verão do
hemisfério austral. Em 24h (Figura 4.7a), observa-se uma grande similaridade em
ambos os modelos. Porém, com um valor médio de MH ligeiramente menor para
o MPAS. No campo de diferença, observa um melhor desempenho do MPAS em
relação ao FV3 sobre a Bacia Amazônica Ocidental e na região de formação de
CCM no norte da Argentina e Paraguai. O DifMH apresentou um valor negativo
(-0,009), ou seja, o MPAS apresentou distância de MH ligeiramente melhor que o
FV3.
Em 48h (Figura 4.7b) um aumento do valor de MH em ambos os modelos, mas
em especial no MPAS sobre o Atlântico Sul. Nas regiões tropicais não se observa
uma diferença expressiva entre os modelos. Porém, no campo DifMH se observa que
24
o MPAS se distanciou menos no campo original sobre a Bacia Amazônica e parte do
Sudeste e Centro-Oeste e sobre a Argentina. Em 72h e 120h (Figuras 4.7ce4.7d)
um aumento do MH em ambos os modelos, em especial nos extratrópicos. Po-
rém, com o MPAS se distanciando mais lentamente do campo original sobre grande
parte do território brasileiro, onde a DifMH tende a ser negativa. No oceano, o dis-
tanciamento tende a ser mais aleatório, com o MPAS se distanciando mais sobre o
Atlântico Sul. Em 240h (Figuras 4.7e e Figura 4.7f), observa-se o aumento expressivo
do MH nos extratrópicos conforme observado no campo global. A diferença está
no aumento expressivo do MH sobre o Brasil central em ambos os modelos. Porém,
com o MPAS mostrando um distanciamento menor em relação ao FV3 sobre grande
parte do território brasileiro e maior sobre os oceanos subtropicais e extratropicais.
Nos meses de inverno austral para 24h (Figura 4.8a), observa-se um comportamento
similar em ambos os modelos, com o MH de 1,058 apesar do maior distanciamento
do MPAS sobre os Andes. Em termos de DifMH, o MPAS mostrou um menor distan-
ciamento, o que é visível no predomínio de valores negativos sobre o todo o campo
de diferença. Em 48h (Figura 4.8b), um pequeno aumento do MH, forçado pelo
aumento nos extratrópicos. Porém o DifMH se manteve negativamente favorável ao
MPAS, em especial sobre o território brasileiro, embora tenha apresentado maior
distância no Sul do Brasil. Em 72h (Figura 4.8c), o MH aumenta nos extratrópicos,
com uma DifMH positiva favorável ao FV3 no Sul e Sudeste do Brasil, e negativa
favorável ao MPAS no centro-norte do Brasil. Em 120h (Figura 4.8d), a distância
de MH aumenta, porém a DifMH tende a ser negativa e favorável ao MPAS so-
bre grande parte da América do Sul. Para 240h (Figura 4.8e), um aumento do
valor de MH, principalmente nos subtrópicos e extratrópicos, porém com o FV3
apresentando uma distância menor que o MPAS no geral (DifMH média de 0,042).
Em resumo, o MPAS mostrou ter um MH ligeiramente maior que o FV3, tanto no
campo global quando no regional sobre a América do Sul. O MPAS também mostrou
um maior distanciamento sobre as regiões de topografia elevada (Andes e Platô do
Tibete) e sobre a Antártida, Groelândia e Oceano Ártico. Porém, o MPAS mostrou
ter um MH menor que o FV3 sobre a América do Sul, em especial sobre a Bacia
Amazônica, tanto no verão astral quanto no inverno, com alguns momentos em que
este menor distanciamento foi dominante sobre todo o continente sul americano.
25
5 Considerações Finais
O modelo GEF foi avaliado somente no quesido Adequação. Concluiu-se que este
modelo não pode ser aplicado, a curto prazo, para as ações a que se destina o
MONAN devido ao seu núcleo dinâmico ser hidrostático. Desta forma, a avaliação
da acurácia e dos demais quesitos não foi realizada.
Os modelos avaliados nos demais aspectos compõem o estado-da-arte em modelagem
dos processos físicos e dinâmicos da atmosfera. Por meio da análise de diversas mé-
tricas relacionadas às características de funcionalidade de software, foi possível iden-
tificar que ambos os modelos são amplamente utilizados pela comunidade americana
de meteorologia para diversas aplicações. Os modelos são aptos a serem acoplados
a outros componentes do sistema terrestre e possuem funcionalidades que permitem
que sejam executados fazendo uso de um sistema de assimilação de dados. O SHi-
ELD leva vantagem por ser um modelo cujo núcleo dinâmico é utilizado em modo
operacional nos Estados Unidos, e diversas funcionalidades são preparadas para o
ambiente operacional. Por outro lado, a interação com a equipe de desenvolvimento
do MPAS é um ponto positivo e importante a se levar em consideração, uma vez que
facilita o intercâmbio do conhecimento e resolução de problemas de aspecto técnico
no uso do modelo em ambiente operacaional.
Em relação à avaliação de acurária dos modelos, destaca-se o que segue.
A partir da análise da distância de MH, o MPAS mostrou ter um MH ligeiramente
maior que o FV3, tanto no campo global quando no regional sobre a América do
Sul. Por outro lado, o MPAS mostrou um maior distanciamento sobre as regiões
de topografia elevada (Andes e Platô do Tibete) e sobre a Antártida, Groelândia e
Oceano Ártico. O MPAS apresentou MH menor que o FV3 sobre a América do Sul,
em especial sobre a Bacia Amazônica, tanto no verão quanto no inverno, sendo que
este menor distanciamento foi dominante sobre todo o continente sul americano.
Em relação aos índices estatísticos das previsões de precipitação, identificou-se que
o MPAS apresentou melhor desempenho, de modo geral, para limiares de precipi-
tação de até 10mm, enquanto que o SHiELD é ligeiramente superior em termos de
frequência de ocorrência do total de previsões de precipitação para limiares de até
35mm, apesar de apresentar maior ocorrência de falsos alarmes. Entretanto, uma
característica fundamental é a tendência do SHiELD de superestimar os eventos de
chuva, e consequentemente inflar os valores de probabilidade de detecção, o que pode
induzir a uma interpretação equivocada de seu desempenho. Uma vez que o SHi-
26
ELD apresentou desempenho inferior ao MPAS no índice de razão de sucesso, que
é interpretado como a razão entre as previsões corretas em relação ao número total
de eventos previstos (inclusive os falsos alarmes), pode-se interpretar que, ainda que
gere subestimativa da frequência de eventos totais, o MPAS é capaz de prever com
maior confiabilidade os eventos de precipitação que realmente ocorrem, para todos
os limiares de precipitação.
As análises da destreza da altura geopotencial indicaram que ambos os modelos mos-
tram um limite de previsibilidade de até 8 dias para o domínio global nos Hemisférios
Norte e Sul. O uso de diferentes condições iniciais para o processo de inicialização
do FV3-SHiELD indicou ligeiras diferenças e desempenho superior das reanálises
do ERA5, resultado este esperado. As reanálises do ERA5 são o estado-da-arte em
termos de representação do estado da atmosfera em períodos passados. Ela baseia-
se na abordagem de assimilação de dados do ECMWF, combinando um conjunto
extremamente grande de observações com o modelo de previsão meteorológica. Com
esta metodologia, o ERA5 fornece uma das reconstruções mais precisas do clima
passado.
As análises apresentadas neste documento focaram nos aspectos de funcionalidade
de software, na avaliação objetiva da precipitação e na análise multivariada de um
conjunto de variáveis atmosféricas. Entretanto, ressalta-se que ainda é necessário
realizar análises objetivas de outras variáveis meteorológicas e estudos de casos para
ampliar o conhecimento sobre os erros dos modelos avaliados. Esta etapa deverá ser
realizada e publicada em um novo relatório técnico dedicado a este fim.
6 Contribuição dos autores
Ariane Frassoni: Concebeu e projetou a análise; desenvolveu e aplicou a avaliação
da característica de funcionalidade de software e suas subcaracterísticas; realizou a
análise da avaliação quantitativa de precipitação; escreveu o relatório.
Bárbara A. G. P. Yamada: preparou o modelo de publicação do INPE; organizou e
formatou as tabelas do relatório; realizou a revisão final do relatório.
José Roberto Rozante: desenvolveu e aplicou as ferramentas de avaliação quantita-
tiva de precipitação; contribuiu para a avaliação quantitativa de precipitação.
Julio Pablo Fernandez: preparou e executou os modelos numéricos; organizou os
dados dos modelos numéricos; realizou a análise da avaliação quantitativa de altura
27
PUBLICAÇÕES TÉCNICO-CIENTÍFICAS EDITADAS PELO INPE
geopotencial.
Marcelo Bario Rosa: desenvolveu e aplicou a técnica de análise multivariada de
Mahalanobis; realizou a análise multivariada de Mahalanobis.
Teses e Dissertações (TDI) Manuais Técnicos (MAN)
Teses e Dissertações apresentadas nos
Cursos de Pós-Graduação do INPE.
São publicações de caráter técnico que
incluem normas, procedimentos, instru-
ções e orientações.
Notas Técnico-Científicas (NTC) Relatórios de Pesquisa (RPQ)
Incluem resultados preliminares de pes-
quisa, descrição de equipamentos, des-
crição e ou documentação de programas
de computador, descrição de sistemas
e experimentos, apresentação de testes,
dados, atlas, e documentação de proje-
tos de engenharia.
Reportam resultados ou progressos de
pesquisas tanto de natureza técnica
quanto científica, cujo nível seja compa-
tível com o de uma publicação em pe-
riódico nacional ou internacional.
Propostas e Relatórios de Projetos
(PRP)
Publicações Didáticas (PUD)
São propostas de projetos técnico-
científicos e relatórios de acompanha-
mento de projetos, atividades e convê-
nios.
Incluem apostilas, notas de aula e ma-
nuais didáticos.
Publicações Seriadas Programas de Computador (PDC)
São os seriados técnico-científicos: bo-
letins, periódicos, anuários e anais de
eventos (simpósios e congressos). Cons-
tam destas publicações o Internacional
Standard Serial Number (ISSN), que é
um código único e definitivo para iden-
tificação de títulos de seriados.
São a seqüência de instruções ou có-
digos, expressos em uma linguagem
de programação compilada ou interpre-
tada, a ser executada por um computa-
dor para alcançar um determinado obje-
tivo. Aceitam-se tanto programas fonte
quanto os executáveis.
Pré-publicações (PRE)
Todos os artigos publicados em periódi-
cos, anais e como capítulos de livros.
29
Figura 4.1 - Diagrama de desempenho para as previsões de precipitação de a) 24h b) 36h,
c) 48h, d) 60h, e) 120h (132h) e f) 240h. As esferas representam os diferentes
limiares de precipitação: 0,5mm, 2mm, 5mm, 10mm, 15mm, 20mm, 35mm,
sendo a cor vermelha representativa do modelo MPAS e preto, do modelo
SHiELD.
(a) (b)
(c) (d)
(e) (f)
Fonte: Produção própria.
30
Figura 4.2 - Idem à Figura 4.1, exceto para a área B5
(a) (b)
(c) (d)
Fonte: Produção própria.
31
Figura 4.3 - Idem à Figura 4.1, exceto para a área B1
(a) (b)
(c) (d)
Fonte: Produção própria.
32
Figura 4.4 - Métricas das sub-características da Manutenibilidade com os modelos FV3,
GEF e MPAS.
(a)
(b)
Fonte: Produção própria.
33
Figura 4.5 - Series temporais da ACC do geopotencial a 500 hPa dos modelos MPAS (ver-
melho) e SHiELD (azul), para o Hemisfério Norte (painel superior), trópicos
(médio) e Hemisfério Sul (painel inferior). Previsões de 120 h (5 dias) para o
período de junho 2021 a maio 2022 (74 casos).
Fonte: Produção própria.
34
Figura 4.6 - Distância de MH para o MPAS e FV3 e diferença normalizada (DifMH) para
os prazos de previsão de 24h (a), 48h (b), 72h (c), 120h (d) e 240h (e)
(a) (b)
(c) (d)
(e)
Fonte: Produção própria.
35
Figura 4.7 - Idem que a Figura 4.6 mas para os meses de verão austral sobre a América
do Sul.
(a) (b)
(c) (d)
(e)
Fonte: Produção própria.
36
Figura 4.8 - Idem que a Figura 4.7 mas para os meses de inverno austral sobre a América
do Sul.
(a) (b)
(c) (d)
(e)
Fonte: Produção própria.
37
ResearchGate has not been able to resolve any citations for this publication.
Article
Knowing the spatiotemporal distribution of precipitation is undoubtedly important for planning various economic/social activities, such as agriculture, livestock, and energy production. The coarse observation density over certain regions may significantly compromise the quality of precipitation products interpolated by only surface observations. To minimize the lack of observations over certain regions, the Centre for Weather Forecast and Climate Studies (CPTEC) of National Institute for Space Research (INPE) developed two types of blended precipitation products, namely, the Combined Scheme (CoSch) and MERGE, which combine observed precipitation data with satellite estimates on a daily scale. To understand how different blending methodologies impact the final results, a comparison of each algorithm with independent rain gauges was performed with a focus over the Brazilian territory. Both products were generated at a 10-km horizontal resolution using input data from the Global Precipitation Measurement (GPM) Integrated Multi-satellitE Retrievals for GPM (IMERG-Early) for product (Version 5) in conjunction with surface observations from Surface Synoptic Observations (SYNOP), data collection platforms (DCPs) and data from regional meteorological centres. The cumulative 24-hour precipitation was evaluated for the period from June 2014 to June 2017. The results show that both products reliably characterize the precipitation regimes over most of the study regions, although MERGE and CoSch tend to over- and underestimate the amount of precipitation, respectively. However, the magnitude of the Bias achieved by MERGE is smaller than that achieved by CoSch. Overall, MERGE outperforms CoSch when analysing rain/no rain and light to moderate rainfall (0.5 to 20.0 mm). For heavy precipitation (>35.0 mm), the performance of both products is similar. The most significant differences between the two products occur over the Northeast Region of Brazil (R3 and R4), where CoSch tends to encounter difficulties characterizing the precipitation regime during the northeastern wet period (April – November). In R3 and R4, MERGE relies more on surface observations, whereas CoSch relies on GPM-IMERG-Early, which could be associated with the deficiency of GPM-IMERG-Early in estimating the amount of precipitation associated with warm clouds.
Article
A method for visually representing multiple measures of dichotomous (yes-no) forecast quality (probability of detection, false alarm ratio, bias, and critical success index) in a single diagram is presented. Illustration of the method is provided using performance statistics from two previously published forecast verification studies (snowfall density and convective initiation) and a verification of several new forecast datasets: Storm Prediction Center forecasts of severe storms (nontornadic and tornadic), Hydrometeorological Prediction Center forecasts of heavy precipitation (greater than 12.5 mm in a 6-h period), National Weather Service Forecast Office terminal aviation forecasts (ceiling and visibility), and medium-range ensemble forecasts of 500-hPa height anomalies. The use of such verification metrics in concert with more detailed investigations to advance forecasting is briefly discussed.
Article
To effectively utilize mesoscale dynamical simulations of the atmosphere, it is necessary to have an understanding the basic physical and mathematical foundations of the models and to have an appreciation of how a particular atmospheric system works. Mesoscale Meteorological Modeling provides such an overview of mesoscale numerical modeling. Starting with fundamental concepts, this text can be used to evaluate the scientific basis of any simulation model that has been or will be developed. Basic material is provided for the beginner as well as more in-depth treatment for the specialist. This text is useful to both the practitioner and the researcher of the mesoscale phenomena.
Article
A diagram has been devised that can provide a concise statistical summary of how well patterns match each other in terms of their correlation, their root-mean-square difference, and the ratio of their variances. Although the form of this diagram is general, it is especially useful in evaluating complex models, such as those used to study geophysical phenomena. Examples are given showing that the diagram can be used to summarize the relative merits of a collection of different models or to track changes in performance of a model as it is modified. Methods are suggested for indicating on these diagrams the statistical significance of apparent differences and the degree to which observational uncertainty and unforced internal variability limit the expected agreement between model-simulated and observed behaviors. The geometric relationship between the statistics plotted on the diagram also provides some guidance for devising skill scores that appropriately weight among the various measures of pattern correspondence.
The brazilian global atmospheric model (bam): Performance for tropical rainfall forecasting and sensitivity to convective scheme and horizontal resolution. Weather and Forecasting
  • S N Figueroa
  • J P Bonatti
  • P Y Kubota
  • G A Grell
  • H Morrison
  • S R M Barros
  • J P R Fernandez
  • E Ramirez
  • L Siqueira
  • G Luzia
  • J Silva
  • J R Silva
  • J Pendharkar
  • V B Capistrano
  • D S Alvim
  • D P Enoré
  • F L R Diniz
  • P Satyamurti
  • I F A Cavalcanti
  • P Nobre
  • H M J Barbosa
  • C L Mendes
  • J Panetta
FIGUEROA, S. N.; BONATTI, J. P.; KUBOTA, P. Y.; GRELL, G. A.; MORRISON, H.; BARROS, S. R. M.; FERNANDEZ, J. P. R.; RAMIREZ, E.; SIQUEIRA, L.; LUZIA, G.; SILVA, J.; SILVA, J. R.; PENDHARKAR, J.; CAPISTRANO, V. B.; ALVIM, D. S.; ENORé, D. P.; DINIZ, F. L. R.; SATYAMURTI, P.; CAVALCANTI, I. F. A.; NOBRE, P.; BARBOSA, H. M. J.; MENDES, C. L.; PANETTA, J. The brazilian global atmospheric model (bam): Performance for tropical rainfall forecasting and sensitivity to convective scheme and horizontal resolution. Weather and Forecasting, American Meteorological Society, Boston MA, USA, v. 31, n. 5, 2016. 13
Seasonal range test run with global eta framework
  • D Latinovic
  • S C Chou
  • M Rancic
LATINOVIC, D.; CHOU, S. C.; RANCIC, M. Seasonal range test run with global eta framework. Adv. Sci. Res., v. 14, p. 247-251, 2017. Https://doi.org/10.5194/asr-14-247-2017. 6
Manual on the Global Data-processing and Forecasting System: Annex IV to the WMO Technical Regulations
  • O M M Omm
OMM, O. M. M. Manual on the Global Data-processing and Forecasting System: Annex IV to the WMO Technical Regulations. Geneva, Switzerland: [s.n.], 2019. Updated in 2022. Disponível em: <<https: //wmo.int/activities/wmo-integrated-processing-and-prediction-system-wipps>>. 3, 13
Recommendations for the Verification and Intercomparison of QPFs and PQPFs from Operational NWP Models
  • W M O Omm
  • W W R P Wwrp
OMM, W. M. O.; WWRP, W. W. R. P. Recommendations for the Verification and Intercomparison of QPFs and PQPFs from Operational NWP Models. Geneva, Switzerland: [s.n.], October 2009. Revision 2, updated in 2008. Disponível em: <<https://filecloud.wmo.int/share/s/03mFumNQRpeMRYSDZusmkA>>. 13
A multiscale nonhydrostatic atmospheric model using centroidal voronoi tesselations and c-grid staggering
  • W C Skamarock
  • J B Klemp
  • M G Duda
  • Al
  • Et
SKAMAROCK, W. C.; KLEMP, J. B.; DUDA, M. G.; AL. et. A multiscale nonhydrostatic atmospheric model using centroidal voronoi tesselations and c-grid staggering. Monthly Weather Review, v. 140, n. 9, p. 3090-3105, 2012. Https://doi.org/10.1175/MWR-D-11-00215.1. 6