Content uploaded by Sergio Manuel Serra da Cruz
Author content
All content in this area was uploaded by Sergio Manuel Serra da Cruz on Nov 16, 2019
Content may be subject to copyright.
Content uploaded by Sergio Manuel Serra da Cruz
Author content
All content in this area was uploaded by Sergio Manuel Serra da Cruz on Nov 16, 2019
Content may be subject to copyright.
Content uploaded by Sergio Manuel Serra da Cruz
Author content
All content in this area was uploaded by Sergio Manuel Serra da Cruz on Nov 16, 2019
Content may be subject to copyright.
OpenSoils: Uma Plataforma de Apoio à Ciência do Solo
Sérgio Manuel Serra da Cruz1, Filipe Klinger1, Alexia Duarte1, Jéssica Mendes1, Pedro
Vieira Cruz1, Elton Carneiro Marinho2, Eber Assis Schmitz2
1 Departamento de Computação, Universidade Federal Rural do Rio de Janeiro, Seropédica,
Rio de Janeiro, Brasil, serra@pet-si.ufrrj.br
2 Programa de Pós-Graduação em Informática, Universidade Federal do Rio de Janeiro, Ilha
do Fundão, Rio de Janeiro, Brasil, elton@ufrj.br
RESUMO
Solos são recursos não renováveis e parte vital do meio ambiente; os usos racionais bem
como a gestão dos dados de solos são problemas globais que afetam a todos os países do
mundo. O objetivo deste artigo é apresentar a plataforma OpenSoils que armazena, conecta e
compartilha grandes quantidades de dados curados de solos brasileiros. OpenSoils é uma
plataforma aberta, elástica, multiusuária que descreve, organiza e harmoniza grandes
conjuntos de dados de perfis e tradagens de solos. Também oferece dados curados e geração
de relatórios e mapas permitem que os usuários consultem os dados de solo da sua região.
OpenSoils é uma das primeiras infraestruturas voltados para segurança de solos baseada na
tríade de conceitos de e-Science e Open Science.
PALAVRAS-CHAVE: Agricultura 4.0, Aplicativos móveis, Segurança de Solos.
ABSTRACT
Soils are nonrenewable resources; they are an essential asset of the environment. Rational use
of the soils and data management are global, growing and critical problems that affect every
country in the world. The goal of OpenSoils is to connect and share large amounts of cured
soil data at the Brazilian level aiding researchers to developed soils researchers. OpenSoils is
an open, elastic, provenance-oriented framework that collects, stores, describes, organizes,
shares and harmonizes large data sets of soil profiles and boreholes. It also offers high-quality
data and maps allowing users to navigate through the data. OpenSoils is one of the first soils
security-based infrastructures based on e-Science and Open Science concepts.
KEYWORDS: Agriculture 4.0, Mobile apps, Soils Security.
INTRODUÇÃO
A Ciência do Solo é um domínio complexo tanto do ponto de vista científico como também
da integração e gestão de dados. Ela incorpora em suas práticas produtoras de grandes
volumes de dados que variam desde as análises físico-químicas de solos à geolocalização e
mapas de perfis apoiada por satélites. Portanto, a capacidade de integrar e processar
inteligentemente os datasets é uma questão crucial para enfrentar as novas demandas
ambientais, agrícolas, econômicas, científicas e sociais vivenciados pela sociedade atual
(FECHER e FRIESIKE, 2014) e (WOLFERT et al., 2017).
De acordo com Koch et al. (2013) e Wolfert et al. 2017, o solo é um dos recursos
naturais não renováveis mais importantes que sustentam a vida terrestre e humana. O solo
contribui para o sequestro de carbono, a sustentabilidade energética e climática além de ajudar
a manter a biodiversidade e a proteção global do ecossistema. A segurança de solos está
diretamente relacionada com a manutenção e melhoria global desses recursos para produção
de alimentos, fibras e águas. Do ponto de vista da computação, a segurança de solos é uma
área de pesquisa pouco explorada e que pode ser classificada como intensiva em
processamento de dados e que demanda a adoção imediata de inúmeras técnicas de
computação comuns às áreas de big data, inteligência artificial, processamento distribuído,
gestão do conhecimento e governança de dados. Até o momento, ainda não se verificam
muitas plataformas integradoras de dados voltadas para esse contexto. Isto é, os
levantamentos de solos são realizados de modo desconectado e sem apoio sistemático de
repositórios de dados compartilháveis, exacerbando o problema de “silos de dados”, onde
cada pesquisador armazena subconjuntos de dados formatados heterogeneamente, sob a forma
de planilhas, sem semântica explicitamente compartilhada (CRUZ et al., 2018).
O ciclo de vida das pesquisas em solos assemelha-se com o ciclo de vida de
experimentos científicos descritos por Mattoso et al. (2010). Ele é amplo e começa com o
planejamento das coletas a serem realizadas no campo, perpassa por diferentes tipos de
procedimentos experimentais (em campo ou em laboratórios) e continua na estação de
trabalho dos pesquisadores com análises, interpretações e visualizações de dados e finaliza
com a produção de datasets isolados, artigos e mapas que podem ser disponibilizados para
tomadores de decisão e demais interessados.
Motivação e objetivo
As principais motivações para o desenvolvimento da plataforma OpenSoils foram
contribuir com os objetivos de desenvolvimento sustentável enunciados na agenda 2030 da
ONU
1
e oferecer apoio sistemático aos pesquisadores brasileiros na área de Ciência do solo,
fornecendo soluções inovadoras e de baixo custo para atender os problemas descritos no
relatório 011.713/2015-1 do Tribunal de Conta da União (TCU). Por exemplo, o Brasil dispõe
apenas de levantamentos de solo de caráter geral, com mapas de pequena escala, sendo que
menos de 5% do território nacional conta com mapas de solos em escala 1:100.000 ou maior e
carece de políticas de governança de dados de solos (PRONASOLOS, 2019). A plataforma
OpenSoils foi concebida para ser um ativo computacional distribuído, modular, colaborativo,
aberto, de acesso público voltado para a integração, organização, sistematização e
operacionalização de dados decorrentes de estudos e levantamentos pedológicos multi-
escalares, podendo ser utilizado em um amplo arco de usuários, finalidades e projetos que
variam desde simples mapeamentos de atributos de solos até recomendação e educação em
solos.
Neste artigo, defendemos a necessidade de conduzir pesquisas interdisciplinares
considerando os papéis da Ciência da Computação e da Agricultura 4.0 (MASSRUHÁ
e LEITE, 2017) para enfrentar os desafios da sustentabilidade dos solos. Vislumbramos que
várias abordagens computacionais podem ser incorporadas, dentre elas: workflows
científicos, proveniência de dados (FREIRE et al., 2008), bancos de dados abertos, ontologias,
inteligência artificial, aprendizado de máquina, computação em nuvem, princípios FAIR
(WILKINSON et al, 2016), entre outros. Tais abordagens visam apoiar a comunidade de
pesquisadores de solos a realizar investigações mais extensas e oferecer novos conhecimentos
e soluções para a sociedade, contribuindo para a preservação do solo.
O objetivo deste artigo é divulgar a plataforma OpenSoils para cientistas de solos,
agrônomos e tomadores de decisão. A plataforma foi concebida para apoiar projetos de
naturezas distintas, desde grandes projetos multi-institucionais de cobertura nacional tais
como o PRONASOLOS até pequenos projetos locais de mapeamento visando a aptidão,
recomendação de uso de solos em propriedades agrícolas ou em cidades.
MATERIAL E MÉTODOS
O desenvolvimento da plataforma OpenSoils teve seu início em 2018 e, desde então, vem
sendo ampliada, diferindo das demais presentes na literatura (por exemplo, FeBR
2
).
OpenSoils tem como fundamentação teórica a Open Science (ciência aberta) (FECHER e
FRIESIKE, 2014) e e-Science (e-Ciência) (HEY et al., 2009) aplicados a área de Ciências do
solo.
1
https://nacoesunidas.org/pos2015/agenda2030/
2
http://coral.ufsm.br/febr/
Open Science é um movimento global abrangente que engloba um arcabouço de
saberes aplicados a geração e ampla difusão do conhecimento científico para diversos estratos
sociais. É um conceito estimulado por governos e órgão de fomento com vistas para tornar a
pesquisa científica mais acessível, ampliando a reprodutibilidade e o compartilhamento de
dados científicos, tornando o conhecimento mais inteligível em todos os níveis da sociedade.
Atualmente, existem algumas infraestruturas científicas abertas (por exemplo, OpenAIRE,
OSF, EOSC), no entanto, ainda não têm contemplam os desafios de segurança dos solos.
e-Science representa uma nova forma de se fazer ciência no Século XXI (HEY et al.,
2009). O conceito diz respeito a um movimento que apregoa a concepção de uma ciência
fundamentada no uso intensivo de processamento de dados e na colaboração. A incorporação
da e-Science no âmbito dos estudos agronômicos mundiais se amplia a cada dia, no entanto,
ainda é incipiente no Brasil (BAMBINI et al., 2018). No contexto brasileiro, a adoção da e-
Science no setor agropecuário e de solos pode se beneficiar da evolução das redes de telefonia
móvel, do barateamento dos sensores e drones e da computação em nuvem permitindo que os
agricultores, agrônomos e tomadores de decisão se conectem a micro serviços distribuídos
através de dispositivos móveis, auxiliando no processo de gestão da cadeia produtiva com
conveniência e custos acessíveis. O detalhamento das metodologias adotadas neste trabalho
pode ser resumido da seguinte forma.
Os paradigmas adotados no desenvolvimento do backend da plataforma estão
centrados na teoria de sistemas agrícolas de próxima geração (SAPG) proposta de Antle et al.,
(2017). Os paradigmas adotados no desenvolvimento das interfaces (frontend) dos aplicativos
móveis são “centrados no usuário”, desenvolvimento ágil e design thinking apresentados por
Krippendorff (2000).
RESULTADOS E DISCUSSÃO
OpenSoils é a primeira plataforma brasileira de e-ciência e ciência aberta que é elástica,
multiusuária, multicamada e orientada a micros serviços capazes de manipular grandes
volumes de dados primários de projetos multi-escalares de levantamento de solos. Ela é capaz
de processar dados dos projetos e equipes e armazenar dados geolocalizados de cada camada
dos perfis e tradagens de solos de um estudo pedológicos. Além disso, harmoniza e mantém
dados curados etiquetados com metadados de proveniência retrospectiva relativos a todo o
ciclo de atividades/experimentos realizadas diretamente no campo ou em laboratórios que
executam experimentos úmidos ou digitais. A plataforma é compatível com o sistema de
classificação preconizada pelo Sistema Brasileiro de Classificação de Solos (SIBCS, 2019).
Figura 1. Visão conceitual da plataforma OpenSoils, ilustração baseado em Cruz et al., (2018).
Fonte: Elaborado pelos autores.
Resumidamente, o backend da plataforma é composto por um conjunto de APIs,
banco de dados e camadas de serviço (PASS) concebidos para serem distribuídos, seguros, ter
alta disponibilidade e operar em nuvens de computadores. O frontend da plataforma é
composto por muitos aplicativos móveis e ferramentas Web. A Figura 1 resume o ciclo de
vida de pesquisa em solos segundo a plataforma e ilustra de modo conceitual os principais
componentes da arquitetura originalmente proposta por Cruz et al. (2018). Tecnicamente, a
plataforma é composta por diversas camadas, a saber:
Camada I - É a camada das interfaces voltadas para os usuários (e.g. especialistas em
solos, pesquisadores, formuladores de políticas públicas, agricultores, profissionais da
extensão rural, assistência técnica e estudantes) que utilizam os aplicativos móveis ou portal
da Web para acessar os dados ou serviços digitais ofertados pelo backend. Além disso, a
camada oferece as funcionalidades de governança através da central de controle de projetos e
operações que são utilizados por curadores, administradores de dados e gestores de projetos.
As aplicações cliente podem inserir/consultar dados ou administrar serviços no banco
de dados OpenSoils DB através da API OpenSoils, microsserviços ou aplicações (por
exemplo, o portal OpenSoils Lab e os aplicativos OpenSoils Field e OpenSoils Edu). O
aplicativo OpenSoils Fields permite coletar dados diretamente no campo e rastrear a rota de
cada amostra enviada aos laboratórios de análise de solos. Normalmente, cada amostra de
solo tem sua análise morfológica realizada no local da coleta, esta pode ser complementada
posteriormente em laboratórios. O aplicativo OpenSoils Field submete, através de conexão
segura, dados de solos brutos para o backend que opera em nuvem (Figura 1). Depois disso,
cada amostra de solo pode ser etiquetada eletronicamente e enviada para laboratórios onde os
pesquisadores realizam experimentos úmidos ou de natureza computacional registrados
através de ferramentas digitais, tais como o SisGExp (CRUZ e NASCIMENTO, 2019).
Camada II – É uma camada de serviços internos, trata-se do backend da plataforma
que oferece as APIs e microsserviços utilizadas pelos demais componentes. Utiliza modelos
científicos e matemáticos que são representados por workflows científicos centrados em
dados (analisam a consistência dos dados legados recebidos da camada I e inserem
descritores de proveniência retrospectiva segundo a especificação PROV-DM da W3C
(MOREAU e MISSIER, 2013). Proveniência são metadados que explicam as origens de um
item de dado (FREIRE et al., 2008). A camada também pode suportar conexões com
ferramentas de terceiros, tais como o RFlow (CRUZ e NASCIMENTO, 2019) que encapsula
workflows científicos baseados em scripts estatísticos descritos em linguagem R, permitindo
a captura da proveniência retrospectiva dos scripts associados aos experimentos. Essa camada
também permite a ingestão de dados legados de solos armazenados em silos de dados
dispersos na Internet. Estes podem ser incorporados por meio de workflows científicos do tipo
ETL (Extração-Transformação-Carga) desenvolvidos em ferramentas de manipulação de
dados (por exemplo, Pentaho/Kettle, entre outros).
Camada III - É a camada mais interna do OpenSoils, armazena, classifica e organiza
os dados primários e secundários de solos. A estrutura interna suporta um grau diversificado
de granularidade de dados e se apoia no schema denominado OpenSoilsDB (CRUZ et al.,
2018). Esta camada pode armazenar tanto os dados recém coletados no campo quanto os
dados legados incorporados a partir dos silos de dados pré-existentes, sendo anotados com
metadados proveniência. Resumidamente, o schema é capaz de armazenar grandes volumes
de dados de solos e de governança. Os dados de solos são georreferenciados e representam as
camadas dos perfis e tradagens, são dados de alta qualidade que são voltados para as
comunidades brasileira e internacional interessadas em padronização e harmonização de
dados de solos. Os dados de solos da plataforma utilizam os padrões de classificação do
Sistema Brasileiro de Classificação de Solos (SIBCS, 2019). Cada descrição de perfil de solo
possui mais 250 atributos para registrar as propriedades mineralógicos, morfológicos,
químicos, físicos, sensores proximais, fertilidade, contaminações por metais pesados e
ambientais do solo, entre outros. Além disso, o OpenSoilsDB suporta o versionamento de
dados abertos e dados georreferenciados, imagens de perfis e dados físicos de experimentos
(e.g. curva de retenção e dados de espectrometria de solos).
Os dados e metadados de governança, são as informações relativas aos projetos,
protocolos de pesquisa/trabalho, usuários, grupos de trabalho, permissões, entre outros. Eles
são tão importantes quanto os científicos e são principalmente utilizados na camada IV.
Grande parte das ações necessárias para garantir perenidade e a qualidade dos dados se
apoiam na capacidade de permitir que pesquisadores executem e gerenciem datasets e
experimentos com captura sistemática de metadados de proveniência. A proveniência dos
dados produzidos pelos workflows da camada II consiste no registro da derivação de um
resultado por um processo computacional (por exemplo, a ingestão de perfil do solo, coleta de
uma imagem, geração de um mapa de atributos de solos). O OpenSoils DB adota a
recomendação PROV-DM para armazenar a proveniência retrospectiva das execuções dos
workflows científicos e scripts.
O banco de dados também permite o armazenamento de grandes volumes de dados
legados de solos que podem ser importados por meio de workflows ETL da camada II. Além
disso, para suportar o paradigma dos dados abertos, oferecem conexão com outras
plataformas que podem compartilhar datasets harmonizados e curados para toda a
comunidade de usuários da plataforma.
Camada IV – A camada de governança de dados do OpenSoils, que ainda está em
desenvolvimento, permite que especialistas desenvolvam estratégias de governança de dados
nos níveis estratégico, tático e operacional. A camada amplia a acessibilidade e a reutilização
de dados de solos e permite difundir os conhecimentos sobre levantamentos e segurança de
solos tanto para a comunidade científica quanto para cidadãos, agricultores e gestores
públicos e privados. A camada suportará os princípios FAIR para a gestão e
compartilhamento de dados (WILKINSON et al, 2016).
Adotar os princípios de governança de dados é vantajoso porque não só alinha a
plataforma OpenSoils com as principais demandas dos órgãos nacionais tais como o TCU,
Infraestrutura Nacional de Dados Abertos (INDA) e a Infraestrutura Nacional de Dados
Espaciais (INDE), como também facilita o compartilhamento de dados para órgãos
internacionais de gestão de dados agrícolas (por exemplo, GODAN (Global Open Data for
Agriculture and Nutrition), CGIAR (Consultative Group for International Agricultural
Research), Research Data Alliance (RDA), World Soil Information (ISRIC), World Data
System (ICSU-WDS), entre outros).
A camada IV disponibiliza serviços datacêntricos e processos padronizados que
asseguram a transparência das atividades de coleta e distribuição de dados. A camada
incorpora regras, políticas e padrões de segurança, direitos e responsabilidades de usos de
dados, permitindo o gerenciamento e licenciamento de datasets por parte de profissionais da
área de curadoria. Embora a governança e a curadoria de dados de solos de longo prazo
tenham recebido pouca atenção dos governos e das comunidades de pesquisa em Ciência do
solo, acreditamos que essa camada seja fundamental para contribuir com as políticas de
gestão de dados científicos.
Protótipo da plataforma
Um protótipo da plataforma OpenSoils já se encontra operacional e armazena dados de
mais de 13.000 perfis/tradagens de solos de todo o Brasil; seus aplicativos móveis são
gratuitos e podem ser encontrados na loja no Google Play
3
. O portal Web e a ferramenta
OpenSoils Lab estão disponíveis em www.opensoils.org. Testes de campo sobre a usabilidade
da plataforma estão sendo realizados com especialistas em projetos de mapeamentos digitais
de solos.
Figura 2. Exemplos de telas descrevendo o ciclo de inclusão de dados, relatório de perfil de solo e visualização
de dados produzidos pela plataforma OpenSoils.
Fonte: Elaborado pelos autores.
A Figura 2 exemplifica um caso de operação integrada da plataforma através de
algumas telas dos seus módulos principais. No detalhe da Figura 2A, exemplifica-se o
processo de coleta de dados diretamente no campo através do aplicativo OpenSoils Fields
(camada I) e posterior armazenamento no banco de dados na nuvem (camada III). A seguir,
há o tratamento e harmonização de dados no portal OpenSoils Lab (Figura 2B) e a geração de
3
https://play.google.com/store/apps/details?id=br.ufrrj.petsi.opensoils&hl=en
relatórios digitais com descrição de um perfil contendo dados curados e imagens dos
horizontes daquele perfil (Figura 2C) (camadas II e III). Por fim, a visualização espacial dos
perfis ilustrados através do aplicativo OpenSoils Edu (Figura 2D), onde os pins (cor
vermelha) representam a geolocalização de todos os perfis de um projeto de levantamento de
dados de solos.
CONCLUSÕES
Ao mesmo tempo em que os solos fornecem um espaço vital para os seres humanos, eles
estão sob pressão, devido ao aumento da população e crescentes demandas por alimentos ou
aos usos competitivos da terra.
Neste artigo, apresentamos o OpenSoils, uma plataforma centrada em dados de solos
que fornece apoio ao ciclo de vida de estudos na Ciência do solo. A plataforma, está em
atualização constante, mas já pode ser utilizada em projetos de levantamentos pedológicos
multi-escalares, na conservação e o uso sustentável do solo ou em atividades ligadas à
Agricultura 4.0. A plataforma está em constante evolução, porém já é capaz de armazenar e
compartilhar datasets curados e permite a coleta de dados em diversos pontos do ciclo de
vida, sendo capaz de auxiliar nas tomadas de decisão.
Como trabalhos futuros, planejamos continuar a implementação da plataforma, em
especial no mapeamento da API da camada II que facilitarão conectividade com redes de
sensores de solos e ferramentas de terceiros. Adicionalmente, investiremos mais esforços nos
módulos da camada IV que permitirão investigar a ligação semântica entre os datasets de
solos do OpenSoils com datasets produzidos por organismos internacionais, tais como WoSIS
Soil Profile Database. Além disso, planejamos incorporar recursos do modelo de ciência
cidadã e envolver uma rede de voluntários para auxiliar na coleta de novos dados de solos a
serem utilizados nas pesquisas em segurança de solos.
AGRADECIMENTOS
O presente trabalho foi parcialmente realizado com apoio da Programa de Educação Tutorial
(PET-SI, da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – Brasil
(CAPES) – Código de Financiamento 001 e do Conselho Nacional de Pesquisas (CNPq) –
Código de Financiamento produtividade DT-II (315399/2018-0). Agradecimentos ao
professor Marcos Cedia pelo apoio na área de solos.
REFERÊNCIAS
ANTLE J.M., JONES J.W., ROSENZWEIG C.E., Next generation agricultural system data,
models and knowledge products: Introduction. Agricultural Systems.; 2017, pp. 155:186-190.
BAMBINI, M.D., BONACELLI, M. B. M., HIHA, R. H., Pesquisa Agropecuária No
Contexto Da E-Science: Monitoramento de Temas e Plataformas de Data Science. 56
Congresso SOBER, Campinas, SP. 2018, 20pp.
CRUZ, S. M. S et al. OpenSoils: e-Science em Segurança de Solos II. Encuentro
Latinoamericano de e-Ciencia (TICAL), Cartagena da Índias. Anais da Octava Conferência de
Directores de Tecnología de Información y Comunicación en Instituciones de Educación
Superior, y II Encuentro Latinoamericano de e-Ciencia 2018. 8p.
CRUZ, S. M. S e NASCIMENTO, J. A. P., Towards integration of data-driven agronomic
experiments with data provenance. Computers and Electronics in Agriculture, v. 161, 2019,
pp. 14-28.
CARACCIOLO C. et al., The AGROVOC linked dataset, Semant. Web, vol. 4, no. 3, 2013,
pp. 341–348.
DEELMAN, E., GANNON, D., SHIELDS, M., TAYLOR, I., Workflows and e-Science: An
overview of workflow system features and capabilities, Futur. Gener. Comput. Syst., vol. 25,
no. 5, 2009, pp. 528–540.
FECHER B., FRIESIKE S., Open Science: One Term, Five Schools of Thought, Open. Sci.,
2014, pp. 17–47.
FREIRE, J., KOOP, D., SANTOS, E., SILVA, C. T., Provenance for computational tasks: A
survey, Comput. Sci. Eng., vol. 10, no. 3, 2008, pp. 11–21.
HEY T., TANSLEY S., TOLLE K., The Fourth Paradigm: Data-Intesive Scientific
Discovery. 2009.
KOCH A. et al., Soil Security: Solving the Global Soil Crisis, Glob. Policy, vol. 4, no. 4, Nov.
2013, pp. 434–441.
KRIPPENDORFF, K. Propositions Of Human-Centeredness: A Philosophy For Design. In:
Durling, D. Friedman, K. (Eds.). Doctoral Education in Design: Foundations for the Future.
Staffordshire (UK): Staffordshire Univ.Press. 2000, pp.55-63.
MASSRUHÁ, S. M. F. S.; LEITE, M. A. de A. AGRO 4.0 no meio rural. Futuro das TICs na
AGRO 4.0. 2017.
MATTOSO M. et al., Towards supporting the life cycle of large scale scientific experiments,
Int. J. Bus. Process Integr. Manag., vol. 5, no. 1, 2010, pp. 79.
MOREAU, L., MISSIER, P., PROV-DM: The PROV Data Model, W3C Recommendation,
2013. [Online]. http://www.w3.org/TR/prov-dm/.
PRONASOLOS. 2019. [Online]. https://www.embrapa.br/pronasolos
SiBCS. 2019. [Online]. https://www.embrapa.br/solos/sibcs
WILKINSON M. D. et al., The FAIR Guiding Principles for scientific data management and
stewardship, Sci. Data, vol. 3, Mar. 2016. pp. 160018.
WOLFERT S., GE L., VERDOUW C., BOGAARDT M. J., Big Data in Smart Farming – A
review, Agric. Syst., vol. 153, 2017, pp. 69–80.