Conference PaperPDF Available

OpenSoils: Uma Plataforma de Apoio à Ciência do Solo

Authors:

Abstract and Figures

RESUMO Solos são recursos não renováveis e parte vital do meio ambiente; os usos racionais bem como a gestão dos dados de solos são problemas globais que afetam a todos os países do mundo. O objetivo deste artigo é apresentar a plataforma OpenSoils que armazena, conecta e compartilha grandes quantidades de dados curados de solos brasileiros. OpenSoils é uma plataforma aberta, elástica, multiusuária que descreve, organiza e harmoniza grandes conjuntos de dados de perfis e tradagens de solos. Também oferece dados curados e geração de relatórios e mapas permitem que os usuários consultem os dados de solo da sua região. OpenSoils é uma das primeiras infraestruturas voltados para segurança de solos baseada na tríade de conceitos de e-Science e Open Science. PALAVRAS-CHAVE: Agricultura 4.0, Aplicativos móveis, Segurança de Solos. ABSTRACT Soils are nonrenewable resources; they are an essential asset of the environment. Rational use of the soils and data management are global, growing and critical problems that affect every country in the world. The goal of OpenSoils is to connect and share large amounts of cured soil data at the Brazilian level aiding researchers to developed soils researchers. OpenSoils is an open, elastic, provenance-oriented framework that collects, stores, describes, organizes, shares and harmonizes large data sets of soil profiles and boreholes. It also offers high-quality data and maps allowing users to navigate through the data. OpenSoils is one of the first soils security-based infrastructures based on e-Science and Open Science concepts.
Content may be subject to copyright.
OpenSoils: Uma Plataforma de Apoio à Ciência do Solo
Sérgio Manuel Serra da Cruz1, Filipe Klinger1, Alexia Duarte1, Jéssica Mendes1, Pedro
Vieira Cruz1, Elton Carneiro Marinho2, Eber Assis Schmitz2
1 Departamento de Computação, Universidade Federal Rural do Rio de Janeiro, Seropédica,
Rio de Janeiro, Brasil, serra@pet-si.ufrrj.br
2 Programa de Pós-Graduação em Informática, Universidade Federal do Rio de Janeiro, Ilha
do Fundão, Rio de Janeiro, Brasil, elton@ufrj.br
RESUMO
Solos são recursos não renováveis e parte vital do meio ambiente; os usos racionais bem
como a gestão dos dados de solos são problemas globais que afetam a todos os países do
mundo. O objetivo deste artigo é apresentar a plataforma OpenSoils que armazena, conecta e
compartilha grandes quantidades de dados curados de solos brasileiros. OpenSoils é uma
plataforma aberta, elástica, multiusuária que descreve, organiza e harmoniza grandes
conjuntos de dados de perfis e tradagens de solos. Também oferece dados curados e geração
de relatórios e mapas permitem que os usuários consultem os dados de solo da sua região.
OpenSoils é uma das primeiras infraestruturas voltados para segurança de solos baseada na
tríade de conceitos de e-Science e Open Science.
PALAVRAS-CHAVE: Agricultura 4.0, Aplicativos móveis, Segurança de Solos.
ABSTRACT
Soils are nonrenewable resources; they are an essential asset of the environment. Rational use
of the soils and data management are global, growing and critical problems that affect every
country in the world. The goal of OpenSoils is to connect and share large amounts of cured
soil data at the Brazilian level aiding researchers to developed soils researchers. OpenSoils is
an open, elastic, provenance-oriented framework that collects, stores, describes, organizes,
shares and harmonizes large data sets of soil profiles and boreholes. It also offers high-quality
data and maps allowing users to navigate through the data. OpenSoils is one of the first soils
security-based infrastructures based on e-Science and Open Science concepts.
KEYWORDS: Agriculture 4.0, Mobile apps, Soils Security.
INTRODUÇÃO
A Cncia do Solo é um domínio complexo tanto do ponto de vista científico como também
da integração e gestão de dados. Ela incorpora em suas práticas produtoras de grandes
volumes de dados que variam desde as análises físico-químicas de solos à geolocalização e
mapas de perfis apoiada por satélites. Portanto, a capacidade de integrar e processar
inteligentemente os datasets é uma questão crucial para enfrentar as novas demandas
ambientais, agrícolas, econômicas, científicas e sociais vivenciados pela sociedade atual
(FECHER e FRIESIKE, 2014) e (WOLFERT et al., 2017).
De acordo com Koch et al. (2013) e Wolfert et al. 2017, o solo é um dos recursos
naturais não renováveis mais importantes que sustentam a vida terrestre e humana. O solo
contribui para o sequestro de carbono, a sustentabilidade energética e climática além de ajudar
a manter a biodiversidade e a proteção global do ecossistema. A segurança de solos está
diretamente relacionada com a manutenção e melhoria global desses recursos para produção
de alimentos, fibras e águas. Do ponto de vista da computação, a segurança de solos é uma
área de pesquisa pouco explorada e que pode ser classificada como intensiva em
processamento de dados e que demanda a adoção imediata de inúmeras técnicas de
computação comuns às áreas de big data, inteligência artificial, processamento distribuído,
gestão do conhecimento e governança de dados. Até o momento, ainda não se verificam
muitas plataformas integradoras de dados voltadas para esse contexto. Isto é, os
levantamentos de solos são realizados de modo desconectado e sem apoio sistemático de
repositórios de dados compartilháveis, exacerbando o problema de silos de dados, onde
cada pesquisador armazena subconjuntos de dados formatados heterogeneamente, sob a forma
de planilhas, sem semântica explicitamente compartilhada (CRUZ et al., 2018).
O ciclo de vida das pesquisas em solos assemelha-se com o ciclo de vida de
experimentos científicos descritos por Mattoso et al. (2010). Ele é amplo e começa com o
planejamento das coletas a serem realizadas no campo, perpassa por diferentes tipos de
procedimentos experimentais (em campo ou em laboratórios) e continua na estação de
trabalho dos pesquisadores com análises, interpretações e visualizações de dados e finaliza
com a produção de datasets isolados, artigos e mapas que podem ser disponibilizados para
tomadores de decisão e demais interessados.
Motivação e objetivo
As principais motivações para o desenvolvimento da plataforma OpenSoils foram
contribuir com os objetivos de desenvolvimento sustentável enunciados na agenda 2030 da
ONU
1
e oferecer apoio sistemático aos pesquisadores brasileiros na área de Ciência do solo,
fornecendo soluções inovadoras e de baixo custo para atender os problemas descritos no
relatório 011.713/2015-1 do Tribunal de Conta da União (TCU). Por exemplo, o Brasil dispõe
apenas de levantamentos de solo de caráter geral, com mapas de pequena escala, sendo que
menos de 5% do território nacional conta com mapas de solos em escala 1:100.000 ou maior e
carece de políticas de governança de dados de solos (PRONASOLOS, 2019). A plataforma
OpenSoils foi concebida para ser um ativo computacional distribuído, modular, colaborativo,
aberto, de acesso público voltado para a integração, organização, sistematização e
operacionalização de dados decorrentes de estudos e levantamentos pedológicos multi-
escalares, podendo ser utilizado em um amplo arco de usuários, finalidades e projetos que
variam desde simples mapeamentos de atributos de solos até recomendação e educação em
solos.
Neste artigo, defendemos a necessidade de conduzir pesquisas interdisciplinares
considerando os papéis da Ciência da Computação e da Agricultura 4.0 (MASSRUHÁ
e LEITE, 2017) para enfrentar os desafios da sustentabilidade dos solos. Vislumbramos que
várias abordagens computacionais podem ser incorporadas, dentre elas: workflows
científicos, proveniência de dados (FREIRE et al., 2008), bancos de dados abertos, ontologias,
inteligência artificial, aprendizado de máquina, computação em nuvem, princípios FAIR
(WILKINSON et al, 2016), entre outros. Tais abordagens visam apoiar a comunidade de
pesquisadores de solos a realizar investigações mais extensas e oferecer novos conhecimentos
e soluções para a sociedade, contribuindo para a preservação do solo.
O objetivo deste artigo é divulgar a plataforma OpenSoils para cientistas de solos,
agrônomos e tomadores de decisão. A plataforma foi concebida para apoiar projetos de
naturezas distintas, desde grandes projetos multi-institucionais de cobertura nacional tais
como o PRONASOLOS até pequenos projetos locais de mapeamento visando a aptidão,
recomendação de uso de solos em propriedades agrícolas ou em cidades.
MATERIAL E MÉTODOS
O desenvolvimento da plataforma OpenSoils teve seu início em 2018 e, desde então, vem
sendo ampliada, diferindo das demais presentes na literatura (por exemplo, FeBR
2
).
OpenSoils tem como fundamentação teórica a Open Science (ciência aberta) (FECHER e
FRIESIKE, 2014) e e-Science (e-Ciência) (HEY et al., 2009) aplicados a área de Ciências do
solo.
1
https://nacoesunidas.org/pos2015/agenda2030/
2
http://coral.ufsm.br/febr/
Open Science é um movimento global abrangente que engloba um arcabouço de
saberes aplicados a geração e ampla difusão do conhecimento científico para diversos estratos
sociais. É um conceito estimulado por governos e órgão de fomento com vistas para tornar a
pesquisa científica mais acessível, ampliando a reprodutibilidade e o compartilhamento de
dados científicos, tornando o conhecimento mais inteligível em todos os níveis da sociedade.
Atualmente, existem algumas infraestruturas científicas abertas (por exemplo, OpenAIRE,
OSF, EOSC), no entanto, ainda não têm contemplam os desafios de segurança dos solos.
e-Science representa uma nova forma de se fazer ciência no Século XXI (HEY et al.,
2009). O conceito diz respeito a um movimento que apregoa a concepção de uma ciência
fundamentada no uso intensivo de processamento de dados e na colaboração. A incorporação
da e-Science no âmbito dos estudos agronômicos mundiais se amplia a cada dia, no entanto,
ainda é incipiente no Brasil (BAMBINI et al., 2018). No contexto brasileiro, a adoção da e-
Science no setor agropecuário e de solos pode se beneficiar da evolução das redes de telefonia
móvel, do barateamento dos sensores e drones e da computação em nuvem permitindo que os
agricultores, agrônomos e tomadores de decisão se conectem a micro serviços distribuídos
através de dispositivos móveis, auxiliando no processo de gestão da cadeia produtiva com
conveniência e custos acessíveis. O detalhamento das metodologias adotadas neste trabalho
pode ser resumido da seguinte forma.
Os paradigmas adotados no desenvolvimento do backend da plataforma estão
centrados na teoria de sistemas agrícolas de próxima geração (SAPG) proposta de Antle et al.,
(2017). Os paradigmas adotados no desenvolvimento das interfaces (frontend) dos aplicativos
móveis são “centrados no usuário, desenvolvimento ágil e design thinking apresentados por
Krippendorff (2000).
RESULTADOS E DISCUSSÃO
OpenSoils é a primeira plataforma brasileira de e-ciência e ciência aberta que é elástica,
multiusuária, multicamada e orientada a micros serviços capazes de manipular grandes
volumes de dados primários de projetos multi-escalares de levantamento de solos. Ela é capaz
de processar dados dos projetos e equipes e armazenar dados geolocalizados de cada camada
dos perfis e tradagens de solos de um estudo pedológicos. Além disso, harmoniza e mantém
dados curados etiquetados com metadados de proveniência retrospectiva relativos a todo o
ciclo de atividades/experimentos realizadas diretamente no campo ou em laboratórios que
executam experimentos úmidos ou digitais. A plataforma é compatível com o sistema de
classificação preconizada pelo Sistema Brasileiro de Classificação de Solos (SIBCS, 2019).
Figura 1. Visão conceitual da plataforma OpenSoils, ilustração baseado em Cruz et al., (2018).
Fonte: Elaborado pelos autores.
Resumidamente, o backend da plataforma é composto por um conjunto de APIs,
banco de dados e camadas de serviço (PASS) concebidos para serem distribuídos, seguros, ter
alta disponibilidade e operar em nuvens de computadores. O frontend da plataforma é
composto por muitos aplicativos móveis e ferramentas Web. A Figura 1 resume o ciclo de
vida de pesquisa em solos segundo a plataforma e ilustra de modo conceitual os principais
componentes da arquitetura originalmente proposta por Cruz et al. (2018). Tecnicamente, a
plataforma é composta por diversas camadas, a saber:
Camada I - É a camada das interfaces voltadas para os usuários (e.g. especialistas em
solos, pesquisadores, formuladores de políticas públicas, agricultores, profissionais da
extensão rural, assistência técnica e estudantes) que utilizam os aplicativos móveis ou portal
da Web para acessar os dados ou serviços digitais ofertados pelo backend. Além disso, a
camada oferece as funcionalidades de governança através da central de controle de projetos e
operações que são utilizados por curadores, administradores de dados e gestores de projetos.
As aplicações cliente podem inserir/consultar dados ou administrar serviços no banco
de dados OpenSoils DB através da API OpenSoils, microsserviços ou aplicações (por
exemplo, o portal OpenSoils Lab e os aplicativos OpenSoils Field e OpenSoils Edu). O
aplicativo OpenSoils Fields permite coletar dados diretamente no campo e rastrear a rota de
cada amostra enviada aos laboratórios de análise de solos. Normalmente, cada amostra de
solo tem sua análise morfológica realizada no local da coleta, esta pode ser complementada
posteriormente em laboratórios. O aplicativo OpenSoils Field submete, através de conexão
segura, dados de solos brutos para o backend que opera em nuvem (Figura 1). Depois disso,
cada amostra de solo pode ser etiquetada eletronicamente e enviada para laboratórios onde os
pesquisadores realizam experimentos úmidos ou de natureza computacional registrados
através de ferramentas digitais, tais como o SisGExp (CRUZ e NASCIMENTO, 2019).
Camada II É uma camada de serviços internos, trata-se do backend da plataforma
que oferece as APIs e microsserviços utilizadas pelos demais componentes. Utiliza modelos
científicos e matemáticos que são representados por workflows científicos centrados em
dados (analisam a consistência dos dados legados recebidos da camada I e inserem
descritores de proveniência retrospectiva segundo a especificação PROV-DM da W3C
(MOREAU e MISSIER, 2013). Proveniência são metadados que explicam as origens de um
item de dado (FREIRE et al., 2008). A camada também pode suportar conexões com
ferramentas de terceiros, tais como o RFlow (CRUZ e NASCIMENTO, 2019) que encapsula
workflows científicos baseados em scripts estatísticos descritos em linguagem R, permitindo
a captura da proveniência retrospectiva dos scripts associados aos experimentos. Essa camada
também permite a ingestão de dados legados de solos armazenados em silos de dados
dispersos na Internet. Estes podem ser incorporados por meio de workflows científicos do tipo
ETL (Extração-Transformação-Carga) desenvolvidos em ferramentas de manipulação de
dados (por exemplo, Pentaho/Kettle, entre outros).
Camada III - É a camada mais interna do OpenSoils, armazena, classifica e organiza
os dados primários e secundários de solos. A estrutura interna suporta um grau diversificado
de granularidade de dados e se apoia no schema denominado OpenSoilsDB (CRUZ et al.,
2018). Esta camada pode armazenar tanto os dados recém coletados no campo quanto os
dados legados incorporados a partir dos silos de dados pré-existentes, sendo anotados com
metadados proveniência. Resumidamente, o schema é capaz de armazenar grandes volumes
de dados de solos e de governança. Os dados de solos são georreferenciados e representam as
camadas dos perfis e tradagens, são dados de alta qualidade que são voltados para as
comunidades brasileira e internacional interessadas em padronização e harmonização de
dados de solos. Os dados de solos da plataforma utilizam os padrões de classificação do
Sistema Brasileiro de Classificação de Solos (SIBCS, 2019). Cada descrição de perfil de solo
possui mais 250 atributos para registrar as propriedades mineralógicos, morfológicos,
químicos, físicos, sensores proximais, fertilidade, contaminações por metais pesados e
ambientais do solo, entre outros. Além disso, o OpenSoilsDB suporta o versionamento de
dados abertos e dados georreferenciados, imagens de perfis e dados físicos de experimentos
(e.g. curva de retenção e dados de espectrometria de solos).
Os dados e metadados de governança, são as informações relativas aos projetos,
protocolos de pesquisa/trabalho, usuários, grupos de trabalho, permissões, entre outros. Eles
são tão importantes quanto os científicos e são principalmente utilizados na camada IV.
Grande parte das ações necessárias para garantir perenidade e a qualidade dos dados se
apoiam na capacidade de permitir que pesquisadores executem e gerenciem datasets e
experimentos com captura sistemática de metadados de proveniência. A proveniência dos
dados produzidos pelos workflows da camada II consiste no registro da derivação de um
resultado por um processo computacional (por exemplo, a ingestão de perfil do solo, coleta de
uma imagem, geração de um mapa de atributos de solos). O OpenSoils DB adota a
recomendação PROV-DM para armazenar a proveniência retrospectiva das execuções dos
workflows científicos e scripts.
O banco de dados também permite o armazenamento de grandes volumes de dados
legados de solos que podem ser importados por meio de workflows ETL da camada II. Além
disso, para suportar o paradigma dos dados abertos, oferecem conexão com outras
plataformas que podem compartilhar datasets harmonizados e curados para toda a
comunidade de usuários da plataforma.
Camada IV A camada de governança de dados do OpenSoils, que ainda está em
desenvolvimento, permite que especialistas desenvolvam estratégias de governança de dados
nos níveis estratégico, tático e operacional. A camada amplia a acessibilidade e a reutilização
de dados de solos e permite difundir os conhecimentos sobre levantamentos e segurança de
solos tanto para a comunidade científica quanto para cidadãos, agricultores e gestores
públicos e privados. A camada suporta os princípios FAIR para a gestão e
compartilhamento de dados (WILKINSON et al, 2016).
Adotar os princípios de governança de dados é vantajoso porque não só alinha a
plataforma OpenSoils com as principais demandas dos órgãos nacionais tais como o TCU,
Infraestrutura Nacional de Dados Abertos (INDA) e a Infraestrutura Nacional de Dados
Espaciais (INDE), como também facilita o compartilhamento de dados para órgãos
internacionais de gestão de dados agrícolas (por exemplo, GODAN (Global Open Data for
Agriculture and Nutrition), CGIAR (Consultative Group for International Agricultural
Research), Research Data Alliance (RDA), World Soil Information (ISRIC), World Data
System (ICSU-WDS), entre outros).
A camada IV disponibiliza serviços datacêntricos e processos padronizados que
asseguram a transparência das atividades de coleta e distribuição de dados. A camada
incorpora regras, políticas e padrões de segurança, direitos e responsabilidades de usos de
dados, permitindo o gerenciamento e licenciamento de datasets por parte de profissionais da
área de curadoria. Embora a governança e a curadoria de dados de solos de longo prazo
tenham recebido pouca atenção dos governos e das comunidades de pesquisa em Ciência do
solo, acreditamos que essa camada seja fundamental para contribuir com as políticas de
gestão de dados científicos.
Protótipo da plataforma
Um protótipo da plataforma OpenSoils já se encontra operacional e armazena dados de
mais de 13.000 perfis/tradagens de solos de todo o Brasil; seus aplicativos móveis são
gratuitos e podem ser encontrados na loja no Google Play
3
. O portal Web e a ferramenta
OpenSoils Lab estão disponíveis em www.opensoils.org. Testes de campo sobre a usabilidade
da plataforma estão sendo realizados com especialistas em projetos de mapeamentos digitais
de solos.
Figura 2. Exemplos de telas descrevendo o ciclo de inclusão de dados, relatório de perfil de solo e visualização
de dados produzidos pela plataforma OpenSoils.
Fonte: Elaborado pelos autores.
A Figura 2 exemplifica um caso de operação integrada da plataforma através de
algumas telas dos seus módulos principais. No detalhe da Figura 2A, exemplifica-se o
processo de coleta de dados diretamente no campo através do aplicativo OpenSoils Fields
(camada I) e posterior armazenamento no banco de dados na nuvem (camada III). A seguir,
há o tratamento e harmonização de dados no portal OpenSoils Lab (Figura 2B) e a geração de
3
https://play.google.com/store/apps/details?id=br.ufrrj.petsi.opensoils&hl=en
relatórios digitais com descrição de um perfil contendo dados curados e imagens dos
horizontes daquele perfil (Figura 2C) (camadas II e III). Por fim, a visualização espacial dos
perfis ilustrados através do aplicativo OpenSoils Edu (Figura 2D), onde os pins (cor
vermelha) representam a geolocalização de todos os perfis de um projeto de levantamento de
dados de solos.
CONCLUSÕES
Ao mesmo tempo em que os solos fornecem um espaço vital para os seres humanos, eles
estão sob pressão, devido ao aumento da população e crescentes demandas por alimentos ou
aos usos competitivos da terra.
Neste artigo, apresentamos o OpenSoils, uma plataforma centrada em dados de solos
que fornece apoio ao ciclo de vida de estudos na Ciência do solo. A plataforma, está em
atualização constante, mas já pode ser utilizada em projetos de levantamentos pedológicos
multi-escalares, na conservação e o uso sustentável do solo ou em atividades ligadas à
Agricultura 4.0. A plataforma está em constante evolução, porém é capaz de armazenar e
compartilhar datasets curados e permite a coleta de dados em diversos pontos do ciclo de
vida, sendo capaz de auxiliar nas tomadas de decisão.
Como trabalhos futuros, planejamos continuar a implementação da plataforma, em
especial no mapeamento da API da camada II que facilitarão conectividade com redes de
sensores de solos e ferramentas de terceiros. Adicionalmente, investiremos mais esforços nos
módulos da camada IV que permitirão investigar a ligação semântica entre os datasets de
solos do OpenSoils com datasets produzidos por organismos internacionais, tais como WoSIS
Soil Profile Database. Além disso, planejamos incorporar recursos do modelo de ciência
cidadã e envolver uma rede de voluntários para auxiliar na coleta de novos dados de solos a
serem utilizados nas pesquisas em segurança de solos.
AGRADECIMENTOS
O presente trabalho foi parcialmente realizado com apoio da Programa de Educação Tutorial
(PET-SI, da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior Brasil
(CAPES) Código de Financiamento 001 e do Conselho Nacional de Pesquisas (CNPq)
Código de Financiamento produtividade DT-II (315399/2018-0). Agradecimentos ao
professor Marcos Cedia pelo apoio na área de solos.
REFERÊNCIAS
ANTLE J.M., JONES J.W., ROSENZWEIG C.E., Next generation agricultural system data,
models and knowledge products: Introduction. Agricultural Systems.; 2017, pp. 155:186-190.
BAMBINI, M.D., BONACELLI, M. B. M., HIHA, R. H., Pesquisa Agropecuária No
Contexto Da E-Science: Monitoramento de Temas e Plataformas de Data Science. 56
Congresso SOBER, Campinas, SP. 2018, 20pp.
CRUZ, S. M. S et al. OpenSoils: e-Science em Segurança de Solos II. Encuentro
Latinoamericano de e-Ciencia (TICAL), Cartagena da Índias. Anais da Octava Conferência de
Directores de Tecnología de Información y Comunicación en Instituciones de Educación
Superior, y II Encuentro Latinoamericano de e-Ciencia 2018. 8p.
CRUZ, S. M. S e NASCIMENTO, J. A. P., Towards integration of data-driven agronomic
experiments with data provenance. Computers and Electronics in Agriculture, v. 161, 2019,
pp. 14-28.
CARACCIOLO C. et al., The AGROVOC linked dataset, Semant. Web, vol. 4, no. 3, 2013,
pp. 341348.
DEELMAN, E., GANNON, D., SHIELDS, M., TAYLOR, I., Workflows and e-Science: An
overview of workflow system features and capabilities, Futur. Gener. Comput. Syst., vol. 25,
no. 5, 2009, pp. 528540.
FECHER B., FRIESIKE S., Open Science: One Term, Five Schools of Thought, Open. Sci.,
2014, pp. 1747.
FREIRE, J., KOOP, D., SANTOS, E., SILVA, C. T., Provenance for computational tasks: A
survey, Comput. Sci. Eng., vol. 10, no. 3, 2008, pp. 1121.
HEY T., TANSLEY S., TOLLE K., The Fourth Paradigm: Data-Intesive Scientific
Discovery. 2009.
KOCH A. et al., Soil Security: Solving the Global Soil Crisis, Glob. Policy, vol. 4, no. 4, Nov.
2013, pp. 434441.
KRIPPENDORFF, K. Propositions Of Human-Centeredness: A Philosophy For Design. In:
Durling, D. Friedman, K. (Eds.). Doctoral Education in Design: Foundations for the Future.
Staffordshire (UK): Staffordshire Univ.Press. 2000, pp.55-63.
MASSRUHÁ, S. M. F. S.; LEITE, M. A. de A. AGRO 4.0 no meio rural. Futuro das TICs na
AGRO 4.0. 2017.
MATTOSO M. et al., Towards supporting the life cycle of large scale scientific experiments,
Int. J. Bus. Process Integr. Manag., vol. 5, no. 1, 2010, pp. 79.
MOREAU, L., MISSIER, P., PROV-DM: The PROV Data Model, W3C Recommendation,
2013. [Online]. http://www.w3.org/TR/prov-dm/.
PRONASOLOS. 2019. [Online]. https://www.embrapa.br/pronasolos
SiBCS. 2019. [Online]. https://www.embrapa.br/solos/sibcs
WILKINSON M. D. et al., The FAIR Guiding Principles for scientific data management and
stewardship, Sci. Data, vol. 3, Mar. 2016. pp. 160018.
WOLFERT S., GE L., VERDOUW C., BOGAARDT M. J., Big Data in Smart Farming A
review, Agric. Syst., vol. 153, 2017, pp. 6980.
... They have multiple semantics and formats and little or no provenance metadata. These silos are isolated, undocumented, and stored in laboratories or institutions with limited findability, accessibility, and security guarantees (Cruz et al., 2019;. ...
Conference Paper
Full-text available
Blockchain technology combined with Data provenance is one way to make soil data more trustworthy and traceable by providing tamper-proof information about the origin, transformations, and history of pieces of data. We present Hyperledger Fabric of FAIRCHAIN, a computational infrastructure that manages smart contracts that uses soil data. We aim to mitigate the open challenges of the agricultural food supply chain, specifically in the difficulty of traceability of soil data. In this work, we present the mechanism to structure a smart contract using soil data enriched with retrospective provenance metadata. The infrastructure can hold workflow implementations.
... Este trabalho tem como objetivo propor a melhoria de uma plataforma que já tem um aporte inicial para suportar a proveniência de dados e um potencial para se tornar um modelo seguro de base para coleta de dados de solo. Dentro desse contexto, apresentamos nas seções abaixo uma proposta de como a plataforma OpenSoils [6], [7] pode, futuramente, contribuir muito mais para tornar, tanto pesquisas voltadas para dados de solos quanto para aplicações no campo, mais seguras, confiáveis e dinâmicas. 1 Dados de solos TICAL2020 y 4° Encuentro Latinoamericano de e-Ciencia La ruta digital de una Universidad inteligente" Cuenca, Ecuador, septiembre de 2020 Princípios FAIR Em 2014, em uma conferência intitulada "Jointly designing a data FAIRPORT", foram discutidos os obstáculos relativos à utilização e reutilização de dados científicos; foram propostas soluções a estes problemas através da criação de uma infraestrutura global para dados no contexto da e-Science. ...
Conference Paper
Full-text available
A quantidade de dados que são gerados diariamente, em todas as áreas do conhecimento, necessita de uma forma controlada de extração para que sejam usados de modo analítico, mostrando de onde são extraídas as descobertas com habilidade para transformar a realidade. Neste contexto, a agricultura está sendo transformada por dados, em especial, dados abertos, usados para ajudar agricultores, pesquisadores e formuladores de políticas para tomadas de decisão mais crítica. Neste trabalho foi feita uma análise teórica dos princípios FAIR com foco na e-Science, proveniência e na segurança de dados digitais na Agricultura digital, em especial na área de solos. A sociedade busca cada vez mais segurança e controle de suas informações e a tecnologia blockchain está alinhada com estas tendências. Analisando os conceitos inerentes aos princípios FAIR, mostra-se a aderência da tecnologia blockchain a estes conceitos. Apresentamos uma proposta de melhoria de uma plataforma que já tem todo um aporte para a proveniência de dados e um potencial enorme para se tornar um modelo seguro de base para coleta de dados de solo, a OpenSoils. A blockchain traz consenso e confiança na comunicação P2P, capacita os usuários (que controlam diretamente suas informações e transações), oferece durabilidade, confidencialidade e longevidade, traz dados de alta qualidade e integridade ao processo, além de transparência e imutabilidade, transações mais rápidas com baixo custo e totalmente digital. A introdução da tecnologia blockchain nesta plataforma pode, futuramente, contribuir para tornar, tanto pesquisas voltadas para dados de solos quanto para aplicações no campo, mais confiáveis e dinâmicas.
Article
Full-text available
With improvements in computing and communications, the amount of scientific data in agriculture has been exploding. Thus, researchers must rely on computational simulations to model the data-driven in silico agronomic experiments, the in silico experiments are those that are completely executed by using computer models. Reproducibility, transparency, independent verification are major features of Science. However, even agricultural research of exemplary quality may have irreproducible empirical findings because of random or systematic error. Funding agencies, researchers, and reviewers are demanding improved processes and the use of open data to increase reproducibility of those experiments. Currently, there are no scientific criteria to evaluate the integration of data-driven agronomic experiments with data provenance. We propose RFlow, a framework that aid researchers to manage, share, and enact the scientific in silico experiments of research projects that use reusable R scripts. The framework uses open data standards and transparently captures provenance of the agronomic experiments. RFlow is non-intrusive, can be connected to workflow systems and does not require researchers to change their working way. Our computational experiments show that the framework can collect provenance metadata and enrich a scientific project. This study shows how RFlow can serve as the primary integration platform for statistical systems, like R, with implications for other data and compute-intensive agronomic projects. As a proof of concept, we show the concrete effectiveness and expressive power of the RFlow which was evaluated through a set of data-driven agronomic in silico experiments and provenance SQL queries that exemplifies what kind of information was gathered.
Article
Full-text available
Smart Farming is a development that emphasizes the use of information and communication technology in the cyber-physical farm management cycle. New technologies such as the Internet of Things and Cloud Computing are expected to leverage this development and introduce more robots and artificial intelligence in farming. This is encompassed by the phenomenon of Big Data, massive volumes of data with a wide variety that can be captured, analysed and used for decision-making. This review aims to gain insight into the state-of-the-art of Big Data applications in Smart Farming and identify the related socio-economic challenges to be addressed. Following a structured approach, a conceptual framework for analysis was developed that can also be used for future studies on this topic. The review shows that the scope of Big Data applications in Smart Farming goes beyond primary production; it is influencing the entire food supply chain. Big data are being used to provide predictive insights in farming operations, drive real-time operational decisions, and redesign business processes for game-changing business models. Several authors therefore suggest that Big Data will cause major shifts in roles and power relations among different players in current food supply chain networks. The landscape of stakeholders exhibits an interesting game between powerful tech companies, venture capitalists and often small start-ups and new entrants. At the same time there are several public institutions that publish open data, under the condition that the privacy of persons must be guaranteed. The future of Smart Farming may unravel in a continuum of two extreme scenarios: 1) closed, proprietary systems in which the farmer is part of a highly integrated food supply chain or 2) open, collaborative systems in which the farmer and every other stakeholder in the chain network is flexible in choosing business partners as well for the technology as for the food production side. The further development of data and application infrastructures (platforms and standards) and their institutional embedment will play a crucial role in the battle between these scenarios. From a socio-economic perspective, the authors propose to give research priority to organizational issues concerning governance issues and suitable business models for data sharing in different supply chain scenarios.
Article
Full-text available
There is an urgent need to improve the infrastructure supporting the reuse of scholarly data. A diverse set of stakeholders—representing academia, industry, funding agencies, and scholarly publishers—have come together to design and jointly endorse a concise and measureable set of principles that we refer to as the FAIR Data Principles. The intent is that these may act as a guideline for those wishing to enhance the reusability of their data holdings. Distinct from peer initiatives that focus on the human scholar, the FAIR Principles put specific emphasis on enhancing the ability of machines to automatically find and use the data, in addition to supporting its reuse by individuals. This Comment is the first formal publication of the FAIR Principles, and includes the rationale behind them, and some exemplar implementations in the community.
Article
Full-text available
We are now seeing governments and funding agencies looking at ways to increase the value and pace of scientific research through increased or open access to both data and publications. In this point of view article, we wish to look at another aspect of these twin revolutions, namely, how to enable developers, designers and researchers to build intuitive,multimodal, user-centric, scientific applications that can aid and enable scientific research.
Article
Full-text available
Born in the early 1980's as a multilingual agricultural thesaurus, AGROVOC has steadily evolved over the last fifteen years, moving to an electronic version around the year 2000, and embracing the Semantic Web shortly thereafter. Today AGROVOC is a SKOS-XL concept scheme published as Linked Open Data, containing links (as well as backlinks) and references to many other Linked Datasets in the LOD cloud. In this paper we provide a brief historical summary of AGROVOC and detail its specification as a Linked Dataset.
Article
Full-text available
One of the main challenges of scientific experiments is to allow scientists to manage and exchange their scientific computational resources (data, programs, models, etc.). The effective management of such experiments requires a specific set of cardinal facilities, such as experiment specification techniques, workflow derivation heuristics and provenance mechanisms. These facilities may characterise the experiment life cycle into three phases: composition, execution, and analysis. Works concerned with supporting scientific workflows are mainly concerned with the execution and analysis phase. Therefore, they fail to support the scientific experiment throughout its life cycle as a set of integrated experimentation technologies. In large scale experiments this represents a research challenge. We propose an approach for managing large scale experiments based on provenance gathering during all phases of the life cycle. We foresee that such approach may aid scientists to have more control on the trials of the scientific experiment.
Article
Full-text available
Some important concepts related to systematically capture and manage provenance for computational tasks that has relevance to a wide range of domains and applications have been discussed. A provenance management solution comprises three main components, a capture mechanism, a representational model, and an infrastructure for storage, access, and queries. A provenance capture mechanism requires access to a computational task's relevant details such as its steps, execution information, and user-specific annotations. Operating system (OS)-based capture mechanisms do not require modifications to existing processes and are agnostic about how tasks are modeled. A wide variety of data models and storage systems ranging from specialized Semantic Web languages and XML dialects stored as files to tuples stored in relational database tables have also been proposed to facilitate an infrastructure for effectively and efficiently querying data in a provenance management system.
Article
Full-text available
Scientific workflow systems have become a necessary tool for many applications, enabling the composition and execution of complex analysis on distributed resources. Today there are many workflow systems, often with overlapping functionality. A key issue for potential users of work- flow systems is the need to be able to compare the capabilities of the various available tools. There can be confusion about system functionality and the tools are often selected without a proper functional analysis. In this paper we extract a taxonomy of features from the way sci- entists make use of existing workflow systems and we illustrate this feature set by providing some examples taken from existing workflow systems. The taxonomy provides end users with a mechanism by which they can assess the suitability of workflow in general and how they might use these features to make an informed choice about which workflow system would be a good choice for their particular application.
Article
Full-text available
This paper explores the discourse needed to both institute a Ph.D. in Design and face the challenges of contemporary technologies. Concerning these challenges, it draws on a recent history of paradigmatic design problems, and argues that we are in transition from a culture that is dominated by science (modernism), to one that embraces design as its primary organizing feature (constructivism). To this end, it offers several propositions of an epistemologically informed and, hence, human-centered philosophy for design. Concerning a Ph.D. in Design, the paper opposes modeling this degree on the tradition of scientific research and suggests instead that design scholarship address improvements of design practices. It culminates in a sketch of what a human-centered design discourse might embrace. Ph.D. dissertations should reflect on and contribute to the practices of the community that grants the degree. The paper demonstrates both and invites Ph.D. scholarship to continue along this path.
Article
Soil degradation is a critical and growing global problem. As the world population increases, pressure on soil also increases and the natural and the natural capital of soil faces continuing decline, international policy makers have recognized this and a range of initiatives to address it have emerged over recent years. However, a gap remains between what the science tells us about soil and its role in underpinning ecological and human sustainable development, and existing policy instruments for sustainable development. Functioning soil is necessary for ecosystem service delivery, climate change abatement, food and fiber production and fresh water storage. Yet key policy instruments and initiatives for sustainable development have under-recognised the role of soil in addressing major challenges including food and water security, biodiversity loss, climate change and energy sustainability. Soil science has not been sufficiently translated to policy for sustainable development. Two underlying reasons for this are explored and the new concept of soil security is proposed to bridge the science policy divide. Soil security is explored as a conceptual framework that could be used as the basis for a soil policy framework with soil carbon as an exemplar.