Article

Desmistificando os princípios FAIR: conceitos, métricas, tecnologias e aplicações inseridas no ecossistema dos dados FAIR

Authors:
To read the full-text of this research, you can request a copy directly from the authors.

Abstract

Os princípios FAIR, um acrônimo para Findable, Accessible, Interoperable e Reusable, estão presentes nas discussões e práticas contemporâneas da ciência de dados, desde o início de 2014, e tiveram sua aplicação consolidada em 2017, quando a Comissão Europeia passou a exigir a adoção de plano de gestão de dados, com base nesses princípios, por projetos financiados por seus recursos. Desde então, tais princípios passaram a ser norteadores da descoberta, do acesso, da interoperabilidade, do compartilhamento e da reutilização dos dados de pesquisa. No entanto, quando colocados em prática levantam dúvidas e imprecisões, gerando diferentes interpretações, o que dificulta sua aplicação. Por essa razão buscou-se elucidar seu entendimento, utilizando-se de conceitos esclarecedores, apresentando métricas específicas que medem o nível de FAIRnessdos objetos digitais; disseminando a proposta do ecossistema dos dados FAIR e as tecnologias Data FAIRPort e FAIR Data Point. Apresentamos, ainda, estudos realizados na Europa que comprovam o impacto e o potencial desses princípios, em diferentes áreas disciplinares, dando destaque às necessidades e aos exemplos de aplicação. A abordagem metodológica desta pesquisa é de natureza bibliográfica e de caráter qualitativo dando ênfase na descrição conceitual dos elementos necessários para a compreensão do ecossistema FAIR, o que permitiu, neste estudo, trabalhar a fundamentação teórica e conceitual, bem como o uso das práticas do FAIR em diferentes contextos e dimensões. As considerações finais corroboram as mudanças culturais e tecnológicas que vêm ocorrendo, no mundo informacional, relacionadas às novas práticas de gestão de dados e às interações e parcerias necessárias para a sua complexaimplementação.

No full-text available

Request Full-text Paper PDF

To read the full-text of this research,
you can request a copy directly from the authors.

... Os princípios FAIR, um acrônimo para Findable, Accessible, Interoperable e Reusable são norteadores na gestão de dados de metadados. (Henning et al., 2018). Natal, v. 9, n. 2, p. 145 -153, 2023. ...
Article
Full-text available
O artigo investiga a percepção de pesquisadores sobre metadados de proveniência necessários para o reúso de dados de pesquisa em COVID-19. A metodologia envolveu uma revisão de fontes bibliográficas e documentais, nacionais e internacionais e a aplicação de um instrumento de coleta de dados. Os resultados revelaram que a maioria dos repositórios que armazenam dados de pesquisa em COVID-19 opta por não adotar os padrões de metadados amplamente reconhecidos pela comunidade científica. Os participantes destacaram a importância de informações claras nos metadados, como tema ou palavras-chave, informações sobre licenças de uso, detalhes sobre os coletores de dados e estratégias de preservação em longo prazo. Os metadados de proveniência atualmente em uso não oferecem robustez necessária para garantir o reúso eficaz dos dados de pesquisa em COVID-19, cruciais para evitar ou responder a outra emergência sanitária.
... Esforços para a disseminação e adoção dos princípios FAIR têm sido desenvolvidos em todo o mundo, por meio de redes de escritórios regionais, estudos e novas definições de padrões de dados e metadados; disseminação do uso de proveniência de dados, vocabulários controlados, ontologias e adoção de identificadores persistentes que proporcionam significado preciso aos dados e aos demais objetos a eles vinculados [Henning et al., 2019]. Espera-se que, com a implementação da Rede GO-FAIR Brasil Agro, pesquisadores e profissionais que permeiam toda a cadeia do agronegócio e que atuam na interface entre as Ciências Agrárias e da Ciência da Computação contribuam para alavancar a adoção dos princípios FAIR neste domínio científico, bem como para expandir a cultura da promoção de melhores práticas de gestão de dados e de outros objetos digitais. ...
Conference Paper
Full-text available
O presente trabalho tem o objetivo de apresentar os esforços que estão em curso para a estruturação da Rede de Implementação Temática GO-FAIR Brasil Agro, sua relação com as iniciativas GO-FAIR Internacional e GO-FAIR Brasil. A importância dos pilares de mudança cultural, treinamento e infraestrutura também é destacada, bem como a proposta de objetivos da rede brasileira voltada para promover o compartilhamento e o reúso de dados de pesquisa em ciências agrárias, apoiado nos princípios FAIR. Como resultados, o trabalho mostra a trajetória percorrida até o momento e aponta para a elaboração de um Manifesto pactuado e construído através de participação das comunidades de Ciências Agrárias e afins.
... Since the end of 2017, this Brazilian fostering agency demands a data management plan for some of the thematic projects from applicants to research financing. 1 In December Furthermore, it is being drafted a Data Management Plan to be used by all of its research units. The Brazilian Institute of Science and Technology Information (IBICT) has recently joined the GO FAIR initiative supported by the Dutch German and French governments, and that have the mission to help all the associated countries to adhere to FAIR principles as part f the Global Internet of FAIR services and data. ...
Article
A abertura, compartilhamento e reuso dos dados de pesquisa são práticas recorrentes nas discussões contemporâneas da ciência de dados, em todo o mundo. A importância dessas temáticas ocorre não apenas por dar maior transparência e visibilidade as pesquisas financiadas com recursos públicos, mas principalmente, pelo leque de opções que se abre para a geração de novos recursos informacionais, contribuindo fortemente para o avanço da ciência.No Brasil, essa discussão nasce nas universidades e institutos de pesquisa sendo necessária sua adesão à filosofia da Ciência Aberta que visa, entre diversas práticas, o acesso aberto à informação cientifica e aos dados de pesquisa. Além disso, busca promover ações colaborativas que incentivem o compartilhamento e reuso dos dados entre os pesquisadores.No entanto, devido as características inerentes aos dados das diferentes áreas do conhecimento, além da necessidade de tratá-los e guardá-los por um longo prazo, se faz indispensável repensar quais as melhores práticas de gestão de dados que deverão ser adotadas. Segundo Henning et al (2018) “Esta gestão deve promover a identificação de princípios teóricos que apoiem os processos de organização, significação e recuperação, dando coerência, com o desenvolvimento de normas e métricas de apoio.”
Article
Full-text available
O movimento do acesso aberto está sendo impulsionado pela iniciativa Open Science, onde, em essência, os objetos de pesquisa e resultados obtidos em investigações vão além da produção documental em C&T, pois passam a incorporar também os dados que são utilizados no desenvolvimento dessas pesquisas. A disponibilização desses dados deve ser implementada de forma a possibilitar que outras iniciativas de pesquisa possam reutilizá-los no contexto de novas investigações. Este relato explora o uso do banco de dados do projeto Música em Periódicos Oitocentistas (MPO) e apresenta o protótipo com a iniciativa de compartilhamento de dados desse projeto. O desenvolvimento do protótipo para compartilhamento seguiu as recomendações apresentadas pelos princípios FAIR (Findable, Accessible, Interoperable e Reusable), pois a adoção desses princípios promove a melhoria no compartilhamento de dados de pesquisa. A metodologia utilizada combina métodos e abordagens epistemológicas, avaliando os dados de forma qualitativa e utilizando a revisão bibliográfica para reunir os aspectos teóricos envolvidos, além da aplicação prática por meio de estudo de caso para a composição dos conjuntos de dados. Fazendo uso do processo de FAIRficação (FAIRfication process) sobre conjuntos de dados do projeto MPO, selecionados a partir do periódico A Marmota na Corte, foram definidas estruturas de recursos para elucidar o conjunto de dados (dataset) depositado no software CKAN - Comprehensive Knowledge Archive Network. Os resultados do protótipo apresentam a estrutura de dois conjuntos de dados que contém registros com descrições textuais de notícias sobre música no século XIX. Os conjuntos de dados estão publicados sob licenciamento Creative Commons Attribuition License (cc-by) e hospedados na plataforma CKAN, possibilitando que o seu conteúdo possa ser reutilizado por pesquisadores interessados na temática.
Article
Full-text available
Resumo As agências de fomento dos países desenvolvidos começaram a exigir o depósito, em acesso aberto, dos dados de pesquisa, para isso eles precisam cumprir exigências que permitam sua integridade, completude, qualidade e correta descrição dos seus metadados. Surgem assim, os Princípios FAIR - Findability, Accessibility, Interoperability, and Reusability, diretrizes para melhorar a reutilização dos dados de pesquisa. Com o objetivo de contribuir para essas discussões, este artigo buscou verificar a adoção dos Princípios FAIR nos datasets depositados no repositório LattesData, a partir do uso da ferramenta F-UJI. Essa ferramenta foi desenvolvida para automatizar o trabalho de análise das métricas do FAIR. Do ponto de vista metodológico, esta é uma pesquisa de caráter descritivo, na qual foram analisados 13 datasets disponíveis no LattesData. Os resultados obtidos permitem observar que o princípio da Encontrabilidade foi o melhor contemplado nos datasets, os princípios da Acessibilidade, da Interoperabilidade e da Reutilização, carecem de atenção, pois nem todas as métricas foram contempladas. Conclui-se que o repositório LattesData tem adotado os Princípios FAIR, ainda que de maneira incipiente. Necessita de políticas e diretrizes que garantam que os dados depositados possam ser reutilizados. A F-UJI se mostrou uma ferramenta prática e simples de ser utilizada. O uso de ferramentas para a gestão de dados de pesquisa pode facilitar na implementação de boas práticas e no depósito de conjunto de dados com qualidade.
Chapter
In the information age, it is urgent to work in a collaborative network, as well as the identification of researchers in specific areas in the globalized world. In this time, half of the world's population does not have access to essential health services, and more than one billion are threatened by neglected diseases. Information management helps in the identifying, extracting, and treating. In Brazil, the Lattes platform is the main curriculum repository for scientists and professionals in the different areas of scientific knowledge. After processing, 105 specialists were identified. Scientific articles published on Dengue, Zika virus, and Chikungunya are 11,743. The computational tool ScriptLattes proved to be efficient to extract, identify, and recover data from the curricula present in the Lattes database, contributing to the management of scientific knowledge in public health. Thus, Dengue, Zika, and Chikungunya infection data extracted from the platform generate information to assist in the knowledge management and decision makers for public health.
Article
Full-text available
Introdução: trata-se de um levantamento da produção científica na Ciência da Informação em torno dos repositórios de dados de pesquisa. A produção científica é fundamental para entender o estado da arte e o seu desenvolvimento ao longo dos anos, principalmente de temas emergentes como aqui propostos. Os dados de pesquisa são os insumos principais para o fazer científico na e-Science, preocupada com o reuso, compartilhamento, colaboração, economia, intercâmbio e rapidez das pesquisas. Objetivo: apresentar um panorama da produção científica na Ciência da Informação em torno do tema repositórios de dados de pesquisa. Método: esta é uma pesquisa exploratória, bibliográfica e quantitativa a partir dos resultados encontrados nas seguintes fontes de informação: BRAPCI, SciELO, Portal de Periódicos da CAPES, BDTD e Lisa. Resultados: recuperou-se um total de 127 trabalhos publicados em periódicos científicos, com 290 autores diferentes. A literatura em inglês começou em 2009 a publicar relatos de repositório de dados, sendo recuperados trabalhos sobre metadados e padrões de interoperabilidade de dados desde 2005. Percebe-se que o primeiro artigo brasileiro recuperado nas buscas é de 2015. Já 2019 constitui-se como o ano em que mais se publicou sobre o tema, com nove artigos, contra cinco publicados em inglês.Conclusão:: é um tema emergente e com produção crescente dentro da CI no Brasil, necessitando de bibliotecários com conhecimentos e habilidades para a gestão de repositórios e dados de pesquisa.
Article
Full-text available
Introdução: Trata-se de um levantamento da produção científica em torno dos repositórios de dados e ciência da informação. A produção científica é fundamental para entender o estado da arte e o seu desenvolvimento ao longo dos anos, principalmente de temas emergentes como repositórios de dados. Os dados de pesquisa são os insumos principais para o fazer científico na e-Science, preocupada com o reuso, compartilhamento, colaboração, economia, intercâmbio e rapidez das pesquisas ao se depositar todos os dados produzidos em repositórios de dados. Objetivo: Recuperar artigos científicos sobre repositórios de dados na literatura da área de Ciência da Informação (CI). Método: Esta é uma pesquisa exploratória, bibliográfica e quantitativa. Consultou-se nas bases: Brapci, Scielo, Portal de Periódicos da Capes, BDTD e Lisa. Resultados: recuperou-se um total de 127 trabalhos publicados em periódicos científicos, com 290 autores diferentes e predominantemente em língua inglesa com 93 artigos, em segundo lugar o português com 25 artigos, em terceiro lugar 3 artigos em inglês/português. A literatura em inglês começou desde 2009 a publicar relatos de repositório de dados, sendo recuperados trabalhos sobre metadados e padrões de interoperabilidade de dados desde 2005. Percebe-se que o primeiro artigo brasileiro recuperado nas buscas é de 2015. Sendo 2019 o ano que mais publicou-se sobre o tema com nove artigos, contra cinco publicados em inglês. Conclusão: É um tema emergente e com produção crescente dentro da CI no Brasil, necessitando de bibliotecários com conhecimentos e habilidades para a gestão de repositórios e dados de pesquisa.
Article
Full-text available
Objetivo: Inserido no contexto do potencial dos dados de pesquisa para o avanço científico, o presente artigo busca avaliar a conformidade dos datasets depositados no repositório da Universidade Federal de São Carlos (UFSCar) quanto aos 4 princípios FAIR. Metodologia: A pesquisa é de natureza quantitativa, com caráter descritivo e exploratório. A amostra contempla os 12 datasets depositados no repositório institucional da UFSCar. Como instrumento de coleta de dados, utilizou-se a ferramenta auxiliar F-UJI, que permite a avaliação automática dos datasets e fornece relatórios de feedback. Resultados: A média de pontuação geral quanto à aderência dos datasets aos princípios foi de 30%. As pontuações individuais para cada um dos quatro princípios também foram baixas, com as maiores notas sendo: 4/7 para encontrável, 1,5/3 para acessível, 1/4 para interoperável e 2/4 para reusável. Conclusões: Para que o repositório da UFSCar siga as diretrizes internacionais de boas práticas, recomenda-se à instituição que considere a implementação gradual dos princípios FAIR como uma melhoria do serviço, especialmente em relação ao princípio interoperável, um dos aspectos essenciais quando se fala em repositórios de dados de pesquisa. Descritores: Dados de pesquisa. Repositório institucional. Princípios FAIR. Certificação. 1 INTRODUÇÃO No contexto atual dos avanços tecnológicos, pesquisadores têm produzido quantidades cada vez maiores de dados para suas pesquisas, muitos dos quais são poucos explorados em seu potencial para os avanços científicos
Article
Full-text available
Introdução: o desenvolvimento de modelos conceituais como artefatos de referência para compreensão de domínios do conhecimento contribui para auxiliar na redução da distância semântica entre a representação e a interpretação das informações. Tomando por base o contexto do compartilhamento de dados nos esforços do acesso aberto à produção em Ciência & Tecnologia, bem como as dificuldades originadas pela crise da reprodutibilidade, este relato analisa a existência de modelos semânticos para representação no contexto das GLAM (Galleries, Libraries, Archives and Museums). Objetivo: propor a análise desse rol de modelos em busca da homogeneização das representações dos objetos componentes das pesquisas, à luz dos princípios FAIR e apresentar um modelo de referência que permita a convergência nas representações. Metodologia: combinando métodos e abordagens epistemológicas, este position paper usou pesquisa exploratória com análise bibliográfica e documental para identificar padrões de representação. Resultados: apresenta o conjunto de instrumentos identificados e categorizados segundo sua aplicabilidade, além de uma proposta de modelo semântico. Conclusões: este relato aponta para a necessidade de convergência de padrões de representação em conjunto com modelos conceituais, como forma de viabilizar a interoperabilidade e o uso dos princípios FAIR.
ResearchGate has not been able to resolve any references for this publication.