ChapterPDF Available

Elaboração de estratégia para mensuração de critérios de qualidade na recuperação de datasets disponíveis em sítios governamentais

Authors:

Abstract and Figures

Este texto descreve estudo realizado a partir de documentos propostos pelo Open Data for Development, na fase de recuperação e focando no objetivo da qualidade dos dados, em especial ao analisar estruturas de páginas com especificações descriti- vas de datasets governamentais, no intuito de identificar formas de mensurar nestes ambientes os critérios de qualidade. A metodologia adotada foi a pesquisa explorató- ria, descritiva, de caráter qualitativo, com amostra delimitada ao conjunto de páginas com especificações descritivas de datasets do ‘Portal e-Cidadania’. Como resultado, propõe-se 7 dimensões de análise: Relevância, Precisão, Temporalidade e Pontuali- dade, Acessibilidade e Clareza, Comparabilidade e Coerência e Padronização.
Content may be subject to copyright.
IX Congresso
Comunicação e Transformações Sociais
Volume 1
CNCIA DA INFORMAÇÃO
COMUNICAÇÃO E EDUCAÇÃO
Coimbra
2015
FICHA TÉCNICA
TUL O
Comunicação e Transformações Sociais (vol. 1)
Ciência da Informação, Comunicação e Educação
EDITORES
Carlos Camponez
Bruno Araújo
Francisco Pinheiro
Inês Godinho
João Morais
IMAGEM DE CAPA
Emanuel Pimenta
PAGINAÇÃO
Filomena Matos
ISBN
978-989-99840-0-4
Coimbra, 2017
© O conteúdo desta obra está protegido por Lei. Qualquer forma de reprodução, distribuição,
comunicação pública ou transformação da totalidade ou de parte desta obra carece de expressa
autorização do editor e dos seus autores. Os artigos, bem como a autorização de publicação das
imagens são da exclusiva responsabilidade dos autores.
APOIOS
Comissão Cientíca Editorial Comissão Cientíca do Congresso
Carlos Camponez Ana Lúcia Terra
Bruno Araújo Ana Teresa Peixinho
Francisco Pinheiro Clara Almeida Santos
Gil Baptista Ferreira Carlos Camponez
Inês Godinho Eduardo Camilo
Joana Lobo Fernandes Fábio Ribeiro
João Miranda Felisbela Lopes
João Morais Francisco Pinheiro
Pedro Jerónimo Gil Baptista Ferreira
Rosa Sobreira Inês Godinho
Sara Meireles Isabel Ferin
Sílvio Santos Isabel Vargues
Joana Lobo Fernandes
João Carlos Correia
João Figueira
João Morais
Jorge Pedro Sousa
José Gomes Pinto
Luís Costa Dias
Madalena Oliveira
Maria Augusta Babo
Maria João Silveirinha
Maria da Luz Correia
Nilza Sena
Mirian Tavares
Moisés de Lemos Martins
Óscar Mealha
Paulo Serra
Pedro Jorge Braumann
Rita Basílio de Simões
Rosa Maria Sobreira
Sandra Pereira
Sara Pereira
Silvana Mota-Ribeiro
Sílvio Correia Santos
Índice
PREFÁCIO 1
INTRODUÇÃO 5
CIÊNCIA DA INFORMAÇÃO 9
Servicios a la investigación en la biblioteca universitaria: gestión de la identidad
digital
Viviana Fernández Marcial & Llarina González Solar 10
A abordagem sistémica na gestão da informação na Universidade de Coimbra:
potencialidade e desaos, presente e futuro
Liliana Isabel Esteves Gomes 24
Relações (inter)disciplinares entre a Ciência da Informação e a Ciência da Comu-
nicação: uma análise bibliométrica das cocitações e mobilidade das bancas
nas teses de programas brasileiros de pós-graduação
João de Melo Maricato & Filipe Reis 36
Informação, comunicação e conhecimento: os desaos da sociedade do século XXI
Maria Beatriz Marques 48
Uma perspectiva histórica sobre as licenças de acesso à informação: das licenças
de software ao licenciamento de livros electrónicos em bibliotecas públicas
António Machuco Rosa 63
Normalização – condição sine qua non para a comunicação da informação em
arquivos históricos ou denitivos
Gracinda Maria Ferreira Guedes 76
Nós na rede. Conexão e participação em dois grupos do Facebook a partir dos
digital methods
Jorge Martins Rosa & Janna Joceli C. de Omena 81
Mediatização das Marchas Populares de Lisboa: análise de um metaprocesso histórico-
social
Élmano Ricarte de Azevêdo Souza & Rita Maria Brás Pedro Figueiras 99
i
Twitter e a Privacidade: A partilha de Estratégias e Ferramentas
Ana Serrano Tellería 112
Políticas de gestão do e-mail: uma abordagem comparativa de recomendações
nacionais
Ana Lúcia Terra 144
Elaboração de estratégia para mensuração de critérios de qualidade na recupera-
ção de datasets disponíveis em sítios governamentais
Fernando de Assis Rodrigues & Ricardo César Gonçalves Sant’Anaa 155
Diretrizes curriculares nacionais e a construção de propostas curriculares ino-
vadoras: um estudo de cotejamento dos projetos políticos pedagógicos da
UNIRIO e UFMG
Dayanne da Silva Prudencio & Mara Eliane Fonseca Rodrigues 170
Biomechanics and Animation: information technology and arts interactions
José Maria Dinis, Filipe Costa Luz & João M.C.S. Abrantes 186
Técnicas infográcas para dashboard turístico open data
Ricardo Carvalho & Óscar Mealha 196
Tradição é herança cultural: memória em arquivos e as transformações sociais
Zeny Duarte 219
Comportamento infocomunicacional online dos docentes/ investigadores do Cen-
tro de Ciências Sociais e Humanas (CCSO/ CCH) da Universidade Federal
do Maranhão (UFMA)
Raimunda Ribeiro, Lídia Oliveira & Cassia Furtado 228
Acessibilidade e produtos de apoio nas bibliotecas universitárias brasileiras e por-
tuguesas: ações e estratégias
Isabel Cristina dos Santos Diniz, Ana Margarida Almeida & Cassia Cordeiro
Furtado 244
COMUNICAÇÃO E EDUCAÇÃO 258
Educação e comunicação: a aproximação entre as ciências
Suyanne Tolentino de Souza 259
A visão de adolescentes com câncer sobre a divulgação da sua imagem: entre a
privacidade e a autoarmação
Lidia Marôpo, Raiana de Carvalho & Inês Vitorino Sampaio 274
ii
Comunicação e ludicidade como plataforma teórica na projeção do modelo cria-
in-forma-ação
Filipe Manuel Dias Vagos 284
La Web 2.0 comme resource emancipateur pour la conception de musées numeri-
ques communautaires
Rita de Cássia Maia da Silva, Lídia Oliveira & Pedro Miguel dos Santos Beça
Pereira 298
A criação de plataformas comunicativas para a construção de sonhos e da cidada-
nia na infância
Ana Lúcia Dias Garcia 304
A inclusão digital do idoso. Entre oportunidades e desaos
Simone Petrella & Mafalda Oliveira 319
Educação, partilha e comunicação mediada: conclusões de um estudo exploratório
em contexto educativo
Elvira Rodrigues & Joaquim Escola 330
Operacionalizar criatividades através de literacias audiovisuais para a realização
do webdocumentário “olhares sonhadores”
Vania Baldi & Inês Santos Moura 343
A importância da comunicação no desencadear de comunidades de prática. Caso
de projetos de empreendedorismo social
Ana Luísa Rego Melro & Lídia de Jesus Oliveira da Silva 355
Realidade aumentada aplicada em manuais escolares de educação visual
José Duarte Cardoso Gomes, Mário Vairinhos, Cristina Maria Cardoso Gomes
& Lídia Oliveira 361
Scratch, um brinquedo potenciador de brincadeiras das crianças
Patrícia Oliveira e Conceição Lopes 385
Práticas na rede: um estudo sobre o consumo digital dos jovens portugueses
Inês Amaral, Paula Lopes, Célia Quintas & Bruno Reis 396
Adolescentes na cibercultura: sociabilidade e construção de conhecimento – uma
pesquisa de campo
Sebastião Gomes de Almeida Júnior 402
iii
Os discursos dos jovens sobre o mundo do trabalho: pesquisa de recepção na rede
pública de ensino
Alexandre Akio Casoto Suenaga 415
A gamicação da experiência de aprendizagem – revisão metodológica de investi-
gações na área dos jogos para a educação
Conceição Costa, Sara Henriques, Carla Galego, Kathleen Tyner, Luis Pedro,
Carlos Santos & João Batista 424
Canal Laborav: práticas para um devir audiovisual inventivo
Alita Villas Boas de Sá Rego 447
Uma ferramenta para a inteligência coletiva: musibraille na educação musical e
formação na Cibercultura
Dolores Tomé & Ana Margarida Almeida 458
Reexão sobre os desaos que os seniores enfrentam aquando do uso das tecnolo-
gias da informação e comunicação
Ana Paula Henriques Vazão, Ana Isabel Veloso & Sónia Almeida Ferreira 469
iv
Elaboração de estratégia para mensuração de critérios de qualidade
na recuperação de datasets disponíveis em sítios governamentais
Fernando de Assis Rodrigues & Ricardo César Gonçalves Sant’Ana
fernando@elleth.org / ricardosantana@marilia.unesp.br
Univ Estadual Paulista – UNESP
Resumo
Este texto descreve estudo realizado a partir de documentos propostos pelo Open
Data for Development, na fase de recuperação e focando no objetivo da qualidade
dos dados, em especial ao analisar estruturas de páginas com especicações descriti-
vas de datasets governamentais, no intuito de identicar formas de mensurar nestes
ambientes os critérios de qualidade. A metodologia adotada foi a pesquisa explorató-
ria, descritiva, de caráter qualitativo, com amostra delimitada ao conjunto de páginas
com especicações descritivas de datasets do ‘Portal e-Cidadania’. Como resultado,
propõe-se 7 dimensões de análise: Relevância, Precisão, Temporalidade e Pontuali-
dade, Acessibilidade e Clareza, Comparabilidade e Coerência e Padronização.
Palavras-chave: qualidade de dados; open government data toolkit; ciclo de vida
dos dados; dados abertos; dados abertos governamentais; datasets.
1. Elaboração de estratégia para mensuração de critérios de quali-
dade na recuperação de datasets disponíveis em sítios governamen-
tais
A transformação do modo com que a sociedade interage com informações advindas de insti-
tuições públicas e privadas é parte integrante do paradigma denominado por Castells como “So-
ciedade da Informação” (Castells, Majer & Cardoso, 2007; Saracevic, 1996; Werthein, 2000).
Neste paradigma, a sociedade pós-industrial tem, dentre suas características fundamentais, uma
alta penetrabilidade do uso de Tecnologias de Informação e Comunicação (TIC) no desempenho
de ações e de atividades humanas; e do uso de dados e de informação como principal insumo e
capital (Castells, 2004; Castells et al., 2007; Sant’Ana & Rodrigues, 2013).
O uso de TIC para a abertura e divulgação de datasets (conjunto de dados) governamentais
oferece novas oportunidades: a) aos Estados, pois a partir da divulgação e acesso a estes da-
tasets é possível ter mais precisão nas análises sobre a gestão pública; e b) aos cidadãos, pois
este processo de divulgação permite melhor acompanhar questões como a gestão pública e a
política, ao tornar disponível datasets governamentais contendo informações sobre repasses pú-
blicos nanceiros, resultados de votações de câmaras, decisões de cortes, entre outros (Bohman,
2000; Diniz, 1996; Marcondes & Jardim, 2003; Rodrigues & Sant’Ana, 2009; 2013; Sant’Ana
& Rodrigues, 2013).
IX Congresso Sopcom. pp. 155-169.Coimbra, novembro de 2015
156 Fernando de Assis Rodrigues & Ricardo César Gonçalves Sant’Ana
Os Estados signatários da Open Government Partnership – parceria de Estados em prol da
união de esforços na formação de uma gestão pública mais transparente aos cidadãos – têm papel
de destaque em iniciativas de abertura de datasets governamentais. O Estado brasileiro é signa-
tário e primeiro colíder desta parceria; possui legislação vigente sobre a temática, consolidando
a adoção da Internet como infraestrutura obrigatória para ampla publicidade de datasets gover-
namentais brasileiros (Brasil, 2011; Open Government Partnership, 2014; Rodrigues, Sant’Ana
& Ferneda, 2015; Rodrigues et al., 2015).
Paralelo a este processo, iniciativas como o Open Data for Development (OD4D), estabele-
cido a partir da combinação de esforços e nanciamento de agências governamentais do Canadá,
do Reino Unido e do Banco Mundial, contribuíram para o surgimento de frameworks (estruturas
de trabalho) com o objetivo de auxiliar agências governamentais para aumentar a transparência
das ações de Estados. Por exemplo, o Open Government Data Toolkit (OGD Toolkit) oferece do-
cumentação e procedimentos técnicos para publicação de datasets governamentais (Open Data
for Development, 2015; The World Bank Group, 2014a).
Pesquisas realizadas no âmbito da Ciência da Informação – interdisciplinar e de caráter so-
cial – e estruturadas com base no Ciclo de Vida dos Dados no contexto da Ciência da Informação
(CVD-CI), proposto por Sant’Ana (2013), podem proporcionar o incremento das perspectivas
de adoção e ampliação das diretrizes propostas por programas como o OD4D, fortalecendo seu
arcabouço teórico e minimizando barreiras oriundas da característica interdisciplinar de estu-
dos neste contexto de aplicação (Santos & Sant’Ana, 2013; 2015; Saracevic, 1996; Wersig &
Neveling, 1975).
O CVD-CI se baseia na indicação de quatro fases: coleta, armazenamento, recuperação e
descarte, e de seis objetivos que permeiam transversalmente estas fases: preservação, dissemi-
nação, direitos autorais, qualidade, integração e privacidade (Sant’Ana, 2013: 17–21).
Este texto descreve estudo realizado a partir de documentos e diretrizes propostas pelo Open
Data for Development (OD4D), tomando por base o Ciclo de Vida dos Dados para a Ciência
da Informação (CVD-CI) em sua fase de recuperação e focando no objetivo da qualidade dos
dados, em especial ao analisar estruturas de páginas com especicações descritivas de datasets
governamentais, no intuito de identicar formas de mensurar nestes ambientes os critérios de
qualidade propostos no framework de trabalho Open Government Data Toolkit (OGD Toolkit)
na seção Supply and Quality of Data. Destaque especial foi dado ao atendimento às dimensões
de qualidade propostas pela Eurostat.
A metodologia adotada foi a pesquisa exploratória, descritiva, de caráter qualitativo, com o
universo de pesquisa delimitado a sítios Web governamentais do Brasil, mais especicamente o
conjunto de sítios ociais especializados em divulgação de datasets governamentais. A amos-
tra estabelecida foi o conjunto de páginas com as especicações descritivas de cada dataset,
disponível no primeiro trimestre de 2015 no sítio Web ‘Portal e-Cidadania’ 1, sob tutela e admi-
nistrado pelo Senado Brasileiro, vinculado a esfera federal e ao poder legislativo. Não foi parte
desta pesquisa a avaliação de aspectos de qualidade relacionados aos conteúdos intrínsecos dos
datasets, com exceção do tipo de formato dos cheiros.
1. Endereço eletrônico do sítio: http://dadosabertos.senado.gov.br
Elaboração de estratégia para mensuração de critérios de qualidade na recuperação de datasets
disponíveis em sítios governamentais 157
A pesquisa está dividida em 5 (cinco) capítulos: 1. Introdução; 2. Apresentação dos critérios
de qualidade estabelecidos na seção Supply and Quality of Data do ODG Toolkit e as dimensões
de qualidade propostas pela Eurostat; 3. Descrição de características das páginas com as especi-
cações descritivas de datasets governamentais do sítio Web Portal e-Cidadania; 4. Discussão,
com a proposta de estratégia de avaliação para mensurar critérios de qualidade na recuperação
de datasets disponíveis em sítios governamentais; 5. Considerações Finais.
2. Critérios de qualidade do ODG Toolkit e dimensões de qualidade
da Eurostat
O objetivo do OGD Toolkit é auxiliar Estados e instituições nanceiras a acelerar o desen-
volvimento e a implantação de projetos de disponibilização de Dados Abertos Governamentais
(Open Government Data), ao minimizar esforços de iniciativas unilaterais de Estados na elabo-
ração destes projetos (The World Bank Group, 2014a).
Segundo The World Bank Group (2014b: 1), iniciativas de Dados Abertos podem ser vistas
de forma análoga como “[...] um tipo de economia, onde os dados representam commodities;
usuários de dados, ou ‘consumidores’, proporcionam a demanda pelos dados; e as agências
governamentais e outras fontes são as fornecedoras de dados. Esta losoa está incorporada
dentro do toolkit 2e em sua abordagem para estruturar uma iniciativa de Dados Abertos”.
Oframework é composto por uma coleção de documentos e está dividido em sete seções: 1.
Open Data Essentials, 2. Starting an Open Data Initiative, 3. Technology Options, 4. Demand
& Engagement, 5. Supply & Quality of Data, 6. Readiness Assessment Tool e 7. Technical
Assistance and Funding.
A seção Supply & Quality of Data contém uma seleção hiperlinks para documentos e sítios
sobre a temática qualidade de dados, apresentando para publicadores de dados exemplos de boas
práticas elaboradas por comunidades, padrões e estudos de caso. O documento está dividido em
3 (três) seções, sendo:
1. Padrões gerais de qualidade: apresenta critérios de qualidade já estabelecidos para pu-
blicação de datasets;
2. Padrões de dados: apresenta uma lista de padrões e ferramentas para publicação de da-
dos, porém segmentada por tipologia de dado (e.g., ferramentas para datasets contendo
dados estatísticos, nanceiros, de transporte, saúde, geoespacial, etc.);
3. Mais orientações sobre qualidade e técnicas: contendo orientações sobre temas comple-
mentares: Governança, Anonimização e Metadados.
2. Refere-se ao OGD Toolkit.
158 Fernando de Assis Rodrigues & Ricardo César Gonçalves Sant’Ana
3. Padrões gerais de qualidade
Com relação a padrões gerais de qualidade, o OGD Toolkit adota como características de
qualidade de um dataset, as dimensões de qualidade para informações estatísticas, propostas
pelo escritório de estatística europeu Eurostat.
Estas dimensões são balizadas pelo conceito de qualidade denido no vocabulário da ISO
8402:1986, entendido como “[...] a totalidade de propriedades e características de um produto
ou serviço que afetam a sua capacidade de satisfazer necessidades explícitas ou implícitas” (Eu-
ropean Statistical System, 2003: 2). Nesta perspectiva, são propostas 6 (seis) dimensões de
qualidade (European Statistical System, 2003: 23):
1. Relevância: grau em que datasets satisfazem as necessidades dos atuais e potenciais
usuários, para relevar se há demanda por novos dados e se denições e classicações
utilizadas reetem as necessidades dos usuários;
2. Precisão: representa o quão próximo os dados e os resultados de cálculos estão de valores
reais;
3. Temporalidade e Pontualidade: a Pontualidade refere-se ao intervalo de tempo entre a
data de publicação e a previsão de publicação dos datasets, regulada, por exemplo, por
datas em calendários ociais estipuladas em legislação. A Temporalidade é denida
como o período de tempo entre a disponibilidade do dataset e o evento ou o fenômeno
que este descreve;
4. Acessibilidade e Clareza: a Acessibilidade refere-se a descrever características das con-
dições físicas da obtenção dos dados (e.g., localização, protocolos para aquisição, tempo
de entrega, granularidade, formato, etc.). A Clareza compreende em identicar nos am-
bientes de informação o uso de metadados, grácos, mapas, estatísticas sobre qualidade
dos dados e outras informações adicionais relevantes à contextualização dos datasets ao
público;
5. Comparabilidade: grau de comparação de dados originários de diferentes entidades, re-
giões ou temporalidade (e.g., através da conformidade com padrões internacionais).
6. Coerência: grau de conabilidade dos dados e das estatísticas utilizadas, principalmente
quando estes dados são resultados de outras análises.
A seção destaca que dimensões similares de qualidade foram propostas por outras iniciativas,
como os princípios de Dado Aberto do Project Open Data document – que em diversos estudos já
são considerados princípios obrigatórios na publicação de datasets governamentais, e portanto,
fora do escopo deste estudo.
4. Padrões de dados
A segunda seção apresenta 7 (sete) abordagens temáticas para aumentar a qualidade na pu-
blicação de dados, divididas conforme a tipologia de dado. Para cada tipo de dado é apresentado
uma coleção hiperlinks com padrões e ferramentas especícas:
Elaboração de estratégia para mensuração de critérios de qualidade na recuperação de datasets
disponíveis em sítios governamentais 159
1. Estatísticas e Contabilidade Nacionais: apresenta padrões e metodologias para a cons-
trução e disponibilização de dados sobre macroeconomia por institutos estatísticos;
2. Dados sobre Contratos: recomenda que Estados e outras instituições divulguem dados
sobre contratos para aquisição de produtos e serviços em conformidade com o conjunto
de princípios estabelecidos pela Open Contracting Partnership ou por padrões estabele-
cidos pela Open Contracting Data Standard (OCDS);
3. Dados sobre o Orçamento: apresenta as iniciativas BOOST e OpenSpending como refe-
rência de boas práticas na publicação de datasets sobre orçamentos;
4. Dados sobre Transporte: determina que produtores de dados sobre transporte conheçam a
priori o padrão de dados legível por máquina General Transit Feed Specication (GTFS);
5. Dados Geoespaciais: apresenta uma lista de padrões para a disponibilização de dados de
localização geoespacial, como o GeoJSON, o TopoJSON, o Keyhole Markup Language
(KML) e o Shapele. Também cita a iniciativa Open Geospatial Consortium (OGC)
como referência em padronização de dados nesta temática;
6. Microdados: dene microdados como datasets formados por dados sobre indivíduos,
famílias e instituições originários de respostas de enquetes. Alerta sobre a necessidade de
precaução adicional para esta tipologia e apresenta hiperlinks para o conjunto de práticas
e ferramentas para microdados proposta pelo Banco Mundial (World Bank Microdata
Practices & Tools) e para guias do International Household Survey Network;
7. Dados sobre Saúde: referencia a ampla adoção do padrão International Aid Transpa-
rency Initiative Standard (IATI Standard) para dados sobre nanciamento de atividades
internacionais de saúde.
5. Mais orientações sobre qualidade e técnicas
A terceira seção apresenta outras orientações e técnicas importantes ou complementares a
questões sobre qualidade na publicação de dados governamentais:
1. Governança de Dados: é denido como o modo que “[...] os Dados Abertos são gerenci-
ados durante seu lançamento inicial e em seu percurso” (The World Bank Group, 2014a:
1). Apresenta como referência o Guia de conguração rápida de sítios para a publicação
de datasets, proposto pela iniciativa data.gov.uk, e o Guia de implementação de projetos
de Dados Abertos, da iniciativa Open Data;
2. Anonimização: é denida como o processo remoção de informações que possam ser
utilizadas para identicar indivíduos, famílias ou instituições (The World Bank Group,
2014a: 1). Apresenta os seguintes recursos como referência: Manual de Controle da
divulgação de Estatísticas do Escritório de Estatísticas da Holanda, o Guia de Anonimi-
zação do Escritório do Gabinete do Comissário de Informação da Inglaterra e o relatório
“Repensando Dados Pessoais: Fortalecendo a Conança”, resultante de discussões do
Fórum Econômico Mundial (2013-2014);
160 Fernando de Assis Rodrigues & Ricardo César Gonçalves Sant’Ana
3. Metadados: estimula os publicadores de dados a adotar padrões de metadados para des-
crever o conteúdo dos datasets, como o Dublin Core Metadata Schema e coleções de
metadados desenvolvidas para cenários especícos, como o Data Documentation Initia-
tive (DDI).
6. Características do Portal e-Cidadania
O sítio Web Portal e-Cidadania utiliza a plataforma de código aberto CKAN para o gerenci-
amento e disponibilização de datasets. Em 2015, o sítio continha 45 (quarenta e cinco) datasets,
distribuídos em 9 (nove) Grupos temáticos, sendo: 1. Projetos e Matérias; 2. Plenário; 3. Parla-
mentares; 4. Composição; 5. Comissões; 6. LexML; 7. Legislação; 8. Processo Legislativo, e;
9. Orçamento (Brasil; Open Knowledge Foundation, 2015).
O acesso as páginas com especicações descritivas de datasets governamentais pode ser rea-
lizado tanto por itens da navegação quanto pelo sistema de busca. Em ambos os casos, o usuário
é direcionado para páginas com mesma estrutura, em formato HyperText Markup Language
(HTML).
Figura 1. Recorte de página com especicações descritivas de datasets governamentais (Brasil, 2015)
Ao acessar a página de um dataset (Fig. 1), estão disponíveis os seguintes elementos:
1. Barra de navegação principal (primeiro retângulo cinza na parte superior), com itens
estáticos, formada pelos hiperlinks:
(a) Início: retorna o usuário para a página principal do sítio;
Elaboração de estratégia para mensuração de critérios de qualidade na recuperação de datasets
disponíveis em sítios governamentais 161
(b) Pesquisar: direciona o usuário para a página inicial do mecanismo de busca interno;
(c) Grupo: direciona o usuário para a página lista de Grupos, contendo as colunas: Tí-
tulo, Número de datasets e Descrição;
(d) Sobre: direciona o usuário para a página sobre a ferramenta CKAN, com a mensagem
padrão de instalação;
(e) Formulário de Solicitação de Dados: direciona o usuário para uma página com o
formulário para a solicitação de dados que ainda não estão disponíveis no sítio (na
modalidade de transparência passiva).
2. Barra de navegação secundária (segundo retângulo cinza na parte superior), com itens
dinâmicos, formada pelos hiperlinks:
(a) Ver: direciona o usuário à página inicial de descrição do dataset;
(b) Recursos: direciona o usuário à página com a descrição de cada recurso do dataset.
Um dataset contém um ou mais recursos, tais como cheiros para descarga e acesso
à páginas em formato HTML;
(c) Histórico: exibe a lista de revisão de conteúdo, contendo as colunas: Revisão, Re-
gistro de Tempo, Autor e Mensagem de Log, classicada pela coluna Registro de
Tempo (data e hora) e ordenada de forma decrescente.
3. Parágrafo de descrição do dataset (texto abaixo da barra de navegação secundária), con-
tendo um parágrafo com a descrição do conteúdo;
4. Lista com os recursos disponíveis no dataset (área de conteúdo principal);
5. Campos: Licença de uso, etiquetas (tags) e Grupos, vinculados ao dataset, com valo-
res estipulados e preenchidos pelos administradores do sítio (coluna direita da área de
conteúdo principal);
6. Informações adicionais, constituído por uma tabela de duas colunas de rótulo “Campo” e
“Valor”, respectivamente, e com valores variáveis originários dos metadados do dataset,
com valores estipulados e preenchidos pelos administradores do sítio (parte inferior).
162 Fernando de Assis Rodrigues & Ricardo César Gonçalves Sant’Ana
Tabela 1. Total de recursos em cada dataset, agrupados por formato do recurso.
Elaboração de estratégia para mensuração de critérios de qualidade na recuperação de datasets
disponíveis em sítios governamentais 163
Em cada dataset pode estar disponível um ou mais recursos. No sítio foram identicados
um total de 221 (duzentos e vinte e um) recursos, distribuídos em 6 (seis) formatos de arquivo
(Tabela 1): HTML, Extensible Markup Language (XML),cheiro em formato texto (Text File),
Esquema XML (XML Schema), Portable Document Format (PDF) e LeXML (sem denição no
sítio) – este último sem informação no sítio sobre seu signicado.
164 Fernando de Assis Rodrigues & Ricardo César Gonçalves Sant’Ana
Fig. 2. Recorte de página com especicações descritivas de recursos (Brasil, 2015)
Cada recurso possui uma página com especicações descritivas especícas para seu contexto
e é acessível tanto pela lista de recursos na página do dataset (item 4), quanto pelo item Recursos
da Barra de Navegação Secundária (item 2.2). Em ambos os casos, o usuário é direcionado para
páginas com mesma estrutura, em formato HTML, com os seguintes elementos (Fig. 2):
1. Barra de navegação principal (primeiro retângulo cinza na parte superior), com itens
estáticos, formada pelos hiperlinks:
(a) Início: retorna o usuário para a página principal do sítio;
i. Pesquisar: direciona o usuário para a página inicial do mecanismo de busca in-
terno;
ii. Grupo: direciona o usuário para a página lista de Grupos, contendo as colunas:
Título, Número de datasets e Descrição;
iii. Sobre: direciona o usuário para a página sobre a ferramenta CKAN, com a men-
sagem padrão de instalação;
Elaboração de estratégia para mensuração de critérios de qualidade na recuperação de datasets
disponíveis em sítios governamentais 165
iv. Formulário de Solicitação de Dados: direciona o usuário para uma página com
o formulário para a solicitação de dados que ainda não estão disponíveis no sítio
(na modalidade de transparência passiva).
(b) Barra de navegação secundária (segundo retângulo cinza na parte superior), com
itens dinâmicos, formada pelos hiperlinks:
i. Ver: direciona o usuário à página inicial de descrição do dataset;
ii. Recursos: direciona o usuário à página com a descrição de cada recurso do data-
set. Um dataset contém um ou mais recursos, tais como cheiros para descarga
e acesso à páginas em formato HTML;
iii. Histórico: exibe a lista de revisão de conteúdo, contendo as colunas: Revisão,
Registro de Tempo, Autor e Mensagem de Log, classicada pela coluna Registro
de Tempo (data e hora) e ordenada de forma decrescente.
(c) Parágrafo de descrição do recurso (texto abaixo da barra de navegação secundária),
contendo um parágrafo com a descrição do conteúdo;
(d) Área de conteúdo principal, divididas em duas partes:
i. Superior: quadro (sem bordas nas células) contendo as seguintes informações:
dataset pertencente, formato do recurso, data da última atualização, licença e
botão para descarga do recurso (download);
ii. Inferior: Informações adicionais, constituído por uma tabela de duas colunas de
rótulo “Campo” e “Valor”, respectivamente, e com valores variáveis originários
dos metadados do recurso, com valores estipulados e preenchidos pelos adminis-
tradores do sítio (parte inferior).
7. Discussão
As recomendações estabelecidas nos documentos do OGD Toolkit tratam tanto sobre aspec-
tos de qualidade de dados de forma intrínseca, ou seja, uma abordagem voltada para a análise
da forma, estrutura e conteúdo atributos e valores dos datasets, quanto sobre aspectos de quali-
dade nos sistemas de informação que gerenciam e publicam datasets. Especicamente na seção
Supply & Quality of Data destacam-se as seguintes características sobre aspectos de qualidade:
a. Padrões gerais de qualidade: adoção das dimensões de qualidade propostas pela Eu-
rostat (Relevância, Precisão, Temporalidade e Pontualidade, Acessibilidade e Clareza,
Comparabilidade e Coerência);
b. Padrões de dados: destaque ao enfoque temática de qualidade, sugerindo:
c. Padrões ou recomendações especícas para publicação de dados: Estatísticos e Conta-
bilidade Nacionais, Dados Sobre Contratos, Dados Geoespaciais, Microdados e Dados
sobre Saúde;
166 Fernando de Assis Rodrigues & Ricardo César Gonçalves Sant’Ana
(a) Metodologias para construção de datasets: Estatísticos e Contabilidade Nacionais,
Dados Sobre Contratos, Dados sobre Transporte e Microdados;
(b) Exemplos de boas práticas na publicação de datasets: Dados sobre Orçamento e
Microdados.
d. Mais orientações sobre qualidade e técnicas:
(a) Governança de Dados: necessidade de adoção de metodologias para o desenvolvi-
mento e gerenciamento dos datasets por publicadores de dados;
(b) Anonimização: adoção de técnicas de Anonimização para remover ou ofuscar dados
que possam identicar pessoas, famílias ou instituições;
(c) Metadados: adoção de padrões de metadados para a descrição das informações con-
tidas nos datasets.
Considera que as abordagens temáticas de qualidade propostas no item ‘b’ são parte in-
tegrante da avaliação dos critérios das dimensões de qualidade propostas pela Eurostat. Os
padrões, as recomendações, as metodologias e as boas práticas especícas para publicação de
dados são necessárias para mensurar o grau de Relevância, de Precisão, de Acessibilidade e
Clareza, de Comparabilidade e de Coerência.
Também foram consideradas já integrantes na mensuração de todos os critérios as demais
orientações destacadas na seção Mais orientações sobre qualidade e técnicas.
Elaboração de estratégia para mensuração de critérios de qualidade na recuperação de datasets
disponíveis em sítios governamentais 167
Tabela 2. Distribuição de elementos de páginas descritivas
de datasets governamentais em dimensões de análise.
Portanto, quando acessado as informações sobre um dataset governamental, é possível re-
distribuir elementos identicados na recuperação de páginas com informações sobre o dataset
(e seus recursos) a partir das recomendações da seção Supply & Quality of Data.
Por exemplo, a Tabela 2 distribui os elementos identicados nas páginas de datasets e recur-
sos recuperados no portal e-Cidadania pelos critérios de avaliação propostos pela Eurostat. As
linhas representam as páginas analisadas (páginas descritivas para datasets e para recursos).
As informações identicadas nos elementos (enumerados conforme estrutura apresentada
no capítulo 3) estão distribuídas conforme as dimensões de análise. A disponibilidade de infor-
mação em uma dimensão representa um elemento extra de análise da qualidade de publicação
de dados do sítio, como informações sobre o Histórico de Alterações do dataset e do recurso
pra a mensurar o grau de Temporalidade e Pontualidade ou o uso de padrões de Metadados para
mensurar todas as dimensões.
168 Fernando de Assis Rodrigues & Ricardo César Gonçalves Sant’Ana
8. Considerações Finais
Percebeu-se que é possível estabelecer, de forma mais padronizada, estratégias para veri-
cação do objetivo da qualidade na fase da recuperação de datasets governamentais disponibili-
zados em sítios ociais, a partir de uma aplicação de um processo de mensuração de critérios de
qualidade em páginas com especicações descritivas de datasets e seus recursos.
Estas dimensões de mensuração propostas podem delimitar, em estudos de qualidade destes
sistemas de informação, a importância da existência (ou da ausência) de elementos informaci-
onais nas páginas descritivas dos datasets, pois pode estabelecer parâmetros classicatórios e
comparativos com análises realizadas em sítios em outros contextos e a evolução de alterações
no conteúdo destas páginas ao longo do tempo.
O acesso e a existência destes elementos informacionais – blocos de informação, acessí-
veis nas páginas descritivas dos datasets e dos recursos – permite o acompanhamento externo
à gestão pública sobre questões inerentes a cada dimensão nos planos de Governança de Dados
elaborados por administradores públicos; e também a comparação sistematizada destes elemen-
tos em outros cenários.
Propõe-se nesse contexto uma nova dimensão de qualidade de dados, denominada Publici-
dade, sendo denida como o grau de divulgação de elementos informacionais sobre um dataset
que permita a avaliação das outras dimensões de qualidade. Portanto, características identi-
cadas nas páginas com especicações descritivas de datasets podem ser mensuradas de acordo
com as denições estabelecidas em 7 (sete) dimensões: seis oriundas das dimensões propostas
pela Eurostat (Relevância, Precisão, Temporalidade e Pontualidade, Acessibilidade e Clareza,
Comparabilidade e Coerência) e uma proposta por este estudo (Padronização).
Bibliograa
Bohman, J. (2000). Public deliberation: pluralism, complexity, and democracy. MIT press.
Brasil. Lei No 12.527, de 18 de Novembro de 2011 (Lei de Acesso à Informação), Pub. L. No.
12.527 (2011). Recuperado de www.planalto.gov.br/ccivil_03/_Ato2011-2014/2011/Lei/L
12527.htm
Brasil. (2015). Portal e-Cidadania – Dados Abertos Legislativos. Recuperado de http://dadosab
ertos.senado.gov.br/about
Castells, M. (2004). A Galáxia Internet: reexões sobre internet, negócios e sociedade. Lisboa:
Fundação Calouste Gulbenkian.
Castells, M.; Majer, R. V. & Cardoso, F. H. (2007). A sociedade em rede. São Paulo: Paz e
Terra.
Diniz, E. (1996). Governabilidade, governance e reforma do Estado: considerações sobre o novo
paradigma. Revista do Serviço Público, 120(2): 175-189.
European Statistical System. (2003, março 10). Item 4.2: Methodological Documents - Deni-
tion of quality in statistics. Working Group “Assessment of quality in statistics”. Recupe-
rado de http://ec.europa.eu/eurostat/documents/64157/4373735/02-ESS-quality-denition.
pdf/f0fdc8d8-6a9b-48e8-a636-9a34d073410f
Elaboração de estratégia para mensuração de critérios de qualidade na recuperação de datasets
disponíveis em sítios governamentais 169
Marcondes, C. H., e Jardim, J. M. (2003). Políticas de informação governamental: a construção
de governo eletrônico na administração federal do Brasil. DataGramaZero - Revista de
Ciência da Informação, 4(2). Recuperado de www.dgz.org.br/abr03/Art_04.htm
Open Data for Development. (2015). The Program. Recuperado de www.od4d.net/
Open Government Partership (Org.). (2014). Open Government Partnership: four year strategy
2015-2018. Recuperado de www.opengovpartnership.org/sites/default/les/attachments/O
GP%204-year%20Strategy%20FINAL%20ONLINE.pdf
Open Knowledge Foundation. (2015). CKAN Frequently asked questions. Recuperado de
http://ckan.org/faq/
Rodrigues, F. de A., e Sant’Ana, R. C. G. (2013). Restrições tecnológicas e de acesso a dados
disponíveis sobre destinos de repasses nanceiros federais para a saúde pública em ambi-
entes informacionais digitais. Anais do XIII Encontro Nacional de Pesquisa em Ciência
da Informação – XIII ENANCIB 2012 (p. 19). Rio de Janeiro: ANCIB. Recuperado de
http://enancib.ibict.br/index.php/enancib/xiiienancib/paper/viewFile/3865/2988
Rodrigues, F. de A.; Sant’Ana, R. C. G. & Ferneda, E. (2015). Análise do processo de recupera-
ção de conjuntos de dados em repositórios governamentais. InCID: Revista de Ciência da
Informação e Documentação, 6(1): 38-56. Doi: 10.11606/issn.2178-2075.v6i1p38-56
Sant’ana, R. C. G. (2009). Tecnologia e gestão pública municipal: mensuração da interação
com a sociedade. [s.l.]: SciELO Books – Editora UNESP.
Sant’Ana, R. C. G. (2013). Ciclo de Vida dos Dados e o papel da Ciência da Informação. Anais
do XIV Encontro Nacional de Pesquisa em Ciência da Informação (p. 21). Florianópolis:
ANCIB. Recuperado de http://enancib2013.ufsc.br/index.php/enancib2013/XIVenancib/pa
per/viewFile/284/319
Sant’Ana, R. C. G., e Rodrigues, F. de A. (2013). Visualização de anidades entre parlamentares
mediante dados de votações no Senado Brasileiro. Informação & Sociedade: estudos,
23(1): 49-59.
Santos, P. L. V. A. da C. & Sant’Ana, R. C. G. (2015). Dado e granularidade na perspectiva
da informação e tecnologia: uma interpretação pela ciência da informação. Ciência da
Informação, 42(2): 11.
Saracevic, T. (1996). Ciência da informação: origem, evolução e relações. Perspectivas em
Ciência da Informação, 1(1): 41-62.
The World Bank Group. (2014a). Open Government Data Toolkit. Recuperado de http://opendat
atoolkit.worldbank.org/en/
The World Bank Group. (2014b). Open Government Data Toolkit - About this Toolkit. Recupe-
rado de http://opendatatoolkit.worldbank.org/en/open-data-in-60-seconds.html#about-this-
toolkit
Wersig, G., e Neveling, U. (1975). The phenomena of interest to information science. The
information scientist, 9(4): 127-140.
Werthein, J. (2000). A sociedade da informação e seus desaos. Ciência da informação, Brasí-
lia, 29(2): 71-77.
... Este conceito ganha relevância a partir do princípio de que grande parte dos dados gerados pela gestão da coisa pública deveria estar ao alcance de todos os cidadãos e, portanto, estruturados como dados abertos. Para que sejam considerados como dados abertos, é preciso levar em conta critérios que garantam que estes dados possam ser acessados de tal forma que sejam processados automaticamente, sem a exigência de identificação do usuário que os procura, sem a necessidade de uso de aplicativos que também não sejam abertos, entre outros critérios, garantindo assim que estes dados realmente tenham seu acesso facilitado e otimizado (OPEN GOVERNMENT WORKING GROUP, 2008;RODRIGUES;SANT'ANA, 2017a, 2017bTHE WORLD BANK GROUP, 2014). ...
Conference Paper
Full-text available
A criação e o uso de ambientes democráticos permite a sociedade participar, ainda que indiretamente, nas discussões sobre serviços prestados pelo Estado. Nos últimos anos, a discussão da qualidade dos serviços públicos em saúde ganhou ênfase pelos meios de comunicação. Em 2011, o acesso a dados governamentais tornou-se obrigatório com a sanção da “Lei de Acesso à Informação”. As Tecnologias de Informação e Comunicação de uso externo à gestão pública, seguindo os princípios de dado aberto, podem promover uma condição de interação entre o Estado e sociedade, na ampliação da transparência das ações do Estado e da cidadania, auxiliando na melhoria significativa da qualidade dos serviços, ao possibilitar aos cidadãos o uso dos conjuntos de dados em construções de gráficos e visualizações externas aos sítios oficiais governamentais, bem como o cruzamento dos dados com outros conjuntos. Entretanto, sítios oficiais do Governo Federal, que contém recursos informacionais com conjunto de dados sobre destinos de repasses de recursos financeiros para a saúde pública, possuem interfaces heterogêneas, restrições de acesso e restrições tecnológicas, formando uma barreira para o cidadão na recuperação dos dados. O objetivo deste trabalho é apresentar, sob o olhar da Ciência da Informação, aspectos ligados às restrições de acesso e restrições tecnológicas, encontrados na análise exploratória dos oito recursos informacionais que contém dados sobre destinos de repasses de recursos financeiros para a saúde, já disponíveis em quatro sítios oficiais do Governo Federal. A conclusão apresenta pontos de atenção a partir dessa análise dos recursos informacionais, em atendimento a “Lei de Acesso à Informação” e aos princípios de dado aberto.
Article
Full-text available
A ampliação da participação cidadã na esfera pública depende diretamente do acesso as informações relativas a atuação dos representantes eleitos, principalmente no que diz respeito a suas decisões nas votações durante seus mandatos. A Ciência da Informação pode colaborar neste processo, propondo e avaliando modelos de acesso a estas informações que podem ser obtidos através de dados a serem disponibilizados pelos sítios oficiais do Poder Legislativo nas esferas Federal, Estadual e Municipal. Propõe-se neste artigo a análise do processo de coleta e uso de dados sobre votações de senadores com vistas a apropriação deste modelo para coleta e uso de dados nas demais esferas. A partir dos dados é analisada a elaboração de uma matriz de afinidades que permita identificar a relação entre cada um dos parlamentares com os demais, em função das similaridades das decisões tomadas no conjunto das votações abertas. É analisa também a elaboração de visualizações iniciais e a ampliação do escopo da pesquisa através da aplicação dos dados obtidos em todas as afinidades entre os parlamentares e na obtenção de uma afinidade média entre partidos, permitindo novas dimensões de análise aos dados coletados. A elaboração das matrizes completas das relações de afinidades entre os parlamentares, pode propiciar um horizonte rico de possibilidades para elaboração de novas formas de visualização e análise, ampliando a visibilidade das ações parlamentares junto a sociedade.
Article
Full-text available
O presente trabalho tem como objetivo identificar, na fase de recuperação, atributos disponíveis nos momentos em que se realiza pesquisas por conjuntos de dados em repositórios governamentais, a partir do modelo de Ciclo de Vida de Dados para a Ciência da Informação (CVD-CI) proposto por Sant'Ana (2013). A pesquisa fora delimitada a realização de buscas por conjuntos de dados através do mecanismo oferecido pelo sítio Portal Brasileiro de Dados Abertos, utilizando os termos 'Educação' e 'Saúde'. O uso do termo 'Saúde' resultou na recuperação de 14 conjunto de dados e o termo 'Educação' recuperou 23, totalizando 37 conjuntos de dados. A análise destes conjuntos de dados dividiu-se em duas etapas: na primeira foram identificados quais atributos estavam disponíveis na página contendo o resultado das buscas a partir termos utilizados. A segunda etapa consistiu em identificar os atributos disponíveis nas páginas referentes a cada um dos conjuntos de dados recuperados na busca. Como resultado, fora construído dois quadros: o primeiro identifica os atributos que estão disponíveis nas páginas com resultados da pesquisa pelo mecanismo de busca do site; o segundo, identifica os atributos disponíveis em cada conjunto de dados recuperado pela pesquisa. Os resultados demonstraram que na primeira etapa, não há diferença nos atributos disponíveis nos resultados de busca por ambos os termos. Entretanto, na segunda etapa houve discrepâncias nos atributos identificados em cada conjunto de dados.
Article
Full-text available
Partindo de um conceito que ressalta as características do novo paradigma técnico econômico e critica as concepções deterministas e evolucionistas da mudança social, apresentam-se as promessas da sociedade da informação que justificam o esforço da sociedade na sua construção. Descontados os exageros utópicos que constituem a "computopia", a justificativa desse esforço prende-se às perspectivas oferecidas pelo novo paradigma de avanços significativos para a vida individual e coletiva, elevando o patamar dos conhecimentos gerados e utilizados na sociedade, oferecendo o estímulo para constante aprendizagem e mudança, facilitando a salvaguarda da diversidade e propiciando dinamismo econômico mais condizente com o respeito ao meio ambiente. Suas promessas não podem impedir a constatação de inúmeros desafios e problemas. Alguns são técnicos, outros de natureza social, outros ainda são puramente econômicos e requerem um compromisso político para assegurar o acesso a comunidades menos privilegiadas. Finalmente, há significativos desafios a enfrentar para criar um arcabouço internacional apropriado que minimize as desigualdades globais no acesso à informação.
Article
O artigo pretende contribuir para o debate sobre a reforma do Estado associando este objetivo ao processo mais amplo de fortalecimento das condições de governabilidade democrática. Propõe-se uma ruptura com o viés restritivo e reducionista das análises correntes através da adoção de uma perspectiva integrada, que enfatize o teor pluridimensional da questão da governabilidade sem perder de vista os fatores endógenos que concorrem para a crise do Estado, tais como a assimetria entre os poderes Executivo e Legislativo e o hiato entre o Estado e a sociedade. Segundo a autora, a maximização da eficácia da ação estatal passa pelo incremento da governabilidade - sobretudo por meio da mobilização de recursos políticos que viabilizem a implementação das metas governamentais - e pelo aumento da governance, entendida como a capacidade de comando, coordenação e implementação do Estado. Afirma-se que o novo paradigma da reforma administrativa deve partir da redefinição do conceito de autonomia estatal e do modelo de gestão pública preexistentes.
Public deliberation: pluralism, complexity, and democracy
  • J Bohman
Bohman, J. (2000). Public deliberation: pluralism, complexity, and democracy. MIT press.
Lei No 12.527, de 18 de Novembro de
  • Brasil
Brasil. Lei No 12.527, de 18 de Novembro de 2011 (Lei de Acesso à Informação), Pub. L. No. 12.527 (2011). Recuperado de www.planalto.gov.br/ccivil_03/_Ato2011-2014/2011/Lei/L 12527.htm
Portal e-Cidadania -Dados Abertos Legislativos
  • Brasil
Brasil. (2015). Portal e-Cidadania -Dados Abertos Legislativos. Recuperado de http://dadosab ertos.senado.gov.br/about
Item 4.2: Methodological Documents -Definition of quality in statistics. Working Group "Assessment of quality in statistics
European Statistical System. (2003, março 10). Item 4.2: Methodological Documents -Definition of quality in statistics. Working Group "Assessment of quality in statistics". Recuperado de http://ec.europa.eu/eurostat/documents/64157/4373735/02-ESS-quality-definition. pdf/f0fdc8d8-6a9b-48e8-a636-9a34d073410f