Conference PaperPDF Available

Domain Analysis of scientific production about Data Collecting on Institute of Electrical and Electronics Engineers context

Authors:

Abstract

The goal of this study is to identify scientific studies about the thematic of data collecting. For this purpose, it was adopted the domain analysis method on the scientific papers, by an application of Citation and Co-citation Analysis. The identification of representatives from the thematic of data collecting and the existent dialog among them were obtained by authors and papers metadata sets processing, available on IEEE Xplore(r) Digital Library. As search strategy, it was used on advanced search the terms ‘Data Collecting’, ‘Data Collect’, and ‘Data Gathering’, concatenated by the boolean operator ‘OR’. This process recovered 2,278 scientific papers and the sample was set only by scientific papers published in scientific journals between the years 1954 and 2018, with a total of 281 papers. For each paper, the reference section was collected in HTML document format. It was applied an algorithm to convert formats from HTML documents to CSV files and also to serialize the IEEE Editorial Style found on collected reference data. The algorithm processed 5,867 references and discarded 270 because they not fit into the IEEE Editorial Style standards adopted on serialization. From this references, was identified a total of 8,267 authors. In Citation and Co-citation Analysis, it was applied the Price's square root law to delimit the authors' group to 91 participants, rounded to 94 participants because of the 91st participant had the same total of citation of his 3 successors. After that, the "Cited and Who cited" and the "Absolute Frequency of Co-citation" matrices was generated from an application of an algorithm. By those data, the identification of nationality and the institutional affiliation were obtained by a manual process. Was calculated the social networks indexes i) Network Density, representing the relationship intensity between authors on the network and ii) Centrality Degree, representing the number of relationships received by an author. The analyzed data resulted in a Network Density value of 3.20 with a standard deviation of 3.34, that is, each researcher has approximately 3 relationships with other network nodes. Also, the resulted value of Centrality Degree was 20.93%, demonstrating dispersion on the network, once that each node has 20.93% of probability to receive some interaction from the network. This dispersion is associated with the analyzed domain amplitude, once that Data Collecting is a recurrent theme on distinct knowledge areas, but still adherent to IEEE scientific journals context. When results of the Centrality Degree of each author are analyzed, it is possible to observe a relationship between the results of received citations, indicating that the 13 best-ranked authors by Centrality Degree are also the most cited ones, representing 25.16% of all citations from the network. Also in this group was identified an average of 7.69% from the total of cites to each author, with amplitude varying between 6.12% and 11.76%. It was concluded that this thematic, although widely cited, shows an American core, related to the institutions UC, USC, and MIT.
2
X EIICA ENCONTRO INTERNACIONAL DE
INFORMAÇÃO, CONHECIMENTO E AÇÃO
Informação, Conhecimento, Ação Autônoma e Big
Data: Continuidade ou Revolução?
CADERNO DE RESUMOS
X EIICA INTERNATIONAL MEETING ON
INFORMATION, KNOWLEDGE AND ACTION
Information, Knowledge, Autonomous Action and
Big Data: Continuity or Revolution?
BOOK OF ABSTRACTS
Marília: Universidade Estadual Paulista, 2018.
3
X EIICA: 18/06 22/06, 2018
Coordenação: Maria Eunice Quilici Gonzalez.
Organização: Maria Eunice Quilici Gonzalez, Mariana Claudia Broens, Daniel
Martínez-Ávila, Maria José Jorente, Maria Cláudia Cabrini Grácio, Hércules de
Araújo Feitosa.
Comissão Científica: Rosa San Segundo, Melodie Fox, Marcos Antonio Alves,
Lauro Frederico Barbosa da Silveira, Juan Carlos Fernández-Molina, Mariana
Matulovic, Frederick Adams, Antonio García Gutiérrez, Maria José Vicentini
Jorente, Placida Amorim da Costa Santos, Ely Francina Tannuri de Oliveira,
Leilah Santiago Bufrem, Walter Moreira, Silvana Aparecida Borsetti Gregório
Vidotti, Natália Bolfarini Tognoli, Maria Cláudia Cabrini Grácio, José Augusto
Chaves Guimarães, Carlos Cândido de Almeida, Daniel Martínez-Ávila, Maria
Eunice Quilici Gonzalez.
Comissão de Trabalho: Alain Hidalgo, Amanda Mendes, Ana Paula de Carvalho
Gomes, Ana Paula Talin Bissoli, Barbara Tavares, Bruna Marcela Furlan, Caio
Saraiva Coneglian, Camila da Cruz Silva, Carla Conforto de Oliveira, Caroline
Gomes de Oliveira, Edna Alves de Souza, Emanuelly Rodrigues, Emily Micaeli
Pereira Guedes, Emily Miriele Abreu Silva, Ester Luiza de Oliveira, Felipe
Eleutério, Fernanda Lucchetti Monteiro, Gabriel Henrique Ordones Ferreira de
Freitas, Julia Rodrigues de Lima, Leonardo Francisco de Andrade, Letícia de
Jesus Nascimento, Luciana Gomes, Manoela Ferreira da Silva, Marcos Antonio
Alves, Marcus Rei de Lima Alves, Max Rogério Vicentini, Mirella Fernanda
Leite Gil, Natacha Paruker, Polyana Silva dos Santos, Renata Silva Souza,
Ricardo Peraça Cavassane, Rúbia Martins, Sabrina Balthazar Ramos Ferreira,
Samantha Augusta dos Santos de Jesus, Sofia Curuci Pegoraro, Thiago Ferreira
de Oliveira, Tiago Hideki Manzati Kabutomori, Túlio César Martos, Valdirene
Pascoal, Valéria Martins Bonfuoco, Yara Maria Cinque.
Secretaria Geral: Edna Bonini de Souza.
Apoio Técnico: Eder Ludovico de Matos, Renato Geraldi.
Local: Faculdade de Filosofia e Ciências da Unesp Marília, São Paulo, Brasil.
4
CADERNO DE RESUMOS DO X EIICA
Organização: Maria Eunice Quilici Gonzalez, Mariana Claudia Broens, Daniel
Martínez-Ávila, Ricardo Peraça Cavassane, Renata Silva Souza.
Revisão: Ricardo Peraça Cavassane, Renata Silva Souza, Edna Alves de Souza,
Max Rogério Vicentini.
Marília: Universidade Estadual Paulista, 2018.
ISSN: 2447-7494.
41
Comunicações Orais e Pôsteres
Oral Communications and Posters
233
ANÁLISE DE DOMÍNIO DA PRODUÇÃO CIENTÍFICA SOBRE
COLETA DE DADOS NO CONTEXTO DO INSTITUTE OF
ELECTRICAL AND ELECTRONICS ENGINEERS
DOMAIN ANALYSIS OF SCIENTIFIC PRODUCTION ABOUT
DATA COLLECTING ON INSTITUTE OF ELECTRICAL AND
ELECTRONICS ENGINEERS CONTEXT
Comunicação Oral / Oral Communication
RODRIGUES, Fernando de Assis.
Unesp / Marília
fernando.orionx@gmail.com
MOREIRA, Fábio Mosso Moreira.
Unesp / Marília
fmmoreira1990@gmail.com
SANT’ANA, Ricardo César Gonçalves.
Unesp / Tupã
ricardosantana@tupa.unesp.br
Este estudo teve como objetivo identificar pesquisas que versam sobre
a temática de coleta de dados. Para tanto foi utilizada análise de domínio em
publicações científicas, com a aplicação de uma análise de citações e cocitações.
A identificação dos representantes da temática de coleta de dados e a
interlocução existente entre eles foi obtida a partir do processamento dos
conjuntos de metadados sobre publicações em periódicos disponíveis da base de
conhecimento IEEE Xplore(r) Digital Library. Como estratégia de busca,
utilizou-se na interface de busca avançada os termos Data Collecting’, Data
Collect’ e ‘Data Gathering’, concatenados pelo operador booleano ‘OU’. Foram
recuperados dados sobre 2.278 publicações e a amostra foi delimitada aos
artigos publicados em periódicos científicos entre os anos de 1954 e 2018,
totalizando 281 publicações. Para cada artigo, foi coletado o conjunto de
referências na forma de documento HTML. Sobre o conteúdo obtido foi
aplicado um algoritmo para a conversão das referências de HTML para CSV e a
serialização das referências para o padrão de estilo IEEE Editorial Style. Foram
processadas 5.867 referências e identificados 8.267 autores, sendo descartadas
270 referências por estarem fora do padrão. Aplicou-se a Lei do Elitismo de
Price para a delimitação do corpo de autores nas análises de citação e cocitação,
totalizando 91 autores, número este que foi arredondado para 94 para
contabilizar mais 3 autores que possuíam o mesmo número de citação do 91º
234
autor. Posteriormente, aplicou-se um algoritmo para a geração das matrizes i)
citados e citantes e ii) de frequência absoluta de cocitação. A partir destes dados,
a identificação de informações sobre nacionalidade e associação institucional
foram obtidas por processamento manual. Foram calculados os indicadores de
rede social: i) Densidade da Rede, representando a intensidade de
relacionamentos entre autores da rede e ii) Centralidade de Grau, representando
o número de ligações incidentes em um autor. A análise dos dados resultou em
uma Densidade de Rede no valor de 3,20 e desvio padrão amostral de 3,34, ou
seja, cada pesquisador têm aproximadamente 3 relacionamentos com pares da
rede; e Centralidade de Grau no valor de 20,93%, demonstrando dispersão, com
cada vértice possuindo 20,93% de probabilidade de receber alguma interação da
rede. A dispersão está associada com a amplitude do domínio analisado, pois
coleta de dados é um tema recorrente em diferentes áreas do conhecimento, mas
aderente ao contexto de publicação dos periódicos da IEEE. Ao analisar a
Centralidade de Grau dos autores individualmente, é possível observar uma
relação com a quantidade de citações recebidas, uma vez que os 13 principais
autores do índice de Centralidade de Grau são também os mais citados,
representando 25,16% de todas as citações recebidas da rede. Neste grupo, foi
identificado uma média de 7,69% de representatividade de cada autor no total de
citações, com amplitude variando entre 6,12% e 11,76%. Conclui-se que a
temática apesar de amplamente citada apresenta um núcleo estadunidense,
ligado às instituições UC, USC e MIT.
The goal of this study is to identify scientific studies about the thematic
of data collecting. For this purpose, it was adopted the domain analysis method
on the scientific papers, by an application of Citation and Co-citation Analysis.
The identification of representatives from the thematic of data collecting and the
existent dialog among them were obtained by authors and papers metadata sets
processing, available on IEEE Xplore(r) Digital Library. As search strategy, it
was used on advanced search the terms ‘Data Collecting’, ‘Data Collect’, and
‘Data Gathering’, concatenated by the boolean operator ‘OR’. This process
recovered 2,278 scientific papers and the sample was set only by scientific
papers published in scientific journals between the years 1954 and 2018, with a
total of 281 papers. For each paper, the reference section was collected in
HTML document format. It was applied an algorithm to convert formats from
HTML documents to CSV files and also to serialize the IEEE Editorial Style
found on collected reference data. The algorithm processed 5,867 references and
discarded 270 because they not fit into the IEEE Editorial Style standards
adopted on serialization. From this references, was identified a total of 8,267
authors. In Citation and Co-citation Analysis, it was applied the Price's square
root law to delimit the authors' group to 91 participants, rounded to 94
participants because of the 91st participant had the same total of citation of his 3
successors. After that, the "Cited and Who cited" and the "Absolute Frequency
235
of Co-citation" matrices was generated from an application of an algorithm. By
those data, the identification of nationality and the institutional affiliation were
obtained by a manual process. Was calculated the social networks indexes i)
Network Density, representing the relationship intensity between authors on the
network and ii) Centrality Degree, representing the number of relationships
received by an author. The analyzed data resulted in a Network Density value of
3.20 with a standard deviation of 3.34, that is, each researcher has
approximately 3 relationships with other network nodes. Also, the resulted value
of Centrality Degree was 20.93%, demonstrating dispersion on the network,
once that each node has 20.93% of probability to receive some interaction from
the network. This dispersion is associated with the analyzed domain amplitude,
once that Data Collecting is a recurrent theme on distinct knowledge areas, but
still adherent to IEEE scientific journals context. When results of the Centrality
Degree of each author are analyzed, it is possible to observe a relationship
between the results of received citations, indicating that the 13 best-ranked
authors by Centrality Degree are also the most cited ones, representing 25.16%
of all citations from the network. Also in this group was identified an average of
7.69% from the total of cites to each author, with amplitude varying between
6.12% and 11.76%. It was concluded that this thematic, although widely cited,
shows an American core, related to the institutions UC, USC, and MIT.
DESCRIÇÃO DE ACERVOS MUSEOLÓGICOS:
POSSIBILIDADES DA UTILIZAÇÃO DO SOFTWARE ATOM
NA REPRESENTAÇÃO DA INFORMAÇÃO
DESCRIPTION OF MUSEOLOGICAL ACCOUNTS:
POSSIBILITIES OF THE USE OF THE ATOM SOFTWARE IN
THE REPRESENTATION OF THE INFORMATION
Comunicação Oral / Oral Communication
RODRIGUES, Nandia Leticia Freitas.
Unesp / Marília
nandiarodrigues@gmail.com
JORENTE, Maria José Vicentini.
Unesp / Marília
mjjorente@yahoo.com.br
Os avanços e desenvolvimentos constantes das novas Tecnologias de
Informação e Comunicação têm impulsionado às instituições museológicas a
disponibilizar no ambiente web grande parte de seus acervos para o livre acesso
ResearchGate has not been able to resolve any citations for this publication.
  • Marília
Marília: Universidade Estadual Paulista, 2018. ISSN: 2447-7494.