A natureza de conjuntos de dados científicos em repositórios sul-americanos: um levantamento de formatos e extensões

Autores

  • Marcello Mundim Rodrigues
  • Cíntia de Azevedo Lourenço
  • Guilherme Ataíde Dias

Palavras-chave:

dados científicos, conjuntos de dados, repositórios de dados, formatos e extensões, levantamento

Resumo

Objetivo:identificar os repositórios de dados científicos criados e geridos por Instituições de Ensino Superior e/ou agências de pesquisa e fomento sul-americanas; identificar e descrever os formatos e extensões dos arquivos que compõem os conjuntos de dados científicos depositados nesses repositórios.Método:oito repositórios recuperados pelo RE3DATA foram selecionados à investigação. Obteve-se uma população (N) de 1.115 conjuntos de dados científicos. A partir da Amostragem Aleatória Estratificada, chegou-se ao valor da amostra (n) igual a 258 conjuntos de dados, que corresponde a 23,15% da população (N). Os dados retirados das amostras foram condensados em tabelas e quadros.Resultado:notou-se que a natureza dos conjuntos de dados científicos investigados se concentra em dados textuais e numéricos, salvos em arquivos de texto e em tabelas, respectivamente. Percebeu-se que os conjuntos de dados podem ser tanto homogêneos (um ou mais arquivos salvos em um único formato e extensão, ex.: formato deimagem em .jpg) ou heterogêneos (arquivos salvos em diferentes formatos e extensões, ex.: mesmo formato de imagem salvo em .jpg e .tiff) em sua composição. Apurou-se também que algumas extensões possibilitam a identificação da natureza, do domínio e do conteúdo dos dados, como observado nas extensões .gpx e .gdb, que se referem a dados de geolocalização, logo, de natureza alfanumérica.Conclusões:há crescente necessidade de se descrever a natureza dos dados, assim como os formatos e extensões de seus arquivos. Esse tipo de metadado descritivo seria valioso a potenciais usuários, pois permitiria obter maior compreensão do contexto dos dados com foco em seu reúso.

Link: https://periodicos.ufsc.br/index.php/eb/article/view/85148/49558

Downloads

Não há dados estatísticos.

Publicado

2024-05-01

Como Citar

Mundim Rodrigues, M., de Azevedo Lourenço, C., & Ataíde Dias, G. (2024). A natureza de conjuntos de dados científicos em repositórios sul-americanos: um levantamento de formatos e extensões. Pesquisa Brasileira Em Ciência Da Informação E Biblioteconomia, 19(1). Recuperado de https://pbcib.com/index.php/pbcib/article/view/62108

Edição

Seção

Resumos de artigos científicos