Repositórios para dados localizáveis, acessíveis, interoperáveis e reutilizáveis (FAIR): adaptando um repositório de dados para se comportar como um FAIR Data Point
Resumo
É necessário um esforço significativo para encontrar, entender e reutilizar dados da pesquisa. Para endereçar esse problema, os princípios de dados Localizáveis, Acessíveis, Reutilizáveis e Interoperáveis (FAIR em inglês) foram criados, e descrevem um conjunto mínimo de requisitos para gerenciamento e administração de dados, considerados a base tecnológica para a Nuvem Europeia de Ciência Aberta. O FAIR Data Point (FDP) utiliza dados ligados (LD) para expor dados e metadados aderentes aos princípios de dados FAIR, especificando um conjunto de metadados padronizados que um repositório de dados deve implementar. Os proprietários de dados podem expor conjuntos de dados e os usuários de dados podem reutilizar conjuntos de dados por meio de serviços RESTful, permitindo a interoperabilidade em escala na web. Os repositórios de dados e o software subjacente apenas recentemente começaram a oferecer suporte à LD, e seus metadados estão disponíveis apenas como pares de valores-chave. Uma questão em aberto neste contexto é como permitir que um software de repositório de dados existente seja compatível com a especificação do FDP, ou seja, como adicionar descrições semânticas aos repositórios de dados para garantir a interoperabilidade semântica entre dados de diferentes repositórios. Este artigo descreve uma solução não invasiva e não intrusiva de proxy semântico que permite que um software de repositório de dados, o serviço EUDAT B2share, se comporte como um FDP, permitindo a interoperabilidade semântica por meio de traduções semânticas. A solução inclui uma metodologia para o mapeamento de metadados com base em transformações endógenas de modelos léxicos para modelos semânticos. Mostramos como os metadados nos pares de valores-chave de um repositório de uso geral podem ser compatíveis com a tecnologia LD sem alterar o software do repositório. A validação da solução inclui testes funcionais das camadas de metadados do FDP e uma análise de desempenho do impacto do proxy semântico na troca de dados. Os resultados mostram que o B2share pode ser compatível com as especificações do FDP, tendo impacto reduzido no desempenho da troca de dados. Portanto, a validação mostra que a solução é viável e adequada para transformar um software de repositório de dados de uso geral em um FDP.
Palavras-chave: Dados FAIR.Reusabilidade de Dados.Software de Repositório de Dados.FAIR Data Point.
Link: http://revista.ibict.br/liinc/article/view/4817