O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 á 2018 nas ciências sociais aplicadas

Autores

  • Luiz Antônio Lopes Mesquita Universidade Federal de Minas Gerais
  • Renato Rocha Souza Universidade Federal de Minas Gerais
  • Célia da Consolação Dias Universidade Federal de Minas Gerais

Resumo

O objetivo geral desta pesquisa foi analisar se há uma variação temporal característica da distribuição de valores de termosrelevantes ao longo do tempo da produção de textos que possa contribuir como um critério para o processo de sua indexação automática.Foram analisadas as teses de doutorado dos programas de pós-graduação (PPGs) da área de Ciências Sociais Aplicadas da UFMG, considerando-se7 PPGs distintos, sendo cada um deles um corpus, com um total de 641 teses defendidas períodode12 anos, de 2007 a 2018.Os termos considerados foram todos os sintagmas nominais contidos nos próprios textosdas teses. Cada sintagma nominalrecebeu um valor associado à sua relevância como descritor de acordo com os critérios de frequência do termo na própria tese (TF –Term Frequency) e com o inverso da frequência de ocorrência do termo no total de teses de cada PPG (IDF –Inverse Document Frequency). As teses foram divididas em 12 gruposem cada PPG para o cálculo da data média de defesa das teses e da média de pontuação consolidada dos termos relevantes nas teses. Como resultados, identificou-se o comportamento característicode cada PPGatravés de um gráfico de dispersão do nível médio de pontuação de relevância ao longo do tempo. Para cada gráfico de cada um dos 7 PPGs foi adicionada uma linha de tendência, considerando seu respectivo R², e feita sua análise específica.Todos os comportamentos de distribuição temporais foram caracterizados em equações polinomiais e podem ser aplicados como critério para indexação automática.

Palavras-chave: Recuperação da Informação Temporal. Indexação Automática. Sintagmas Nominais.

Link: https://periodicos.furg.br/biblos/article/view/12395/8459

Downloads

Não há dados estatísticos.

Biografia do Autor

Luiz Antônio Lopes Mesquita, Universidade Federal de Minas Gerais

Doutorando em Gestão e Organização do Conhecimento pela Escola de Ciência da Informação da Universidade Federal de Minas Gerais (UFMG). Mestre em Ciência da Informação pela UFMG, Belo Horizonte, Minas Gerais, Brasil.

Renato Rocha Souza, Universidade Federal de Minas Gerais

Doutor em Ciência da Informação pela Universidade Federal de Minas Gerais (UFMG), Brasil. Professor e Pesquisador da Escola de Matemática Aplicada da Fundação Getúlio Vargas, Brasil. Pesquisador da Escola de Ciência da Informação da Universidade Federal de Minas Gerais, Brasil. Bolsista de produtividade do CNPq.

Célia da Consolação Dias, Universidade Federal de Minas Gerais

Doutora em Ciência da Informação pela Universidade Federal de Minas Gerais (UFMG).Professora do Departamento de Organização e Tratamento da Informação da Escola de Ciência da Informação da UFMG.

Publicado

2021-09-25

Edição

Seção

Resumos de artigos científicos