O fluxo temporal de termos relevantes: uma análise em teses da UFMG de 2007 á 2018 nas ciências sociais aplicadas
Resumo
O objetivo geral desta pesquisa foi analisar se há uma variação temporal característica da distribuição de valores de termosrelevantes ao longo do tempo da produção de textos que possa contribuir como um critério para o processo de sua indexação automática.Foram analisadas as teses de doutorado dos programas de pós-graduação (PPGs) da área de Ciências Sociais Aplicadas da UFMG, considerando-se7 PPGs distintos, sendo cada um deles um corpus, com um total de 641 teses defendidas períodode12 anos, de 2007 a 2018.Os termos considerados foram todos os sintagmas nominais contidos nos próprios textosdas teses. Cada sintagma nominalrecebeu um valor associado à sua relevância como descritor de acordo com os critérios de frequência do termo na própria tese (TF –Term Frequency) e com o inverso da frequência de ocorrência do termo no total de teses de cada PPG (IDF –Inverse Document Frequency). As teses foram divididas em 12 gruposem cada PPG para o cálculo da data média de defesa das teses e da média de pontuação consolidada dos termos relevantes nas teses. Como resultados, identificou-se o comportamento característicode cada PPGatravés de um gráfico de dispersão do nível médio de pontuação de relevância ao longo do tempo. Para cada gráfico de cada um dos 7 PPGs foi adicionada uma linha de tendência, considerando seu respectivo R², e feita sua análise específica.Todos os comportamentos de distribuição temporais foram caracterizados em equações polinomiais e podem ser aplicados como critério para indexação automática.
Palavras-chave: Recuperação da Informação Temporal. Indexação Automática. Sintagmas Nominais.
Link: https://periodicos.furg.br/biblos/article/view/12395/8459