Análise textual de artigos científicos publicados sobre fósseis colombianos
Palavras-chave:
Colômbia, Iramuteq, Lexicon, PaleontologiaResumo
Objetivo: Identificar as proximidades lexicais em um corpus de textos de artigos científicos publicados em revistas acadêmicas indexadas na base de dados Scopus sobre fósseis colombianos.Método: Este trabalho aplica a análise textual a cinco artigos paleontológicos sobre fósseis colombianos, a fim de identificar a proximidade lexical em um corpus de textos. Este trabalho permitiu determinar: as categorias gramaticais, a proximidade entre categorias de palavras e variáveis com a análise de especificidades (AE), o agrupamento das palavras com a análise da classificação hierárquica descendente (CJD) e a apresentação gráfica das palavras. Resultado: Verificamos que o corpus documental é composto por 31.319 ocorrências de palavras, 1.450 formas ativas ou palavras específicas e 303 formas complementares ou palavras comuns. A categoria gramatical de substantivo predomina (24%) e palavras não reconhecidas no dicionário (17%). As palavras comuns com maior número de frequências são artigos, conjugações, proposições e pronomes. Conclusões: Constatou-se que existe umaproximidade lexical entre o artigo 1 e as formas ativas de “Colômbia” e o artigo 2 e as formas ativas de “fóssil”. As palavras foram agrupadas em cinco classes e a nuvem de palavras foi criada com 1271 palavras.
Link: https://periodicos.ufsc.br/index.php/eb/article/view/83470/51257