Seleção de sintagmas nominais na indexação automática
Resumo
Objetivo: Sintetizar e classificar critérios de seleção de sintagmas nominais utilizados em metodologias de indexação automática por sintagmas nominais para textos escritos em língua portuguesa. Métodos: A metodologia da pesquisa tem natureza exploratória, de cunho bibliográfico, e tem como método
procedimental a análise de conteúdo. As metodologias de seleção de sintagmas nominais baseiam-se em critérios como: frequência absoluta de ocorrência, frequência normalizada de ocorrência, frequência inversa nos documentos, não ocorrência em lista de sintagmas nominais pouco significativos, na estrutura gramatical e no nível dos sintagmas nominais. Resultados: Quanto ao escopo dos critérios, predominam em número os baseados em características do sintagma nominal (estrutura gramatical, nível, conteúdo lexical) e quanto a adoção predominam os baseados no conteúdo do documento e no conteúdo do corpus.
Conclusões: A principal contribuição deste estudo consiste do panorama dos critérios de seleção de sintagmas nominais relevantes para textos em português.
Palavras-chave: Indexação automática. Sintagmas nominais. Seleção de sintagmas nominais. Língua portuguesa. Recuperação da informação.
Link: https://periodicos.ufsc.br/index.php/eb/article/view/1518-2924.2019.e57927/39975