Avaliação de critérios para seleção de sintagmas nominais com valor para a recuperação da informação
Resumo
O presente estudo avalia critérios para seleção de sintagmas nominais mais representativos do conteúdo de documentos jurídicos em língua portuguesa. A metodologia da pesquisa consistiu em revisão de literatura brasileira e experimento. No experimento foram aplicados dez critérios de seleção aos sintagmas nominais extraídos de um conjunto de resumos de teses e dissertações. Os critérios foram avaliados quanto à eficácia na seleção de sintagmas nominais relevantes para a recuperação da informação. Por meio do experimento, foram identificados como mais eficazes os critérios de eliminação de sintagmas nominais considerados stopwords ou contendo pronomes no núcleo, e os critérios de seleção por posição de ocorrência, nível do sintagma nominal, inverso da frequência nos documentos e frequência de ocorrência em um documento.