Técnicas de recuperación de información aplicadas a la construcción de tesauros
Resumo
El artículo propone la aplicación de un conjunto de técnicas propias del ámbito de la Recuperación de Información a la elaboraciónde Tesauros. Las propuestas que se presentan se aplicaron en la selección de la terminología, en la categorización de términosmediante clusters, y en el establecimiento de relaciones semánticas entre los términos, por procedimientos de similitud, quedieron como resultado un Tesauro de Comercio Exterior, de 7.790 términos. De tales resultados se puede concluir que las técnicasutilizadas simplifican de forma considerable las tareas para la recopilación de la terminología, y pueden suponer una mejora de lacalidad del Tesauro resultante, en tanto que permiten el análisis de las condiciones de la colección para la que se utilizará elTesauro, así como aportar información extra a los expertos que es difícilmente obtenible de forma manual.
Palabras clave: Construcción de tesauros. Clustering. Modelo de espacio vectorial. Modelo generalizado de espacio vectorial.Semántica latente.
Link para o texto completo (PDF)
http://periodicos.puc-campinas.edu.br/seer/index.php/transinfo/article/view/2235