Buscar este blog

jueves, 4 de noviembre de 2010

PALABRAS VACIAS

De acuerdo con la información encontrada en la pagina de la Universidad  de Granada, en el documento “Modelos de Sistemas de Recuperación de Información Documental Basados en Información Lingüística Difusa. 2006”  Se determina que los aspecto a tener en cuenta a la hora de seleccionar los términos consiste en eliminar las palabras vacías de significado, como pueden ser artículos, preposiciones, conjunciones, incluso en algunos casos, se pueden calificar asi algunos verbos, adverbios y adjetivos

Por tanto, estas palabras vacías de significado no nos sirven como términos de indexación, ya que, por un lado son muy frecuentes, y por otro no representan correctamente el contenido del documento. La acción habitual que se lleva a cabo con ellas es su eliminación del texto, proceso que se conoce como eliminación de palabras vacías (stopwords1 en ingles), y se pone en practica mediante la comparación de cada palabra del texto con un diccionario que contiene la lista de palabras no aptas para la indexación (tanto en  como en  se presentan dos listas completas de palabras vacías).

No hay comentarios:

Publicar un comentario