Nuevos retos de la tecnología web crawler para la recuperación de información
PDF

Palabras clave

web crawler
recuperación de información
marcado semántico
Apache Nutch
Heritrix
WIRE
SocSciBot
Mbot

Cómo citar

Blázquez Ochando, M. (2014). Nuevos retos de la tecnología web crawler para la recuperación de información. Métodos De información, 4(7), 115–128. https://doi.org/10.5557/IIMEI4-N7-115128

Resumen

El web crawler constituye una parte importante de la cadena documental en la recuperación de información, dado que genera el corpus documental necesario sobre el que aplicar los distintos algoritmos de recuperación. Dada su relevancia, se analiza el papel que desempeñan, sus distintos enfoques, aportaciones significativas y estado de la técnica. Algunas de las conclusiones obtenidas, apuntan a la introducción del reconocimiento del marcado semántico en la web, al desarrollo de un web crawler más polivalente, capaz de interactuar con la web social y realizar campañas de comunicación.
https://doi.org/10.5557/IIMEI4-N7-115128
PDF

La segunda época de revista MEI es propiedad del Col·legi Oficial de Bibliotecaris i Documentalistes de la Comunitat Valenciana. Los artículos que en ella se publican están sujetos a la licencia Creative Commons; es decir, podrán ser reproducidos y citados libremente, siempre que se cite correctamente al autor de la contribución y a MEI.