Recuperacion y Organizacion de la Informacion

Introducción a los Motores de recuperación de documentos XML/RDF

En un principio la World Wide Web fue ideada para uso humano, por lo que la recuperación y organización de la información contenidos en ella estaba sujeta al difícil proceso de automatización de búsquedas satisfactorias para los usuarios. Fue necesario dotar a las páginas Web de metadatos, es decir, información sobre los datos contenidos en el documento, como medio de describir e informar sobre los recursos ofrecidos por la Web.

Disponiendo ya de webs que proporcionan información en los metadatos acerca de sus contenidos, surgió la necesidad de automatizar el proceso de recuperación de información que describa los diferentes recursos. Como respuesta a esto se realizó la especificación XML/RDF, dejando como último hito para conseguir una recuperación eficaz de información sobre los contenidos la implementación de motores de recuperación de documentos XML/RDF

El ámbito de búsqueda de estos motores no es la World Wide Web tradicional, sino una extensión de la misma denominada Web Semántica, es decir, un entorno al que se le han añadido datos semánticos. Estos, expresados en un lenguaje formal como XML/RDF, permiten describir el contenido, el significado y la relación de los datos, facilitando su procesamiento automático.

La adición de semántica permitirá dotar a la Web de una base de conocimiento que satisfará de forma exacta las solicitudes de información de los usuarios: Supongamos que un usuario utiliza en la actualidad alguno de los motores de recuperación de información para encontrar los vuelos entre Madrid y Londres que salen esta tarde. Los buscadores actuales devuelven un amplio abanico de resultados, desde webs de aerolíneas, información sobre Madrid o Londres, y demás información descontextualizada. La única posibilidad para el usuario pasa por refinar su búsqueda sobre esos resultados, o incluso redefinir la consulta. La adición de semántica y su utilización por parte de los motores ofrecería a los usuarios una respuesta exacta: vuelos que salen esta tarde de Madrid a Londres. Gracias a la semántica palabras como tarde podrían ser interpretadas y el origen geográfico podría omitirse al detectarse y contextualizarse adecuadamente.

Por tanto, la ventaja de la dotar a la Web de contenido semántico es que permite ofrecer soluciones a problemas habituales de la recuperación y organización de la información, al servirse de una infraestructura mediante la cual la transmisión y el procesamiento de información se realizan de forma sencilla. La información no se procesa por los motores de recuperación en términos de entradas y salidas, sino en función de la semántica y apoyándose un una redefinición tanto de los operadores como de los datos.

Las siguientes secciones ofrecen una profundización en el concepto de Web semántica, los motores de recuperación utilizados en la misma y enlaces a documentación adicional.

Motores de recuperación de documentos XML/RDF

Introducción a los Motores de recuperación de documentos XML/RDF

Enlaces