Motores de recuperación de documentos XML/RDF

Estos recuperadores de información constituyen la herramienta con la que buscar documentos de la Web Semántica: XML/RDF. El usuario realiza una consulta de la forma usual, tras lo cual se transfiere a un agente automático que mide la relevancia entre diferentes ontologías y le devuelve los resultados.

A continuación se describen las características y el funcionamiento de dos de los principales motores de recuperación de información de la Web Semántica: Swoogle y SWSE.

SWOOGLE

Swoogle es un motor de recuperación para la Web Semántica, fruto de un proyecto de investigación del "Computer Science and Electrical Engineering Department at the University of Maryland, Baltimore County". La recuperación de información que realiza el buscador se basa en el análisis de la semántica de la búsqueda, proporcionando resultados para consultas manuales o automáticas realizadas por software. El motor ha sido también utilizado por diversas organizaciones para gestionar y mantener su base de conocimiento (documentación RDF).

Los contenidos indexados por el motor, unos 1.4 millones, son documentos escritos en XML/RDF y OWL, o que incluyan fragmentos de XML/RDF, recogidos de la World Wide Web. La indexación se basa en la solicitud manual y una búsqueda de metas similar a la de Google.

El posicionamiento se realiza en base a un algoritmo configurable también basado en el PageRank de Google. Éste emula un agente racional adquiriendo conocimiento sobre la web semántica usando los hipervínculos proporcionados.

El sitio de Swoogle ofrece una completa documentación, con artículos sobre Swoogle, búsqueda y clasificación en la Web Semántica y una completa F.A.Q., así como información actualizada sobre los datos de indexación. Por otra parte tiene una función de archivo, dando la opción de acceder a contenido cacheado por el buscador.

The Semantic Web Search Engine - SWSE

Este buscador se define como uno de los motores de recuperación y búsqueda de datos de la Web Semántica, y presume de proporcionar resultados más acertados que los buscadores tradicionales. Se presenta a través de una interfaz HTML, si bien se advierte que no es operativo para el buscador Internet Explorer por problemas de compatibilidad de JavaScript.

SWSE implementa las funcionalidades típicas de los motores de recuperación de documentos XML/RDF: búsqueda a través de semánticas RDF u OWL, cuyas ontologías y vocabularios permiten afinar las búsquedas.

El contenido a indexar proviene de la exploración de la web mediante su framework MultiCrawler le permite recopilar RDF, HTML y XML, convirtiendo estos dos últimos tipos en XML/RDF antes de añadirlos al índice.

La recuperación de documentos XML/RDF se realiza de la siguiente forma:

Se introduce la palabra de búsqueda.
Se elige uno de los resultados obtenidos o bien permite refinar la búsqueda usando el filtro que ofrece el buscador: archivos de Wikipedia, FOAF Document, FOAF Person, RSS, etc.

Recuperacion y Organizacion de la Informacion