Yahoo! Workshop: Structured Retrieval

Aunque han sido bastante técnicas, os hago un resumen de las 4 charlas…

XML Compression and Search (por Pablo Ferragina)

Ha comentado varios sistemas para almacenar información en formato XML. En resumen el mejor podría ser el XBzipIndex, que comprime sobre un 36%, y permite hacer consultas y navegar en menos de 10 milisegundos.

Semantic structure in structured document retrieval (por Roelof Van Zwol)

¿Se puede usar la estructura XML para recuperar mejor la información? Esta es la pregunta que hace Roelof. La respuesta es qué necesitamos de ese XML (contenido, contenido y estructura…) y, de esa estructura, si todo o sólo parte de ella.

Yahoo! Workshop

Hay dos formas de buscar:

  • Usando palabras clave
  • Usando búsquedas semánticas

El uso de búsquedas semánticas mejora la relevancia de los resultados sobre las búsquedas por palabra clave.

Flexible XML using summaries (por Mariano Consens)

Me quedo con dos conceptos:

Toda la información se puede rastrear y buscar.

Los feeds son un ejemplo claro de sumarización, aunque existan los RSS, RDF, Atom con muchas variantes.

Yahoo! Workshop

Exploiting Temporal Features for Structured Queries (por Albercht Schmidt)

Ha dado algunas ideas a nivel tecnológico sobre las estrcuturas de búsquedas y recuperación de información. Una de ellas podría ser la de tener un índice reducido con aquellos sitios que se actualizan de forma frecuente y uno estático mayor en el que se almacenen datos que vayan a ser actualizados en mucho tiempo.

1 comentario en “Yahoo! Workshop: Structured Retrieval

  1. Vaya maratón!

    Se agradece tu esfuerzo (por las reseñas y por aguantar el tostón), me ha parecido muy interesante ver a que dedican el tiempo los laboratorios de search engines.

Los comentarios están cerrados.