Yahoo! Workshop: Retrieval Foundations

·

La próxima hora y media se dedicará a revisar formas de recuperar información. Todo este bloque lo dan españoles:

Applications of Influence Diagrams to Information Retrieval (por Juan F. Huete)

A destacar que hay que tener en cuenta como mínimo que la información que hay que indexar ha de ser útil, pero que podemos encontrarnos problemas básicos.

Un detalle a tener en cuenta es que si disponemos de una entradilla de un artículo y de un artículo completo hemos de decidir si recuperamos la información de ambos, sólo de la entradilla o sólo del artículo completo.

En definitiva, en un proyecto hemos de:

  • Decidir el modelo de recuperar la información.
  • Detectar de forma automática los «mejores puntos»:
    • Considerar el contenido
    • Relevancia

Si se recupera la información correctamente no debe haber problemas para adaptarla a cualquier modelo de datos.

Yahoo! Workshop

Tunning: Error Optimization in Ad-Hoc Retrieval (por Hugo Zaragoza)

Hugo ha explicado un caso curioso que han desarrollado cuando estaba en Microsoft Research. Toma el caso de elegir a un grupo de usuarios y les pide que elijan, según su relevancia, entre los 5 primeros resultados. De esta forma, dado un posible caso de que la gente haya decidido que el 2º y 3º resultado son más relevantes que el primero, hay que buscar el porqué de este error del sistema al hacer la puntuación, y de cómo ordenarlos, si basándose en esos 5 resultadoso aplicando el error a todos los resultados de esa búsqueda.

Yahoo! Workshop

Ongoing research on sentence retrieval and novelty detection (por David Losada)

Poco a comentar, una charla muy «científica».