La próxima hora y media se dedicará a revisar formas de recuperar información. Todo este bloque lo dan españoles:
Applications of Influence Diagrams to Information Retrieval (por Juan F. Huete)
A destacar que hay que tener en cuenta como mínimo que la información que hay que indexar ha de ser útil, pero que podemos encontrarnos problemas básicos.
Un detalle a tener en cuenta es que si disponemos de una entradilla de un artículo y de un artículo completo hemos de decidir si recuperamos la información de ambos, sólo de la entradilla o sólo del artículo completo.
En definitiva, en un proyecto hemos de:
- Decidir el modelo de recuperar la información.
- Detectar de forma automática los «mejores puntos»:
- Considerar el contenido
- Relevancia
Si se recupera la información correctamente no debe haber problemas para adaptarla a cualquier modelo de datos.
Tunning: Error Optimization in Ad-Hoc Retrieval (por Hugo Zaragoza)
Hugo ha explicado un caso curioso que han desarrollado cuando estaba en Microsoft Research. Toma el caso de elegir a un grupo de usuarios y les pide que elijan, según su relevancia, entre los 5 primeros resultados. De esta forma, dado un posible caso de que la gente haya decidido que el 2º y 3º resultado son más relevantes que el primero, hay que buscar el porqué de este error del sistema al hacer la puntuación, y de cómo ordenarlos, si basándose en esos 5 resultadoso aplicando el error a todos los resultados de esa búsqueda.
Ongoing research on sentence retrieval and novelty detection (por David Losada)
Poco a comentar, una charla muy «científica».