Yahoo! Workshop: Web Search and Mining

·

Ahora llega la parte pura y dura de Búsquedas

Current approaches to personalized web search (por Paul-Alexandre Chirita)

El 80% de los usuarios prefieren los resultados de búsqueda personalizados. Se podría crear un Pagerank especializado para este tipo de resultados en base a varios factores, pero que supondrían una carga elevada para el cálculo del Pagerank por usuario. Otra opción podría ser trabajar en base a una lista de dominios importantes en los que calcular esa personalización.

El 40% del top 100 de los resultados está en DMOZ o en el directorio de Yahoo!.

Applications of Query Mining (por Ricardo Baeza-Yates)

Ricardo está explicando de forma general todo lo que tiene Yahoo! junto a algunos datos interesantes (que colgaremos en alguna foto en un artículo resumen).

Además, comenta las partes importantes de la relevancia de los contenidos, el contexto donde están (edad, lugar, curriculums, logs…) de donde podemos sacar la información importante.

Boosting Performance of Web Search Engines using Query Logs (por Fabrizio Silvestri)

Fabrizio nos habla de los datos que se guardan cuando se realiza una búsqueda. Entre otras cosas se guarda la búsqueda, los resultados, el timestamp

Además, comenta cómo cuando un usuario pasa a la siguiente página de resultados (un 10%) cuando se llega a la 4ª página hay un 70%-90% de que siga en las siguientes.

Por otro lado, comenta nuevas posibilidades para poder extraer datos de los logs, ya sea particionandolos o teniendo una nueva forma de selección de datos…

Web mining for natural language engineering tasks (por Paolo Rosso)

Una charla bastante técnica… no creo que haya que remarcar nada…

Comments

Una respuesta a «Yahoo! Workshop: Web Search and Mining»