#WWW2012: CrowdSearch 2012, crowdsearching on textual and linked data

2012-04-17

Javier Casares

Seguimos con las presentaciones… ahora empiezan las charlas más formativas y técnicas. Comienza la charla Social-Textual Search and Ranking (de Ali Khodaei y Cyrus Shahabi).

En los últimos años las redes sociales se han disparado, y tenemos una serie de relaciones como los intereses similares que podemos conseguir gracias a nuestros amigos o a grupos. Todo esto básicamente conseguido gracias a la llamada Web 2.0.

Una pregunta importante a hacernos es «qué es la relevancia social». Cómo podemos relacionarla con la relevancia textual (la que usan los buscadores). Esto también va unido a la relación entre pares de documentos.

Para todo esto debemos presentar el concepto «Social-textual Query», o sea una consulta textual que implícitamente lleve una parte social. Esta lleva una parte de relevancia textual y una parte de relevancia social (además de las acciones sociales que se pueden realizar).

Hay 3 grandes factores:

La relevancia de cada usuario según la búsqueda, es decir, si la temática que tiene este usuario sobre unos temas particulares son relevantes o no lo son.
La relevancia del usuario en el grupo, en la propia red social, que se podría medir por los seguidores, los que sigues, su importancia…
Por último tenemos las acciones del usuario; por ejemplo tener un vídeo en Youtube es más relevante que comentar un vídeo.

El cálculo de los valores y pesos es dinámico, es decir, variará según vaya pasando el tiempo con bastante frecuencia ya que las redes sociales evolucionan.

Los análisis «en laboratorio» dicen que si combinamos los resultados textuales con los sociales los primeros resultados de búsqueda mejorarían ligeramente pero que el resto de resultados mejoraría bastante más, lo que en general daría una calidad mayor a los resultados de búsqueda, eso sí, en determinados tipos de búsqueda y dependiendo de tu red social.

La siguiente charla es A semantically enabled architecture for crowdsourced Linked Data management (de Elena Simperl, Maribel Acosta y Barry Norton).

El Linked Data básicamente son nodos relacionados la mayoría por RDFa y su sistema de consulta es SPARQL. En general los usuarios no saben buscar de forma concreta, por lo que las consultas de búsqueda, aunque se quieran interpretar son difíciles de calcular. Para ello primero hay que corregir internamente las consultas.

La idea es la de crear un escenario híbrido en el que se tenga en cuenta las consultas y datos establecidos (con SPARQL) junto a elementos de inteligencia colectiva.

Otro de los objetivos es el análisis de la relación entre DataSets, de forma que se podría mejorar la cantidad y calidad de los contenidos de forma automática.

La última presentación es Exploiting Twitter as a Social Channel for Human Computation (de Ernesto Diaz-Aviles y Ricardo Kawase).

En general se pueden usar herramientas como Mechanical Turk para encontrar computación humana, pero ¿por qué no utilizar algo del estilo Twitter? Twitter tiene más de 300 millones de usuarios y 200 millones de tweets diarios.

Para ello lo primero que habría que crear es una especie de framework para poder trabajar con los usuarios de la plataforma.

El sistema de preguntas y respuesta se haría mediante tweets, enviando la pregunta, un identificador y las respuestas, teniendo el usuario que contestar con el identificador y la respuesta seleccionada.

Comments

Deja una respuesta Cancelar la respuesta

Últimas entradas

WordPress no necesita un MCP: usa la REST API2026-07-06
QUERY como nuevo método HTTP (RFC 10008)2026-07-03
Detective para los bots de IA2026-07-01
Por qué mi código ya no vive en GitHub2026-06-29
Baremetal virtualizado vs. VPS2026-06-26