#WWW2012: WebQuality 2012, Online Credibility and Trust Session

Y tras las presentaciones sobre Web Quality, ahora tocan las de credibilidad y confianza.

La primera charla es Game-theoretic Models of Web Credibility (de Thanasis Papaioannou, Katarzyna Abramczuk, Paulina Adamska, Adam Wierzbicki y Karl Aberer).

Uno de los mayores problemas hoy en día es la creciente dificultad de detectar la credibilidad de los contenidos en Internet. Puede haber factores económicos que pueden incluir en la calidad o neutralidad, por ejemplo. Los primeros acercamientos hacen referencia a estudios empíricos, a mecanismos de repitación /pero hay que tener en cuenta la información histórica, que es muy relevante) y, lo que se nos propone, que es un juego entre los contenidos producidos y los consumidos.

A la hora de tener elementos en cuenta debemos distinguir entre el contenido producido por los generadores y por los consumidores. Además hay que distinguir la calidad y presentación del mismo y finalmente la experiencia de los usuarios, además del incentivo económica. En el caso de los lectores de los contenidos hay que tener en cuenta dos opciones, que acepten o que rechacen dicho contenido.

Los generadores de contenidos han de ir a buscar la honestidad hacia los buenos contenidos y decidir entre la inversión o no en la presentación de dichos contenidos.

Hay que tener también en cuenta los usuarios… hay una gran diferencia entre los usuarios ingenuos y los expertos. Los usuarios ingenuos necesitas una gran inversión en diseño y en la presentación de los contenidos, en cambio los usuarios expertos dejan un poco de lado esto, ya que se centran más en el contenido propiamente. Los usuarios ingenuos siempre rechazan una mala apariencia y aceptan una buena apariencia.

La siguiente presentación es An Information Theoretic Approach to Sentimental Polarity Classification (de Yuming Lin, Jingwei Zhang, Wang Xiaoling y Aoying Zhou).

En la red hay muchos temas, que provocan efectos sentimentales que pueden ser positivos o negativos. En base a esto podemos hacer una clasificación. Esta información la podemos extraer de elementos que marquen detalles positivos o negativos (me gusta, no me gusta). Para ello hay que sacar y analizar frases y no palabras sueltas. Una de las formas para establecer la tendencia es la cantidad de veces que aparecen dichos elementos en el documento.

Un ejemplo de DataSet para realizar un experimento lo podemos encontrar en Multi-Domain Sentiment Dataset.

La última charla es Content-Based Trust and Bias Classification via Biclustering (de David Siklosi, Balint Daroczy y Andras A. Benczur).

La idea es la de encontrar a las instituciones a seleccionar los contenidos fiables de la red de redes. Esto también ayuda a detección del spam y a clasificar la escalabilidad según el tamaño de la Web. En este caso se han seleccionado 3 categorías para diferenciar los contenidos: credibilidad, neutralidad y parcialidad.

El biclustering es un sistema de clustering bidireccional, que analiza sitios web y los términos que incluyen los mismos. Gracias a esto se pueden encontrar sitios similares con contenidos similares y analizarlos en la misma situación y calidad. Además, con este sistema también podemos extraer dominios relacionados con temáticas relacionadas, de forma que se puedan categorizar de forma sencilla.

Deja un comentario