Google Quality Rater: utilidad del documento

Para los que no lo sepan, Google desde hace muchos años contrata a gente que suele trabajar desde casa en la revisión de calidad de los resultados de búsqueda. Incluso, muchos de los que hace unos años eran “los mejores SEO” tenían a algún familiar muy directo metido a trabajar en este tema (de ahí ser tan buen SEO y ahora ya no serlo tanto). A cada Quality Rater de Google se le en entregan las General Guidelines (PDF) en la que se explica el funcionamiento de la plataforma de calificación además de los diferentes puntos donde se detalla qué es y no es calidad, además de qué es y no spam.

Aunque esta última versión (la 3.18 de marzo de 2011) tampoco lleva muchos cambios con respecto a la anterior, lo principal es el concepto de “sin utilidad”. Este documento no te ayuda a hacer SEO, sino que te ayuda a diferenciar lo que Google considera qué es y qué no es calidad en un resultado de búsqueda para una búsqueda concreta, dependiendo de muchos factores.

La utilidad de la landing page es la de medir cuánto de útil es la página para lo que el usuario intenta encontrar. Páginas útiles son de ayuda para los usuarios. Páginas inútiles son de poca ayuda. La utilidad es el aspecto más importante para la calidad de un motor de búsqueda y es lo más importante a tener en cuenta cuando evalúes una página web.

Existen varios niveles de utilidad:

  • Vital (vital): Son lo que podríamos llamar “páginas que han de estar ahí sí o sí”.
  • Useful (útil): Página muy útil para el usuario.
  • Relevant (relevante): La página es de ayuda para la mayoría de los usuarios.
  • Slightly Relevant (algo relevante): La página no es de gran ayuda pero está relacionada con la búsqueda y algunos usuarios pueden encontrarle utilidad.
  • Off-Topic or Useless (sin relación o inútil): La página puede ser útil para uno o ningún usuario.
  • Unratable (inclasificable): La página no puede ser evaluada.

Lo primero que hay que hacer es entender la consulta de búsqueda que está haciendo el usuario. Por ejemplo, si busca [fedex] lo más probable es que quiera hacer un seguimiento de un paquete, si busca [ebay] querrá visitar el sitio o comprar o vender algún producto; si busca [calendar] puede que busque imprimir o prsonalizar un calendario, encontrar un calendario con fechas destacadas o encontrar un servicio de calendarios en línea.

Por otro lado hay que tener en cuenta el idioma con su peculiaridad geográfica. Por ejemplo no es lo mismo buscar [football] en inglés de Estados Unidos que [football] en inglés de Reino Unido, ya que en el primer caso hablaríamos de “fútbol americano” (similar al rugby) y en el segundo hablamos de “fútbol” (en inglés, lo que es soccer).

Otro detalle a tener en cuenta es que una consulta de búsqueda puede tener varios significados. Y para ello se utilizan tres clasificaciones:

  • Dominant interpretation: Es lo que la mayoría de usuarios tienen en mente cuando hacen esa consulta de búsqueda.
  • Common interpretations: A veces no hay una interpretación principal, por lo que caben muchas posibles válidas. Por ejemplo palabras con varias acepciones.
  • Minor interpretations: Son el resto de interpretaciones que puede tener una búsqueda, no habitual pero igualmente válida.

Los usuarios también, cuando realizan una búsqueda, pueden tener en mente la acción que quieren hacer. Es por esto que las búsquedas se clasificarían de 3 formas distintas, el Do-Know-Go:

  • Action intent (Do): El usuario quiere realizar una acción (descargar, jugar, enviar algo, comprar…)
  • Information intent (Know): El usuario busca información sobre algo.
  • Navigation intent (Go): El usuario quiere visitar alguna página en concreto.

Otro detalle a tener en cuenta es el idioma del documento en cuestión. Para cada idioma se puede asignar que la página está en ese idioma, en uno “razonable”, en inglés o desconocidos:

  • Task Language: El idioma es el mismo que el que realiza la consulta.
  • Acceptable Language: Un idioma aceptable para la región desde la que se consulta. Por ejemplo, un idioma que la mayoría de la población sea capaz de entender.
  • English: Si el documento está completamente o parcial en inglés. Sí, el inglés siempre tiene una predominancia especial.
  • Foreign Language: Si el documento está el otro idioma que no corresponde a los casos anteriores.
  • None of the above: No es posible identificar el idioma del documento.

Todo esto nos dejaría un panel bastante similar a este:

Esto sería más o menos de forma general los detalles a tener en cuenta para determinar la relevancia y calidad de un sitio, pero no es todo. Antes de seguir voy a revisar con detalle cada uno de los puntos de relevancia, en los que hay mucho más a explicar que el breve resumen anterior.

Vital

La opción “vital” se utiliza en 2 situaciones claras: la consulta de búsqueda es inequívocamente el resultado de búsqueda; la otra es que la consulta de búsqueda haga referencia a una marca, producto, negocio, lugar, etc… de forma predominante para esa búsqueda. En cualquiera de los casos ha de ser una interpretación dominante, de forma que no puede haber ninguna duda en la respuesta.

En el caso de que la búsqueda sea navigacional (Go), si la consulta de búsqueda coincide con el sitio se convierte en vital. Incluso, si la búsqueda hace referencia a una subpágina también se convertiría.

Otro de los casos especiales es el de las búsquedas de personas. Hay consultas que son obvias y predominantes como [george bush] o [bill clinton] que serían vitales, pero otras genéricas como [bob smith] no tienen una interpretación clara, por lo que no pueden serlo. Personas que no son “famosas” pero son conocidas en un sector determinado por alguna razón también pueden llegar a tener un elemento vital. Las páginas oficiales de las personas siempre son vitales, incluso para gente que no es famosa pero sí que puede ser relevante en un sector. Las páginas oficiales de grupos de personas (música, organizaciones, etc) pueden también considerarse vitales. Las páginas de redes sociales nunca son vitales.

Las páginas oficiales de un sitio web que está en varios idiomas también pueden considerarse vitales en cada uno de esos idiomas. Los sitios en las que la búsqueda coincide con el dominio no tienen porqué considerarse vitales; un ejemplo podría ser [diabetes] y que exista el [diabetes.com], pero al ser una consulta genérica con múltiples interpretaciones no se puede hacer vital dicho dominio.

Dentro de las opciones de Vital existen:

  • Appropiate Vital: La versión de la página coincide completamente con el idioma, país, etc de lo que el usuatio ha consultado.
  • International Vital: Si la página es de esas de “elige tu país” o “elige tu idioma”. También se puede considerar la versión en inglés de la web oficial como este caso.
  • Other Vital: Aunque el idioma o país no coincida con lo que debiera, pero esa versión cuadra al máximo con lo que el usuario necesita.

Useful

Una página útil es aquella que ofrece un resultado de mucha calidad y que “cuadra” con la búsqueda. Normalmente son páginas en las que uno puede confiar y donde las fuentes de información son correctas, por lo que no contienen spam.

En este caso, muchas páginas relacionadas con una consulta pueden ser clasificadas aquí. Páginas de rumores, sitios populares, vídeos, páginas de redes sociales pueden marcarse como útiles en esta sección.

Relevant

Los resultados relevantes son aquellos que contienen información útil para algunos usuarios; son páginas con algo menos de valor que las útiles. Estas páginas entran dentro de la consulta de búsqueda pero pueden ser difíciles de comprender, pueden estar desactualizadas, con una fuente poco reconocida o cubrir sólo una parte de lo que se consulta.

Estas páginas deben ser útiles para los usuarios aunque incluyan “otros temas”. Las páginas han de tener una buena calidad y, de media, son buenas páginas.

Slightly Relevant

Este punto de poca relevancia hay que marcarlo cuando la página no tiene mucha relevancia para la mayoría de los usuarios, pero sí para algunos. Estas páginas pueden tener una menor calidad o contenidos menos útiles; incluso pueden ser páginas que sirvan a una menor interpretación, tener información desactualizada, ser muy general…

Las versiones móviles de un sitio siempre han de marcarse como esta opción, ya que suelen ser versiones de páginas de escritorio.

En algunas ocasiones una página puede encajar en esta opción si tiene “buena pinta” con contenido mínimamente útil. En otros casos páginas que copian contenidos de otros sitios pueden considerarse en esta opción; también lo son aquellas páginas que tienen contenido útil pero que vienen de alguien sin autoridad. Incluso, algunas de estas páginas podrían llegar a macarse como spam.

No todas las páginas que copian pueden considerarse de baja calidad. Si la página está bien organizada y es de ayuda para los usuarios, y en este caso incluye poca cantidad de anuncios y parece estar creada para ayudar, puede considerarse de ayuda.

Off-Topic or Useless

Estas son aquellas páginas que no tienen nada que ver con la consulta de búsqueda o no son útiles para ningún usuario. Aquí podríamos incluir aquellas páginas en la que sólo hay publicidad pero el contenido es mínimo o inexistente. Si los enlaces conducen a páginas en las que sólo hay otros enlaces o anuncios también se deben considerar inútiles. Muchas de estas páginas incluyen elemento de spam.

Unratable

Son aquellas páginas que no es posible evaluar. Se pueden considerar de este tipo en base a dos posibilidades.

Unratable: Didn’t Load

El contenido no carga y suelen recibir algún tipo de mensaje de error desde el servidor. En este caso nos podemos encontrar páginas en blanco, que las redirecciones no funcionan, con avisos de “malware” o con errores de carga de certificados. En estos casos en los que hay avisos nos e debe marcar ni como spam ni como malware. Las páginas con códigos 401, 403, 404, 500 o 503 entran dentro de esta clasificación. En el caso de que la página cargue, aunque los enlaces en ella no funcionen, hay que valorar la página, no los enlaces.

En este caso hay que copiar o especificar el error que aparece en la página / servidor por el que no se puede validar la página.

Unratable: Foreign Language

Cuando el documento no está en ninguno de los idiomas aceptables hay que marcar esta opción. La única excepción es que el documento sea Vital.

Una vez revisadas todas las opciones posibles, hay que tener en cuenta que una de las bases a la hora de evaluar una página es la intención del usuario. Lo primero es relación la utilidad de la página con lo que el usuario quiere. Con esto valoraríamos de la forma que hemos visto. El siguiente punto es tener en cuenta la localización. En este caso siempre primará lo que el usuario haya introducido en el cajetín de búsqueda sobre la geolocalización que pueda dar el sistema. También hay que tener en cuenta que en muchas ocasiones la versión en inglés puede ser de gran ayuda en resultados en los que la calidad es baja o la página en general no tiene valor. De todas formas hay países en los que el inglés no es un idioma muy utilizado, por lo que en esos casos esta no será una opción. Otro detalle es que, por ejemplo, búsquedas técnicas sí que pueden serlo, al igual que otros idiomas pueden serlo para otros temas.

Los resultados de enciclopedias o de diccionarios en muchos casos pueden ser útiles, aunque hay otros casos en los que no lo son. Otras consultas pueden ir relacionadas con la búsqueda de listas de elementos. En estos casos los resultados de búsqueda o páginas con listados de elementos más concretos pueden ser una buena solución.

Otro tipo de consultas que podemos encontrar son aquellas que incluyen algún tipo de error ortográfico. Que sea incorrecta no significa que no pueda ser tratada de la misma forma que el resto. Aún así, hay que tener en cuenta que algunas búsquedas pueden haber sido forzadas a escribirse de forma incorrecta, no podemos dar por hecho nada. Una búsqueda como [my sapce] queda claramente marcado como Vital el sitio de [myspace.com].

Otro tipo de búsqueda son las búsquedas de URL. Normalmente este tipo de consultas llevan el nombre de una web, o un dominio, o una URL completa. En ocasiones hay direcciones que se plantean que no funcionan, son las llamadas “imperfect URL queries”. Esto significa que aunque se evalúa el contenido de la página, también hay que observar la dirección URL para ver si tiene relación con lo que el usuario consulta. En este caso se pueden dar resultados Vitales siempre y cuando la consulta coincida con el resultado. Aquí también podemos encontrar las búsquedas de tipo “sitio web”, que son aquellas en las que la intención principal del usuario hace referencia a un sitio web; por ejemplo [kayak], [ebay], [addicting games]… hay casos que aunque el sitio web corresponde con la consulta, la búsqueda es un tanto genérica, por lo que no se puede valorar como Vital.

Un factor más a tener en cuenta es la edad de la página que se está consultando. En este caso las páginas más antiguas o las más nuevas no tienen porqué ser mejores o peores, pero sí que habrá que valorar la información que incluyen según los valores anteriores. En el caso de que se trate de un evento podemos determinar si la edición anterior o siguiente es la mejor. Por ejemplo, si hay un evento anual y se realiza la búsqueda unos pocos meses después, la versión correcta es la pasada, pero si falta poco tiempo para el evento, la versión nueva es la mejor.

Cuando nos encontramos con páginas de resultados de búsqueda, hay que valorarlas como se haría el resto. El único detalle es que si el cajetín de búsqueda está vacío hay que marcarlo como Off-Topic or Useless.

El caso de los vídeos el sistema de calificación es similar. Para empezar hay que comprobar correctamente el idioma del mismo, y después revisar la utilidad del mismo… en el caso de canciones, bandas sonoras, películas o eventos que hablan de lo que se está buscando, pero no es lo que se está buscando, la calidad es nula.

Pero las consultas, además de las generales, pueden ir geolocalizadas, de forma que la forma de valorar los resultados puede variar dependiendo de una serie de casos.

La geolocalización puede darse porque el usuario incluya un dato geográfico en la consulta de búsqueda (una ciudad, un código postal…) o porque el propio Google tenga asignada una localización (ya sea por la configuración de Google, que el usuario puede adaptar, o por la geolocalización móvil, detectando el lugar desde el que se conecta).

A partir de este momento el “SEO tradicional” desaparecería ya que la valoración de utilidad de los documentos cambia completamente, ya que ha de hacerse desde el punto de vista de ese lugar, de gente que vive en ese sitio. Por norma general, las páginas locales, la de gente que vive cerca del lugar reciben una alta valoración. Si una empresa u organización tiene una edición local de su empresa/producto para ese lugar se convertiría en Appropriate Vital.

En una siguiente entrada hablaré de la parte de SPAM y de lo que se considera que se puede y no se puede hacer (spam, pornografía, códigos maliciosos…), además de temas que tienen que ver con la geolocalización (más en profundidad de lo que he comentado)… pero eso será en otra ocasión.

Google Quality Raters:

Categorías Javier, SEO

5 comentarios en “Google Quality Rater: utilidad del documento”

  1. Gracias, Javi, pillé el último pdf General Guidelines al vuelo y como es más largo que tu post leeré antes tu post :) pero desde el kindle :P

  2. Excelente resumen!

    Ojo, que Google prohibió publicar enlaces directos al documento… ;)

    Abrazo

  3. Pues no tenía ni idea de que esta clasificación se hiciera. La verdad es que es muy interesante conocerlo, gracias por la información.

Deja un comentario