Los Sitemaps XML ayudan a encontrar novedades

Esta mañana me he encontrado con un tweet de Jaime que me preguntaba si sabía algo de porqué muchos de los Sitemaps XML en Google Webmaster Tools estaban a valor 0.

La verdad es que me ha sorprendido un poco que pasase eso en las herramientas de motor de Mountain View pero, aún a sabiendas de que la cifra no suele ser 100% exacta, es muy extraño que quede completamente a cero.

Tras revisar varios ficheros de varios sitios que no tienen nada que ver e incluso son creados por desarrolladores distintos, me he dado cuenta de que había algunos que, efectivamente, estaban a cero, pero, incluso, en un mismo sitio con varios Sitemaps, había algunos con valor y otros a cero.

Independientemente de que no tengo claro si es un fallo del propio panel, hay que tener varias cosas presentes a la hora de desarrollar los Sitemaps XML. Y para empezar hay que tener presente lo que pone en el propio sitio: Envíe un Sitemap para informar a Google acerca de las páginas de su sitio que no podríamos detectar de otro modo.

Mucha gente se cree que hay que enviar todas las URL de un sitio a Google (o Bing, o quién sea) dentro de los Sitemaps, y no es cierto; los Sitemaps están pensados para indicar a Google las direcciones URL que de otra forma no encontraría. Esto significa que enviar URL “viejas” o “que no se actualizan con frecuencia” no tiene sentido. Hay que pensar más en un Sitemap como en una especie de RSS, un fichero en el que se incluyen las últimas noticias… la diferencia con un RSS es que aquí suele haber sólo las últimas noticias, y en un Sitemap hay URL de todo tipo, además de las que puede haber en un RSS.

¿Qué quiero decir con esto? Pues que en un sitio recién lanzado, sí que podemos incluir hasta las 50.000 URL que permite los Sitemaps y así que descubra todo lo que el sitio puede dar de sí, pero cuando un sitio ya está lanzado, es mucho mejor ver cuántas de esas URL están indexadas y limitarlas. Esto significa que si tenemos un Sitemap con 50.000 URL y hay indexadas 43.500, pues con que pongamos un Sitemap con las últimas 10.000 URL hay más que de sobra… las otras URL ya están indexadas, así que ¿para qué pedirle a Google que las siga leyendo?

Claro está, los Sitemaps tienen una peculiaridad y es que se basan en la actualización. Yo, por norma general, siempre digo que este tipo de ficheros ha de incluir la etiqueta LOC (que es obligatoria) y ya está. Ya está, a menos que tengamos disponible la fecha de última actualización, es decir, la etiqueta LASTMOD, que, en caso de tenerla, hay que ponerla. Además, el Sitemap estará ordenado cronológicamente inverso en base a esa fecha de modificación.

Vuelvo a repetir que el Sitemap no está pensado para enviarle todo el sitio al buscador, sino para informar de las URL nuevas… y cuando un fichero no tiene esa frescura o URL nuevas qué indexar, pierde todo el valor y la utilidad para la que se inventó esto…

¿Por qué explico todo esto? Pues porque, como decía al principio, he revisado varios ficheros de varios sitios y lo que tienen en común es que o hay un exceso de URL (no tiene sentido enviar 450.000 URL a Google, porque dudo que se hayan actualizado las 450.000 en los últimos 7 días) o la fecha de última modificación del propio fichero o de la URL más nueva que hay esté dentro de esos, también, 7 días…

No olvidemos una máxima: Si quieres que Google te ayude, ayúdalo. Si haces trabajar y malgastar tiempo y recursos a Google, Google te dará por cul*.

Categorías Javier, SEO

1 comentario en “Los Sitemaps XML ayudan a encontrar novedades”

  1. Muy interesante el articulo, y en general tu blog.

    Soy de los que mandan todas las url en el sitemap, jajaja.

    Saludos

Deja un comentario