SEO negativo

Los que me conocen bien saben que no estoy muy de acuerdo en hacer políticas muy activas de link-building, al menos no hacerlas hasta que no ha pasado una serie de cosas.

Categorías SEO

Google, publicidad y adservers

La situación es la siguiente: te llaman a las 8 de la mañana diciendo que una de las webs, cuando entras, aparece un mensaje en rojo diciendo que la web es peligrosa.

Varnish y página de mantenimiento con Código 503

Cuando se hacen migraciones en un sitio web (por ejemplo, una subida a producción o un cambio de versión) y hay que tener «la web apagada» unos minutos, los buscadores recomiendan que, para que eso no afecte a los resultados de búsqueda, se debe devolver un código 503. Hay veces en los que hay que parar el servidor web, hacer algún cambio más además de cambiar la web… ¿te has preguntado cómo podría gestionar esto Varnish? Es cierto que Varnish es capaz de devolver una página «antigua» cacheada aunque el servidor no funciona (que para eso están los tiempos de gracia) pero en algunos casos en que las páginas son muy dinámicas eso no funciona del todo bien, lo que significa que podríamos hacer que el propio Varnish … Leer más

RFC6596: The Canonical Link Relation

Pues ahora ha aparecido el RFC6596: The Canonical Link Relation en el que se habla sobre el «famoso» rel-canonical propuesto por Google hace ya un tiempo.

Categorías SEO

Velocidad del Sitio en Google Analytics

Lo que al principio había que añadir de forma manual al código de Google Analytics desde hace meses es ya una funcionalidad integrada. Los que revisáis el WPO de vuestro sitio sabéis que en Analytics existe la pestaña de Contenidos -> Velocidad del Sitio pero que estos datos son «poco fiables». Voy a poner un poco más de situación. Hoy en día hay 3 lugares en Google para hacer mediciones de tiempos de carga. El más antiguo es el de Webmaster Tools, dentro de Salud -> Estadísticas de rastreo. Aquí hay 3 gráficos, y el último hace referencia al Tiempo de descarga de una página (en milisegundos). Esta gráfica viene a ser el tiempo que Googlebot tarda en llegar a tu sitio, descargar el contenido e irse. Esta … Leer más

Categorías WPO

WebPerf Barcelona: Magento

Este jueves (pasado mañana) tenemos de nuevo evento de Web Performance, en esta ocasión para Magento. Una vez más contamos con la colaboración de La Salle donde contaremos con dos ponentes que tratarán la optimización de este, muchas veces, problemático (en cuanto a rendimiento) software de comercio electrónico. El evento, como decía, será en La Salle Barcelona, de 19:00 a 21:00 en la sala de actos de la facultad de Arquitectura (Edifici St. Josep – Auditori, Quatre Camins 2). Te puedes apuntar para asistir de forma gratuita. Los ponentes son Manel Doménech (SysAdmin de Onestic – @onestic) y Jordi Rosell (Einnova – @jrosell) que nos explicarán los entresijos de este sistema y cómo optimizarlo. Entre otros temas que se tratarán, tenemos: Rendimiento de Magento Magento y Cloud APC … Leer más

Categorías WPO

SEO y textos alternativos

Decenas de veces te habrán dicho que si quieres posicionar imágenes en Google hay que poner bien los textos alternativos (el famoso «alt») en las imágenes. Pero ¿es esto cierto? ¿Cuándo y cómo hay que usar los textos alternativos? Ahora que llega el HTML5, el W3C, organismo que establece los estándares de los sitios web, han planteando un documento llamado técnicas para ofrecer textos alternativos útiles en el que se explica con bastante detalle el cómo hay que redactar esos textos y en qué casos. Hay que tener presente que los textos alternativos se plantearon inicialmente como una forma textual que representa a las imágenes (pero no al contenido del mismo). Básicamente estos textos aparecen cuando el «lector» no carga la imagen (lo que incluyen navegadores sólo-texto, robots … Leer más

Categorías SEO

Vigencia de Google Page Speed y Yahoo! YSlow

Estos días se están haciendo revisiones en algunos sitios de la validez que tienen los puntos que definió Steve Souders hace ya algunos años (entre dos y tres) para saber si siguen vigentes, teniendo en cuenta que los navegadores han evolucionado exponencialmente estos últimos años. Hay que tener en cuenta que las herramientas de Google Page Speed y de Yahoo! YSlow se basan en estos datos pero… ¿siguen siendo vigentes los resultados de estas herramientas? Creo que la respuesta es que en algunos casos no. Comencemos repasando los de Yahoo! (que al final es la plantilla en la que se basan ambos), que fueron los primeros en aparecer y los que creo que no han evolucionado ni actualizado. Minimize HTTP Requests: Creo que no cabe duda de que … Leer más

Categorías WPO

Ontologías, HTML, Microdatos, Schema.org y RDFa

Allá por el año 2000 comencé a escuchar sobre la Web Semántica. Cuando apareció el término de la Web 2.0 muchos se apresuraros a decir que la Web 3.0 sería esa web semántica que tantos años hemos estado añorando. Y es probable que sea así ya que últimamente los motores de búsqueda se están poniendo la pilas en lo que se refiere a adaptar ontologías, lo que puede dar un empujón a este tema en un corto-medio plazo. Las ontologías, aunque la Wikipedia lo define de una manera, viene a ser el «meterle semántica al HTML». Esta semántica, claro está, ha de ser un estándar, para que todo el mundo que habla de ese tema lo hable de la misma forma, y de la misma forma ha de … Leer más

Fórmula para Domain Sharding

Uno de los problemas habituales en el Domain Sharding es decidir en qué subdominio colocar cada una de las imágenes… esta fórmula tiene que gestionarse de forma que o sea lineal (es decir, primero 3 elementos por subdominio, luego 3 elementos en el subdominio siguiente…) o han de ser aleatorios. Personalmente siempre he planteado que la primera opción es la mejor, pero eso impediría que una misma imagen pueda estar en más de un sitio, a parte de implicar problemas de contenido duplicados. ¿Cuál es la mejor solución entonces? Quizá la segunda, con una fórmula que sea lo más simple pero funcione. Un ejemplo sería este: function getDomainShard($url, $subdominios) { return strlen($url) % $subdominios; } Básicamente lo que hacemos es pasar la dirección URL, la cantidad de subdominios … Leer más

Categorías WPO

Herramientas para Microdatos

Hace ya un tiempo que los Microdatos (en general más conocidos como Microformatos y por el sistema Schema.org) vienen pegando fuerte y los buscadores los están teniendo bastante en cuenta a la hora de dar formato a algunos resultados de búsqueda concretos. La cuestión es que si queremos verificar si estamos haciéndolo bien hay muy pocas formas de hacerlo, pero se puede. Las principales herramientas las ofrecen los propios buscadores aunque podemos encontrar alguna más: Google Rich Snippets Testing Tool En principio es la herramienta más trabajada. Permite introducir una URL que Google descarga y verifica, e incluso si tiene un formato específico para ella lo formatea a modo de ejemplo, además de permitirte subir un código de HTML y analizarlo para ver si es correcto. Aquí un … Leer más

Sitios seguros o inseguros por defecto

En ocasiones queremos que nuestro sitio siempre tenga activado o desactivado que las URL empiecen por http:// o https://, sobre todo porque cuando está un sitio en modo seguro y se cargan cosas no seguras comenzamos a recibir mensajes de error o de inseguridad que no gustan nada a nadie. En el caso de Apache HTTPD hay un sistema muy sencillo que nos permite redirigir cualquier tipo de petición de un lado a otro de una forma rápida y sencilla… En el .htaccess podemos añadir unas líneas tal que así: Código para que siempre tenga http seguro: RewriteEngine On RewriteCond %{HTTPS} off RewriteRule (.*) https://%{HTTP_HOST}%{REQUEST_URI} En el caso contrario, si lo que queremos es que siempre funcione por http inseguro: RewriteEngine On RewriteCond %{HTTPS} on RewriteRule (.*) http://%{HTTP_HOST}%{REQUEST_URI} … Leer más

Categorías SEO

Cómo migrar un dominio a otro

Migrar un sitio web es una tarea que en principio parece sencillo pero puede convertirse en una tarea un poco más compleja. En este caso voy a explicar lo que sería un cambio de «hostname» sencillo, sin cambiar el resto de estructura de URL. En general una migración de un dominio es tan sencillo como migrar simplemente con una redirección 301 (redirección permanente), pero hay que analizar y preparar la redirección con unos meses de antelación. Y es que una redirección habría que plantearla con unos 6 meses de antelación si queremos hacerlo completamente correcto. Lo primero que hemos de hacer es analizar el dominio nuevo al que vamos a redirigir. Esto significa que hay que buscar en la red de redes información sobre si el dominio ha … Leer más

Categorías SEO

Animales en Blanco y Negro: primero el Panda, ahora el Pingüino

Hace un año conocíamos una faceta desconocida de uno de los animales que considerábamos más pacíficos y carismáticos: el Panda. Pero Google le ha dado otro sentido a este entrañable animalito convirtiéndose en uno de los mayores dolores de cabeza para algunos en la red de redes (porque para otros sigue siendo ese animalito cariñoso que nos ha hecho seguir subiendo y subiendo…). Ahora lleva a nuestras vidas otro animal que, al igual que el Panda, vive su vida en colores blanco y negro: el Pingüino. Y es que, como en la informática hay sólo ceros y unos, parece que en Mountain View tampoco hay términos medios: todo es blanco o negro. La semana pasada le mandaba un correo a varios clientes, amigos, proyectos con los que me … Leer más

Categorías SEO

WebPerf Barcelona: WordPress

En unos minutos comenzará el primer #WebPerf en España, organizado desde WebPerf.es por mi mismo y donde yo voy a ser el primer ponente (por las cosas del directo, ya sabéis). Aunque las carreras de última hora son siempre previsibles, tengo un rato para comentar varias cosas sobre el evento que, como bien dice el título habla de WordPress, de cómo conseguir que el WordPress consiga un alto rendimiento. Os dejo con la presentación para descargar y dejo el canal en directo aunque es una prueba piloto, por lo que si hay algún problema, lo siento de ante mano, seguramente poco podré hacer, aunque intentaré que sea posible que se vea (y sobre todo, que se oiga)… Reconozco que estoy un poco nervioso, no tanto por la charla … Leer más

Categorías WPO

Plugin para WordPress y Varnish

Acabo de parir… han sido 9 meses largos (en serio, he estado, ahora que lo pienso, 9 meses desarrollando cosas sobre este tema) pero han valido la pena porque hoy he subido al repositorio oficial mi primer plugin: WordPress Varnish as a Service. Aunque en la página del repositorio no hay mucha información, he preparado una página interna sobre este mismo tema en el que hay algo más de información, como por ejemplo algunas funcionalidades, los idiomas a los que está traducido… Hace unas semanas ya os comenté que estábamos preparando un servicio de Varnish para WordPress como Servicio que básicamente multiplica enormemente la velocidad de carga de las páginas (el WPO y el SEO, vamos). Y como contra prestación ha salido un bonito plugin. Aunque ha habido … Leer más

El PageRank ha muerto

No sé si sabes que desde hace unos años Google ya no ostenta en exclusiva la patente del PageRank; me explico. Cuando Larry Page, por aquellos 1997-1998 patentaba el PageRank, la fórmula que básicamente dice que el peso de los enlaces hace que una página tenga relevancia lo hizo no para él o para Google Inc. sino para la Universidad de Stanford. Hace unos años la patente quedó fuera de los ámbitos de uso exclusivo por parte de Larry y su compañía, lo que supone que, aunque tienen derechos de uso, el objetivo a muy corto plazo es no usar dicha estrategia ya que hoy en día ya no es totalmente suya. Ahora en 2012 todos los buscadores utilizan el concepto de que un sitio con enlaces cobra … Leer más

#WWW2012: CrowdSearch 2012, crowdsourcing for multimedia applications

Último bloque de presentaciones del día, en este caso va a ir relacionado con la inteligencia colectiva en contenidos y temas multimedia. Para comenzar tenemos PodCastle and Songle: Crowdsourcing-Based Web Services for Retrieval and Browsing of Speech and Music Content de Masataka Goto, Jun Ogata, Kazuyoshi Yoshii, Hiromasa Fujihara, Matthias Mauch y Tomoyasu Nakano). Existen los sitios PodCastle (para voz hablada) y Songle (para música) que se usan para el reconocimiento multimedia. El primero, por ejemplo, permite la lectura de un contenido e interpretar sus textos. Los usuarios pueden ayudar y colaborar corrigiendo las palabras que sean erróneas, eligiendo, por ejemplo, entre distintas palabras o simplemente corrigiéndolas. Entre las cosas interesantes son las interfaces que este sistema ofrece con formas alternativas. Además, tras corregir, el sistema aprende por … Leer más

#WWW2012: CrowdSearch 2012, methods and tools for crowdsearching

Seguimos con las charlas de inteligencia colectiva (más concretamente con su uso en temas relacionados con las búsquedas). Retomamos las charlas con Crowd Sourcing Literature Review in SUNFLOWER (de Sihem Amer-Yahia). La idea es generar contenidos de forma automática en base a resumir otros contenidos junto a la inteligencia colectiva. La primera parte lo que intenta es encontrar contenidos y buscar contenidos relacionados, generando distintos grupos y palabras clave. La segunda parte es la de generar un resumen de los contenidos (procesar, clasificar, reescribir…). La última parte es la que afecta a las personas. La idea es que en esta parte los usuarios acaben verificando y reescribiendo la documentación. Para sacar los documentos se buscan contenidos similares y se basa también en los autores. Gracias a distintas herramientas … Leer más

#WWW2012: CrowdSearch 2012, crowdsearching on textual and linked data

Seguimos con las presentaciones… ahora empiezan las charlas más formativas y técnicas. Comienza la charla Social-Textual Search and Ranking (de Ali Khodaei y Cyrus Shahabi). En los últimos años las redes sociales se han disparado, y tenemos una serie de relaciones como los intereses similares que podemos conseguir gracias a nuestros amigos o a grupos. Todo esto básicamente conseguido gracias a la llamada Web 2.0. Una pregunta importante a hacernos es «qué es la relevancia social». Cómo podemos relacionarla con la relevancia textual (la que usan los buscadores). Esto también va unido a la relación entre pares de documentos. Para todo esto debemos presentar el concepto «Social-textual Query», o sea una consulta textual que implícitamente lleve una parte social. Esta lleva una parte de relevancia textual y una … Leer más

#WWW2012: CrowdSearch 2012, bienvenida

Y comienza un nuevo día en Lyon en el evento WWW2012, en este caso con el Workshop CrowdSearch 2012: First International Workshop on Crowdsourcing Web Search . Si ayer los temas iban más enfocados a la calidad de los contenidos, a combatir el web-spam y similares, hoy toca el día a los enlaces, a su calidad y, sobre todo, a su socialización dentro de la red de redes. Para comenzar Loretta Anania, la que era responsable de buscadores de la Unión Europea comienza explicando la importancia sobre los buscadores y sobre la innovación que han llevado a cabo. También presenta un evento llamado Search Computing: The Search Computing Project que se llevará a cabo a finales de septiembre. Es un momento de grandes cambios, venimos aquí a tomar … Leer más

#WWW2012: WebQuality 2012, Abuse Detection and Prevention Session

Y para acabar el día, tras las presentaciones sobre Web Quality, y las de credibilidad y confianza, ahora le llega el turno a la detección y prevención de abusos (y spam). La primera charla es Detecting Collective Attention Spam (de Kyumin Lee, James Caverlee, Krishna Kamath y Zhiyuan Cheng). Aparecer en la página principal de Youtube, eventos como el Año Nuevo generan marketing viral y atención colectiva, consiguiendo ser «trend» (Google Trends o Twitter Trending Topic). En general los spammers van a por momentos de atención que se convierten en fenómenos. Primero se consigue información de los temas con tendencia y se generan contenidos para twitter, afcebook, youtube, foursquare… eso genera atención por parte de los usuarios. En general los spammers en Twitter, a diferencia de lo que … Leer más

#WWW2012: WebQuality 2012, Online Credibility and Trust Session

Y tras las presentaciones sobre Web Quality, ahora tocan las de credibilidad y confianza. La primera charla es Game-theoretic Models of Web Credibility (de Thanasis Papaioannou, Katarzyna Abramczuk, Paulina Adamska, Adam Wierzbicki y Karl Aberer). Uno de los mayores problemas hoy en día es la creciente dificultad de detectar la credibilidad de los contenidos en Internet. Puede haber factores económicos que pueden incluir en la calidad o neutralidad, por ejemplo. Los primeros acercamientos hacen referencia a estudios empíricos, a mecanismos de repitación /pero hay que tener en cuenta la información histórica, que es muy relevante) y, lo que se nos propone, que es un juego entre los contenidos producidos y los consumidos. A la hora de tener elementos en cuenta debemos distinguir entre el contenido producido por los … Leer más

#WWW2012: WebQuality 2012, Web Quality Session

Y como lo prometido es deuda, comienzo con las charlas de hoy, concretamente las del WebQuality 2012. Comenzamos con un cambio en el programa, así que toca A Breakdown of Quality Flaws in Wikipedia (Maik Anderka y Benno Stein). La idea es investigar la calidad de la Wikipedia, ya que es muy grande: tiene cerca de 90 millones de páginas, 22 millones de artículos y es la sexta web más visitada del mundo. Para la calidad hay algunos elementos como que cualquiera puede editarla, los autores son muy distintos y las ediciones nos e revisan antes de la publicación. Esto implica que las mejoras sean de baja calidad y que sea difícil mantener la alta calidad. Sólo un 0,1% de los artículos de la Wikipedia en inglés son … Leer más

II Jornada Internet i Empresa

Hoy estoy en Tortosa (Tarragona) en las charlas que la Cambra de Comerç de Tortosa organiza junto a Empatica en las charlas de Internet i Empresa. Me ha tocado estar en la parte de las charlas de SEO, dando una breve charla de poco menos de una hora en la que he explicado un poco todo a nivel introductorio, Buenas Prácticas y cómo evitar penalizaciones. Tal y como he prometido a los asistentes a la charla, os dejo la presentación que he hecho para descargar. Agradecer a la organización y a los asistentes sus caras de no entender nada (cosas que pasan), las preguntas (muy interesantes), la conversación a la hora de comer y las discusiones tan interesantes que se han generado. Por cierto, brutal la estrategia de … Leer más

Varnish para WordPress como Servicio

¿Tu WordPress va lento? ¿Te gustaría que volase? Pues esta es la idea que he estado planteando desde hace unos días… Hace cosa de un año que comencé a montar blogs con WordPress bajo Varnish. Al principio iba bien pero configurarlo y mantener las máquinas es algo complejo, a parte de que no todo el mundo puede permitirse montar y mantenerlo. Así que, tras muchas vueltas, pruebas, testeo de plugins y demás, he conseguido poder montar un sistema que, de forma sencilla, permita cachear y mantener un WordPress con Varnish. El sistema es sencillo… sólo hay que subir 2 plugins: uno de ellos es para purgar (limpiar) la caché de Varnish cuando alguien publica algo, comenta, edita… así, cuando el blog cambie, se regenera la caché y los … Leer más

Varnish User Group Meeting 5 #VUG5

Varnish Caché es un software muy especial, sobre todo desde que ha conseguido que, como dice su eslogan, las webs «vuelen». Y es que sin duda una capa intermedia de web-caché que prácticamente no influye en nada en la configuración del sitio es mágico. Ayer tuve la oportunidad de estar en el Varnish User Group Meeting 5 y conocer a parte del equipo de Varnish y conocer otros proyectos y empresas que utilizan este software. Voy a intentar hacer un pequeño resumen de algunas de las charlas que me parecieron más interesantes. Para comenzar, Poul-Henning Kamp –@bsdphk– (si no me equivoco es el desarrollador jefe del software) explicó algunas ideas que tienen del roadmap hasta 2020, y lo curioso es que casi no explicó nada del propio sistema, … Leer más

Guía de HTML Data

En los últimos años microformatos, microformatos-2, RDFa o microdatos se han convertido en elementos básicos de la construcción del HTML siempre que hemos querido darle información semántica a las máquinas, a los robots de búsqueda. Pero ¿estás usándolos realmente de forma correcta? La respuesta a esta pregunta siempre la hemos de buscar en la información que el organismo de crear los estándares de desarrollo web nos ofrece, y para esto existe la HTML data Guide donde nos encontramos con un resumen bastante interesante de su funcionamiento. Antes de nada, poner los enlaces a las páginas oficiales de cada uno de estos lenguajes de marcas que os he comentado al inicio: Microformatos y Microformatos 2 RDFa (y sintáxis) microdatos Todos estos elementos tienen una cosa en común, y es … Leer más

Evento Web Performance

Gentes de Barcelona y Madrid, ¡preparaos! porque llegan los eventos WebPerf a España. Los que me conocéis sabéis que llevo trabajando desde hace bastante en este proyecto, en recuperar mi faceta de «montar eventos», aunque esta vez no quiero montar un macro congreso como en otras ocasiones, sino que quiero algo más reducido y sobre todo de profesionales a profesionales del sector. WebPerf está concebido como un evento formativo en el que más o menos en 2 horas podamos tratar algún tema concreto, de bajo o alto nivel, con un ponente que de una charla de 1 hora exponiendo su punto de vista y el resto del tiempo plantear dudas, sugerencias y que cualquiera pueda salir a la palestra a explicar lo que quiera. Esto significa que el … Leer más

Categorías WPO

Search Congress Barcelona 2012

Estos días se está celebrando el Search Congress en Barcelona y una vez más me toca dar una charla. Este año es de Web Performance Optimization, y aunque es de sólo 30 minutos, creo que a los que no hayan escuchando nunca del tema les será mínimamente útil. Hace ya un par años, en el Search Congress de Bilbao presenté algo que aún no llamaba WPO sino «infraestructura SEO» en el que di los primeros pasos a tratar sobre todo este mundillo. Esta vez no he tenido las 3 horas que tuve la otra vez, sólo 30 minutos, así que como dicen por aquí «us faig cinc cèntims». Os dejo la presentación para que la descarguéis si os interesa, muy en la línea de seguir siendo un SEO … Leer más

I Master SEO Profesional (Madrid 2012)

En unas semanas comienza el I Master SEO Profesional que dirige Miguel López (TallerSEO) y que se celebrará en Madrid. A diferencia de otros cursos y formación, este está enfocado al 100% a todo lo que tiene que ver con optimización de sitios, además de todo lo que hay alrededor de ello. No sé si puedo decirlo o no, pero os voy a adelantar algunos de los ponentes y algunos de los temas que se tratarán. Por ejemplo Miguel Pascual explicará las distintas fases de un proyecto, José Moreno hablará, entre otras cosas de reputación digital, Edgar Sánchez nos dará algunas herramientas, Aleyda Solis tratará los entresijos para conseguir enlaces, Fernando Muñoz acabará con auditorías SEO. Por mi parte trataré temas más técnicos y hablaré un poco de … Leer más

CSS 3 object-fit: cover y contain

Sin duda CSS3 nos va a permitir hacer cosas que hasta ahora eran bastante complejas de hacer, al menos si se querían hacer bien. Aunque todavía casi ningún navegador le da soporte (yo lo he probado con Opera 12a), me gusta mucho las funciones de object-fit que permiten, de forma sencilla, integrar imágenes o incluso vídeos dentro de un espacio determinado, o adaptarlo a unos tamaños a los que hasta ahora estábamos forzados. He hecho la prueba en Internet Explorer 9.0, Google Chrome 16.0, Mozilla Firefox 9.0 y Opera 12a y sólo en este último he conseguido que esto funcione… El objetivo es hacer lo siguiente (imagen basada en Opera 12a): Object Fit: Contain Básicamente es meter la imagen dentro de un espacio definido. En mi caso era … Leer más

Categorías CSS

deSEO para 2012

Puede que sea cosa mía, pero haciendo una revisión de los cambios de 2010 y 2011 me doy cuenta de que el SEO se ha estancado… estancado en cuanto a que los buscadores van metiendo cosas pero no van muy relacionadas tanto con la evolución del SEO como lo ha estado haciendo entre 2005 y 2010. Sí, ya sé que el año pasado entró en nuestra vidas un animal muy entrañable como es el Panda, un algoritmo que ha hecho mucho daño a un determinado tipo de sitios, sitios que básicamente «no hacían las cosas bien» (y entiéndase bien por lo que a Google se le pasa por el forro). Eso sí, cada vez más vemos unos resultados más personalizados para cada usuario o para cada territorio (ciudad … Leer más

Categorías SEO

Ancho de banda, latencia y tenerla grande (la conectividad)

El tamaño importa, ¿pero cuánto? Pues las pruebas que se han hecho dicen que tener una conexión a 5 Mbps es suficiente para que un sitio web funcione de forma bastante razonable siempre desde el punto de vista del cliente, claro. Y es que Internet, como en muchas ocasiones dice Jaime Ferré es como un milagro que funcione, pero tiene limitaciones físicas, porque la velocidad de la luz es la que es. En muchas ocasiones hablamos que una web ha de cargar rápido y que cargue rápido significa que ha de tardar entre 1,5 y 2,5 segundos. En este tiempo hemos de incluir el tiempo desde que el usuario pulsa «Intro» en su navegador hasta que la página se muestra por pantalla. Y en la mayor parte de … Leer más

Categorías WPO

Navigation Time API en Google Analytics

Una de las API más interesantes que nos trae el W3C en los últimos tiempos y que han implementado algunos navegadores es la Navigation Time API. Si queréis ver una prueba de datos, podéis probar la página de Navigaton Timing de la Guía de WPO. Pero claro, estos datos dependen de los usuarios y en la mayoría de ocasiones no los tenemos disponibles… así que, ¿por qué no añadirlos a Google Analytics? Sí, como he dicho no estarán en todas las páginas y tendremos información parcial ya que sólo está disponible en algunos navegadores, pero al menos tendremos cierta información. La información que propongo guardar es la siguiente: DNS: es el tiempo que se dedica a hacer peticiones DNS. Connect: es el tiempo que se dedica a procesos … Leer más

Categorías WPO

SEO básico a tener siempre controlado

El SEO puede evolucionar, puede cambiar para bien o para mal, pero hay algunos elementos que nunca podemos despreocupar y sobre los que tenemos que tener siempre un control absoluto. robots.txt Es básico tener el fichero de robots.txt bien controlado. Primero, ha de existir. Segundo, debe tener como mínimo la línea User-Agent: *. Tercero, debería tener siempre, al principio de todo, la línea indicando el Sitemap. Código 404 Todo dominio tiene que tener su propia página de error. Si entras en example.com/0123456789 debe devolver una página (sin hacer redirecciones o cosas intermedias) un código 404. La página resultante es recomendable que tenga el diseño del resto del dominio. rel-canonical Hoy en día es casi obligatorio que todos los sitios usen el rel-canonical. Y también es importante que este … Leer más

Categorías SEO

Pirámide de Maslow del internauta

El ser humano tiene unas necesidades, y eso es lo que el Señor Maslow puso en formato gráfico en una pirámide… pero Internet también tiene su público y esas necesidades no son tan personales sino que te las da el sitio web que estás visitando. Y es que la pirámide del internauta es muy sencilla. En la parte más baja de la pirámide, en la base encontramos algo muy simple: el sitio web ha de funcionar. Y es que si un sitio web no funciona, apaga y vámonos. Ya digo que puede parecer una tontería, pero que un sitio web esté caído creo que es de las cosas más duras que te puede pasar. De ahí todo el tema del «cloud» y la virtualización, distribución de cargas, etc… … Leer más

Categorías WPO

smushit.net, una API simple de smushit

Si te dedicas al mundo de Internet es muy probable que entre las aplicaciones que utilices se encuentre la de comprimir imágenes… pero el uso de algunas herramientas a veces se hace muy complejo o necesita de servidores con algunas configuraciones extrañas. Es por eso que, como yo mismo me he encontrado en esa situación y soy bastante asiduo a la herramienta de Smush.it de Yahoo! he querido simplificarme la vida y, de paso, os hago partícipes de ello a vosotros. Que conste que es una simple prueba y que puede fallar (como todo en la vida). El servicio es smushit.net y lo que hace es simplificar la API existente eliminando los datos poco útiles. El objetivo es que introduzcas por parámetro la URL de la imagen que … Leer más

Arreglando una penalización

Con mucha frecuencia me llegan correos de personas que tienen un sitio web pequeño y que han sido penalizados (o degradados) por Google de alguna manera. Hoy, tomando como ejemplo uno de estos correos, voy a explicaros cómo se puede arreglar una penalización (de las más sencillas) con tan sólo utilizar Google como herramienta (sin Webmaster Tools o Analytics). Esto significa que lo único que necesitamos es un navegador y un poco de imaginación. El sitio en cuestión es juegostt.com y su problema es que ha caído el tráfico mucho. Lo primero que he hecho es darle una ojeada al sitio para ver si había algún error garrafal o simplemente es un sitio spam, pero básicamente tiene casual games. Hasta aquí todo bastante correcto, sin entrar muy en … Leer más

Categorías SEO

Cómo Bing mejora el PageRank contra el WebSpam

Hablar de sistemas antispam en los resultados de búsqueda es algo de lo que he hablado muchas muchas veces en los últimos meses. Cada buscador busca sus propios sistemas para mejorar el análisis de los sitios web, ya sea mediante factores humanos, analizando las propias páginas y con decenas de métodos para aumentar la calidad del índice. Pero sin duda este sistema de Microsoft me ha sorprendido ya que se basa en el propio PageRank de Google. La patente Locally computable spam detection features and robust pagerank de Microsoft deja bien claro que hoy en día tanto el PageRank como HITS son fácilmente manipulables, ya que se basan principalmente en los enlaces que envía y recibe un sitio y que esto ya no sirve de cara a que … Leer más

Categorías SEO

Google Quality Rater: WebSpam

Hace unos días comencé a explicar sobre cómo los Google Quality Rater validan la utilidad de los documentos. Ahora que ya sabemos cómo se valida un documento, queda que veamos los «flags» que pueden recibir; esto significa que independientemente de la utilidad del documento podemos marcar determinados elementos (como spam, malware, …) para que se investigue más sobre él. Spam Aunque luego entraré en más detalle en este punto, el webspam se puede marcar con 3 niveles distintos: not-spam, mayby-spam y spam. Una página correcta, en la que no hay ningún intento de engañar al buscador ni al usuario se marca como no spam, es decir, se marca como correcta. En el caso en el que haya ciertas sospechas de que puede incluir alguna técnica extraña, pero no … Leer más

Categorías SEO

Percona Live 2011 en Londres

Hace una semana que tuve la oportunidad de visitar por primera vez Londres para ir al evento Percona Live London 2011. Este evento organizado por Percona (una de las mayores distribuciones de MySQL) tenía buena pinta, así que arrastré conmigo a Rubén Ortiz (uno de los mejores administradores de sistemas que conozco y además buen amigo). El evento se dividió en un par de días. El primero de ellos iba enfocado más a cosas prácticas, ya que eran talleres. Yo me fui a uno que duró todo el día (mañana y tarde) y que hablaba de cómo escalar LAMP (Linux + Apache + MySQL + PHP) aunque en este caso la A era N, de nginx. El profe del taller era Alexey Rybak, que trabaja en Badoo, y … Leer más

Versiones de webs móviles inteligentes

Según voy leyendo y probando en algunos sitios, me doy cuenta de que a los buscadores no les gustan tanto las versiones móviles de los sitios como podría parecer. Esto no significa que no haya que hacer versiones para dispositivos móviles, pero deberían ser la misma web que la original, tratada con CSS y en una versión especial en otro dominio o subdominio. Al menos estas últimas versiones siempre quedarán degradadas a un último plano a la hora de hacer SEO. Y teniendo en cuenta esto Google tiene un sistema para que no sea necesario crear ediciones especiales en dispositivos móviles muy antiguos, Identifying relevant portions of a document, un sistema por el cuál cuando un usuario introduce una búsqueda desde un dispositivo de este tipo, la consulta … Leer más

Categorías SEO

Google Quality Rater: utilidad del documento

Para los que no lo sepan, Google desde hace muchos años contrata a gente que suele trabajar desde casa en la revisión de calidad de los resultados de búsqueda. Incluso, muchos de los que hace unos años eran «los mejores SEO» tenían a algún familiar muy directo metido a trabajar en este tema (de ahí ser tan buen SEO y ahora ya no serlo tanto). A cada Quality Rater de Google se le en entregan las General Guidelines (PDF) en la que se explica el funcionamiento de la plataforma de calificación además de los diferentes puntos donde se detalla qué es y no es calidad, además de qué es y no spam. Aunque esta última versión (la 3.18 de marzo de 2011) tampoco lleva muchos cambios con respecto … Leer más

Categorías SEO

Historial de contenidos duplicados

En la red existen multitud de documentos a rastrear; los buscadores van reindexándolos y descubriendo los nuevos según van revisitándolos. Pero existe el problema de encontrar documentos duplicados ya sea completa o pacialmente. Además, hay documentos que cambian con mucha frecuencia. Incluso, puede ser que simplemente el documento vaya cambiando una parte del mismo (la publicidad, los enlaces recomendados o algún bloque aleatorio…), lo que podría implicar tener dicho documentos con sólo la variable parcial del mismo. Otro problema que nos podemos encontrar es el de el rastreo sesgado. Esto suele pasar en los blogs, donde un mismo documento se encuentra en varios sitios pero en una de las páginas encontramos una versión del mismo y en otra parte encontramos una versión actualizada, lo que significa que el … Leer más

Categorías SEO

Formas de propagar la relevancia entre documentos

Es de muchos conocido el algoritmo del PageRank (Google), que básicamente lo que calcula es la relación entre documentos en base a la cantidad de enlaces que tienen entre ellos y, en base a esto, calcular el peso de la información a la hora de ofrecer resultados de búsqueda. Con esto se puede llegar a realizar una clasificación de todos los datos de la red de redes aún teniendo en cuenta que hay páginas sin enlaces, generando una imagen instantánea de la red. Pero aunque este es el algoritmo más conocido, existen otros dos algoritmos igual de interesantes. Uno de ellos es HITS (Ask), que se basa en el principio de que si un documento enlaza a otros documentos importantes, ese documento es importante por sí mismo. Con … Leer más

Categorías SEO

¿Afecta Google Analytics al SEO?

Seguro que alguna vez te has preguntado ¿afectará poner Google Analytics al SEO de mi sitio? Pues ahora tenemos la respuesta oficial, y es que Google ha conseguido una patente que permite reorganizar los resultados de búsqueda parcialmente dependiendo de las estadísticas… es decir, que si Google quiere, puede. Y es que ha conseguido la Methods and apparatus for employing usage statistics in document retrieval en la que se mejoran los resultados de búsqueda dependiendo, total o parcialmente, de las estadísticas de uso. Systems and methods consistent with the present invention address this and other needs by identifying compounds based on the overall context of a user query. One aspect of the present invention is directed to a method of organizing a set of documents by receiving a … Leer más

Categorías SEO

Respuestas a consultas de búsqueda

Hace ya muchos años que los buscadores son capaces de responder a preguntas, normalmente elementos sencillos que facilitan lo que el usuario está buscando. Y es por eso que Microsoft se ha hecho con Presenting instant answers to internet queries que básicamente, como su nombre indica, se queda con los llamados «onebox» de respuesta directa. El sistema es sencillo… el usuario realiza una consulta de búsqueda y, dependiendo de lo que se esté buscando (mediante palabras clave o combinaciones) se devuelve el resultado directamente. One or more computer-storage media having computer-executable instructions embodied thereon for performing a method of providing a response to a query request, the method comprising: receiving the query request that includes query terms from a requester, wherein the requester is not registered to receive … Leer más

Categorías SEO

Herramienta que decide el mejor sitio de los contenidos

Por norma general nos toca a los creadores de sitios web decidir dónde va la publicidad o los bloques de contenidos… esto, junto al departamento de marketing acaba constituyendo la creación de un sitio web. Pero, en muchas ocasiones tener la publicidad o determinados bloques de contenido «que generan beneficios» no es siempre el adecuado… ¿qué tal si dejamos a Yahoo! decidir cuál es el sitio óptimo para colocar un bloque de contenido relacionado (tal y como explica en System and method using sampling for allocating web page placements in online publishing of content? Los medios de comunicación offline, principalmente los periódicos, tienen una estructura de contenidos que poco puede variar, ya que el espacio es limitado en espacio… pero en Internet el espacio no lo es tanto, … Leer más

Categorías WPO

Detección y clasificación de contenidos para adultos

Desde que se lanzaron los primeros motores de búsqueda uno de los primeros filtros que se incorporaron fue el de contenidos para adultos, normalmente con 3 límites: nulo, moderado y estricto. Cada cierto tiempo, y debido a que el sector de adultos evoluciona mucho más rápido que el resto de la web, los motores han de buscar nuevas formas de organizar y clasificar esa información, y de ahí que Microsoft haya preparado el Multimodal classification of adult content donde se detallan algunas metodologías. El objetivo es encontrar en textos, imágenes y vídeos si hay contenidos para adultos, y para ello se utilizan ciertas metodologías de detección, que se suman a las ya utilizadas hasta ahora. Y por eso el primer paso que se realiza es el de detectar … Leer más

Categorías SEO

¿Sabes buscar? Bing será para ti

Personalmente en muchas ocasiones echo en falta que Google, Bing o cualquier otro me muestre determinadas cosas en la interfaz de resultados cuando estoy trabajando. Y es que hay determinados momentos en que comienzo a hacer algunas consultas de búsqueda complejas, principalmente cuando rastreo información de un sitio concreto. Pues bien, eso podría acabarse. Y es que Microsoft se ha planteado encontrar a los expertos buscadores, tal y como explica en Identification and use of web searcher expertise, donde explica claramente que algunos usuarios son mejores buscando cosas que otros, ya sea por las búsquedas complejas (usando paréntesis, OR y similares) o porque saben encontrar las palabras adecuadas para esa consulta. ¿Por qué a ellos no darles una interfaz de búsqueda distinta? ¿Algo más compleja para poder sacarle … Leer más

Categorías SEO

Detección de granjas de enlaces

Sin duda en SEO uno de los grandes problemas que tienen los buscadores es lidiar con aquellos que quieren hacer trampa y jugar con el PageRank. Pero el PageRank de Google (que al final es un estándar de facto en el resto de motores) se puede usar ligeramente como sistema antispam y sobre todo puede ayudar a detectar incoherencias en cuanto a grafos. En el caso de los buscadores existe el llamado web-graph, que es «el momento» en el que todas las webs y enlaces se pueden tomar en un momento determinado, como si hiciéramos una foto de Internet. Pues Yahoo! (una vez más) ha creado un sistema llamado Methods and apparatus for computing graph similarity via sequence similarity con el que pretende encontrar incongruencias, ramas duplicadas del … Leer más

Categorías SEO

Sistema para detectar una plantilla web

Una forma de saber qué parte de un sitio web es importante y qué parte es común al resto de páginas del sitio es saber qué plantilla se está utilizando. Y eso es lo que Yahoo! ha patentado en System and method for detecting a web page template. El objetivo es conseguir que un sistema de forma automática detecte qué parte de la página es una plantilla, extraer los distintos bloques de contenido y asignarle, a cada uno de los bloques un determinado peso. Los motores de búsqueda en muchas ocasiones necesitan eliminar de la ecuación la parte común de todas las páginas de un sitio para conseguir lo importante de las páginas: sus contenidos. Para ello es necesaria la extracción de aquellas partes que generan ruido, lo … Leer más

Categorías SEO

Yahoo!: navega y mejoraremos las búsquedas

Interesante propuesta la que hace Yahoo! para mejorar los resultados de búsqueda y no depender tanto de conceptos como el PageRank o de la navegación que hacen los usuarios a través de las propias páginas de resultados, y es la de usar los logs de navegación de los ISP. Antes de seguir pongámonos en antecedentes para aquellos que no tengan muy claro cómo funciona la navegación del usuario. Un usuario está en su casa delante de su navegador de Internet y con su proveedor de Internet (cable, ADSL, etc…). El proveedor lo que hace es de intermediario entre tu casa y los servidores donde se encuentran las páginas web que visitas. Por ejemplo, ahora que estás visitando javiercasares.com has de conectarte con (por ejemplo) Telefónica, que va a … Leer más

Categorías SEO

Google y el SEO de tus sitios favoritos

Cuando en SEO se habla de enlaces nos olvidamos de un tipo de enlaces muy importantes pero a la vez muy complejos de que Google o Bing los acaben encontrado: los que tenemos en nuestra lista de marcadores favoritos del navegador. Pues ahora Google se ha hecho con una patente que permite indexar este tipo de información y usarla. La situación es que normalmente nos guardamos en nuestra lista de «favoritos» aquellas páginas que visitamos mucho o que nos son complejas de encontrar y por tanto nos las guardamos. Sin duda estas direcciones URL son de un valor, ya que sin duda son las más importantes para cada uno de nosotros. Y ahí es donde Google quiere llegar. Hasta hace un tiempo si querías tener tus marcadores en … Leer más

Categorías SEO

Yahoo!, singular y plural

Si ayer comentaba que hay patentes que te llegan a sobre coger por lo amplias que pueden ser, a veces otras te sorprenden por lo sencillas y efectivas que son. Y este es el caso que ha patentado Yahoo!, un sistema que busca palabras en singular y/o plural y reconstruye la consulta de búsqueda para tener mejores resultados. La patente llamada Word pluralization handling in query for web search básicamente lo que hace es analizar la consulta de búsqueda, buscar aquellos conceptos que tengan un equivalente en singular o plural (dependiendo del caso) y reconstruye la consulta y es la que se ejecuta, de forma transparente para el usuario. Para esto se usaría un diccionario de palabras relacionadas basadas en las consultas anteriores de muchos usuarios. Como curiosidad, … Leer más

Categorías SEO

Google patenta la interfaz de resultados para productos

Sin duda las cosas que se pueden patentar son bastante impresionantes, y la que ha patentado Google me parece sorprendente ya que es algo bastante estándar en muchos motores de búsqueda y esto puede llevar consecuencias en cuanto a cambios de interfaz en algunos de estos sitios con tal de no tener que pagar al buscador de Mountain View. En esta ocasión, y basándose en Froogle (lo que actualmente conocemos como Google Product Search), Google ha conseguido la patente llamada Method and apparatus for output of search results en la que se explica cómo se muestran los resultados (en modo lista y modo parrilla) de un buscador que devuelve resultados de tipo «producto». In another embodiment, the user may even be able to customize an output format. For … Leer más

Categorías SEO

Tiempo de carga de una web

En SEO y WPO hay muchas cifras a tratar. Como expliqué en el artículo que comparaba el WPO con la Fórmula 1 la cosa va de décimas, pero… ¿cuáles son las décimas que importan? En los paneles de Google Webmaster Tools tenemos muchas cifras relacionados con tiempos, y estas cifras significan muchas cosas distintas. Voy a ver si soy capaz de explicar cada una de ellas. Una de las primeras gráficas que tenemos es la de «Rendimiento del Sitio»: Esta gráfica lo que muestra es el tiempo de carga de la página, desde que se descarga el primer byte hasta que se descarga el último, incluyendo la descarga del HTML y de todos los ficheros relacionados (CSS, JavaScript, imágenes, publicidad, etc…). Como digo es el tiempo desde que … Leer más

Categorías WPO

Dónde conseguir visitas

Seguramente en esta entrada encontraréis cosas obvias, pero a muchos les servirá para darse cuenta de que la realidad de Internet cambia a lo largo del tiempo y nunca está de más darle una ojeada a los sitios que más visitas pueden aportar a nuestros sitios web. Para empezar podemos hablar de los clásicos, los buscadores, que hoy en día se resumen en 2 grandes motores aunque varios sitios de origen de tráfico. El principal de ellos es Google junto a Bing, aunque sin descartar otros sitios como Yahoo!, Yandex, Baidu, Naver e incluso Ask o AOL. Todo depende del país en el que se encuentre el proyecto y su idioma. Aunque desde España nos centramos en Google casi al 100% no hemos de olvidar que hay usuarios … Leer más

Categorías SEO

Facebook, resultados de búsqueda y Me Gusta

Facebook parece no preocuparse mucho por las búsquedas, al menos no por montar un buscador de la forma en la que lo harían Bing o Google, sino que estaría más preocupada por ofrecer unos buenos resultados a la hora de encontrar información en su propia red, pero para conseguir eso sí que necesita cierta forma de ordenar los resultados… y ¿cómo lo hace? Pues un par de patentes en las que, en principio, se patenta lo mismo, tendrían la respuesta. La primera de ellas se llama Ranking search results based on the frequency of clicks on the search results by members of a social network who are within a predetermined degree of separation y la segunda Visual tags for search results generated from social network information, ambas con … Leer más

Categorías SEO

Google patenta el «Quiso decir…»

Desde prácticamente el inicio de Google hemos visto en los resultados de búsqueda un sistema que, al escribir de forma incorrecta una consulta se nos sugería otra escrita correctamente. Tiempo después hemos visto evoluciones de este servicio incluso dando directamente los resultados de búsqueda intercalando los correctos e incorrectos o incluso dando directamente los resultados corregidos completamente. Han tenido que pasar 7 años para que Google ahora consiga la patente que permite corregir y sugerir automáticamente una consulta de búsqueda por otra. Cuando el sistema recibe una consulta de búsqueda que incluye una entidad, se determina la posibilidad de ofrecer una consulta reescrita basada en la información recibida por consultas anteriores relacionadas con la entidad y reescribe la consulta de búsqueda cuando se determina que la consulta de … Leer más

Categorías SEO

Google patenta los Sitelinks

A mediados de 2005 Google solicitaba la patente Systems and methods for providing search results en la que básicamente se quería patentar lo que hoy en día conocemos como los «sitelinks», aquellos resultados de búsqueda relacionados con el mismo sitio al que corresponde el resultado previo. Estos días atrás Google ha comenzado a hacer muchos más experimentos sobre este tipo de formato, justo después de recibir la aprobación de la patente que le permite este uso. ¿Qué hará ahora el resto de buscadores con respecto a este sistema? La definición exacta en la patente de un sitelink vendría a ser la siguiente: Una consulta de búsqueda genera resultados de búsqueda donde, al menos uno de los resultados, incluye un grupo de enlaces. El grupo de enlaces es representativo … Leer más

Categorías SEO

WPO, SEO y Fórmula 1

Llevo viendo Fórmula 1 desde hace muchos años, antes de que Alonso estuviera en Minardi, y desde hace un tiempo que me doy cuenta de que la Fórmula 1 cada día se parece más al SEO y al WPO. La cosa va de milésimas de segundo, de fiabilidad y de copiar lo bueno de los demás coches (o webs). Lo entretenido de la Fórmula 1 en muchos casos es, para los que no entiendan mucho, que existen una serie de equipos con distintos presupuestos, que cada equipo suele tener 3 pilotos (2 que corren y 1 que prueba), una serie de fabricantes de motores, en esta temporada un único fabricante de ruedas, distintos fabricantes de combustibles y, principalmente, cada equipo juega con la aerodinámica. Podríamos decir que lo … Leer más

El plugin SEO perfecto para WordPress

Hace un tiempo que comenté que algún día publicaría cómo debería ser el plugin perfecto de SEO para WordPress. Que conste que esto es una carta a los Reyes Magos, y que personalmente limitaría al máximo las opciones que puedan configurar los usuarios, dando una serie de opciones predeterminadas para que realmente la aplicación sea óptima. Comencemos. El primer punto vamos a enfocarlo a los títulos. Por norma general los títulos de un sitio se pueden configurar de forma bastante automática siguiendo las bases de cómo busca la gente. Aunque hay 2 opciones: un sitio organizado principalmente por páginas o por entradas. Si el sitio está organizado por entradas (en modo blog, vaya) la estructura de URL debería ser: Página Principal: Nombre del blog (sin palabras clave ni … Leer más

Qué es una penalización, según Google

Sin duda de tanto en tanto cae alguna perla en la red de redes que vale la pena leer en profundidad e interpretar correctamente (que, como en GH, todo se magnifica por lo que dice una persona, y tampoco es plan). Tiffany Oberoi es una de las personas implicadas en el equipo de calidad de los resultados de búsqueda de Google y ha ofrecido una entrevista de la que se pueden sacar algunas conclusiones y confirmaciones de algunos asuntos que siempre están en el aire. Personalmente lo que más me interesa es la clasificación de las penalizaciones y para qué sirve la petición de reinclusión de Google Webmaster Tools. No voy a traducir la entrevista pero sí que voy a ir comentando las respuestas en el mismo orden … Leer más

Categorías SEO

Google +1, ¿más rápido?

Hace unos días que Google ha anunciado una mejora de velocidad en el botón de Google Plus One. ¿Pero realmente estos códigos aumentan la velocidad? Cuando hice el plugin para WordPress del Social Share Button hice algunos cambios en el código que te daban anteriormente por defecto. Y es que con la llegada de HTML5 se ha introducido un elemento en los scripts, el async que funciona en todos los navegadores desde hace algunas versiones. Es curioso que Google esté apostando por dejar de dar soporte a varios navegadores (principalmente Explorer 7 para abajo, de Firefox 3.5 para abajo y versiones ya algo antiguas de Chrome y Opera). Sin duda Opera es el mejor navegador en cuanto a soporte de HTML5, por detrás pondría Chrome y Firefox y … Leer más

Categorías WPO

SEO paso a paso

Hay dos cosas que suelen preguntarme bastante en cuanto a SEO se refiere: metodología y precios. Hoy voy a comentar sobre el primero de los puntos, el de la metodología. Y es que SEO hay de muchos tipos o, mejor dicho, muchas ramas, y hay que tenerlas todas en cuenta a la hora de preparar un proyecto SEO. Por cierto, hablo de SEO por llamarlo de alguna forma, porque hoy en día el SEO por sí mismo no sirve de mucho. El primer paso de un proyecto web es saber cuáles son los objetivos. Muchos de los proyectos pueden ser simples páginas personales sin ánimo de lucro (como podría ser este blog en este momento, en el que escribo porque me apetece), otros proyectos pueden ir enfocados a … Leer más

Categorías SEO

Google Plus y Google +1 en SEO

Como ya comenté en su día, Google Plus no es una red social al uso, sino un «plus» al propio Google. Y esto ya está comenzando a ver sus efectos en la propia red, sobre todo cuando uno ha accedido a su cuenta. Ahora que tengo una localización con IP estática y muchos ordenadores disponibles hago algunas pruebas con compañeros (principalmente con Màrius Duch) y hemos encontrado que cuando uno está con su cuenta de Google los resultados de Google +1 influyen en el cambio de los listados, ya que en varios ordenadores, con cuentas que han votado, con amigos de algunos, con otros que no son amigos y sin estar, aparecen los resultados de formas distintas. Esto me ha estado haciendo pensar en la entrada que publiqué … Leer más

Categorías SEO

NewSQL

Bases de datos hay muchas, y formas de almacenar datos hay ilimitadas. Pero sistemas de bases de datos que cumplan el estándar SQL99 no hay tantas, y menos si hablamos de las versiones posteriores. Pero últimamente se está hablando mucho de qué sistemas de bases de datos usan servicios como Google, Facebook, twitter… se habla de las bases de datos NoSQL (que personalmente, al no ser relacionales, para mi no son bases de datos completas) y de una nueva era de bases de datos llamadas NewSQL, muchas de ellas compatibles con MySQL. Sin duda un primer tema al que hay que darle una ojeada a el al de la integridad relacional. Formatos como MyISAM no son precisamente los mejores para almacenar datos, ya que si algo falla, ahí … Leer más

Categorías SQL

Cómo detecta Bing el spam

Ayer os contaba sobre el Search Ranger de Bing, el sistema que tiene Microsoft para detectar y contrarrestar el webspam. Pero aunque ya el documento era bastante denso, la información que ofrecía era aún mayor… ¿Y cómo funciona ese sistema antiwebspam? Un sistema revisa las búsquedas habituales de spam en los resultados de búsqueda. Se extrae una serie de URL con posibilidad de ser spam, que usan actividades habituales de spammers. Un sistema recibe las URL de spam confirmadas y se aprende de ellas nuevas combinaciones de palabras spam, sistemas, relación con otras páginas, el dominio… Se hacen pruebas de búsqueda con el comando LINK: y SITE: de esa página y dominio con las palabras relacionadas. La mayoría de los spammers buscan ganar dinero (más que el posicionamiento), … Leer más

Categorías SEO

Search Ranger AntiSpam de Bing

Los sistemas para detectar el web-spam es lo que estos últimos años más de cabeza trae a todos los motores de búsqueda, principalmente Bing y Google que se enfrentan a grandes cantidades de basura que rastrean por la red de redes. Y sin duda Microsoft nos da ciertas pistas de algo que solicitó hace menos de un lustro en lo que a sistemas antispam se refiere, y lo hace a través de una patente con un título un poco complejo: Search ranger system and double-funnel model for search spam analyses and browser protection. El sistema básicamente describe un proceso de ingeniería inversa relacionado con el abuso sobre los enlaces, de forma que todos aquellos enlaces que se han creado artificialmente sean descubiertos de una forma relativamente sencilla, según … Leer más

Categorías SEO

Google y tu reputación digital

Aunque he hablado varias veces sobre reputación digital en vistas a que ahora parece que con lo del Google Me on the Web a todos les ha dado por revisar sus cosas, me gustaría explicar de una forma más sencilla qué herramientas existen para eliminar información privada que podemos encontrar por la red y que no hayamos ofrecido directamente. Esta lista de herramientas son algunas páginas de ayuda que he ido recopilando en alguna ocasión por alguna razón y que me gustaría compartir con vosotros por si os fuera de utilidad. Para empezar Google tiene una página en la que se explica bastante claro cómo evitar que aparezca información personal en Google. Esta página sin duda es el inicio y la referencia, y recomiendo 8aunque es algo extensa, … Leer más

Categorías SEO

Estáticos para WordPress

La verdad es que WordPress es un gran CMS y, sobre todo, muy extensible y configurable. En esta ocasión me gustaría enlazar una entrada que publiqué hace ya un tiempo en el que hablaba de los dominios sin cookies con la posibilidad de configurar WordPress para tener las imágenes separadas del dominio principal. El objetivo de este sistema básicamente es separar lo que es la propia web de los contenidos estáticos que se pueden separar. En principio se podrían separar hasta los diseños (JS, CSS…) pero suele ser algo más complejo. Para empezar la idea es separar los contenidos que subimos a través del panel y que suelen estar en la carpeta /wp-content/uploads/. Para comenzar lo que debemos tener es un dominio configurado para estáticos. En mi caso … Leer más

Yahoo! se queda con el «buscador social»

¿Quién es el dueño de las búsquedas sociales? Pues Yahoo! o al menos eso parece tras la concesión de la patente System and method for ranking search results using social information en la que básicamente se detalla lo que serían los factores que se pueden tener en cuenta de sitios sociales para generar o mejorar los resultados de búsqueda de un buscador. An improved system and method for ranking search results using social information is provided. A social information ranking engine may be provided to rerank a list of URLs of web pages in search results from a search engine using social information. To do so, the search query may be applied to a social information domain and a second list of references to web pages may be … Leer más

Categorías SEO

SEO, de la Prehistoria a la Revolución Tecnológica

Estamos en el año 2011, a mediados, más o menos… si hiciéramos una línea del tiempo tendríamos que el año 1995 podría ser el inicio de la era de los buscadores, la prehistoria, donde había que ir a los buscadores y añadirles todas las URL desde un formulario, indicándole muchos datos. Luego comenzaron a tener la lectura de los metas. Hasta aquí estaríamos hablando de la Edad de Piedra. Más tarde llegó Altavista, el que podríamos considerar el primer buscadores decente ya que empezó a buscar dentro de los contenidos de las páginas. Es la Edad de Bronce. El siguiente gordo en llegar fue Google, que potenciado con Yahoo! convirtió Internet en la Edad de Hierro. Esto podría ser aproximadamente el año 1999, cuando Google y Yahoo! ya … Leer más

Categorías SEO

Cómo detecta Google los contenidos duplicados

De nuevo otra patente concedida a Google ayer mismo vuela sobre nuestras cabezas… se llama Document near-duplicate detection y se solicitó en 2009, hace tan sólo año y medio. Aún así hay que tener en cuenta que existe ya una patente previa llamada de la misma forma, ororgada a mediados del año pasado pero «creada» en 2004, lo que significaría que desde 2004 Google está detectando los duplicados, aunque hace menos de 2 años que solicitó una actualización del algoritmo. ¿Qué es lo que la patente reclama? Pues algo tal que así: A near-duplicate component includes a fingerprint creation component and a similarity detection component. The fingerprint creation component receives a document of arbitrary size and generates a compact «fingerprint» that describes the contents of the document. The … Leer más

Categorías SEO

Google Panda ¿ideado en 2005?

Aquellos que todavía sigan creyendo que Google se inventa las cosas y que se las saca de la manga es que no sabe que en Estados Unidos hay que patentarlo todo. Y en previsión de que la patente estaba a punto de concederse (concretamente fue concedida ayer día 14) se ha lanzado hace poco… Como esta hay otras tantas, pero quizá cabe destacar algunos elementos que la convierten en la semilla del Panda. La patente se llama Deriving and using document and site quality signals from search query streams y tiene como resumen lo siguiente: A system analyzes one or more search streams to detect one or more associations between a document and one or more queries in the one or more search streams. The system further derives … Leer más

Categorías SEO

Cursos de Verano: SEO para diseño y maquetación

Comienza la semana y una nueva charla más, en esta ocasión enfocado a SEO para diseñadores y maquetadores de páginas web. La idea básica es la de concienciar a la gente que diseña de la importancia de su trabajo, pero a la vez de la necesidad de que sea óptima a la hora de ponerlo en producción. Se comentan muchas cosas… un poco de HTML5, el nuevo estándar de Web Timing para calcular la carga de las páginas, un poco de Web Performance en imágenes, CSS y JavaScript… además de algunas herramientas para la optimización de imágenes y Flash. Así que, quien quiera darle una ojeada, ya está disponible para descargar.

Categorías SEO

Qué es el Google Panda (y cómo no ser penalizado)

Todos hablan del Google Panda pero muy poca gente fuera de Estados Unidos y los países angloparlantes realmente lo ha sufrido. Además, los sitios que lo han sufrido, un 85% no se han recuperado (porque no han sabido o no lo han cogido a tiempo). Y es que Google nos tiene acostumbrados a una gran actualización cada cierta cantidad de años. Hace unos cuantos sufrimos el Google Florida Update, hace menos el MayDay y el Caffeine. Para ponernos en situación vamos a hacer un breve repaso sobre estos: Florida: Fue un cambio en la infraestructura de Google, un nuevo índice, una mejora de futuro. Básicamente metieron todos los filtros antispam aqprendidos los 6 primeros años de vida del motor. MayDay: Este cambio de algoritmo afectó principalmente a los … Leer más

Categorías SEO

Google Maps + Foursquare

Si eres de los que le da igual que sepan donde estás en todo momento (o al menos donde accedes en Foursquare) tal vez te interese este pequeño mashup con el que podrás mostrar gracias a los mapas de Google Maps tu última localización de Foursquare. ¿Cómo se consigue esto? Pues tan sencillo como entrando en tu cuenta de Foursquare y luego visitando la sección de feeds. Allí encontrarás una de las opciones en formato KML. Ahora tan sólo has de añadir esa dirección URL al final del mapa de Google. Por ejemplo: <iframe scrolling=»no» marginheight=»0″ marginwidth=»0″ width=»300″ height=»300″ src=»http://maps.google.com/maps?f=q&source=s_q&hl=es&geocode=&q=http://feeds.foursquare.com/history/ABCDEF0123456789.kml?count=1&ie=latin1&output=embed»></iframe> El parámetro «q» es el que lleva la URL de Foursquare, y el «count» es el número de puntos que quieres que se muestren. Si pones 1 indicará … Leer más

Categorías PHP

Cursos de Verano: SEO para contenidos

Otro día más, una charla menos… hoy ha tocado juntar a los periodistas y darles un poco la paliza con, principalmente, los distintos «tags» que tiene el HTML y que ellos pueden utilizar para mejorar su calidad en los textos… además de darles un toque de atención con respecto a los títulos o el uso de las herramientas para webmasters, que al fin y al cabo, ellos son parcialmente webmasters de los sitios web). La presentación es un poco larga, pero ya está disponible para descargar.

Categorías SEO

Schema, el paradigma de la Web Semántica

Desde poco antes del año 2000 que llevo escuchando sobre la Web Semántica. Cuando alguien me preguntaba sobre ello le decía que para eso faltaban todavía muchos años, porque la gente no estaba capacitada para generar sitios web que pudieran ser comprensibles. A principios de 2008 Yahoo! comenzó a dar soporte a los MicroFormatos más habituales, ya que era complejo el uso de RDFa y, al poco tiempo, en unas charlas muy interesantes comencé a entender de qué iba todo esto. Semanas después lancé OJOmicroformatos (hoy en día desaparecido e integrado en OJObuscador), aunque todavía queda cierta parte de información disponible. Hace meses, interesándome con el HTML 5 vi que se lanzaban los «microdatos» de forma oficial por el W3C, y que leyéndo la documentación oficial del W3C … Leer más

Cursos de Verano: HTML 5

Otra semana que empieza y otra semana con más cursos de formación… hoy ha tocado una pequeña introducción a algunos elementos interesantes de HTML 5 para hacer abrir boca a desarrolladores y parte de la gente de contenidos. Básicamente me he centrado en comentar los nuevos elementos (los que he considerado más interesantes), en comentar los que desaparecen y otras cosas bastante estándar como son los meta-tags, los enlaces o las relaciones entre elementos. En fin, como siempre, mejor dejo la descarga de la presentación y cualquier cosa comentáis.

Cursos de Verano: Arquitectura de la Información

Un día más (y hasta el próximo martes no habrá más) ha tocado otra charla en la empresa, charla que os dejo aquí. En esta ocasión es de Arquitectura de la Información, donde a parte de hablar sobre cómo deberían ser las direcciones URL, se comentan algunos detalles sobre los robots.txt, los Sitemaps XML, los rel-canonical o los meta-noindex. Así que, quien quiera, ya está disponible la presentación para descargar.

Categorías SEO

Google Panda, Adsense y más patentes

Una vez más la solución a los problemas que Google nos genera se encuentra en alguna de sus patentes… y es que sin duda la llamada Compensation Distribution Using Quality Score nos puede dar una idea muy clara de lo que Google podría estar pensando hacer tras el Google Panda. Among other disclosed subject matter, a computer-implemented method for compensation distribution includes analyzing first content from a publisher with regard to a quality criterion. The method includes associating the first content with a quality score based on the analysis. The method includes providing second content to the publisher to be published with the first content. The method includes distributing a compensation to the publisher relating to the second content, the compensation based at least in part on the … Leer más

Categorías SEO

Cachear de forma sencilla una página dinámica en PHP

¿Te ha pasado alguna vez que tienes una web desde hace un montón de años, que la hiciste tú y a veces te da problemas de saturación por exceso de visitas? Pues a mi sí y, aunque llevaba tiempo pensando en alguna forma de cachear, que acababa siendo hipercompleja, hoy me ha dado por pensar alguna forma sencilla basándome en unas pruebas que había hecho hacía poco. La cuestión es que sabía cómo hacerlo, iba por el camino, pero entre unas cosas y otras «nunca encontraba el momento», hasta ahora. El sistema es bastante simple y en principio se podría aplicar a cualquier sitio. El código sería algo tal que este: <?php $md5 = md5($_SERVER[«REQUEST_URI»]); // convertimos la URL a único identificador $file = «cache/».$md5.».html»; // donde se … Leer más

El ansia de indexarlo todo

De un tiempo a esta parte que me estoy encontrando con algunas cosas que no me gustan de Google. Sí, ya sé que es muy fácil meterse con el gigante de Mountain View, pero creo que a alguien de la parte de búsquedas se le ha ido un poco la cabeza. Todo ha comenzado con el cambio de diseño de mi blog, o sea, de esta página, y de paso con la instalación del nuevo WordPress 3.2. Revisando mis «plugins de SEO» me he dado cuenta de que se estaba indexando más de lo debido. hace meses que decidí que si quería tener unos buenos resultados en Google y Bing sólo tenía que indexar las entradas del blog y las pocas páginas que tengo (como la Guía SEO). … Leer más

Categorías SEO

Presentación sobre SEO / WPO

Hace un par de días tuve, una vez más, la oportunidad de impartir una clase de un par de horas sobre SEO en ESDi. En este caso se planteaba como una clase más práctica para gente que no tiene muchos conocimientos tecnológicos y que probablemente tendrán que decidir a qué empresa de SEO contratar, por lo que me focalicé bastante en ese punto, el de cómo elegir a una empresa, qué ha de aportar esa empresa y cómo se ha de pensar el proyecto antes de lanzarse. Hoy en día el que quiere lanzar un proyecto en la red y lo quiere lanzar bien ha de pensar en bastantes cosas… para empezar qué quiere conseguir con el proyecto, dónde se va a alojar (si está enfocado a un … Leer más

el SEO ha muerto

Es curioso cómo va pasando el tiempo… hace ahora 3 años que el SEO ha muerto y aunque hace 2 que resucitó un poco hoy estoy aquí para reivindicar un poco más que el SEO sigue cada día más muerto. Como dicen en USA, a 6 pies bajo tierra. En el año 2009 cuando hablé de la muerte del SEO comenté que cada vez más tendríamos que hacer SEO para «otras cosas» que no fueran las búsquedas web. Acababa de aparecer la «búsqueda universal» y nos daba la sensación de que la pantalla de resultados de Google se iba a llenar de todo menos de resultados tradicionales… al final Google ha creado un menú lateral y la búsqueda universal ha quedado algo diluida. La siguiente vez, en 2009, … Leer más

Categorías SEO

SEO, enlaces y medios sociales

Una de las cosas que más gusta a los SEO que hacen linkbuilding es todo lo que tiene alguna relación con «lo social», y para ayudarles a hacer algo de seguimiento de cada una de sus URL les voy a recomendar algunas API que creo que les será muy útiles. No son todas las aplicaciones sociales que hay hoy en día, pero con estas se cubre gran parte de los datos que quizá más interesen. La mayoría de aplicaciones devuelven la información en JSON, lo que será fácil de gestiona directamente desde JavaScript o convertirlo desde algún otro lenguaje. Eso sí, la información, en cada caso, es distinta… algunos simplemente devuelven la cantidad de enlaces y otros muchísima información. Delicious Entrada: http://feeds.delicious.com/v2/json/urlinfo/data?url=http://www.google.com/ Salida: [{«hash»:»ff90821feeb2b02a33a6f9fc8e5f3fcd»,»title»:»Google»,»url»:»http:\/\/www.google.com\/»,»total_posts»:55048,»top_tags»:{«search»:15300,»google»:13108,»searchengine»:5881,»engine»:4255,»web»:2606,»reference»:1903, «searchengines»:1833,»internet»:1414,»research»:1013,»tools»:956}}] Facebook Entrada: http://graph.facebook.com/?ids=http://www.google.com/ … Leer más

Categorías SEO

La primera patente de Google: ¿BackRub?

Por norma general cuando hablas con alguien sobre los orígenes de Google y en qué está basada su tecnología siempre se habla de PageRank, pero no se suele hacer mención de BackRub (algo así como el «frota-espaldas»). Y es que sin duda el pensador máximo de Google siempre ha sido Larry Page, y de ahí que la application 60/035,205 del 10 de enero de 1997 no sea muy conocida. Su nombre: Improved Text Searching in Hypertext Systems. Sin duda difiere bastante de la 6.285.999, la más conocida como Pagerank y que en realidad lleva por nombre: Method for node ranking in a linked database. Además, es curioso porque Larry le hace referencia en 4 patentes posteriores a la primera. La primera diferencia es clara: la primera patente hace … Leer más

Categorías SEO

Determinar la credibilidad de un sitio web

Estos días, con eso del Farmer Panda Update se está hablando mucho de la baja calidad de los contenidos. Aunque ahora mismo en realidad no se está atendiendo realmente a la calidad de los contenidos con respecto a su credibilidad, sí que se están revisando la calidad de una página con respecto al resto de páginas de un sitio. Pero de eso ya he hablado, así que voy a ir a por lo otro: la credibilidad. Estos días se ha presentado un documento muy interesante llamado Augmenting Web Pages and Search Results to Support Credibility Assessment y reducido a «una palabra»: WebCredibility. Este documento está desarrollado parcialmente por Microsoft Research y básicamente detalla formas a tener en cuenta a la hora de intentar saber si un sitio (y … Leer más

Categorías SEO

Border Gateway Protocol (BGP) y SEO

Aprovechando la visita de estas semanas atrás de David y Rubén estuvimos hablando de algo de lo que ya he comentado alguna vez y que, al estar aquí, pudimos medianamente probar: el tiempo de respuesta. Uno de los problemas que habitualmente me encuentro con la gente de Miami es que si ponemos los sitios en Barcelona la conexión es lenta. Claro está, lento es algo muy extraño, porque estamos hablando de 0,1 segundos más por petición, pero claro, sólo una web que tenga 30 peticiones (algo bastante normal) significa que la web puede tardar en cargar 3 segundos más que si estuviera más cerca. Como digo, en principio no parece mucho, pero como haya algo de saturación en la red y en vez de 0,1 sea 0,2 la … Leer más

Categorías WPO

Google quiere la antigua Internet

¿Os acordáis de cómo era Internet en 1995? Yo tengo leves recuerdos, porque con un amigo del instituto nos comenzamos a conectar en aquella época, aunque no fue hasta el ’97 cuando me metí en ello en profundidad. Todo esto viene por una razón: la Internet de aquella época no se parece en nada a la actual. Está claro que la tecnología ha evolucionado, pero no me refiero a eso, sino a los contenidos e información que había, cómo se hacía Internet en aquellos días. Hace unos días comentaba las turbulencias en Internet que estaba llevando a cabo debido al Farmer Panda Update y una de las cosas que comenté al final del artículo fue que lo único que no había cambiado en todos estos años era que … Leer más

Categorías SEO

Plan B: no depender de Google

Estos días, como cada cierto tiempo, vuelve a haber movimiento y estrés en la red de redes debido a los últimos cambios de Google en su índice. Por ahora el cambio afecta sólo al índice de Estados Unidos, pero eso no ha impedido que la histeria de cambios haya llegado a países europeos que no deberían «notar nada» (todavía). Hay dos cosas a tener en cuenta en estas situaciones que, personalmente, me hacen algo de gracia. La primera de ellas es… ¿de qué estás preocupado? Si haces las cosas bien ¿te has de preocupar de algo? ¿no será que eres un tramposete y te cagas las patas abajo cuando hay un cambio? En esos casos lo voy a decir claro: te jodes, eso te pasa por gilipollas y … Leer más

Categorías SEO

Turbulencias en Internet

Muchos de los que me conocéis desde hace años recordaréis que en las primeras charlas que daba en algunos eventos comentaba siempre que estaba calculado que sobre 2012, en base al crecimiento de Internet, los buscadores tendrían que cambiar radicalmente su algorítmica. Ahora parece que ese momento ha llegado. Vamos a poner unas cuantas sobre la mesa: Google va a perder la patente del Pagerank, en estos últimos años han aparecido herramientas como Facebook, Twitter, Digg… el SEO «tradicional» se ha extendido de forma que «cualquiera hace SEO» y, como decía antes, Internet ha crecido quizá más de lo que se esperaba. ¿Qué pasa si metemos todo esto en la coctelera? Estas semanas atrás ha habido una pelea entre Bing y Google, provocada por vete a saber quién, … Leer más

Categorías SEO

HTML 5 en todos los navegadores

Hace ya un tiempo que no comento cosas de HTML 5, y ahora que se va acercando la fecha de su puesta en marcha ya muchos proyectos nuevos se plantean, al menos la estructura base, comenzarse en esta nueva versión del idioma de Internet. En su día comenté cómo conseguir que, mediante un pequeño script, funcionase HTML5 en Internet Explorer 8. El tema es ¿cómo hacer que funciona siempre? La solución es bastante sencilla y a la vez también algo compleja, aunque en su día permitirá hacer una actualización bastante rápida del código con un simple «replace». Como ya sabéis, HTML 5 es un markup, al igual que lo son el HTML, los XML, el RDFa, etc… de forma que, lo mismo que podemos cargar XML en el … Leer más

Web Site Optimization: adiós SEO, WPO, link building…

Cuando hablamos de SEO ¿de qué estamos hablando realmente?. Cuando hablamos de WPO ¿de qué estamos hablando realmente?. Podría seguir con una larga lista, como el link building, el diseño web, la infraestructura… y a eso me refería hace ya unos cuantos años con lo de que el SEO ha muerto como ya he explicado en varias ocasiones. Este 2011 va a producirse un detalle que quizá muchos no conozcan y que puede cambiar el camino en lo que al tratamiento de sitios web se refiere. Cuando se pidió la patente del Pagerank por parte de Brin y Page, no se hizo como Google, sino como la Universidad de Stanford, que cedió dicha patente en exclusiva a Google hasta 2003, cuando fue renovada hasta 2011. Pero el contrato … Leer más

Categorías SEO

Web Performance Optimization, el libro

Aunque ya lo había comentado hace unas semanas por twitter, hoy aparece la que considero la primera versión decente de mi nuevo libro (aunque en esta ocasión estará sólo como libro electrónico) y que se llama Web Performance Optimization. El lema de este libro es: La velocidad es un elemento diferencial; el rendimiento es una nueva oportunidad. La idea de escribir esto surgió hace un par de meses cuando, debido a mi frase de el SEO ha muerto de hace unos años y que cada vez veo que el SEO de por sí sirve de muy poco, sumado a la presentación que hice en el Search Congress de Bilbao, me hizo ponerme manos a la obra. Además, lo bueno de esto es que además de servir a los … Leer más

Categorías WPO