Cómo detecta Bing el spam

Ayer os contaba sobre el Search Ranger de Bing, el sistema que tiene Microsoft para detectar y contrarrestar el webspam. Pero aunque ya el documento era bastante denso, la información que ofrecía era aún mayor… ¿Y cómo funciona ese sistema antiwebspam? Un sistema revisa las búsquedas habituales de spam en los resultados de búsqueda. Se extrae una serie de URL con posibilidad de ser spam, que usan actividades habituales de spammers. Un sistema recibe las URL de spam confirmadas y se aprende de ellas nuevas combinaciones de palabras spam, sistemas, relación con otras páginas, el dominio… Se hacen pruebas de búsqueda con el comando LINK: y SITE: de esa página y dominio con las palabras relacionadas. La mayoría de los spammers buscan ganar dinero (más que el posicionamiento), … Leer más

Categorías SEO

Gestos que te hacen sonreír

Según venía de la oficina, casi llegando a casa en la moto me ha tocado un semáforo en rojo. Por la acera venía una niña de un par de años en brazos de su padre saludando a todo el mundo, pero con cara seria; cuando ha pasado por delante mía le he devuelto el saludo. La niña se ha avergonzado, sonriendo, y se ha escondido tras la cabeza de su padre. Unos pasos más adelante ha vuelto a asomarse y me ha vuelto a saludar, haciendo yo lo mismo. Una sonrisa se dejaba ver detrás del casco. Antes de que se pusiera el semáforo en verde, y ya la niña habiéndole dicho al padre que alguien la saludaba, en marcha, me he despedido de ella. Los niños son grandes.

Search Ranger AntiSpam de Bing

Los sistemas para detectar el web-spam es lo que estos últimos años más de cabeza trae a todos los motores de búsqueda, principalmente Bing y Google que se enfrentan a grandes cantidades de basura que rastrean por la red de redes. Y sin duda Microsoft nos da ciertas pistas de algo que solicitó hace menos de un lustro en lo que a sistemas antispam se refiere, y lo hace a través de una patente con un título un poco complejo: Search ranger system and double-funnel model for search spam analyses and browser protection. El sistema básicamente describe un proceso de ingeniería inversa relacionado con el abuso sobre los enlaces, de forma que todos aquellos enlaces que se han creado artificialmente sean descubiertos de una forma relativamente sencilla, según … Leer más

Categorías SEO

V de Vendetta

Lo sé, lo siento, no tengo perdón, pero aunque veo muchas series, lo del cine lo llevo peor, y aunque hace años que debería haber visto V for Vendetta hasta hoy no había tenido la oportunidad de verla. Lo que si que he de decir es que quién no la haya visto, ya está tardando, porque las 2 horas que dura lo merecen. Y es que el papel Natalie Portman (como Evey) y el de Hugo Weaving (como V, y aunque no se le vea en ningún momento) no tienen desperdicio. Aunque, por supuesto, lo que realmente hay que mirar es el fondo de todo y no quedarnos en el simple film. Poco tengo que decir sobre la película en sí, al menos sobre la historia, ya que … Leer más

PagedNoindex WordPress Plugin

Uno de los problemas que me encuentro con el All in One SEO Pack es que no permite que las paginaciones no se indexen, algo que puede generar ciertos problemas y que, personalmente no me gusta que haga. Para solventar esto he creado un pequeño plugin para WordPress que detecta si es una pagina paginada y añade un meta-robots-noindex de forma que esa página no aparecerá en los motores de búsqueda como Bing o Google. Tan sólo hay que subirlo y activarlo, ya que no requiere de ningún tipo de configuración ni nada parecido. Puedes descargar el plugin desde aquí: PagedNoindex WordPress Plugin (versión 1.0 – 20110624).

Social Share Button WordPress Plugin

En muchas ocasiones he querido tener mi propio sistema para compartir en Twitter, Google PlusOne y Facebook, pero ninguna herramienta me daba exactamente lo que yo quería… así que me he montado este plugin para WordPress llamado Social Share Button. Este sistema básicamente añade el botón de compartir en twitter (con el contador) el sistema de votación propio de Google (el Google +1 o Google PlusOne) y finalmente el botón de compartir en Facebook a través del famoso Me Gusta. Este plugin incorpora un fichero de configuración que hay que editar antes de subirlo en el que se indican algunos elementos: $social_lugar: Indicando 0 o 1 podemos hacer que el bloque aparezca encima o debajo del contenido. $social_ancho: Es el ancho (en píxeles) de la columna donde está … Leer más

OpenGraphProtocol WordPress Plugin

El Open Graph Protocol es un sistema de meta-etiquetas que permite, de forma abierta, que algunos robots como por ejemplo los de Facebook) puedan recopilar información de tu página de una forma sencilla y así mostrar la información relevante en sus resultados. El ejemplo más claro sería el de compartir una URL en Facebook, que cuando lo haces te aparece un título, descripción e imagen (o te deja elegir). Este plugin para WordPress básicamente lo que hace es crear esas meta-etiquetas de forma automática y tampoco es que permita ningún tipo de configuración. Simplemente lo subes, lo activas y hará su trabajo. El sistema activa los datos de página y URL para todo el dominio, el tipo, la imagen (si es una imagen destacada, tomará esa, sino intentará … Leer más

Google y tu reputación digital

Aunque he hablado varias veces sobre reputación digital en vistas a que ahora parece que con lo del Google Me on the Web a todos les ha dado por revisar sus cosas, me gustaría explicar de una forma más sencilla qué herramientas existen para eliminar información privada que podemos encontrar por la red y que no hayamos ofrecido directamente. Esta lista de herramientas son algunas páginas de ayuda que he ido recopilando en alguna ocasión por alguna razón y que me gustaría compartir con vosotros por si os fuera de utilidad. Para empezar Google tiene una página en la que se explica bastante claro cómo evitar que aparezca información personal en Google. Esta página sin duda es el inicio y la referencia, y recomiendo 8aunque es algo extensa, … Leer más

Categorías SEO

Estáticos para WordPress

La verdad es que WordPress es un gran CMS y, sobre todo, muy extensible y configurable. En esta ocasión me gustaría enlazar una entrada que publiqué hace ya un tiempo en el que hablaba de los dominios sin cookies con la posibilidad de configurar WordPress para tener las imágenes separadas del dominio principal. El objetivo de este sistema básicamente es separar lo que es la propia web de los contenidos estáticos que se pueden separar. En principio se podrían separar hasta los diseños (JS, CSS…) pero suele ser algo más complejo. Para empezar la idea es separar los contenidos que subimos a través del panel y que suelen estar en la carpeta /wp-content/uploads/. Para comenzar lo que debemos tener es un dominio configurado para estáticos. En mi caso … Leer más

Yahoo! se queda con el «buscador social»

¿Quién es el dueño de las búsquedas sociales? Pues Yahoo! o al menos eso parece tras la concesión de la patente System and method for ranking search results using social information en la que básicamente se detalla lo que serían los factores que se pueden tener en cuenta de sitios sociales para generar o mejorar los resultados de búsqueda de un buscador. An improved system and method for ranking search results using social information is provided. A social information ranking engine may be provided to rerank a list of URLs of web pages in search results from a search engine using social information. To do so, the search query may be applied to a social information domain and a second list of references to web pages may be … Leer más

Categorías SEO

Movimientos sociales

Es innegable que la gente ha salido a la calle a raíz del movimiento 15M y con un descontento general con la clase política. Estoy totalmente de acuerdo de que el sistema político que tenemos se ha quedado retrasado principalmente por la gente que lo tiene que usar, no tanto por la democracia en sí. Creo que lo que estamos viviendo tiene mucho que ver con las cosas que pasaron antes de que yo mismo naciese, y para eso hay que irse a principios del siglo pasado… en la época en la que vivimos una República y más tarde toda la Guerra Civil y finalmente la Transición. Todos los políticos que hoy en día nos representan estaban corriendo hace unos cuantos años delante de los grises, y creo … Leer más

Abrazar

No me considero una persona muy afectuosa, todo lo contrario… más bien me gusta mantener las distancias. Por poner un ejemplo, no acabo de entender una situación tan rara como que uno llega a la oficina, saluda con unos buenos días y todo está bien. En cambio, dos horas después de salir vas a un evento en el que te encuentras a alguien de la oficina con la que has pasado 8 horas y has de darle la mano como si hiciera semanas que no te ves o has de darte varios besos a modo de cortesía. abrazar: 2. tr. Estrechar entre los brazos en señal de cariño. Desde hace un tiempo he aprendido la importancia que tiene abrazar a la gente que te importa. Si realmente aprecias … Leer más

SEO, de la Prehistoria a la Revolución Tecnológica

Estamos en el año 2011, a mediados, más o menos… si hiciéramos una línea del tiempo tendríamos que el año 1995 podría ser el inicio de la era de los buscadores, la prehistoria, donde había que ir a los buscadores y añadirles todas las URL desde un formulario, indicándole muchos datos. Luego comenzaron a tener la lectura de los metas. Hasta aquí estaríamos hablando de la Edad de Piedra. Más tarde llegó Altavista, el que podríamos considerar el primer buscadores decente ya que empezó a buscar dentro de los contenidos de las páginas. Es la Edad de Bronce. El siguiente gordo en llegar fue Google, que potenciado con Yahoo! convirtió Internet en la Edad de Hierro. Esto podría ser aproximadamente el año 1999, cuando Google y Yahoo! ya … Leer más

Categorías SEO

Cómo detecta Google los contenidos duplicados

De nuevo otra patente concedida a Google ayer mismo vuela sobre nuestras cabezas… se llama Document near-duplicate detection y se solicitó en 2009, hace tan sólo año y medio. Aún así hay que tener en cuenta que existe ya una patente previa llamada de la misma forma, ororgada a mediados del año pasado pero «creada» en 2004, lo que significaría que desde 2004 Google está detectando los duplicados, aunque hace menos de 2 años que solicitó una actualización del algoritmo. ¿Qué es lo que la patente reclama? Pues algo tal que así: A near-duplicate component includes a fingerprint creation component and a similarity detection component. The fingerprint creation component receives a document of arbitrary size and generates a compact «fingerprint» that describes the contents of the document. The … Leer más

Categorías SEO

Google Panda ¿ideado en 2005?

Aquellos que todavía sigan creyendo que Google se inventa las cosas y que se las saca de la manga es que no sabe que en Estados Unidos hay que patentarlo todo. Y en previsión de que la patente estaba a punto de concederse (concretamente fue concedida ayer día 14) se ha lanzado hace poco… Como esta hay otras tantas, pero quizá cabe destacar algunos elementos que la convierten en la semilla del Panda. La patente se llama Deriving and using document and site quality signals from search query streams y tiene como resumen lo siguiente: A system analyzes one or more search streams to detect one or more associations between a document and one or more queries in the one or more search streams. The system further derives … Leer más

Categorías SEO

Google Inside Search 2011

Esta tarde se ha llevado a cabo la segunda edición del evento Google Inside Search en el que se han presentado las novedades relacionadas con funcionalidades de búsqueda de Google. En resumen podemos hablar de 4 productos nuevos: Google Mobile UI: Se ha actualizado gran parte de la interfaz de Google Mobile, y se ha integrado un botón de búsquedas locales desde la página principal del mismo. Esto también incluye dispositivos que no son teléfonos, sino tabletas. El foco, en resumen, es el de los contenidos locales. Google Voice Search Desktop: Aunque ahora sólo estará en Google Chrome, poco a poco veremos aparecer un icono de un micrófono junto al botón «buscar» que permitirá que hables mediante un micro, preguntes lo que quieras y el sistema haga la … Leer más

Cursos de Verano: SEO para diseño y maquetación

Comienza la semana y una nueva charla más, en esta ocasión enfocado a SEO para diseñadores y maquetadores de páginas web. La idea básica es la de concienciar a la gente que diseña de la importancia de su trabajo, pero a la vez de la necesidad de que sea óptima a la hora de ponerlo en producción. Se comentan muchas cosas… un poco de HTML5, el nuevo estándar de Web Timing para calcular la carga de las páginas, un poco de Web Performance en imágenes, CSS y JavaScript… además de algunas herramientas para la optimización de imágenes y Flash. Así que, quien quiera darle una ojeada, ya está disponible para descargar.

Categorías SEO

Qué es el Google Panda (y cómo no ser penalizado)

Todos hablan del Google Panda pero muy poca gente fuera de Estados Unidos y los países angloparlantes realmente lo ha sufrido. Además, los sitios que lo han sufrido, un 85% no se han recuperado (porque no han sabido o no lo han cogido a tiempo). Y es que Google nos tiene acostumbrados a una gran actualización cada cierta cantidad de años. Hace unos cuantos sufrimos el Google Florida Update, hace menos el MayDay y el Caffeine. Para ponernos en situación vamos a hacer un breve repaso sobre estos: Florida: Fue un cambio en la infraestructura de Google, un nuevo índice, una mejora de futuro. Básicamente metieron todos los filtros antispam aqprendidos los 6 primeros años de vida del motor. MayDay: Este cambio de algoritmo afectó principalmente a los … Leer más

Categorías SEO

Google Maps + Foursquare

Si eres de los que le da igual que sepan donde estás en todo momento (o al menos donde accedes en Foursquare) tal vez te interese este pequeño mashup con el que podrás mostrar gracias a los mapas de Google Maps tu última localización de Foursquare. ¿Cómo se consigue esto? Pues tan sencillo como entrando en tu cuenta de Foursquare y luego visitando la sección de feeds. Allí encontrarás una de las opciones en formato KML. Ahora tan sólo has de añadir esa dirección URL al final del mapa de Google. Por ejemplo: <iframe scrolling=»no» marginheight=»0″ marginwidth=»0″ width=»300″ height=»300″ src=»http://maps.google.com/maps?f=q&source=s_q&hl=es&geocode=&q=http://feeds.foursquare.com/history/ABCDEF0123456789.kml?count=1&ie=latin1&output=embed»></iframe> El parámetro «q» es el que lleva la URL de Foursquare, y el «count» es el número de puntos que quieres que se muestren. Si pones 1 indicará … Leer más

Categorías PHP

Cursos de Verano: SEO para contenidos

Otro día más, una charla menos… hoy ha tocado juntar a los periodistas y darles un poco la paliza con, principalmente, los distintos «tags» que tiene el HTML y que ellos pueden utilizar para mejorar su calidad en los textos… además de darles un toque de atención con respecto a los títulos o el uso de las herramientas para webmasters, que al fin y al cabo, ellos son parcialmente webmasters de los sitios web). La presentación es un poco larga, pero ya está disponible para descargar.

Categorías SEO

Schema, el paradigma de la Web Semántica

Desde poco antes del año 2000 que llevo escuchando sobre la Web Semántica. Cuando alguien me preguntaba sobre ello le decía que para eso faltaban todavía muchos años, porque la gente no estaba capacitada para generar sitios web que pudieran ser comprensibles. A principios de 2008 Yahoo! comenzó a dar soporte a los MicroFormatos más habituales, ya que era complejo el uso de RDFa y, al poco tiempo, en unas charlas muy interesantes comencé a entender de qué iba todo esto. Semanas después lancé OJOmicroformatos (hoy en día desaparecido e integrado en OJObuscador), aunque todavía queda cierta parte de información disponible. Hace meses, interesándome con el HTML 5 vi que se lanzaban los «microdatos» de forma oficial por el W3C, y que leyéndo la documentación oficial del W3C … Leer más

Cursos de Verano: HTML 5

Otra semana que empieza y otra semana con más cursos de formación… hoy ha tocado una pequeña introducción a algunos elementos interesantes de HTML 5 para hacer abrir boca a desarrolladores y parte de la gente de contenidos. Básicamente me he centrado en comentar los nuevos elementos (los que he considerado más interesantes), en comentar los que desaparecen y otras cosas bastante estándar como son los meta-tags, los enlaces o las relaciones entre elementos. En fin, como siempre, mejor dejo la descarga de la presentación y cualquier cosa comentáis.

Los dibujos de Cuanto Cabrón

He de reconocerlo: he conocido CuantoCabrón tan sólo hace un mes y pico… y simplemente ejke me meo toa!. Es curioso como con unos simples garabatos se puede hacer y decir tanto… pero, la inteligencia que se le ponen a unas viñetas tan simples no tienen precio. Aww Yea Everything went better than expected El tío de los cereales Challenge Accepted Feel like a ninja Feel like a sir Rage Guy (FFFUUU) Forever alone Fuck Yea Inglip It’s Free It’s something LOL Me gusta Mentira Mother of god Nothing to do here Oh God What I have done? Okay Pat Bateman Poker Face Puke Rainbows Raisins Sí claro That’s suspicious Trolldad Trollface / Coolface Why Not? Y U NO Yao Ming Are you fucking kidding me? Descárgalos todos … Leer más

Cursos de Verano: Arquitectura de la Información

Un día más (y hasta el próximo martes no habrá más) ha tocado otra charla en la empresa, charla que os dejo aquí. En esta ocasión es de Arquitectura de la Información, donde a parte de hablar sobre cómo deberían ser las direcciones URL, se comentan algunos detalles sobre los robots.txt, los Sitemaps XML, los rel-canonical o los meta-noindex. Así que, quien quiera, ya está disponible la presentación para descargar.

Categorías SEO

Cursos de Verano: Dominios

Al igual que ayer tocó hacer un curso bastante técnico sobre el protocolo HTTP, hoy me ha tocado hacer un cursillo más simple explicando algunos detalles sobre los dominios. Básicamente es explicar qué es un dominio, cuál es el proceso de registro, tipos de dominio, estados, transferencias… No es nada del otro mundo, pero ya está disponible para descargar…