• Google DevFest Barcelona 2011

    ·

    Esta mañana estoy en el Google DevFest Barcelona 2011. Voy a estar sólo esta mañana, así que aviso que las charlas que se den esta tarde no las comentaré. En realidad vengo principalmente por las de Chrome y las de Google+, que esta tarde tengo sesión de tuning WPO a niveles ya insospechados de capas OSI… NOTA: Para aquellos que quieran seguir el evento en directo, les recomiendo seguir el hashtag #DevFest en Twitter, donde muchos de los asistentes están retransmitiendo (por lo que yo me limitaré a escribir en el blog). Welcome Intro – Alejandro Villanueva Nos dan la… Seguir leyendo →

  • Cómo Bing mejora el PageRank contra el WebSpam

    ·

    Hablar de sistemas antispam en los resultados de búsqueda es algo de lo que he hablado muchas muchas veces en los últimos meses. Cada buscador busca sus propios sistemas para mejorar el análisis de los sitios web, ya sea mediante factores humanos, analizando las propias páginas y con decenas de métodos para aumentar la calidad del índice. Pero sin duda este sistema de Microsoft me ha sorprendido ya que se basa en el propio PageRank de Google. La patente Locally computable spam detection features and robust pagerank de Microsoft deja bien claro que hoy en día tanto el PageRank como… Seguir leyendo →

  • Google Quality Rater: WebSpam

    ·

    Hace unos días comencé a explicar sobre cómo los Google Quality Rater validan la utilidad de los documentos. Ahora que ya sabemos cómo se valida un documento, queda que veamos los «flags» que pueden recibir; esto significa que independientemente de la utilidad del documento podemos marcar determinados elementos (como spam, malware, …) para que se investigue más sobre él. Spam Aunque luego entraré en más detalle en este punto, el webspam se puede marcar con 3 niveles distintos: not-spam, mayby-spam y spam. Una página correcta, en la que no hay ningún intento de engañar al buscador ni al usuario se… Seguir leyendo →

  • Percona Live 2011 en Londres

    ·

    Hace una semana que tuve la oportunidad de visitar por primera vez Londres para ir al evento Percona Live London 2011. Este evento organizado por Percona (una de las mayores distribuciones de MySQL) tenía buena pinta, así que arrastré conmigo a Rubén Ortiz (uno de los mejores administradores de sistemas que conozco y además buen amigo). El evento se dividió en un par de días. El primero de ellos iba enfocado más a cosas prácticas, ya que eran talleres. Yo me fui a uno que duró todo el día (mañana y tarde) y que hablaba de cómo escalar LAMP (Linux… Seguir leyendo →

  • Versiones de webs móviles inteligentes

    ·

    Según voy leyendo y probando en algunos sitios, me doy cuenta de que a los buscadores no les gustan tanto las versiones móviles de los sitios como podría parecer. Esto no significa que no haya que hacer versiones para dispositivos móviles, pero deberían ser la misma web que la original, tratada con CSS y en una versión especial en otro dominio o subdominio. Al menos estas últimas versiones siempre quedarán degradadas a un último plano a la hora de hacer SEO. Y teniendo en cuenta esto Google tiene un sistema para que no sea necesario crear ediciones especiales en dispositivos… Seguir leyendo →

  • Google Quality Rater: utilidad del documento

    ·

    Para los que no lo sepan, Google desde hace muchos años contrata a gente que suele trabajar desde casa en la revisión de calidad de los resultados de búsqueda. Incluso, muchos de los que hace unos años eran «los mejores SEO» tenían a algún familiar muy directo metido a trabajar en este tema (de ahí ser tan buen SEO y ahora ya no serlo tanto). A cada Quality Rater de Google se le en entregan las General Guidelines (PDF) en la que se explica el funcionamiento de la plataforma de calificación además de los diferentes puntos donde se detalla qué… Seguir leyendo →

  • Historial de contenidos duplicados

    ·

    En la red existen multitud de documentos a rastrear; los buscadores van reindexándolos y descubriendo los nuevos según van revisitándolos. Pero existe el problema de encontrar documentos duplicados ya sea completa o pacialmente. Además, hay documentos que cambian con mucha frecuencia. Incluso, puede ser que simplemente el documento vaya cambiando una parte del mismo (la publicidad, los enlaces recomendados o algún bloque aleatorio…), lo que podría implicar tener dicho documentos con sólo la variable parcial del mismo. Otro problema que nos podemos encontrar es el de el rastreo sesgado. Esto suele pasar en los blogs, donde un mismo documento se… Seguir leyendo →

  • Formas de propagar la relevancia entre documentos

    ·

    Es de muchos conocido el algoritmo del PageRank (Google), que básicamente lo que calcula es la relación entre documentos en base a la cantidad de enlaces que tienen entre ellos y, en base a esto, calcular el peso de la información a la hora de ofrecer resultados de búsqueda. Con esto se puede llegar a realizar una clasificación de todos los datos de la red de redes aún teniendo en cuenta que hay páginas sin enlaces, generando una imagen instantánea de la red. Pero aunque este es el algoritmo más conocido, existen otros dos algoritmos igual de interesantes. Uno de… Seguir leyendo →

  • ¿Afecta Google Analytics al SEO?

    ·

    Seguro que alguna vez te has preguntado ¿afectará poner Google Analytics al SEO de mi sitio? Pues ahora tenemos la respuesta oficial, y es que Google ha conseguido una patente que permite reorganizar los resultados de búsqueda parcialmente dependiendo de las estadísticas… es decir, que si Google quiere, puede. Y es que ha conseguido la Methods and apparatus for employing usage statistics in document retrieval en la que se mejoran los resultados de búsqueda dependiendo, total o parcialmente, de las estadísticas de uso. Systems and methods consistent with the present invention address this and other needs by identifying compounds based… Seguir leyendo →

  • Respuestas a consultas de búsqueda

    ·

    Hace ya muchos años que los buscadores son capaces de responder a preguntas, normalmente elementos sencillos que facilitan lo que el usuario está buscando. Y es por eso que Microsoft se ha hecho con Presenting instant answers to internet queries que básicamente, como su nombre indica, se queda con los llamados «onebox» de respuesta directa. El sistema es sencillo… el usuario realiza una consulta de búsqueda y, dependiendo de lo que se esté buscando (mediante palabras clave o combinaciones) se devuelve el resultado directamente. One or more computer-storage media having computer-executable instructions embodied thereon for performing a method of providing… Seguir leyendo →

  • El Libro de las Almas

    ·

    Hace un par de semanas os comentaba que me había acabado de leer La Biblioteca de los Muertos, y que me había pedido la continuación de ese libro, El Libro de las Almas. Pues bien, no ha durado ni 10 días entre mis manos que ya me lo he fundido. Si la anterior entrega estaba bien, esta casi que me ha gustado más. Se supone que se puede leer sin necesidad de haber leído el anterior, pero, la verdad, hay que leer el anterior para comprender al 100% el porqué los personajes son como son y hacen lo que hacen.… Seguir leyendo →

  • Tras la WordCamp Sevilla 2011

    ·

    Como ya sabéis muchos de vosotros este fin de semana he estado en la WordCamp Sevilla 2011. Las WordCamp son los eventos oficiales de WordPress en los que suele ir gente de Automattic, la empresa que hay detrás de este grandísimo software, además de usuarios y desarrolladores de la plataforma. Durante el fin de semana estuve dando un par de charlas, una sobre Google Panda y WordPress, en la que comenté como reducir la cantidad de URL que genera WordPress perdiendo el mínimo tráfico posible, y sabiendo que en la nueva versión el propio sistema, a sabiendas de esto, va… Seguir leyendo →

  • WordPressformance Optimization #WordCampSev 2011

    ·

    Ayer ya di la charla de Google Panda y WordPress y hoy ha tocado la charla de WordPress Performance Optimization, que he reducido a WordPressformance. La charla de hoy ha tratado de cómo montar una infraestructura más organizada en sitio que necesitan alto rendimiento, ya que está claro que montar un WordPress en la misma máquina el Apache, SQL y PHP pues como que no es lo mejor… Así que nada, aquí os dejo la presentación en PDF para los que queráis descargarla. Seguir leyendo →

  • WordPress y Google Panda #WordCampSev 2011

    ·

    Entre hoy y mañana se está celebrando el WordCamp Sevilla 2011 y voy a dar 2 charlas… la primera de ellas se llama WordPress y Google Panda y, como ya podéis supones habla de la relación que hay entre el nuevo algoritmo Google Panda y WordPress (.org). Os dejo la presentación descargable en PDF. Como comentario a destacar (que he de analizar en una versión de pruebas que tengo) es que me han comentado que WordPress 3.3 incluirá grandes mejoras en cuanto a qué indexa y que no indexan los buscadores en determinadas URL de WordPress. Habrá que verlo y… Seguir leyendo →

  • Herramienta que decide el mejor sitio de los contenidos

    ·

    Por norma general nos toca a los creadores de sitios web decidir dónde va la publicidad o los bloques de contenidos… esto, junto al departamento de marketing acaba constituyendo la creación de un sitio web. Pero, en muchas ocasiones tener la publicidad o determinados bloques de contenido «que generan beneficios» no es siempre el adecuado… ¿qué tal si dejamos a Yahoo! decidir cuál es el sitio óptimo para colocar un bloque de contenido relacionado (tal y como explica en System and method using sampling for allocating web page placements in online publishing of content? Los medios de comunicación offline, principalmente… Seguir leyendo →

  • La Biblioteca de los Muertos

    ·

    hace unas semanas cayó en mis manos el libro La Biblioteca de los Muertos de Glenn Cooper, un libro que no sé como había llegado a mi casa (estaba en la estantería sin leer, y yo no lo había comprado) y la verdad es que me ha encantado. Al principio he de decir que no entendí mucho, porque los libros en los que hay tantos personajes y tantos saltos de tiempo y lugar me acaban mareando, y también que los primeros capítulos no estaba 100% por el libro, la verdad. Pero este fin de semana, aprovechando un viaje, he querido… Seguir leyendo →

  • Detección y clasificación de contenidos para adultos

    ·

    Desde que se lanzaron los primeros motores de búsqueda uno de los primeros filtros que se incorporaron fue el de contenidos para adultos, normalmente con 3 límites: nulo, moderado y estricto. Cada cierto tiempo, y debido a que el sector de adultos evoluciona mucho más rápido que el resto de la web, los motores han de buscar nuevas formas de organizar y clasificar esa información, y de ahí que Microsoft haya preparado el Multimodal classification of adult content donde se detallan algunas metodologías. El objetivo es encontrar en textos, imágenes y vídeos si hay contenidos para adultos, y para ello… Seguir leyendo →

  • Cómo convertirse en un Hijo de Puta

    ·

    Al poco de estrenarse Amazon en España, me encontré leyendo por twitter sobre un libro llamado Cómo convertirse en un Hijo de Puta. No miré nada más… quedaban 2 copias en el portal y me quedé con una de ellas que llegó al par de días. A ver, no os penséis que es una novela romántica, ni tan sólo una novela… son pequeños fragmentos de Herminio Bolaextra, un personaje de cómic / tiras cómicas, un periodista que tiene un particular sentido de ver el mundo. Ahora, para celebrar su mayoría de edad, aparece este volumen de humor gráfico a caballo… Seguir leyendo →

  • ¿Sabes buscar? Bing será para ti

    ·

    Personalmente en muchas ocasiones echo en falta que Google, Bing o cualquier otro me muestre determinadas cosas en la interfaz de resultados cuando estoy trabajando. Y es que hay determinados momentos en que comienzo a hacer algunas consultas de búsqueda complejas, principalmente cuando rastreo información de un sitio concreto. Pues bien, eso podría acabarse. Y es que Microsoft se ha planteado encontrar a los expertos buscadores, tal y como explica en Identification and use of web searcher expertise, donde explica claramente que algunos usuarios son mejores buscando cosas que otros, ya sea por las búsquedas complejas (usando paréntesis, OR y… Seguir leyendo →

  • Detección de granjas de enlaces

    ·

    Sin duda en SEO uno de los grandes problemas que tienen los buscadores es lidiar con aquellos que quieren hacer trampa y jugar con el PageRank. Pero el PageRank de Google (que al final es un estándar de facto en el resto de motores) se puede usar ligeramente como sistema antispam y sobre todo puede ayudar a detectar incoherencias en cuanto a grafos. En el caso de los buscadores existe el llamado web-graph, que es «el momento» en el que todas las webs y enlaces se pueden tomar en un momento determinado, como si hiciéramos una foto de Internet. Pues… Seguir leyendo →