Internet

  • smushit.net, una API simple de smushit

    ·

    Si te dedicas al mundo de Internet es muy probable que entre las aplicaciones que utilices se encuentre la de comprimir imágenes… pero el uso de algunas herramientas a veces se hace muy complejo o necesita de servidores con algunas configuraciones extrañas. Es por eso que, como yo mismo me he encontrado en esa situación y soy bastante asiduo a la herramienta de Smush.it de Yahoo! he querido simplificarme la vida y, de paso, os hago partícipes de ello a vosotros. Que conste que es una simple prueba y que puede fallar (como todo en la vida). El servicio es… Read More →

  • Arreglando una penalización

    ·

    Con mucha frecuencia me llegan correos de personas que tienen un sitio web pequeño y que han sido penalizados (o degradados) por Google de alguna manera. Hoy, tomando como ejemplo uno de estos correos, voy a explicaros cómo se puede arreglar una penalización (de las más sencillas) con tan sólo utilizar Google como herramienta (sin Webmaster Tools o Analytics). Esto significa que lo único que necesitamos es un navegador y un poco de imaginación. El sitio en cuestión es juegostt.com y su problema es que ha caído el tráfico mucho. Lo primero que he hecho es darle una ojeada al… Read More →

  • Cómo Bing mejora el PageRank contra el WebSpam

    ·

    Hablar de sistemas antispam en los resultados de búsqueda es algo de lo que he hablado muchas muchas veces en los últimos meses. Cada buscador busca sus propios sistemas para mejorar el análisis de los sitios web, ya sea mediante factores humanos, analizando las propias páginas y con decenas de métodos para aumentar la calidad del índice. Pero sin duda este sistema de Microsoft me ha sorprendido ya que se basa en el propio PageRank de Google. La patente Locally computable spam detection features and robust pagerank de Microsoft deja bien claro que hoy en día tanto el PageRank como… Read More →

  • Google Quality Rater: WebSpam

    ·

    Hace unos días comencé a explicar sobre cómo los Google Quality Rater validan la utilidad de los documentos. Ahora que ya sabemos cómo se valida un documento, queda que veamos los «flags» que pueden recibir; esto significa que independientemente de la utilidad del documento podemos marcar determinados elementos (como spam, malware, …) para que se investigue más sobre él. Spam Aunque luego entraré en más detalle en este punto, el webspam se puede marcar con 3 niveles distintos: not-spam, mayby-spam y spam. Una página correcta, en la que no hay ningún intento de engañar al buscador ni al usuario se… Read More →

  • Percona Live 2011 en Londres

    ·

    Hace una semana que tuve la oportunidad de visitar por primera vez Londres para ir al evento Percona Live London 2011. Este evento organizado por Percona (una de las mayores distribuciones de MySQL) tenía buena pinta, así que arrastré conmigo a Rubén Ortiz (uno de los mejores administradores de sistemas que conozco y además buen amigo). El evento se dividió en un par de días. El primero de ellos iba enfocado más a cosas prácticas, ya que eran talleres. Yo me fui a uno que duró todo el día (mañana y tarde) y que hablaba de cómo escalar LAMP (Linux… Read More →

  • Versiones de webs móviles inteligentes

    ·

    Según voy leyendo y probando en algunos sitios, me doy cuenta de que a los buscadores no les gustan tanto las versiones móviles de los sitios como podría parecer. Esto no significa que no haya que hacer versiones para dispositivos móviles, pero deberían ser la misma web que la original, tratada con CSS y en una versión especial en otro dominio o subdominio. Al menos estas últimas versiones siempre quedarán degradadas a un último plano a la hora de hacer SEO. Y teniendo en cuenta esto Google tiene un sistema para que no sea necesario crear ediciones especiales en dispositivos… Read More →

  • Google Quality Rater: utilidad del documento

    ·

    Para los que no lo sepan, Google desde hace muchos años contrata a gente que suele trabajar desde casa en la revisión de calidad de los resultados de búsqueda. Incluso, muchos de los que hace unos años eran «los mejores SEO» tenían a algún familiar muy directo metido a trabajar en este tema (de ahí ser tan buen SEO y ahora ya no serlo tanto). A cada Quality Rater de Google se le en entregan las General Guidelines (PDF) en la que se explica el funcionamiento de la plataforma de calificación además de los diferentes puntos donde se detalla qué… Read More →

  • Historial de contenidos duplicados

    ·

    En la red existen multitud de documentos a rastrear; los buscadores van reindexándolos y descubriendo los nuevos según van revisitándolos. Pero existe el problema de encontrar documentos duplicados ya sea completa o pacialmente. Además, hay documentos que cambian con mucha frecuencia. Incluso, puede ser que simplemente el documento vaya cambiando una parte del mismo (la publicidad, los enlaces recomendados o algún bloque aleatorio…), lo que podría implicar tener dicho documentos con sólo la variable parcial del mismo. Otro problema que nos podemos encontrar es el de el rastreo sesgado. Esto suele pasar en los blogs, donde un mismo documento se… Read More →

  • Formas de propagar la relevancia entre documentos

    ·

    Es de muchos conocido el algoritmo del PageRank (Google), que básicamente lo que calcula es la relación entre documentos en base a la cantidad de enlaces que tienen entre ellos y, en base a esto, calcular el peso de la información a la hora de ofrecer resultados de búsqueda. Con esto se puede llegar a realizar una clasificación de todos los datos de la red de redes aún teniendo en cuenta que hay páginas sin enlaces, generando una imagen instantánea de la red. Pero aunque este es el algoritmo más conocido, existen otros dos algoritmos igual de interesantes. Uno de… Read More →

  • ¿Afecta Google Analytics al SEO?

    ·

    Seguro que alguna vez te has preguntado ¿afectará poner Google Analytics al SEO de mi sitio? Pues ahora tenemos la respuesta oficial, y es que Google ha conseguido una patente que permite reorganizar los resultados de búsqueda parcialmente dependiendo de las estadísticas… es decir, que si Google quiere, puede. Y es que ha conseguido la Methods and apparatus for employing usage statistics in document retrieval en la que se mejoran los resultados de búsqueda dependiendo, total o parcialmente, de las estadísticas de uso. Systems and methods consistent with the present invention address this and other needs by identifying compounds based… Read More →

  • Respuestas a consultas de búsqueda

    ·

    Hace ya muchos años que los buscadores son capaces de responder a preguntas, normalmente elementos sencillos que facilitan lo que el usuario está buscando. Y es por eso que Microsoft se ha hecho con Presenting instant answers to internet queries que básicamente, como su nombre indica, se queda con los llamados «onebox» de respuesta directa. El sistema es sencillo… el usuario realiza una consulta de búsqueda y, dependiendo de lo que se esté buscando (mediante palabras clave o combinaciones) se devuelve el resultado directamente. One or more computer-storage media having computer-executable instructions embodied thereon for performing a method of providing… Read More →

  • Herramienta que decide el mejor sitio de los contenidos

    ·

    Por norma general nos toca a los creadores de sitios web decidir dónde va la publicidad o los bloques de contenidos… esto, junto al departamento de marketing acaba constituyendo la creación de un sitio web. Pero, en muchas ocasiones tener la publicidad o determinados bloques de contenido «que generan beneficios» no es siempre el adecuado… ¿qué tal si dejamos a Yahoo! decidir cuál es el sitio óptimo para colocar un bloque de contenido relacionado (tal y como explica en System and method using sampling for allocating web page placements in online publishing of content? Los medios de comunicación offline, principalmente… Read More →

  • Detección y clasificación de contenidos para adultos

    ·

    Desde que se lanzaron los primeros motores de búsqueda uno de los primeros filtros que se incorporaron fue el de contenidos para adultos, normalmente con 3 límites: nulo, moderado y estricto. Cada cierto tiempo, y debido a que el sector de adultos evoluciona mucho más rápido que el resto de la web, los motores han de buscar nuevas formas de organizar y clasificar esa información, y de ahí que Microsoft haya preparado el Multimodal classification of adult content donde se detallan algunas metodologías. El objetivo es encontrar en textos, imágenes y vídeos si hay contenidos para adultos, y para ello… Read More →

  • ¿Sabes buscar? Bing será para ti

    ·

    Personalmente en muchas ocasiones echo en falta que Google, Bing o cualquier otro me muestre determinadas cosas en la interfaz de resultados cuando estoy trabajando. Y es que hay determinados momentos en que comienzo a hacer algunas consultas de búsqueda complejas, principalmente cuando rastreo información de un sitio concreto. Pues bien, eso podría acabarse. Y es que Microsoft se ha planteado encontrar a los expertos buscadores, tal y como explica en Identification and use of web searcher expertise, donde explica claramente que algunos usuarios son mejores buscando cosas que otros, ya sea por las búsquedas complejas (usando paréntesis, OR y… Read More →

  • Detección de granjas de enlaces

    ·

    Sin duda en SEO uno de los grandes problemas que tienen los buscadores es lidiar con aquellos que quieren hacer trampa y jugar con el PageRank. Pero el PageRank de Google (que al final es un estándar de facto en el resto de motores) se puede usar ligeramente como sistema antispam y sobre todo puede ayudar a detectar incoherencias en cuanto a grafos. En el caso de los buscadores existe el llamado web-graph, que es «el momento» en el que todas las webs y enlaces se pueden tomar en un momento determinado, como si hiciéramos una foto de Internet. Pues… Read More →

  • Sistema para detectar una plantilla web

    ·

    Una forma de saber qué parte de un sitio web es importante y qué parte es común al resto de páginas del sitio es saber qué plantilla se está utilizando. Y eso es lo que Yahoo! ha patentado en System and method for detecting a web page template. El objetivo es conseguir que un sistema de forma automática detecte qué parte de la página es una plantilla, extraer los distintos bloques de contenido y asignarle, a cada uno de los bloques un determinado peso. Los motores de búsqueda en muchas ocasiones necesitan eliminar de la ecuación la parte común de… Read More →

  • Yahoo!: navega y mejoraremos las búsquedas

    ·

    Interesante propuesta la que hace Yahoo! para mejorar los resultados de búsqueda y no depender tanto de conceptos como el PageRank o de la navegación que hacen los usuarios a través de las propias páginas de resultados, y es la de usar los logs de navegación de los ISP. Antes de seguir pongámonos en antecedentes para aquellos que no tengan muy claro cómo funciona la navegación del usuario. Un usuario está en su casa delante de su navegador de Internet y con su proveedor de Internet (cable, ADSL, etc…). El proveedor lo que hace es de intermediario entre tu casa… Read More →

  • Google y el SEO de tus sitios favoritos

    ·

    Cuando en SEO se habla de enlaces nos olvidamos de un tipo de enlaces muy importantes pero a la vez muy complejos de que Google o Bing los acaben encontrado: los que tenemos en nuestra lista de marcadores favoritos del navegador. Pues ahora Google se ha hecho con una patente que permite indexar este tipo de información y usarla. La situación es que normalmente nos guardamos en nuestra lista de «favoritos» aquellas páginas que visitamos mucho o que nos son complejas de encontrar y por tanto nos las guardamos. Sin duda estas direcciones URL son de un valor, ya que… Read More →

  • Yahoo!, singular y plural

    ·

    Si ayer comentaba que hay patentes que te llegan a sobre coger por lo amplias que pueden ser, a veces otras te sorprenden por lo sencillas y efectivas que son. Y este es el caso que ha patentado Yahoo!, un sistema que busca palabras en singular y/o plural y reconstruye la consulta de búsqueda para tener mejores resultados. La patente llamada Word pluralization handling in query for web search básicamente lo que hace es analizar la consulta de búsqueda, buscar aquellos conceptos que tengan un equivalente en singular o plural (dependiendo del caso) y reconstruye la consulta y es la… Read More →

  • Google patenta la interfaz de resultados para productos

    ·

    Sin duda las cosas que se pueden patentar son bastante impresionantes, y la que ha patentado Google me parece sorprendente ya que es algo bastante estándar en muchos motores de búsqueda y esto puede llevar consecuencias en cuanto a cambios de interfaz en algunos de estos sitios con tal de no tener que pagar al buscador de Mountain View. En esta ocasión, y basándose en Froogle (lo que actualmente conocemos como Google Product Search), Google ha conseguido la patente llamada Method and apparatus for output of search results en la que se explica cómo se muestran los resultados (en modo… Read More →