Detección y clasificación de contenidos para adultos

Desde que se lanzaron los primeros motores de búsqueda uno de los primeros filtros que se incorporaron fue el de contenidos para adultos, normalmente con 3 límites: nulo, moderado y estricto. Cada cierto tiempo, y debido a que el sector de adultos evoluciona mucho más rápido que el resto de la web, los motores han de buscar nuevas formas de organizar y clasificar esa información, y de ahí que Microsoft haya preparado el Multimodal classification of adult content donde se detallan algunas metodologías. El objetivo es encontrar en textos, imágenes y vídeos si hay contenidos para adultos, y para ello se utilizan ciertas metodologías de detección, que se suman a las ya utilizadas hasta ahora. Y por eso el primer paso que se realiza es el de detectar … Leer más

Categorías SEO

Cómo convertirse en un Hijo de Puta

Al poco de estrenarse Amazon en España, me encontré leyendo por twitter sobre un libro llamado Cómo convertirse en un Hijo de Puta. No miré nada más… quedaban 2 copias en el portal y me quedé con una de ellas que llegó al par de días. A ver, no os penséis que es una novela romántica, ni tan sólo una novela… son pequeños fragmentos de Herminio Bolaextra, un personaje de cómic / tiras cómicas, un periodista que tiene un particular sentido de ver el mundo. Ahora, para celebrar su mayoría de edad, aparece este volumen de humor gráfico a caballo entre el manual de autoayuda y el libro de instrucciones que describe minuciosamente la forma de ser y pensar de Herminio Bolaextra convirtiéndose en la guía definitiva de … Leer más

¿Sabes buscar? Bing será para ti

Personalmente en muchas ocasiones echo en falta que Google, Bing o cualquier otro me muestre determinadas cosas en la interfaz de resultados cuando estoy trabajando. Y es que hay determinados momentos en que comienzo a hacer algunas consultas de búsqueda complejas, principalmente cuando rastreo información de un sitio concreto. Pues bien, eso podría acabarse. Y es que Microsoft se ha planteado encontrar a los expertos buscadores, tal y como explica en Identification and use of web searcher expertise, donde explica claramente que algunos usuarios son mejores buscando cosas que otros, ya sea por las búsquedas complejas (usando paréntesis, OR y similares) o porque saben encontrar las palabras adecuadas para esa consulta. ¿Por qué a ellos no darles una interfaz de búsqueda distinta? ¿Algo más compleja para poder sacarle … Leer más

Categorías SEO

Detección de granjas de enlaces

Sin duda en SEO uno de los grandes problemas que tienen los buscadores es lidiar con aquellos que quieren hacer trampa y jugar con el PageRank. Pero el PageRank de Google (que al final es un estándar de facto en el resto de motores) se puede usar ligeramente como sistema antispam y sobre todo puede ayudar a detectar incoherencias en cuanto a grafos. En el caso de los buscadores existe el llamado web-graph, que es «el momento» en el que todas las webs y enlaces se pueden tomar en un momento determinado, como si hiciéramos una foto de Internet. Pues Yahoo! (una vez más) ha creado un sistema llamado Methods and apparatus for computing graph similarity via sequence similarity con el que pretende encontrar incongruencias, ramas duplicadas del … Leer más

Categorías SEO

Sistema para detectar una plantilla web

Una forma de saber qué parte de un sitio web es importante y qué parte es común al resto de páginas del sitio es saber qué plantilla se está utilizando. Y eso es lo que Yahoo! ha patentado en System and method for detecting a web page template. El objetivo es conseguir que un sistema de forma automática detecte qué parte de la página es una plantilla, extraer los distintos bloques de contenido y asignarle, a cada uno de los bloques un determinado peso. Los motores de búsqueda en muchas ocasiones necesitan eliminar de la ecuación la parte común de todas las páginas de un sitio para conseguir lo importante de las páginas: sus contenidos. Para ello es necesaria la extracción de aquellas partes que generan ruido, lo … Leer más

Categorías SEO

Yahoo!: navega y mejoraremos las búsquedas

Interesante propuesta la que hace Yahoo! para mejorar los resultados de búsqueda y no depender tanto de conceptos como el PageRank o de la navegación que hacen los usuarios a través de las propias páginas de resultados, y es la de usar los logs de navegación de los ISP. Antes de seguir pongámonos en antecedentes para aquellos que no tengan muy claro cómo funciona la navegación del usuario. Un usuario está en su casa delante de su navegador de Internet y con su proveedor de Internet (cable, ADSL, etc…). El proveedor lo que hace es de intermediario entre tu casa y los servidores donde se encuentran las páginas web que visitas. Por ejemplo, ahora que estás visitando javiercasares.com has de conectarte con (por ejemplo) Telefónica, que va a … Leer más

Categorías SEO

Google y el SEO de tus sitios favoritos

Cuando en SEO se habla de enlaces nos olvidamos de un tipo de enlaces muy importantes pero a la vez muy complejos de que Google o Bing los acaben encontrado: los que tenemos en nuestra lista de marcadores favoritos del navegador. Pues ahora Google se ha hecho con una patente que permite indexar este tipo de información y usarla. La situación es que normalmente nos guardamos en nuestra lista de «favoritos» aquellas páginas que visitamos mucho o que nos son complejas de encontrar y por tanto nos las guardamos. Sin duda estas direcciones URL son de un valor, ya que sin duda son las más importantes para cada uno de nosotros. Y ahí es donde Google quiere llegar. Hasta hace un tiempo si querías tener tus marcadores en … Leer más

Categorías SEO

Yahoo!, singular y plural

Si ayer comentaba que hay patentes que te llegan a sobre coger por lo amplias que pueden ser, a veces otras te sorprenden por lo sencillas y efectivas que son. Y este es el caso que ha patentado Yahoo!, un sistema que busca palabras en singular y/o plural y reconstruye la consulta de búsqueda para tener mejores resultados. La patente llamada Word pluralization handling in query for web search básicamente lo que hace es analizar la consulta de búsqueda, buscar aquellos conceptos que tengan un equivalente en singular o plural (dependiendo del caso) y reconstruye la consulta y es la que se ejecuta, de forma transparente para el usuario. Para esto se usaría un diccionario de palabras relacionadas basadas en las consultas anteriores de muchos usuarios. Como curiosidad, … Leer más

Categorías SEO

Google patenta la interfaz de resultados para productos

Sin duda las cosas que se pueden patentar son bastante impresionantes, y la que ha patentado Google me parece sorprendente ya que es algo bastante estándar en muchos motores de búsqueda y esto puede llevar consecuencias en cuanto a cambios de interfaz en algunos de estos sitios con tal de no tener que pagar al buscador de Mountain View. En esta ocasión, y basándose en Froogle (lo que actualmente conocemos como Google Product Search), Google ha conseguido la patente llamada Method and apparatus for output of search results en la que se explica cómo se muestran los resultados (en modo lista y modo parrilla) de un buscador que devuelve resultados de tipo «producto». In another embodiment, the user may even be able to customize an output format. For … Leer más

Categorías SEO

Tiempo de carga de una web

En SEO y WPO hay muchas cifras a tratar. Como expliqué en el artículo que comparaba el WPO con la Fórmula 1 la cosa va de décimas, pero… ¿cuáles son las décimas que importan? En los paneles de Google Webmaster Tools tenemos muchas cifras relacionados con tiempos, y estas cifras significan muchas cosas distintas. Voy a ver si soy capaz de explicar cada una de ellas. Una de las primeras gráficas que tenemos es la de «Rendimiento del Sitio»: Esta gráfica lo que muestra es el tiempo de carga de la página, desde que se descarga el primer byte hasta que se descarga el último, incluyendo la descarga del HTML y de todos los ficheros relacionados (CSS, JavaScript, imágenes, publicidad, etc…). Como digo es el tiempo desde que … Leer más

Categorías WPO

WordCamp Sevilla 2011

Hace más de 6 años que utilizo WordPress… concretamente desde la versión 1.5 cuando lancé OJObuscador allá por mediados de junio de 2005. Había utilizado muchos CMS, pero desde aquel momento todos los proyectos que he tenido que lanzar (sin contar los de desarrollo propio) han sido lanzados con WordPress. Ahora que WordCamp vuelve a España he creído conveniente devolver un par de trucos a la comunidad… además ambos van relacionado con temas que me gustan, como son el WPO y el SEO, por lo que todo perfecto. Los próximos 8 y 9 de Octubre estaré por Sevilla. Las charlas son las siguientes: WordPress y Google Panda: La idea es comentar algunas cosas que WordPress no acaba de hacer correctamente y que a Google no les gusta, pero … Leer más

Futurama: Best Episode Ever

Sabéis que soy muy fan de Futurama, y sin duda en muchas ocasiones me veo más que reflejado en Fry (aunque no por su vida familiar precisamente), alguien del año 2000 que aparece en el año 3000. Os he explicado porqué uno ha de hacer lo que debe hacer, os enseñé cuando Futurama podría ser de Marvel, o si fuera la misma serie que Los Simpson, incluso si se hiciera realidad.

En la temporada 6 episodio 24 tenemos una grata sorpresa. No voy a desvelar nada de las tramas, que son bastante alocadas, pero sí os voy a decir que son 3 episodios en uno. El primero es de los «años 30» a lo Mickey Mouse, el segundo es simplemente un videojuego de 8bits y el último una serie japonesa rollo Transformers.

Honda S-Wing

Hace una semana y poco me compré una Honda S-Wing. Desde hace ya bastante (mayo de 2005) que tenía una Honda SH125i. La verdad es que necesitaba ya un cambio de aires, que tras 6 años y más de 56.000 kilómetros la pobre se estaba quedando muy mayor. Lo primero que hice nada más subirme a ella fue dirigirme a llenarle el depósito (en el que cabe unos 3 libros más que en la otra) y acto seguido a hacer unos pocos kilómetros por una carretera con curvas (Carretera de la Conrería) y volver por otra carretera más normal, aunque también con algunas curvas (Carretera de La Roca). La idea era hacer una buena toma de contacto y acostumbrarme rápidamente al sistema de frenado, a «tumbarla» y, en … Leer más