Sitios que “roban” contenidos

Hace ya un tiempo comenté los problemas que tenía con contenidos duplicados por utilizar Feedburner y la imposibilidad de filtrarlos, y que de ahí comencé a utilizar el plugin de WordPress llamado ©Feed.

La cuestión es que después d un tiempo, tengo una pequeña lista de IP de servicios de esos que almacenan una copia de los contenidos de los feeds para mostrarlos en su sitio web, lo que podría llegar a afectar a la multiplicidad de nuestros contenidos por la red sin que sea una simple mención, sino copia.

ServicioDirección IP ServicioDirección IP
Wikio84.55.184.93Blodico / DigestServices67.212.188.186
Feedshow88.191.13.89Feedage64.34.174.17
UrlFan70.165.48.167MobiType91.121.143.209
Notifixious75.101.147.247Tecnomeme / Webremix64.13.192.34
WASALive88.191.36.95Toluu67.228.53.210
Blogged74.54.159.180flitic78.129.128.90
Hedatu84.20.10.71Portal-seo80.33.138.93
Rssindicato92.243.2.141Multiplica81.19.100.35
Iluminatia69.16.236.104Planet Google64.111.122.23
Xgil66.232.112.166Newsbeet216.86.147.191
Planetaki67.207.138.103WASALive91.121.94.113
Keegy74.52.131.116Dilo Ya!82.146.52.192
Linkandoo91.200.140.50Limlom64.62.174.98
BlogDimension85.31.105.37Blogtok67.43.168.85
DigestServices72.232.181.242UrlFan207.88.140.130
UrlFan70.165.48.162Personalbee67.111.14.203
Jordo Media216.227.208.228Feeddigest75.126.158.42
mytalk.at / Personalbee67.111.14.202RSSmicro209.216.63.55
Newstin195.39.35.193iPlural67.205.3.218
ElPelao67.111.14.204telefonos-moviles.net77.232.72.161
Cognomarket212.227.114.90Fooglesfunny202.106.63.4

La lista de IP y servicios ha sido extraida de una mezcla de blogs que controlo y en los que está el plugin que comentaba, por lo que he podido sacar las direcciones e investigar un poco.

Que conste que hay más sitios que roban contenidos, pero lo hacen a través de otros servicios que, lógicamente, por la repercusión que tienen en lectores reales, no he añadido a la lista…

12 comentarios en “Sitios que “roban” contenidos”

  1. Si está accesible, y veo contenidos míos que se utilizan sin permiso, sí, es robar contenidos…

    Además, como he comentado, todo está verificado en base a que los sitios que pongo usan los contenidos de los feeds y una clave única que hay en ellos… de forma que es fácil detectar si los usan o no…

    Responder
  2. Hombre está accesible porque es una herramienta de suscripción con vista pública. Y si ves tus contenidos, es porque alguien ha decidido que son interesantes y quiere compartir tu feed junto a un conjunto de feeds de temática probablemente similar.

    Si se indica con claridad cual es la fuente no creo que se deba utilizar la palabra «robar», quizás sindicar, referenciar, etc sería más correcto. Siempre se indica quien es el autor, y no hay intención de usurpación de identidad ni apropiación de ideas, puesto que no hay información personal sobre el creador de una cuenta de planetaki. Cuando alguien me referencia de alguna manera, identificando mis feeds o artículos en concreto entiendo que es una muestra de reconocimiento. Hacer copy&paste de un artículo si citar autor ni URL orginal sí es robar.

    Siguiendo tu punto de vista, ¿servicios como technoratti, o los «shared items» de Google reader también roban el contenido?.

    En cualquier caso, si lo que te preocupa es tener menos páginas vistas o que tus contenidos aparezcan duplicados en otras URLs pero no quieres renunciar a un atom o rss, sólo tienes que hacer que tus feeds sean un resumen del contenido original. ¿No te parece?…

    Responder
  3. Yo no tengo ningún problema en sindicar contenidos, siempre y cuando se hagan para uso personal… lo que no me parece correcto es que yo (o alguno de mis sitios) acaben sufriendo penalizaciones por los buscadores debido a que aparecen referenciados (aunque tengan enlaces) en otros sitios.

    Lógicamente, no digo que sea robar, sino «robar», de ahí que en el título haya puesto entrecomillada la palabra.

    Efectivamente, servicios como Technorati antiguamente no mostraban los contenidos, ya que ejercía de buscador, pero ahora sí que lo hace… con una diferencia: se sabe que Technorati es un buscador.

    El caso de los Elementos Compartidos en Google Reader, es más de lo mismo… una cosa es que se utilicen para la lectura personal, y otra es para que «otros sitios» hagan uso comercial de ellos…

    Esto es como la piratería… yo no tengo problema en que cualquiera lea y opine sobre lo que publico… lo que no me gusta es que algunos hagan usos «extraños» de mis cosas, sobretodo si no han pedido permiso…

    Además, la idea, simplemente, es, al dar esa lista de IP, que con el software que comento simplemente a esas empresas o sitios no se les ofrezcan los contenidos… porque, si lo quieren usar para leerlo, lo pueden hacer en un lector de feeds tanto de escritorio como web (no público), y lo que si que no permito es que nadie distribuya mis contenidos sin permiso para un beneficio propio.

    Responder
  4. Si no niego que sea un producto personal ni nada… sólo digo que esto en estos momentos está indexable y contiene un artículo completo.

    Y, como se puede comprobar, está indexable por Google

    Eso, y a mi me da igual quién lo diga o no, perjudica a los autores originales, por mucho enlace que haya, ya que, vuelvo a repetir, es contenido completo que hay en otros sitios que no es el original… y no es cita, sino copia… que, como digo, no hay problema en citar o en usar el feed para que se lea de forma personal, pero eso ya está expuesto al público, y ya se convierte en eso, en público y accesible por todos los robots…

    Que conste que no digo que el portal sea malo o haga cosas que no debe… sólo digo que eso se «copia y pega» literalmente y no es una simple mención.

    Y como digo, no hay problema… ahora que está «filtrado» (entre comillas) se ha convertido en mención, ya que el servicio, como se puede ver en los últimos artículos que tiene ese usuario simplemente enlaza al contenido original…

    Responder
  5. Hola Javier,

    Planetaki es un servicio personal. Los usuarios deciden que fuentes de información incluyen en su planeta y eligen si sea público o privado. Siempre enseña la fuente de la información tanto en la web, como en los feeds, y si miras el robots.txt (como SEO esto debes de haber hecho) verás que indicamos a los buscadores que no indexen *nada* con enlaces permanentes, con lo cual, es imposible que haya información duplicada.

    De todas formas, no tenemos problema en quitar cualquier contenido que te perece «robado», son tus lectores y estas libre hacerles la vida más difícil. Nosotros no queremos problemas por falta de comprensión del servicio. Envíanos un listado de la información duplicado y haremos lo posible para quitarlo.

    Sam

    Responder
  6. Javier, reconozco nuestro fallo, es cierto que no había dado cuenta que hemos cambiado algunas rutas últimamente y el robots.txt estaba des-actualizado. Desde ahora ya esta arreglado, y los indexadores no deben de coger esas páginas internas. Pido disculpas de mi parte por no haber dado cuenta de esto antes. En unos días la información desaparecerá, borramos las entradas de más de 7 días de antigüedad y siempre mientras no están en la fuente.

    Sin embargo, me gustaría reiterar lo que ha mencionado Agustín, si estas preocupado de que hayan copias de tu material no debes de introducirlo en un formato fácil de copiar como el RSS. Además, está muy claro que esto no es un caso de «copiar y pegar», dado que en todo momento la información viene asociado con su fuente tanto con los enlaces originales como el avatar personalizado y enlace al fuente. Sinceramente, no creo que google va a tener problemas con eso.

    Me da pena que has decido optar por un «filtrado» de ese estilo. A final, son tus lectores los que se ven afectados y estás perdiendo una forma muy buena de atraer visitas. Te recomiendo que hechas un vistazo al Creative Commons.

    Sam

    Responder
  7. Ya Javier, ya me imagino que no es oro todo lo que reluce pero, en todo caso, creo, esa discusion ya deberia ser resuelta con Google no con los de planetaki

    Yo no quiero formar con ninguna de las dos partes pero creo que es bueno para todos aclarar las cosas en la fuente del problema (en ese caso Google, mas bien) que limitar a otros cuando estas haciendo publica esa informacion

    Cuando publicas algo en tu weblog lo haces bajo una licencia (licencia tambien es cuando se hace totalmente publico, no solo todos los derechos protegidos que seria el otro extremo), eso deberia ir a misa pues es tu decision expresada tambien de forma publica

    Pero una vez respetado esto, si el problema es los contenidos duplicados y ese problema viene producido desde Google (igual no es el caso exactamente, no me he parado a
    estudiarlo con detalle) no hay mas que indicarlo y seguramente la voz correra tanto como para que llegue al blog donde se hace la afirmacion incorrecta (en este caso el blog para webmasters de la propia Google, que para eso esta)

    Con tu reputacion en internet (que se que estudiais ese tipo de cosas) creo que no te sera muy dificil aclarar este asunto con los verdaderos generadores de problemas y no con otra victima como tu como son los de Planetaki

    Yo te he visto personalmente una vez y ninguna a los de planetaki con lo que mi posicion en este caso no tienen nada que ver con ningun tipo de favoritismo, solo intento usar el sentido comun para resolver una disputa

    Que el sentido comun no siempre es aplicable esta claro, pero tampoco creo que sea la solucion tirarse los platos a la cabeza con alguien que sufre igual que todos de los mismo problemas

    Estoy absolutamente convencido que atacando este problema en su raiz saldras beneficiado tu (que es lo que se pretende con este post, arreglar un desaguisado) pero tambien saldremos beneficiados todos (pues a todos nos afecta que las reglas de posicionamiento vayan cambiando o no se ajusten a lo comunicado)

    Con todo, comparto tu frustracion con este tipo de asuntos que a TODOS (si yo tambien he tenido este problema apesar de ser muchisimo menos conocido que tu) nos han copiado sin indicar la fuente seamos del tamaño (en reputacion internetera) que seamos

    Espero que podais aclarar esto de la forma mas amistosa posible pues este mundo ya suficientemente chungo sin este tipo de sucesos

    Responder
  8. Estoy de acuerdo contigo Javier, Google puede decir misa, pero tengo clarísimo que de mis blogs, los que peor se comportan son precisamente los que más ‘robos’ de contenidos tienen.

    Y colocar un resumen del Feed no es una solución válida. Para los que utilizan un lector de Feeds, obtener solo un resumen es darles un mal servicio. Vamos que muchos de ellos se dan de baja si esto ocurrre.

    Responder
  9. Je, je, pues el primero que «roba» contenidos, no sólo a ti, y ya lo creo que hace negocio con ello, es San Google. De todas formas no te preocupes demasiado por la supuesta penalización porque no es tal. Más bien va a ser al contrario y a mi no me molesta en absoluto que hagan éso con el contenido que yo produzca máxime si me enlazan y/o me nombran. Vamos, que lo que reclamas es tu pequeña porción del pastel o sino que no gane nadie.

    De todas formas si tan afectado estás lo que deberías hacer, ya que sabes quienes son y te has molestado en nombrarlos públicamente, lo cual no me parece mal, envías un email (con uno sólo basta) a todos ellos para que no te «roben» más contenido.

    Responder

Deja un comentario