Cada vez es mas corriente, lamentablemente, el robo de contenido en la red. En muchos casos provienen de los Splogs ((Falsos blogs. Blogs que roban contenido de otros con el único objetivo de atraer visitas y conseguir ingresos mediante publicidad)), y cuando además realizan Hotlinking ((Utilizar los enlaces del sitio original, con lo que además están consumiendo ancho de banda del propietario del contenido)) se convierte en un problema que hay que atajar.
En Ayuda WordPress durante mucho tiempo hemos tratado de no poner cortapisas al robo de contenido sino tratar de «educar» a aquel que localizáramos. Pero tras muchas infructuosas comunicaciones, en las que encima recibíamos insultos como respuesta, hemos empezado a atajar este problema y, como es costumbre de la casa, vamos a compartir todos los métodos para detectar y evitar el robo de contenido y el hotlinking.
Índice de contenidos
1. ¿Como Detectar el robo de contenido?
Incluir enlaces a posts propios
Una de las maneras mas sencillas de evitar el robo de contenido, o que al menos te sirva para algo y de paso te enteres por las referencias, es enlazarte a ti mismo en tus artículos. Puedes hacerlo de varias maneras, bien manualmente, enlazando texto de tu artículo a posts relacionados con el mismo o enlazando palabras clave a tags de tu blog mediante la utilidad incluida en el plugin Simple Tags, que lo hace automáticamente sin que pierdas tiempo en ello.
Eso si, pon los enlaces absolutos, del tipo http://tublog.com/mi-post/
no relativos del tipo /mi-post/
. Te van a llegar trackbacks de tu propio blog pero te servira para detectar a quien te roba los posts y de paso recibir visitantes del Splog que busquen contenido original.
Enlazar tus imágenes
Un método sencillo de detectar el robo de contenido es dejar activa la opción que WordPress tiene por defecto de que las imágenes se enlacen a si mismas. De este modo te llegarán los trackbacks y sabrás quien te está haciendo hotlinking o robo de contenido completo. De paso, también consigues enlaces externos a tu sitio, aunque sea a las imágenes. Por supuesto, también puedes cambiar este comportamiento y tomar la costumbre de que las imágenes de tus posts enlacen a la URL del post en el que están incluidas, mucho mas eficiente si cabe.
Copyscape
Copyscape es un servicio online que permite buscar contenido de nuestro blog y localizar donde aparece. Es un motor de búsqueda especializado que, en su versión gratuita, ofrece un banner que colocar en nuestro blog para «asustar» a posibles sploggers. También disponen de versiones Premium y Copysentry para automatizar este tipo de búsquedas e incluso gestionar los casos de plagio que encuentres.
Pingbacks y Trackbacks
Revisa a diario los enlaces entrantes a tu blog en el Escritorio de WordPress. De este modo encontrarás no solo a blogs que enlazan a tus artículos, a los que por supuesto deberás visitar y agradecerles el detalle, sino también a aquellos que están haciendo uso de tu contenido de algún modo.
2. ¿Como evitar el robo de contenido?
Cortar el Feed RSS
Ya hemos visto en otro artículo que hay sistemas para crear posts de los feeds de un blog, con herramientas que extraen el contenido de modo automático. Pues bien, muchos Splogs están creados con estas aplicaciones o plugins.
Aunque hay muchos detractores al respecto, yo incluido, pues con esta técnica en cierto modo traicionas el objetivo de los feeds: leer en tu lector de feeds o email el contenido de un blog al que has decidido suscribirte, puede ser una solución (radical) para evitar el robo de contenido o que, al menos, te revierta visitas. Esto es así porque en el blog ladrón solo se verá el extracto de tus posts y para verlos completos habrá que hacer clic irremediablemente al enlace original de tu blog.
Añadir contenido dinámico al Feed RSS
Como hemos explicado antes, uno de los mayores cánceres actualmente son los sistemas automáticos de robo de contenido de los feeds RSS. Afortunadamente también hay utilidades para añadir contenido que, al menos, muestre de algún modo el sitio original del contenido.
Cortar tus posts en varias páginas
Además de generar mas impresiones de página en tu propio blog, si escribes un artículo largo es buena costumbre insertar el código <!–nextpage–> de modo que para leerlo completo haya que hacer clic en un enlace, el cual ya lleva a tu blog y el artículo original.
Utilizar Feedflares en tu RSS
Si utilizas Feedburner para gestionar tu feed RSS hay una función muy interesante que, aparte de añadir interactividad a tus posts, puede servir para que, cuando roben tu contenido de los feeds se muestre también algún enlace que identifique el sitio original, los feedflares. Son enlaces que puedes añadir al final de tus feeds para socializar tus posts, añadir copyright o un enlace al post original. Tienes una muestra en nuestro feed RSS, son los enlaces al final de cada post que te muestran el autor del artículo y un enlace al artículo original.
Usar servidores externos para alojar las imágenes
Parece obvio pero huelga decir que si alojas tus imágenes en sitios externos como Flickr o Imageshack no te va a afectar el hotlinking en cuanto al consumo de ancho de banda. Eso si, pierdes la pista en gran medida de quien te está robando contenido.
AntiLeech
AntiLeech es un plugin para WordPress que genera contenido «especial» para los splogs de modo que ofrezcas enlaces de vuelta a tu propio blog. Para ello defines una serie de cadenas de IPs y/o agentes de manera que cuando una IP o sitio sospechoso visite tu blog obtenga una visión falsa del mismo y no pueda robarte el contenido. Sin embargo, los visitantes no bloqueados verán tu blog normalmente.
WP-Ban
WP Ban es otro plugin para WordPress, de mi querido Lester Chan, que permite banear por IP, rango de IP o nombre de dominio a visitantes indeseados. Sencillo de utilizar y muy recomendable.
HTACCESS
Como no podía ser de otro modo, también el fichero .htaccess puede ayudarnos a evitar el robo de contenido de maneras muy eficientes. Vamos a ver como hacerlo.
1. Evitar Robo de Contenido con .htaccess
Editaremos el fichero .htaccess, o lo creamos si no existiera, y le añadiremos las siguientes líneas …
- Baneo por IP
#BEGIN BANEO POR IP order allow,deny deny from 69.77.188.231 allow from all #END USER IP BANNING
Debes, por supuesto, sustituir la IP de muestra (69.77.188.231) por la IP del splogger, o añadir tantas como necesites.
- Baneo por Dominio
#BEGIN SITE REFERRER BANNING RewriteEngine on # Options +FollowSymlinks RewriteCond %{HTTP_REFERER} splogger\.com [NC] RewriteRule .* - [F] #END SITE REFERRER BANNING
Donde sustituirás ‘splogger’ por el nombre de dominio del ladrón de contenido.
2. Evitar Hotlinking con .htaccess
También podemos evitar el robo de imágenes y ancho de banda con el fichero .htaccess. Tenemos dos opciones principales:
- Sin imágen alternativa: Añadiendo estas líneas a nuestro .htaccess evitamos que nuestras imágenes sean robadas y nos consuman ancho de banda.
#BEGIN EVITAR HOTLINKING RewriteEngine on # Options +FollowSymlinks RewriteCond %{HTTP_REFERER} !^$ RewriteCond %{HTTP_REFERER} !^http://(www\.)?tudominio.com/.*$ [NC] RewriteCond %{HTTP_REFERER} !^http://(www\.)?feedburner.com/.*$ [NC] RewriteCond %{HTTP_REFERER} !^http://(www\.)?google.com/.*$ [NC] RewriteCond %{HTTP_REFERER} !^http://(www\.)?bloglines.com/.*$ [NC] RewriteCond %{HTTP_REFERER} !^http://(www\.)?netvibes.com/.*$ [NC] RewriteCond %{HTTP_REFERER} !^http://(www\.)?dominioamigo.com/.*$ [NC] RewriteRule \.(gif|jpg|jpeg|png|js|zip|css)$ - [F,NC,L] #END EVITAR HOTLINKING
Las primeras líneas están diciendo que dominios SI permites mostrar tus imágenes. Como ves, el primero, imprescindible, es el tuyo (tanto si lleva www como si no), y luego puedes ir añadiendo tantas líneas como dominios de confianza quieras permitir que muestren tus imágenes.
La última línea es donde indicamos que tipos de archivo no se verán en el Splog, pudiendo añadir las que utilices habitualmente en tu blog.
- Con imágen alternativa: Con este método no evitamos el consumo de ancho de banda (aunque también podemos alojar la imágen en un servidor externo) pero es mucho mas «convincente» pues los lectores del Splog sabrán que el susodicho sitio es un ladrón de contenido. La idea es que generes una imágen como la que tenemos nosotros y se muestre en vez de las originales de tus artículos.
#BEGIN EVITAR HOTLINKING RewriteEngine on # Options +FollowSymlinks RewriteCond %{HTTP_REFERER} !^$ RewriteCond %{HTTP_REFERER} !^http://(www\.)?tudominio.com/.*$ [NC] RewriteCond %{HTTP_REFERER} !^http://(www\.)?feedburner.com/.*$ [NC] RewriteCond %{HTTP_REFERER} !^http://(www\.)?google.com/.*$ [NC] RewriteCond %{HTTP_REFERER} !^http://(www\.)?bloglines.com/.*$ [NC] RewriteCond %{HTTP_REFERER} !^http://(www\.)?netvibes.com/.*$ [NC] RewriteCond %{HTTP_REFERER} !^http://(www\.)?dominioamigo.com/.*$ [NC] RewriteRule \.(gif|jpg|jpeg|png|js|zip|css)$ http://tudominio.com/imagenes/no-hotlinking.jpe [R,NC,L] #END EVITAR HOTLINKING
Aquí, partiendo del mismo principio del caso anterior, cambiamos la última línea de manera que a cualquiera que trate de mostrar tus ficheros (gif, jpg, jpeg, png – incluso ficheros javascript, css o zip) le aparezca nuestra imagen «personalizada» de castigo o aviso a navegantes.
NOTAS:
- Los modificadores que ves son para dar instrucciones especiales. Así ‘NC‘ indica que no distinga entre mayúsculas y minúsculas, ‘R‘ que redireccione la petición a la URL que le indicamos, ‘F‘ que se prohiba la carga de cualquier extensión que indiquemos y ‘L‘ indica que es la última regla a cumplir si se cumplen las condiciones indicadas anteriormente.
- Es importante que la extensión de la imagen alternativa sea, por ejemplo, JPE para evitar que nuestras propias reglas la bloqueen. Por supuesto puedes elegir otro formato de imagen siempre que no lo hayamos bloqueado en nuestra lista de extensiones bloqueadas con la regla aplicada.
También puedes generar fácilmente este tipo de códigos para .htaccess en esta herramienta online.
Licencias
Por supuesto, no lo evitará en la inmensa mayoría de los casos pero siempre es conveniente añadir una licencia de uso a los contenidos de nuestro blog de modo que podamos defender nuestra autoría en caso de plagio o robo.
Las mas recomendables son estas:
- Creative Commons – CC se basa en la inclusión de un icono que redirige a un texto con manifestación unilateral de cesión de derechos, coloriuris son contratos de cesión de derechos, de tal forma que los visitantes de un sitio web pueden aceptar el contrato que les propone el autor de los contenidos, quedando copia del contrato para las dos partes.
- Coloriuris – Viene a ofrecer un tipo de contrato de cesión de derechos para propietarios de blogs, páginas webs y contenidos audiovisuales. Mediante códigos de colores se puede elegir el tipo de licencia elegida que, incluido el código en tu sitio ofrece un popup con las condiciones de la misma.
Como principal diferencia parece que mientras que Creative Commons son titulares de la marca y cualquier día podrían cobrar por el “servicio”, Coloriuris cede una licencia de uso de la marca y garantía de que siempre será gratuito. Además, Coloriuris está mejor adaptada a la legislación Española, aunque soporta otras.
Espero que todos estos consejos te sirvan de ayuda, que los guardes en tus favoritos y los difundas. Por supuesto, si discrepas, tienes algo que comentar o quieres apuntar algún sistema mas es tu turno.
¿Te gustó este artículo? ¡Ni te imaginas lo que te estás perdiendo en YouTube!
… y tras localizar el contenido plagiado viene el problema de que hacer ¿…?
Una demanda por plagio en España te puede salir un ojo de la cara en abogados.
Pero quien en la red tiene contenido tan inédito como para protegerlo… [Al menos en blogs de tecnología] casi todos "tomamos" algo de alguna parte.
La parte de del consumo de ancho de banda tienes toda la razón…
En lo personal me da igual si toman lo que escribo en mi blog, se supone que lo escribo para que todos puedan leerlo y si les sirve pues usarlo [Claro con sus respectivos créditos].
Y tal como dice "noshadow" y luego de saber que te "plagian" ¿que hacemos?
Saludos!!!
PD: Soy fan de tu blog 😛
Pingback: mueveme.es
Linda guía, está bien completa.
Te hago una consulta, ¿hay alguna manera de permitir via htaccess a todos los dominios de Google? me refiero al .com, .ar, .es, etc, todo esto sin tener que ponerlos uno por línea, obvio =P
@noshadow y Seraphinux: lean la página 2
Argg, en eso mismo ando yo. Cada día meto uno 😀
De momento los tengo uno a uno, y todavía me faltan. Ahora que me acuerdo me falta el de México
Uh, es una cosa de locos poner uno por uno :S
Solo para reportar que las imágenes de la caché de google no se muestran si no la imagen que pusiste para prevenir hotlinking.
Gracias Moises, aunque a Google si que le abrí la puerta.
Y qué es exactamente "robar" contenido? Me parece que yo lo hago, pero, para qué publicamos en internet? Todo el que lea mi blog, además de encontrar cosas que publico, quiero compartir, etc, pues busco información, la copio y la pego (hago alusión siempre a las fuentes) no por no crear algo de mi cosecha, o por conseguir más visitas, sino porque a veces encuentro cosas que me resultan muy interesantes y creo que, cuanto más se difundan, mejor. El último post es sobre cetrería, que me encanta y conozco bastante del tema, pero he encontrado una historia conmovedora que, según mi criterio, sería interesante que conociese más gente, no sólo la que acuda a cetrería.com, que serán búsquedas concretas, sino gente que puede ampliar miras con este tipo de artículos al igual que hago yo al leer a otros.
Saludos
En mi opinión, y creo que la de muchos, es de buena educación al menos, no está de mas citar la fuente de donde lo has sacado, es solo eso, y por supuesto no usar sus imágenes alojadas en su servidor. Te las descargas y las alojas en tu servidor o pones otras. Es solo eso.
Piensa al contrario, que tu escribas algo muy interesante, que te haya costado mucho trabajo desarrollarlo y alguien lo publique como si lo hubiera escrito el, sin siquiera citarte a ti como creador del currazo que te pegaste ¿a que jodería un poco?. Pues es aplicarse ese cuento. 🙂
Tienes razón Fernando, pero pocos hacen esos curros jeje.
Aun asi buena información.
Claro, es de un mínimo de educación citar las fuentes, eso ya lo hago, pero personalmente no publicaría una tesis en un blog, y si lo hago, ten por seguro que tendrá copyright para reclamar la autoría, si es que me interesa hacerlo, porque para que lo lean los demás no tengo ningún problema, por eso lo publico. En cualquier caso entiendo tu postura…
Hola Buenas Noches… tengo una pregunta acerca de este tema tan interesante… me gustaria saber si existe un tipo digamos de script que permita no poder copiar un video de un sitio web; conozco el de desactivar el clic derecho.. pero tengo la duda acerca de lo del video. Gracias
Gustavo, en estos días es imposible evitar eso. Todos los navegadores modernos disponen de alguna herramienta de debug que se salta cualquier restricción que pongas.
Tienes toda la razon … pero existe forma de hacerle digamos mas ficililes el copypase…. ?_?; lo digo por que conozco algunas web que tienen cierto nivel de restriccion.
Losviajeros.com un nido de contenido robado de otras webs. Cualquier dia de estos les va a caer una denunda que no veas. Tiempo al tiempo.
Esta es una temática que hemos discutido y hablado muchísimo al respecto en el colectivo Atipi.cc en canarias. Las conclusiones a las que llegamos en breve estarán publicadas en nuestra nueva web.
@Carlos Cano: Comentarios como el tuyo ayudan justamente a propagar el hotlinkin, ya que seguramente más de uno que lea este post y tu comentario ira a comprobar que aspecto tiene.
Es un tema muy controvertido que ya como dijo @Momo más arriba plantea la problemática pregunta: Y qué es exactamente “robar” contenido?
un saludo ayuda wordpress y felicidades por vuestro contenidos de calidad 😉 Aunque si se acepta la crítica constructiva las imagenes son un poco chungas…
Creo que se confunde cosas. Por un lado texto o fotos de tu autoría deberán ir acompañados de una licencia que indique, permita o restrinja su uso. Así si lo que publican en el blog tiene copyright no podrás copiarlo o tendrás que pagar. Si es cretive commons tendrás que hacer referencia o enlazar al autor si así lo indica.
Y otra cosa distinta es hacer hotlinking a una imagen alojada en su servidor propio. Eso es robar ancho de banda y tasa de transferencia de una página que paga por tener su web.
Estoy de acuerdo con el razonamiento de Fernando Tellado en el comentario del 9 Octubre 2008 a las 14:14. Yo defiendo el derecho de un autor a decidir cómo, cuándo, dónde y quién publica lo que él ha creado. En mi opinión está bien claro lo que significa "robar contenido", basta con mirar las definiciones en un diccionario y querer entenderlas. Si es muy complicado, Momo (9 Octubre 2008 a las 12:27) sustituye "contenido" por "tu comida", "tu dinero", "tu reloj", etc. Así seguro que no te caben dudas. Como dice el refrán, "no hay peor sordo que el que no quiere oir". Yo lo tengo clarísimo: el que quiera un texto, que lo escriba; el que quiera una imagen, que la cree; y más si el autor deja claro (es mi caso) que no permite a nadie, haya o no ánimo de lucro, reproducir su contenido (propiedad del autor) de ninguna forma. En mi caso yo publico mi trabajo para que la gente lo vea y, si es posible, lo disfrute; pero regalarlo, o permitir que otro lo distribuya como le venga en gana, es otra cosa diferente. A pesar de esto, hay gente con las entendederas verdaderamente cortas … cuando le interesa, claro está. Como norma general, si te plagian y puedes demostrar que tienes el contenido registrado, no te cortes, las costas de un posible juicio las paga el infractor. Denúncialo.
Respecto a duplicar contenido, veo que en este sitio hay varios artículos referentes al duplicado de contenido en el blog como algo a evitar; hay plugins, incluso, para evitarlo. Internet es igual, a mi modo de ver, que un sitio web. Es sólo un ejercicio de macrovisión y microvisión (base conceptual de la propia Internet). Mejor enlaza páginas, Momo (9 Octubre 2008 a las 12:27), no dupliques datos, eso es comprender Internet. "Querer compartir" me suena a excusa más que a razón (a no ser que compartas contenidos que hayas generado tú, claro) y, en cualquier caso, basta con un enlace a la dirección de la página que contiene la información para que el que lo vea, si le interesa, acceda a ella. Repito, eso es Internet y no creo que exista razón, por ahora, para cambiar su concepto. Por otro lado, hacer mención al autor no justifica nunca que copies/pegues y, en definitiva, te aproveches de alguna manera del trabajo de los demás. Yo creo que ya empieza a ser hora de aprender a respetar la decisión de cada uno sobre lo que es suyo ¿no?
Un saludo a todos.
a camila duarte la roban
si señor un cruce de cables, digo información, a ver si «resuena»
Un saludo