Evita que te roben el contenido los «scrapers»

web scraping

Un scraper es un sitio, creado para obtener dinero por Adsense y demás sistemas de publicidad contextual, que muestra contenido de otras webs en un marco de su propia web, para obtener beneficios económicos en base al contenido generado por otros.

Esta práctica no solo es despreciable en el aspecto de que otros se beneficien económicamente con tu contenido, sin permiso, sino que incluso puede penalizarte por contenido duplicado, ahí es nada.

Ni siquiera Google garantiza poder discriminar a los scrapers de los generadores de contenido original, así que lo que podemos hacer es evitar que se muestre tu contenido en un marco (frame), y que tus publicaciones solo se publiquen en tu web o blog.

Para conseguirlo, George Notaras ha creado un código que puedes añadir a tu plugin de funciones o al archivo functions.php de tu tema, este:

// Evitar scrapers
function rompe_frames() {
	if (!is_preview()) {
		echo "\n<script type=\"text/javascript\">";
		echo "\n<!--";
		echo "\nif (parent.frames.length > 0) { parent.location.href = location.href; }";
		echo "\n-->";
		echo "\n</script>\n\n";
	}
}
add_action('wp_head', 'rompe_frames');

Lo que hace este código es añadir a la cabecera de tu WordPress la instrucción de que rompa los «frames«, para que tu contenido solo se muestre en tu web o blog.

Solo una pega, y es que este código, con algunos navegadores, es incompatible con la vista previa de WordPress, tenlo en cuenta si ves (o casi mejor no ves) vistas previas de tus entradas.

VALORA Y COMPARTE ESTE ARTÍCULO PARA MEJORAR LA CALIDAD DEL BLOG…
(0 votos, promedio: 0)

¿Te gustó este artículo? ¡Ni te imaginas lo que te estás perdiendo en YouTube!

AVISO: Esta publicación es de hace 3 años o más. Si es un código o un plugin podría no funcionar en las últimas versiones de WordPress, y si es una noticia podría estar ya obsoleta. Luego no digas que no te hemos avisado.

10 comentarios en “Evita que te roben el contenido los «scrapers»”

  1. Voy a utilizarlo hoy, creo que si me va a servir suerte a todos los usuarios de wordpress y gracias a Fernando por compartir este tipo de contenidos…

  2. Ami me han hecho eso en mi foro me di cuenta cuando vi una web con un nombre que no tenia nada que ver con la mia websitedignservices o algo asi.

    Lo que hice fue crear una carpeta /hide con un archivo dentro de guardase la ip de quien entrase y accedi a la web websiteblablabla/hide y coji su IP y la banee desde .htaccess

    Solo pude hacerlo asi ya que el muy listo usaba cloudflare y era imposible ver su ip real.

    Despues hice un tutorial y lo comparti en forobeta.

    El script que usaba dicha web sustituía el nombre de la mía por el suyo en todos los sitios, francamente estaba muy bien hecho.

  3. Sinceramente ningún scraper con dos dedos de frente copiaría código javascript a la hora de sacar contenido de otra web, con simplemente poner: $content = strip_tags($content, ETIQUETAS_QUE_DESEAMOS_QUE_SI_APAREZCAN);

    Lamentablemente he sufrido el scrapeo de contenido durante mucho tiempo :(, y sigo sin encontrar la solución idónea, si alguien tiene alguna lo agradecería.

    1. Pero es que ya presupones que tengan 2 dedos de frente, hay gente que usa scripts perrunos que pilla por ahí y tira. Para esos vale.

      Para otros hay más trucos, cómo la restricción por IP o dominio desde htaccess. No hay nada infalible, pues lo que vale para unos no sirve para otros, no digamos con el hotlinking.

      A mi me copian a diario cientos de sitios, bloqueo los que puedo pero es verdad que es cansino.

  4. Hola,

    Interesante información.

    Una pregunta. Hay sitios que publican contenido directamente obtenido del feed. Eso quiere decir que se publica nada más ser escrito en la página original.

    Por lo que comentas, esto sirve para cuando tu contenido se está mostrando en un frame, pero si no es así? Porque normalmente las páginas que copian mi contenido no contienen frames, sino que usan el plugin para obtener contenido de otros feeds y publicarlos.

    Hay alguna otra solución para el caso en el que no usen Frames?

    Gracias y un saludo!

  5. Hola Fernando,

    Sigo tus posts todos los días desde hace algún tiempo. La información es muy útil e interesante aunque no soy programador. La tardía de este comentario es debido ha que no vi el artículo en su día.

    ¿En este articulo te refieres a páginas que copian tu articulo sin más y hacen la información suya si referencia a su origen o incluyes también las plataformas con formato revista donde incluyen la publicaciones de tus posts pero que lector tiene un link a tu pagina donde puede ver mas contenidos tuyos?
    Lo digo por que la segunda opción también tiene el efecto de traer tráfico a tu página.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

 

Ir arriba Ir al contenido