Oferta SiteGround Black Friday

Como evitar el indexado de archivos PDF (SEO)

Son muchas las situaciones por las que una web ofrece archivos PDF en sus páginas o productos, ya sean informes, catálogos o simplemente guías descargables, para uso y disfrute de sus usuarios.

Ahora bien, puede que no quieras que los archivos PDF sean indexados por los motores de búsqueda y aparezcan en las SERP, y prefieras que se indexen tus otros contenidos en vez de los archivos en sí.

Si es tu caso, y no quieres que tus archivos PDF aparezcan en los resultados de los buscadores, tienes 2 maneras de conseguirlo…

No indexar los archivos PDF desde el archivo robots.txt

El primer método, muy sencillo, es añadir una directriz al archivo robots.txt de que no se indexen los archivos PDF.

Para ello, localiza el archivo robots.txt, que normalmente estará en la carpeta raíz de tu instalación, para editarlo y añadirle esta línea:

Disallow: /*.pdf$

Normalmente, un archivo robots.txt por defecto de WordPress sería así:

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Sitemap: https://ayudawp.com/wp-sitemap.xml

Y, tras añadir la línea, debería quedar así:

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php
Disallow: /*.pdf$
Sitemap: https://ayudawp.com/wp-sitemap.xml

Si no existiese el archivo es posible que sea debido a que tengas un archivo robots.txt virtual, en cuyo caso deberías crearlo manualmente.

Ahora bien, debes saber que no todos los motores de búsqueda harán caso a esta instrucción, Google sí, pero no es seguro que lo hagan todos, así que igual tienes que optar por la segunda opción…

No indexar los archivos PDF usando la etiqueta X-Robots

El método más efectivo para que no se indexen tus archivos PDF es añadir una etiqueta X-Robots a las cabeceras de todas las páginas de tu web. Para ello debes añadir lo siguiente al archivo .htaccess de tu instalación en un servidor Apache:

<Files ~ "\.pdf$">
Header set X-Robots-Tag "noindex, nofollow"
</Files>

En caso de que tu servidor sea NGINX, entonces debes añadir al archivo nginx.conf lo siguiente:

location ~* \.pdf$ 
{
add_header X-Robots-Tag "noindex, nofollow";
}

Guarda los cambios en el archivo que hayas modificado y se añadirá la etiqueta X-Robots a la cabecera de toda tu web, indicando a los bots de los buscadores que no indexen ni sigan los archivos PDF.

¿De cuánta utilidad te ha parecido este contenido?

¡Haz clic en los emoticonos para valorarlo!

Promedio de puntuación 4.9 / 5. Total de votos: 8

Hasta ahora ¡no hay votos!. Sé el primero en valorar este contenido.

Ya que has encontrado útil este contenido...

¡Sígueme en las redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Ayúdame a mejorar este contenido!

Por favor, dime, ¿cómo puedo mejorarlo?

¿Te gustó este artículo? ¡Ni te imaginas lo que te estás perdiendo en YouTube!

Sobre el autor

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Información base sobre privacidad:
- Responsable: Fernando Tellado ([email protected])
- Fin del tratamiento: Moderación de comentarios para evitar spam
- Legitimación: Tu consentimiento
- Comunicación de los datos: No se comunicarán los datos a terceros salvo por obligación legal
- Derechos: Acceso, rectificación, portabilidad, olvido

 

Scroll al inicio