Cómo configurar correctamente el sitemap XML

Si tienes instalado algún plugin de SEO como All in one SEO Pack o Yoast SEO seguramente ya tienes un sitemap XML pero ¿lo tienes configurado correctamente? No solo hay que crear un sitemap XML de nuestra web, y añadirlo a la Search Console y a las Herramientas para Webmasters de Bing, además hay que configurarlo bien.

 

¿Qué es el Sitemap XML y para qué sirve?

sitemap-xml

Un Sitemap XML básicamente es un archivo que informa a los rastreadores de los buscadores sobre la estructura de tu web, listando todos (o parte) de las URLs existentes. Todos los bots de los buscadores usan este sitemap como guía inicial para rastrear tu web.

Un Sitemap XML puede contener información (metadatos) sobre la frecuencia de actualización de cada URL, la prioridad de la misma y, en el caso de vídeos, la duración de los contenidos.

Se pueden (y debe) crear sitemaps específicos para imágenes, vídeo y de contenido especializado para móviles. También es muy recomendable crear una versión de tu sitemap XML comprimido (gzip).

Un sitemap XML es la primera línea de ataque para el indexado en los SERP #WordPress #SEO @fernandot Click Para Twittear

Los buscadores no se guiarán exclusivamente por la información dada en el Sitemap XML pero es su primer mapa a tu web, tendrán en cuenta tus indicaciones, siempre te beneficiará y nunca te perjudicará tenerlo, eso seguro.

Así que crear un sitemap XML es la primera línea de ataque para el correcto indexado en los SERP de los buscadores, y configurarlo adecuadamente es una tarea fundamental para cualquier administrador web, pero los ajustes por defecto de los plugins son eso, por defecto, y no se adaptan a todas las webs existentes.

Si usas el plugin Yoast SEO solo puedes configurar qué tipo de contenido se añadirá al sitemap XML, sin poder determinar más ajustes importantes, así que nos concentraremos en los ajustes que sí están disponibles en All in one SEO Pack, prácticamente iguales que los que encontrarás el fantástico (pero pesado) plugin Google XML Sitemaps, que sí permiten configurar con precisión un sitemap XML.

Qué incluir en el Sitemap XML

En el sitemap debes incluir todas las URLs en las que haya contenido relacionado con la temática de tu web y que ofrezcan información única, valiosa y relevante para los lectores y, lógicamente, también para los buscadores.

elementos a incluir en sitemap xml wordpress

Así que, como regla de partida, el Sitemap XML siempre deberá incluir:

  1. La portada de tu web, lo más importante, la vía de entrada a tu sitio.
  2. Páginas: tu contenido invariable y único que te define y explica lo que eres, a qué te dedicas, qué ofreces, cuáles son tus valores.
  3. Entradas: tus publicaciones periódicas, en las que ofreces información valiosa a los visitantes de tu web sobre el contenido de tu sector o negocio.
  4. Taxonomías: aquellas que sirvan para organizar y jerarquizar tus contenidos, como etiquetas y categorías.

También, dependiendo de la orientación y segmento de tu web, el Sitemap XML puede incluir:

  1. Vídeos: indicando la duración, categoría del contenido y clasificación de audiencia.
  2. Imágenes/Adjuntos: especificando los metadatos que las identifiquen.
  3. Contenido para móviles: especialmente si ofreces páginas especiales para móviles antiguos, pero también si tienes definida una estrategia móvil precisa.
  4. Temas en los foros, si los tuvieses.
  5. Tipos de contenido personalizado, como proyectos, portafolios, etc, si son relevantes para tu temática y estrategia SEO.
  6. Archivos de autor, necesarios para los algoritmos de autoría de Google.

Adicionalmente, si hay URLs que quieres añadir al Sitemap y no las has generado con WordPress el plugin te permite añadirlas manualmente y configurar sus parámetros.

paginas añadidas sitemap xml wordpress

Qué NO incluir en el Sitemap XML

Va a depender mucho de tu estrategia de contenidos pero como regla de partida el Sitemap XML no debería incluir:

  • URLs con contenido duplicado.
  • URLs de las páginas de adjuntos generadas automáticamente por WordPress.
  • URLs de afiliación.
  • Archivos por fecha.
  • Taxonomías autogeneradas por el tema o plugins que no ofrezcan organización o jerarquía de contenidos.

Adicionalmente, también puedes excluir URLs manualmente, aunque globalmente hayas indicando que se incluyan, indicando el ID o slug de las mismas.

elementos excluidos sitemap xml wordpress

Frecuencia de actualización del Sitemap XML

Un parámetro importante, que los buscadores valorarán, será la frecuencia con que se actualizan tus URLs. Los plugins que te permiten configurar estos valores te ofrecen los siguientes valores:

  1. No sobrescribir: Con lo que se utilizarán los valores por defecto del plugin. Los ajustes por defecto suelen ser para blogs así que como norma no lo dejes nunca así.
  2. Siempre (always): Pides a los rastreadores que visiten tus URLs con la mayor frecuencia posible, cada minuto si es posible. Configuración adecuada para sitios con muchas noticias que se actualizan con muchísima frecuencia, como diarios digitales de primer orden.
  3. Cada hora (hourly): Quieres que los bots te visiten cada hora. Adecuado para sitios de noticias que publican contenido nuevo varias veces al día.
  4. Cada día (daily): Para que te visiten una vez al día, ideal para blogs que publican una entrada diaria como mucho.
  5. Cada semana (weekly): Si actualizas el blog de vez en cuando es una buena configuración.
  6. Cada mes  (monthly): Típico para webs estáticas sin sección de noticias o blog, para que los rastreadores revisen si has cambiado la información de tus páginas.
  7. Cada año (yearly): Para webs exclusivamente estáticas y páginas de aterrizaje (landing pages) que no cambian nunca, pero que quieres que Google se acuerde de que existen.

frecuencias sitemap xml wordpress

Y ahora surge la duda habitual ¿qué frecuencia le asigno a cada tipo de URL? Porque claro, uno quiere que le visiten los buscadores cuanto más mejor. Ahora bien, muchas visitas de los rastreadores no implica que te vayan a posicionar mejor en los SERPs.

Facilita la vida a los buscadores y te premiarán, complícasela y te penalizarán #WordPress #SEO @fernandot Click Para Twittear

De hecho, los algoritmos de los rastreadores podrían “pensar” que les engañas si marcas, por ejemplo, una frecuencia always y no actualizas nada de tu contenido nunca o lo haces con muy poca frecuencia.

La norma que debes aplicar siempre con los buscadores es no mentirles ni tratar de engañarles nunca porque te van a pillar sí o sí, y te penalizarán si les generas un consumo de sus recursos inadecuado al resultado que obtendrán. Google y Microsoft son empresas millonarias pero no se hicieron ricas dejándose engañar, y son muy celosos del dinero que emplean para gestionar sus herramientas.

Siempre suelo recomendar la regla universal de … “Facilita la vida a los buscadores y te premiarán, complícales la tarea y te penalizarán“.

Teniendo esto en mente, debes asignar una frecuencia adecuada a la realidad de cada tipo de URL que incluyas en el Sitemap XML, siendo sincero con tus ajustes.

No intentes engañar a Google, te pillará siempre sí o sí #WordPress #SEO @fernandot Click Para Twittear

Para un blog como Ayuda WordPress una configuración adecuada sería más o menos así:

  1. Portadaalways porque publico cada día, a veces varias veces, y en muchas ocasiones modifico títulos y extractos de las entradas, con lo que lo que aparece en portada puede cambiar. También sería válido el valor hourly.
  2. Entradashourly por el mismo motivo anterior, ya que es bastante habitual que modifique entradas una vez publicadas, para corregir errores, añadir enlaces, aportar más contenido que va surgiendo con la conversación con los lectores en los comentarios.
  3. Taxonomías: como muestran el archivo de las entradas debería ser el mismo parámetro que uses para ellas, en el ejemplo que estamos siguiendo hourly.
  4. Páginasdaily | weekly | monthly | yearly, cualquiera de estos valores, pues va a depender mucho de cada cuanto tiempo modificas la información de tus páginas. Ante la duda pon la misma frecuencia que para las entradas, aunque un valor razonable, incluso ambicioso, sería daily.
  5. Páginas de autor: la misma frecuencia que establezcas para las taxonomías, al ser un archivo de entradas.

Sobre todo ten en cuenta de qué estamos hablando, de cada cuanto se actualiza la URL, cada cuanto tiempo muestra información nueva o actualizada.

Así que debes distinguir claramente las páginas de archivo, como portada y taxonomías, de las entradas y páginas. Las primeras van a actualizarse cada vez que haya contenido nuevo, las segundas solamente cuando las modifiques independientemente. Ten esto en mente al definir las frecuencias.

Prioridades del Sitemap XML

Un parámetro de gran relevancia es la prioridad que asignemos a cada URL en nuestro Sitemap. Los ajustes disponibles vienen en formato numérico del tipo: 1.0, 0.9, 0.8, y así sucesivamente hasta 0.0, y siempre incluyen la opción No sobreescribir, para usar los valores por defecto del plugin.

Prioridades sitemap xml wordpress

Aunque el valor sea de este tipo luego se mostrará en el Sitemap XML como 100%, 90%, 80% y así sucesivamente.

Esto se traduce en que le vamos a decir a los buscadores qué valor porcentual tiene cada URL de nuestra web en el SEO de todo nuestro sitio, ahí es nada.

Vamos, que tienes que decidir qué valor tiene sobre el peso total del posicionamiento de tu web cada tipo de contenido o archivo, decisión difícil donde las haya ¿o no?

Mi consejo es que siempre, siempre, asignes el valor 1.0 (100%) a la portada, como elemento fundamental del SEO de tu web (normalmente) ya que contiene la meta title principal y la información más relevante y actualizada de tu sitio.

Para las páginas deberás aplicar el valor 9.0 (90%) pues siempre deben contener información absolutamente relevante sobre lo que eres, lo que ofreces.

Si, además, publicas entradas con contenido de valor, que uses para reforzar tu posicionamiento, les asignes también el valor 1.0 (100%) o como poco 0.9 (90%) o 0.8 (80%) ya que los buscadores se alimentan principalmente de contenido relevante y actualizado.

A partir de aquí no hay regla fija aparte de no asignar valores muy altos al resto de URLs, salvo estrategia específica sobre algún tipo de contenido (vídeo, imágenes, etc.) básicamente para que no compitan con tus principales URLs ( portada, páginas, entradas).

Básicamente, lo que le estás diciendo a Google y Bing es dónde publicas tu contenido más relevante con tu temática, nicho o negocio, y qué prefieres que posicione por delante de otras URLs en caso de dudas o necesidad de ahorro de recursos.

Más parámetros a tener en cuenta en el Sitemap XML

Adicionalmente, nuestros queridos plugins para WordPress también nos ofrecen otros parámetros interesantes a configurar, y los principales son los siguientes:

  • Crear un sitemap XML comprimido (gzip): Créalo siempre, de hecho los rastreadores los leen más rápido que los estándar.
  • Avisar a Google y Bing: Aquí el plugin lanza un ping a los rastreadores cuando se actualiza tu sitemap para que pasen a ver qué ha cambiado. Creo que huelga decir que lo actives siempre.
  • Generar el sitemap XML dinámicamente, cuando publiques contenido nuevo: ¿De verdad hace falta que te diga si hay que activarlo o no? Vale, sí.
  • Programar actualización del sitemap XML: Esto es por si quieres especificar un horario concreto en el que actualizar tu sitemap. Esto es debido a que la creación del sitemap, en webs con muchas URLs (miles), puede consumir bastantes recursos de tu servidor, y puede ser mejor elegir ciertas horas para evitar que se ralentice tu web si no tienes un servidor potente. Si lo usas debes desactivar la actualización automática cuando publiques contenido nuevo, por razones obvias.
  • Prefijo del mapa del sitio: Por defecto el prefijo es sitemap con lo que tu mapa del sitio XML se llamará sitemap.xml. Solo deberías cambiarlo si hay conflicto con algún otro sitemap.
  • Crear índices del mapa del sitio: Si activas esto el mapa del sitio inicialmente no mostrará todas tus URLs, sino que será una especie de menú con enlaces a otros sitemaps, organizados por tipo de contenido (páginas, entradas, taxonomías, etc.), en los que sí estarán las URLs de cada contenedor. No debes activarlo salvo que tu web contenga tantas URLs (la norma es que no contenga más de 50.000 URLs y no pese más de 10 Mb) que ralentice demasiado la visualización del sitemap (Nota: el plugin Yoast SEO crea el sitemap con índices por defecto, sin posibilidad de cambiar). Lo dicho, lo ideal, salvo que tengas muchísimas URLs, es mostrarlo directamente, sin índices, para facilitar la navegación e indexado a los rastreadores, sin hacer que visiten varias URLs para poder ver la estructura de tu web. Si necesitas crear el índice el plugin All in One SEO Pack lo crea con enlaces a los sitemaps comprimidos de cada tipo de contenido, mucho más eficaces y rápidos de carga para los rastreadores.
  • Añadir enlace al archivo robots.txt virtual: WordPress siempre ofrece un archivo robots.txt virtual. Si vas a crear un archivo robots.txt propio (con All in one SEO Pack puedes hacerlo fácilmente) no actives esta casilla, especialmente si ambos van a estar en la misma ruta, normalmente en la carpeta raíz del sitio. Si no vas a crear tu propio archivo actívala, es mejor algo que nada.
  • Añadir sitemap en formato HTML: El plugin Google XML Sitemaps te ofrece esta opción, pero no es necesario. El Sitemap xml normal ofrece los estilos necesarios, y básicos, para que los rastreadores los lean correctamente.
  • Cambiar la ruta del sitemap: Otro ajuste que permite el plugin Google XML Sitemaps, muy útil si no la carpeta raíz de tu sitio no tiene permisos de escritura, permitiéndote guardar el sitemap en cualquier otra carpeta.

 

¿Dudas?

Si te ha quedado alguna duda plantéala en los comentarios y entre todos la resolvemos.

Valora este artículo para mejorar la calidad del blog ...

PobreRegularEstá bienMuy buenoExcelente (12 votos, promedio: 4,92 de 5)
Loading...

Autor: Fernando

Fernando Tellado, apasionado de WordPress, profesor, consultor y ponente. Maquero cansino, padre de tres hijos y de una perrita Beagle, Bilbaíno de nacimiento, Español de corazón y ciudadano de donde me quieran. Autor del libro WordPress - La tela de la araña. Mi blog personal es Navegando con red, donde he crecido como escritor en la red y ofrezco mis visiones acerca de la Web 2.0 y la blogosfera.

Comparte esta entrada en
468 ad
  • Eletroya

    Enhorabuena por el post!! Super completo y muy bien explicado. Si haceis uno igual para el archivo Robots.txt os lo agradecería!!
    Un saludo!

  • David

    Hola, ¿Hay alguna manera de configurar el sitemap correctamente usando el plugin de SEO by Yoast? Gracias

  • Gracias, Muchas!

  • Excelente tutorial, lo dejo en favoritos para usarlo cuando termine mi nuevo sitio WP.

  • Pingback: Cómo aparecer en Google gratis()

  • Carlos San Miguel

    Buenas tardes Fernando! quería hacerte una consulta sobre los sitemaps. Quiero crear páginas “gancho” con mis productos pero incuyendo las palabras “oferta”, “barata”. Estas páginas no serán accesibles desde el propio menú de la web, pero me gustaría que aparecieran en Google. ¿Si las incluyo en el sitemaps, google accedería al contenido para indexarlo? Gracias! 😉 Un saludo!

Pin It on Pinterest