Si tienes instalado algún plugin de SEO como All in one SEO Pack o Yoast SEO seguramente ya tienes un sitemap XML pero ¿lo tienes configurado correctamente? No solo hay que crear un sitemap XML de nuestra web, y añadirlo a la Search Console y a las Herramientas para Webmasters de Bing, además hay que configurarlo bien.
Índice de contenidos
¿Qué es el Sitemap XML y para qué sirve?
Un Sitemap XML básicamente es un archivo que informa a los rastreadores de los buscadores sobre la estructura de tu web, listando todos (o parte) de las URLs existentes. Todos los bots de los buscadores usan este sitemap como guía inicial para rastrear tu web.
Un Sitemap XML puede contener información (metadatos) sobre la frecuencia de actualización de cada URL, la prioridad de la misma y, en el caso de vídeos, la duración de los contenidos.
Se pueden (y debe) crear sitemaps específicos para imágenes, vídeo y de contenido especializado para móviles. También es muy recomendable crear una versión de tu sitemap XML comprimido (gzip).
Un sitemap XML es la primera línea de ataque para el indexado en los SERP #WordPress #SEO @fernandot Clic para tuitearLos buscadores no se guiarán exclusivamente por la información dada en el Sitemap XML pero es su primer mapa a tu web, tendrán en cuenta tus indicaciones, siempre te beneficiará y nunca te perjudicará tenerlo, eso seguro.
Así que crear un sitemap XML es la primera línea de ataque para el correcto indexado en los SERP de los buscadores, y configurarlo adecuadamente es una tarea fundamental para cualquier administrador web, pero los ajustes por defecto de los plugins son eso, por defecto, y no se adaptan a todas las webs existentes.
Si usas el plugin Yoast SEO solo puedes configurar qué tipo de contenido se añadirá al sitemap XML, sin poder determinar más ajustes importantes, así que nos concentraremos en los ajustes que sí están disponibles en All in one SEO Pack, prácticamente iguales que los que encontrarás el fantástico (pero pesado) plugin Google XML Sitemaps, que sí permiten configurar con precisión un sitemap XML.
Qué incluir en el Sitemap XML
En el sitemap debes incluir todas las URLs en las que haya contenido relacionado con la temática de tu web y que ofrezcan información única, valiosa y relevante para los lectores y, lógicamente, también para los buscadores.
Así que, como regla de partida, el Sitemap XML siempre deberá incluir:
- La portada de tu web, lo más importante, la vía de entrada a tu sitio.
- Páginas: tu contenido invariable y único que te define y explica lo que eres, a qué te dedicas, qué ofreces, cuáles son tus valores.
- Entradas: tus publicaciones periódicas, en las que ofreces información valiosa a los visitantes de tu web sobre el contenido de tu sector o negocio.
- Taxonomías: aquellas que sirvan para organizar y jerarquizar tus contenidos, como etiquetas y categorías.
También, dependiendo de la orientación y segmento de tu web, el Sitemap XML puede incluir:
- Vídeos: indicando la duración, categoría del contenido y clasificación de audiencia.
- Imágenes/Adjuntos: especificando los metadatos que las identifiquen.
- Contenido para móviles: especialmente si ofreces páginas especiales para móviles antiguos, pero también si tienes definida una estrategia móvil precisa.
- Temas en los foros, si los tuvieses.
- Tipos de contenido personalizado, como proyectos, portafolios, etc, si son relevantes para tu temática y estrategia SEO.
- Archivos de autor, necesarios para los algoritmos de autoría de Google.
Adicionalmente, si hay URLs que quieres añadir al Sitemap y no las has generado con WordPress el plugin te permite añadirlas manualmente y configurar sus parámetros.
Qué NO incluir en el Sitemap XML
Va a depender mucho de tu estrategia de contenidos pero como regla de partida el Sitemap XML no debería incluir:
- URLs con contenido duplicado.
- URLs de las páginas de adjuntos generadas automáticamente por WordPress.
- URLs de afiliación.
- Archivos por fecha.
- Taxonomías autogeneradas por el tema o plugins que no ofrezcan organización o jerarquía de contenidos.
Adicionalmente, también puedes excluir URLs manualmente, aunque globalmente hayas indicando que se incluyan, indicando el ID o slug de las mismas.
Frecuencia de actualización del Sitemap XML
Un parámetro importante, que los buscadores valorarán, será la frecuencia con que se actualizan tus URLs. Los plugins que te permiten configurar estos valores te ofrecen los siguientes valores:
- No sobrescribir: Con lo que se utilizarán los valores por defecto del plugin. Los ajustes por defecto suelen ser para blogs así que como norma no lo dejes nunca así.
- Siempre (always): Pides a los rastreadores que visiten tus URLs con la mayor frecuencia posible, cada minuto si es posible. Configuración adecuada para sitios con muchas noticias que se actualizan con muchísima frecuencia, como diarios digitales de primer orden.
- Cada hora (hourly): Quieres que los bots te visiten cada hora. Adecuado para sitios de noticias que publican contenido nuevo varias veces al día.
- Cada día (daily): Para que te visiten una vez al día, ideal para blogs que publican una entrada diaria como mucho.
- Cada semana (weekly): Si actualizas el blog de vez en cuando es una buena configuración.
- Cada mes (monthly): Típico para webs estáticas sin sección de noticias o blog, para que los rastreadores revisen si has cambiado la información de tus páginas.
- Cada año (yearly): Para webs exclusivamente estáticas y páginas de aterrizaje (landing pages) que no cambian nunca, pero que quieres que Google se acuerde de que existen.
Y ahora surge la duda habitual ¿qué frecuencia le asigno a cada tipo de URL? Porque claro, uno quiere que le visiten los buscadores cuanto más mejor. Ahora bien, muchas visitas de los rastreadores no implica que te vayan a posicionar mejor en los SERPs.
Facilita la vida a los buscadores y te premiarán, complícasela y te penalizarán #WordPress #SEO @fernandot Clic para tuitearDe hecho, los algoritmos de los rastreadores podrían «pensar» que les engañas si marcas, por ejemplo, una frecuencia always y no actualizas nada de tu contenido nunca o lo haces con muy poca frecuencia.
La norma que debes aplicar siempre con los buscadores es no mentirles ni tratar de engañarles nunca porque te van a pillar sí o sí, y te penalizarán si les generas un consumo de sus recursos inadecuado al resultado que obtendrán. Google y Microsoft son empresas millonarias pero no se hicieron ricas dejándose engañar, y son muy celosos del dinero que emplean para gestionar sus herramientas.
Siempre suelo recomendar la regla universal de … «Facilita la vida a los buscadores y te premiarán, complícales la tarea y te penalizarán«.
Teniendo esto en mente, debes asignar una frecuencia adecuada a la realidad de cada tipo de URL que incluyas en el Sitemap XML, siendo sincero con tus ajustes.
No intentes engañar a Google, te pillará siempre sí o sí #WordPress #SEO @fernandot Clic para tuitearPara un blog como Ayuda WordPress una configuración adecuada sería más o menos así:
- Portada: always porque publico cada día, a veces varias veces, y en muchas ocasiones modifico títulos y extractos de las entradas, con lo que lo que aparece en portada puede cambiar. También sería válido el valor hourly.
- Entradas: hourly por el mismo motivo anterior, ya que es bastante habitual que modifique entradas una vez publicadas, para corregir errores, añadir enlaces, aportar más contenido que va surgiendo con la conversación con los lectores en los comentarios.
- Taxonomías: como muestran el archivo de las entradas debería ser el mismo parámetro que uses para ellas, en el ejemplo que estamos siguiendo hourly.
- Páginas: daily | weekly | monthly | yearly, cualquiera de estos valores, pues va a depender mucho de cada cuanto tiempo modificas la información de tus páginas. Ante la duda pon la misma frecuencia que para las entradas, aunque un valor razonable, incluso ambicioso, sería daily.
- Páginas de autor: la misma frecuencia que establezcas para las taxonomías, al ser un archivo de entradas.
Sobre todo ten en cuenta de qué estamos hablando, de cada cuanto se actualiza la URL, cada cuanto tiempo muestra información nueva o actualizada.
Así que debes distinguir claramente las páginas de archivo, como portada y taxonomías, de las entradas y páginas. Las primeras van a actualizarse cada vez que haya contenido nuevo, las segundas solamente cuando las modifiques independientemente. Ten esto en mente al definir las frecuencias.
Prioridades del Sitemap XML
Un parámetro de gran relevancia es la prioridad que asignemos a cada URL en nuestro Sitemap. Los ajustes disponibles vienen en formato numérico del tipo: 1.0, 0.9, 0.8, y así sucesivamente hasta 0.0, y siempre incluyen la opción No sobreescribir, para usar los valores por defecto del plugin.
Aunque el valor sea de este tipo luego se mostrará en el Sitemap XML como 100%, 90%, 80% y así sucesivamente.
Esto se traduce en que le vamos a decir a los buscadores qué valor porcentual tiene cada URL de nuestra web en el SEO de todo nuestro sitio, ahí es nada.
Vamos, que tienes que decidir qué valor tiene sobre el peso total del posicionamiento de tu web cada tipo de contenido o archivo, decisión difícil donde las haya ¿o no?
Mi consejo es que siempre, siempre, asignes el valor 1.0 (100%) a la portada, como elemento fundamental del SEO de tu web (normalmente) ya que contiene la meta title principal y la información más relevante y actualizada de tu sitio.
Para las páginas deberás aplicar el valor 9.0 (90%) pues siempre deben contener información absolutamente relevante sobre lo que eres, lo que ofreces.
Si, además, publicas entradas con contenido de valor, que uses para reforzar tu posicionamiento, les asignes también el valor 1.0 (100%) o como poco 0.9 (90%) o 0.8 (80%) ya que los buscadores se alimentan principalmente de contenido relevante y actualizado.
A partir de aquí no hay regla fija aparte de no asignar valores muy altos al resto de URLs, salvo estrategia específica sobre algún tipo de contenido (vídeo, imágenes, etc.) básicamente para que no compitan con tus principales URLs ( portada, páginas, entradas).
Básicamente, lo que le estás diciendo a Google y Bing es dónde publicas tu contenido más relevante con tu temática, nicho o negocio, y qué prefieres que posicione por delante de otras URLs en caso de dudas o necesidad de ahorro de recursos.
Más parámetros a tener en cuenta en el Sitemap XML
Adicionalmente, nuestros queridos plugins para WordPress también nos ofrecen otros parámetros interesantes a configurar, y los principales son los siguientes:
- Crear un sitemap XML comprimido (gzip): Créalo siempre, de hecho los rastreadores los leen más rápido que los estándar.
- Avisar a Google y Bing: Aquí el plugin lanza un ping a los rastreadores cuando se actualiza tu sitemap para que pasen a ver qué ha cambiado. Creo que huelga decir que lo actives siempre.
- Generar el sitemap XML dinámicamente, cuando publiques contenido nuevo: ¿De verdad hace falta que te diga si hay que activarlo o no? Vale, sí.
- Programar actualización del sitemap XML: Esto es por si quieres especificar un horario concreto en el que actualizar tu sitemap. Esto es debido a que la creación del sitemap, en webs con muchas URLs (miles), puede consumir bastantes recursos de tu servidor, y puede ser mejor elegir ciertas horas para evitar que se ralentice tu web si no tienes un servidor potente. Si lo usas debes desactivar la actualización automática cuando publiques contenido nuevo, por razones obvias.
- Prefijo del mapa del sitio: Por defecto el prefijo es sitemap con lo que tu mapa del sitio XML se llamará sitemap.xml. Solo deberías cambiarlo si hay conflicto con algún otro sitemap.
- Crear índices del mapa del sitio: Si activas esto el mapa del sitio inicialmente no mostrará todas tus URLs, sino que será una especie de menú con enlaces a otros sitemaps, organizados por tipo de contenido (páginas, entradas, taxonomías, etc.), en los que sí estarán las URLs de cada contenedor. No debes activarlo salvo que tu web contenga tantas URLs (la norma es que no contenga más de 50.000 URLs y no pese más de 10 Mb) que ralentice demasiado la visualización del sitemap (Nota: el plugin Yoast SEO crea el sitemap con índices por defecto, sin posibilidad de cambiar). Lo dicho, lo ideal, salvo que tengas muchísimas URLs, es mostrarlo directamente, sin índices, para facilitar la navegación e indexado a los rastreadores, sin hacer que visiten varias URLs para poder ver la estructura de tu web. Si necesitas crear el índice el plugin All in One SEO Pack lo crea con enlaces a los sitemaps comprimidos de cada tipo de contenido, mucho más eficaces y rápidos de carga para los rastreadores.
- Añadir enlace al archivo robots.txt virtual: WordPress siempre ofrece un archivo robots.txt virtual. Si vas a crear un archivo robots.txt propio (con All in one SEO Pack puedes hacerlo fácilmente) no actives esta casilla, especialmente si ambos van a estar en la misma ruta, normalmente en la carpeta raíz del sitio. Si no vas a crear tu propio archivo actívala, es mejor algo que nada.
- Añadir sitemap en formato HTML: El plugin Google XML Sitemaps te ofrece esta opción, pero no es necesario. El Sitemap xml normal ofrece los estilos necesarios, y básicos, para que los rastreadores los lean correctamente.
- Cambiar la ruta del sitemap: Otro ajuste que permite el plugin Google XML Sitemaps, muy útil si no la carpeta raíz de tu sitio no tiene permisos de escritura, permitiéndote guardar el sitemap en cualquier otra carpeta.
¿Dudas?
Si te ha quedado alguna duda plantéala en los comentarios y entre todos la resolvemos.
¿Te gustó este artículo? ¡Ni te imaginas lo que te estás perdiendo en YouTube!
Enhorabuena por el post!! Super completo y muy bien explicado. Si haceis uno igual para el archivo Robots.txt os lo agradecería!!
Un saludo!
Hola, ¿Hay alguna manera de configurar el sitemap correctamente usando el plugin de SEO by Yoast? Gracias
Gracias, Muchas!
Excelente tutorial, lo dejo en favoritos para usarlo cuando termine mi nuevo sitio WP.
Buenas tardes Fernando! quería hacerte una consulta sobre los sitemaps. Quiero crear páginas «gancho» con mis productos pero incuyendo las palabras «oferta», «barata». Estas páginas no serán accesibles desde el propio menú de la web, pero me gustaría que aparecieran en Google. ¿Si las incluyo en el sitemaps, google accedería al contenido para indexarlo? Gracias! 😉 Un saludo!
Si tengo instalado el de yoast debo antes quitarlo para poner el all in one supongo. ¿Que cosas recomiendas hacer o revisar una vez quitado ? Vale con desactivarlo?
Desactívalo, luego en All in One debes importar los ajustes desde la herramienta específica para ello
Buena ayuda, gracias!
Hola! Me encanta este blog, estoy aprendiendo muchísimo ahora que estoy optimizando mi web, pero tengo un problema grave con yoast… al limpiar broken links
(por cierto ya no puedo entrar más en brokenlinkscheck.com por que me aparece error 403…),
en google me aparecen errores de links la mayoría de páginas que ya no existen y he limpiado, pero siguen apareciendo y creo que es debido a que yoast ha creado un XML site map que no está actualizado y de hecho esos links que genera como propio XML site map, también me aparecen como error en google…. al crear un listado desde el propio plugging vero que aparecen: 3 oficiales: categorias, tags y page pero encima aparecen el xml 1 y el xml 2 que no sé si deberían seguir saliendo o deberían desaparecer por que estos dos me provocan errores en google ya que me redireccionan a paginas que ya no existen… ¿qué puedo hacer?
MIL GRACIAS!!!!!
PDT: gracias a tus reportajes, ya he desactivado el asikmet! lo elimino? y PDT2. no me atrevo a desinstalar Jetpack! me avisa siempre de cuando mi web se cae! si no nunca tendría conocimiento de este hecho!
y PDT3. Google XML Site Map es igual que yoast?
MUCHISIMAS GRACIAS!
Hola
Yoast crea el sitemap con distinta ruta que otros plugins. Los demás plugins lo añaden en /sitemap.xml y Yoast en /siteamp_index.xml. Tienes que ir a la Search Console, quitar el anterior y decirle la ruta del nuevo.
Sobre esos otros sitemaps simplemente comprueba que no estén mostrando los mismos enlaces que el nuevo y si es así quítalos, o si no están declarados en la Search Console simplemente pasa de ellos.
Lo de que Yoast cree sub-sitemaps es normal, no pasa nada
Hola, Fernando
He ido a la consola dentro del plugging pero me aparece esto:
«Para permitir que Yoast SEO recupere tu información de Google Search Console, por favor, introduce tu código de autorización de Google. Al hacer clic en el botón siguiente se abrirá una nueva ventana.
Obtener el código de autorización de Google
Introduce tu código de autorización de Google y pulsa el botón Autorizar.»
No entiendo muy bien, qué pasos he de seguir para que no me sigan apareciendo paginas que ya noe existen provocando errores en google… Debo borrar los xml 1 y 2? en consola no tengo nada…
hago una segunda respuesta actualizada: Estoy pasando el broken links y me siguen apareciendo errores con urls que ya no existen o que no tienen ninguna url asociada dentro del artículo…como si no hubiese sido actualizado…
Ejemplos:
http://womanword.com/2016/02/21/2016-03-28-casa-ordenada-corazon-contento/
ya no hay ningun link! qué da error?
o
Street Style de Escalera – WOMANWORD http://womanword.com/2013/08/13/street-style-de-escalera/
subiendo al Tibidabo – http://womanword.com/2014/11/28/subiendo-al-tibidabo/
ves? no tienen nada adjunto, es como si la web no se hubiese actualizado tras los mil cambios… es por la cache? es por el xml site map que me da error como os comentaba?
Qué puedo hacer?
es un tema muy grave que me preocupa mucho muchísimo… por que esto hace q de error en motores de búsqueda en google y que ralentice mi web…. no sé qué hacer… ni dónde esta el problema… lo relaciono con lo del xml que te contaba… pero no lo sé…
En la consola de búsqueda de Google de tu sitio solo debe haber un sitemap activo, el actual
lo de la autorización es solo para rastrear internamente, desde WP, los errores de la Search Console, no es obligatorio
¡Hola! Soy novata del todo en Wordpress y en programación. He migrado el blog de la empresa de Blogger a Wordpress, la web está hecha a manopla. Entonces, mi duda es, el sitemap de mi web ¿tiene que incluir la página del blog en wordpress? o ¿tengo que tener dos sitemaps diferentes? el blog está en el mismo dominio que la web. Si me pueden ayudar, se lo agradezco mucho. Gracias!!
El sitemap del sitio, el dominio, debe incluir enlaces a todas aquellas páginas que quieras facilitar su indexado, estén hechas con WordPress o con lo que sea. Y por supuesto no incluir 2 versiones del mismo contenido con distinta URL, que te penalizaría.
Espero que esta (mística) respuesta te sirva 🙂
Hola rocío actualmente tengo el mismo problema que tu y aún no lo he podido resolver. ¿Has encontrado ya la manera de resolver estos errores? Saludos
Si tienes bien hechas las redirecciones con el tiempo la Search Console dejará de marcar 404 en esas redirecciones
Hola Fernando
Hyper interesante tu post y el blog en general me apoyo bastante en el. Mil Gracias
Mi consulta según he leído en relación al Sitemaps el plugin Google Sitemaps es más completo que el que crea de manera automatizada All In One SEO Pack ya que permite más configuraciones.
En el blog tengo los dos, acabo de desactivar Google Sitemaps porque verifiqué que en la Google Search Console el que aparece es el de All In One SEO (Sin embargo no veo opciones de configuración al menos en la versión gratuita)
Existe alguna forma de desactivar este y dejar activo el del plugin Google Sitemaps
Mil gracias
El plugin AIOSP si tiene opciones para configurar el mapa del sitio, las tienes en el submenú Mapa del sitio XML, si tienes activo el complemento, en la versión gratuita, claro.
En cuanto a Google usará el que le hayas enviado.
En el 2019 All In One Seo (gratis) no genera robots.txt ni sitemap.xml, supongo que se lo reserva para funcionalidades premium
Es una pena que hayan ido para atrás
Hola Fernando, gracias por el post. Tengo una duda, instalé en mi wordpress el pluggin XML site map y me aparece un mensaje «El plugin Google XML Sitemaps podría provocar problemas usado conjuntamente con Yoast SEO» El caso es que en un principio desactive YOAST pero me ayudan mucho sus consejos de SEO al subir las entradas…¿qué me recomiendas? En search concole sólo tengo enviado el site map de XML. Mil gracias
Muchas gracias por tu post. Me llamó la atención, como puedo hacer que me aparezca en google la imagen y las 5 estrellas como lo hiciste con esta publicación? Queda muy bien. Como se puede hacer con Wordpress?