Qué son los errores soft 404 y cómo solucionarlos en WordPress

Si usas habitualmente la consola de búsqueda de Google, antiguas herramientas para webmasters (y sino deberías) habrás visto un tipo de errores extraños, los llamados errores “soft 404” o errores 404 leves, como los llama Google.

No hace falta que hiperventiles, vamos a ver qué son y, sobre todo, cómo solucionarlos.

¿Qué son los errores soft 404?

Básicamente son páginas que deberían tener el código de error “404 – No encontrado” pero que en realidad son páginas 200, de respuesta normal, que muestran contenido, pero no el que el usuario esperaba encontrar.

Vamos, que porque una página se parezca a un error 404 no significa que lo sea. Y Google piensa que eso puede trastornar, molestar, hacer sentir mal o decepcionados a tus visitantes (pobrecitos) así que te avisa para que lo arregles.

No me refiero a que no puedas personalizar tus páginas 404 añadiendo un buscador o lo que sea, pero la cabecera HTTP debe ser claramente de código de error 404, o incluso 410, no otro. Y es que a veces se nos va la mano personalizando las páginas de error 404, incluso cambiando las cabeceras HTTP, de modo que ni el usuario ni, sobre todo, el buscador es capaz de identificarla como mensaje de error 404.

Tampoco vale una redirección 301 a portada, por ejemplo, un procedimiento muy común. Si haces redirecciones 301 deben ser a páginas con contenido similar a las que tenías indexadas y, por cualquier motivo, decidiste quitar.  Google detecta como errores soft 404 las redirecciones 301 a la portada de tu sitio, un recurso muy socorrido, pero que Google considera un mal chiste para el usuario.

Otro motivo por el que Google puede mostrar un error soft 404 es cuando una página, aunque exista, tenga lo llamado como “thin content“, vamos, que no aporta una mierda, has puesto ahí una frasecita o menos.

Resumiendo, los errores soft 404 pueden ser debidos a:

  1. Páginas que no tienen la cabecera de error 404 y deberían.
  2. Redirecciones masivas a portada.
  3. Thin content.

¿Cómo sé si tengo errores soft 404?

Fácil, Google te avisa, por email o directamente en la consola de búsqueda, con mensajes como este…

¿Tengo que arreglar los errores soft 404?

Lo primero que debes hacer es identificar si las páginas con errores soft 404 son cruciales para tu posicionamiento, en cuyo caso estaría claro que debes solucionarlo con urgencia.

Pero si son páginas que no te traen tráfico, y encima su cantidad en relación con el total de páginas de tu sitio no es relevante, no deberían quitarte el sueño, aunque siempre es bueno hacer caso a Google.

Ergo, si el número de páginas con errores soft 404 es grande también deberías solucionarlo para no penalizar a tu web en los SERP.

¿Que cómo sabes si las páginas son cruciales para tu posicionamiento?

Deberías estar revisando Google Analytics para saber qué páginas de tu web te traen tráfico y cuánto, y sino hoy es tan buen día como cualquier otro para empezar a hacerlo.

¿Cómo saber si la cantidad de páginas con errores soft 404 es en un número relevante?

Por simple matemática, si tu web tiene decenas de miles de URLs y tienes errores soft 404 en solo unas decenas, y no son importantes, puedes aplazar esta tarea por algo más importante, como sacar al perro o leer algún artículo antiguo de Ayuda WordPress.

Pero si hablamos de que suponen un % relevante del total de tus páginas, no digamos si el porcentaje es de dos dígitos, entonces cierra agenda y ponte a ello en cuando puedas.

¿Cómo soluciono los errores soft 404?

La estrategia a llevar a cabo para solucionar errores soft 404 sería así:

Si la página ya no existe

  1. Permitir errores 404 o 410 si la página de verdad no está y no recibe tráfico o enlaces de modo significativo. Por supuesto asegúrate de que la respuesta de la cabecera HTTP es 404 o 410, no 200, fácil usando la herramienta de la consola de búsqueda de Google llamada “Explorar como Google” (lo vemos al final del artículo).
  2. Si la página es relevante crea una redirección 301 a una página relacionada y relevante de tu sitio.
  3. Y nunca hagas redirecciones masivas de páginas desaparecidas a la portada de tu web. O las dejas como 404 o haz redirecciones 301.

Si el culpable son las redirecciones masivas a portada, en este caso lo que te toca es remangarte y solucionarlos a mano, bien haciendo redirecciones 301 a páginas con contenido similar y relevante, desde .htaccess o ayudándote del (maravilloso) plugin Redirection, como prefieras.

Si la página aún existe

Si tienes páginas que existen y que no deberían devolver errores de soft 404 primero asegúrate de que la página tiene algo de contenido, y cuando digo algo me refiero a más de una línea o frase. Y es que a veces Google puede mostrar error soft 404 cuando una página tiene muy poco contenido, lo que te comentaba antes del “thin content“.

En este caso la solución es sencilla: ¡escribe algo que merezca la pena coño!

Si el motivo es que la página indica que es un 404 pero su cabecera dice otra cosa, si su cabecera HTTP devuelve el código de respuesta 200, asegúrate de cambiar la cabecera HTTP. ¿Cómo? pues lo primero que debes hacer es comprobar si tu tema activo tiene bien una página 404, normalmente 404.php, sino te recomiendo crear uno, en cuya cabecera debería especificarse claramente el código de error HTTP que debe devolver, así:

Y luego ya el código normal de las páginas del tema activo, con sus llamadas al loop, etc.

¿Dónde veo las páginas con error soft 404?

Para identificar las páginas con errores soft 404 aprovecha el informe que ofrece la consola de búsqueda de Google y pulsa en el botón para consultar los errores, que te llevarán a una página en la que podrás ver tus URLs con errores soft 404, esta:

Una vez en esa pantalla identifica a golpe de vista, o una por una si lo prefieres, a ver si puedes detectar a qué son debidos los errores.

Para arreglarlos primero haz clic en la URL a arreglar y verás una ventana emergente con un enlace a la página.

Y sí, haz clic en el enlace para ver de primera mano qué tipo de problema es el que esté generando el error soft 404, que en el ejemplo que te muestro era una pijada de Google, que también pasa, y es que en esa página en el texto se muestra un error como si fuese un error HTTP, y el bicho de Google debió pensar que estaba mostrando un error que no era. Vamos, que no es una ciencia exacta, puede pasar.

Lo arreglé poniendo el texto conflictivo dentro de una etiqueta de código preformateado y arreando.

Pero esa era la anécdota …

El caso de las páginas de resultados de búsqueda

Por seguir el ejemplo, el resto de errores sí que eran errores 404 reales de un formulario de búsqueda que debería devolver listados de un directorio y, al no encontrar ciertos resultados, mostraba una página con cabecera 200 pero que en realidad no tenía nada.

Si te encuentras este tipo de errores tienen fácil solución, simplemente añade a tu fichero robots.txt unas líneas para que no se indexen las páginas de resultados de búsquedas internas, así:

Con lo que, en un archivo robots.txt tipo de WordPress quedaría así:

¿Qué hago cuando solucione los errores?

Sencillo, ve de nuevo a la página de errores soft 404 de la consola de búsqueda de Google y marca como solucionados uno a uno.

Y sin son varios los que has solucionado de un plumazo selecciona sus casillas y usa el botón de arriba para tardar menos.

Para finalizar, si las páginas son relevantes para tu posicionamiento ve a la sección de la consola de Google Rastreo > Explorar como Google y solicita la indexación correcta de cada página solucionada.

Ya está ¿ahora qué hago?

Esperar amigo, esperar. Seguro que Google te regalará pronto algún otro error soft 404 o de algún otro tipo que se le ocurra. Lo importante es que revises con regularidad la consola de búsqueda y tus analíticas, están ahí para algo, para empezar para evitarte disgustos y sorpresas de que tu web pierda tráfico y tú no te hayas dado cuenta de los motivos.

A fin de cuentas quien manda en esto es Google, y podemos ponerle a parir, pero si queremos que nos mande tráfico casi mejor hacerle caso, salvo que prefieras vivir peligrosamente claro.

Valora este artículo para mejorar la calidad del blog ...

PobreRegularEstá bienMuy buenoExcelente (3 votos, promedio: 5,00 de 5)
Cargando…

Autor: Fernando

Fernando Tellado, apasionado de WordPress, profesor, consultor y ponente. Maquero cansino, padre de tres hijos y de una perrita Beagle, Bilbaíno de nacimiento, Español de corazón y ciudadano de donde me quieran.Autor del libro WordPress - La tela de la araña. Mi blog personal es Navegando con red, donde he crecido como escritor en la red y ofrezco mis visiones acerca de la Web 2.0 y la blogosfera.

Comparte esta entrada en
468 ad

ESTA WEB UTILIZA COOKIES PARA OFRECER LA MEJOR EXPERIENCIA POSIBLE. SI SIGUES NAVEGANDO DAS TU CONSENTIMIENTO PARA LA ACEPTACIÓN DE COOKIES Y NUESTRA POLÍTICA DE PRIVACIDAD más información

Los ajustes de cookies de esta web están configurados para "permitir cookies" y así ofrecerte la mejor experiencia de navegación posible. Si sigues utilizando esta web sin cambiar tus ajustes de cookies o haces clic en "Aceptar" estarás dando tu consentimiento a esto.

Cerrar