Borrar páginas 404 fantasmas

Inicio Foros WordPress SEO – SEM Borrar páginas 404 fantasmas

Etiquetado: , ,

Este debate contiene 16 respuestas, tiene 3 mensajes y lo actualizó  LGrusin hace 7 años, 7 meses.

  • Autor
    Publicaciones
  • #21145

    coque
    Participante

    <p>Mi blog ha sido hackeado. Se han creado unas 20.000 páginas con error 500 y unas 15.000 con error 404. Todas ellas inexistentes, pero que Webmasters las detecta. Las páginas error 500 tienen la dirección misitio/wp-admin/xxxx, siendo xxxx cada vez diferente. Colocando la sentencia disallow en robots.txt Google las está eliminando poco a poco.<br />
    El problema está en las páginas 404, que cada día hay más, y que tienen la dirección misitio/fcl.php?q=xxxx, siendo igualmente xxxx diferente en cada una de ellas.<br />
    Todas esas páginas, evidentemente no existen, son consecuencia de un malware que me fue introducido y que el hosting me dice que ya fue eliminado.<br />
    El problema es que no sé cómo borrar las páginas 404 que no existen, las 500 van eliminándose de momento. No sé si es conveniente indicar en robots.txt otra vez disallow/fcl etc…etc…Con el directorio wp-admin lo tenía más claro, pero no comprendo mucho si el código fcl.ph?q= es importante o no, y no sé que escribirle exactamente al robots.txt.<br />
    Entiendo que la detección por Google de 15.000 páginas 404 no será buena para el posicionamiento. Desde luego desde que se origino el problema mis visitas han bajado a la décima parte, Google no me indexa bien.<br />
    ¿Qué puedo hacer ahora?
    </p>

  • #51998

    LGrusin
    Miembro

    ¿Qué es fcl.php? ¿Seguro que no quedan restos por ahí del malware? ¿Seguro que no están afectados los archivos del núcleo de WordPress? ¿Está infectada la base de datos?

    Efectivamente el malware puede haber sido eliminado pero no las consecuencias. Ahora toca reponer todo como estaba.

    Ahí tienes trabajo para rato antes de preocuparte por Google.

    Un saludo

  • #52066

    coque
    Participante

    Gracias LGrusin. Me he puesto en contacto con el hosting y, cosa rara porque atienden muy bien, ni me han contestado.
    Desde luego lo de arreglar la base de datos no lo podré hacer, no sé. Soy un usuario de WP, pero no tengo tanta idea de informática. Lo único que podría hacer es si ellos, el hosting, tienen un backup de la base de datos, o yo, que tengo alguno de hace unos seis meses, decirles que la sustituyan. Pero vamos, es ir pegando palos de ciego, porque no entiendo nada de esto.
    Quería hacer 2 preguntas. ¿Se puede poner disallow /fcl.php=q/ en el robots.txt para que vaya eliminando esas páginas 404? ¿Son muy malas las paginas 404 para el posicionamiento? Porque tengo 20000 y si no se quitarlas tendré que cerrar la página, después de 2 años de trabajo, muy bien posicionada y con más de 2000 usuarios únicos día, tendré que cerrarla. Es una pena, pero es que no sé que hacer, y además es una página de actualización diaria, que da bastante trabajo.
    Bueno, si alguien me sabe responder a estas preguntas le quedo muy agradecido, y por supuesto a LGrusin un montón.

  • #52067

    LGrusin
    Miembro

    Lo que yo haría antes es revisar plugins, themes y códigos extraños y en caso de duda eliminarlos.

    También:

    1 – En los hostings suele haber copias de seguridad de los archivos. Podrías restaurar todos esos archivos de WordPress con fecha anterior al ataque. Si no sabes cómo pregunta a tu hosting o que lo hagan ellos.

    Si lo anterior no es posible, lo mejor sería que instales todo de nuevo. Descargate una version de WordPress exactamente igual a la que tienes o en su caso una copia que tengas. Eso todos deberíamos tenerlo. También debes tener copia completa de la carpeta wp-content, del archivo wp-config.php y del archivo .htaccess.

    2 – Elimina los directorios wp-admin, wp-includes y los archivos del raiz. O sea, casi todo menos lo que te dije anteriormente.

    3 – De la copia que debes tener restaura los directorios wp-admin, wp-includes, los archivos del raiz, tu copia de wp-config.php y tu copia de .htaccess.

    Antes de hacer eso pon el sitio en modo mantenimiento para poder trabajar en él. Es decir, sube un archivo index.html al directorio donde tengas WordPress en tu servidor que informe que el sitio está en obras o algo similar, o llamalo index.php, es indiferente. El caso es que no arranque WordPress (o lo que queda de él… 😉 )

    Es importante que el último archivo que subas sea el index.php de WordPress. Cuando hayas terminado todo, lo subes si quieres que arranque WordPress.

    Después queda la base de datos, ya eso son palabras mayores. Esperemos que no tenga nada extraño guardado.

    Un saludo

  • #52069

    coque
    Participante

    Muchas gracias por la info, LGrusin.
    No sé si soy capaz de hacer todo eso, pero antes que rendirme lo que sea. Voy a empezar a estudiar todo lo que me dices, que a pesar de no tener ni idea, se entiende perfectamente.
    Esperaré hasta el lunes, es muy raro que el hosting no me diga nada, y en cuanto pueda me pongo.
    De las preguntas que hice, ¿me podéis decir algo? A lo mejor me sube la moral, y si no sabéis nada de eso pues quedo igualmente enormemente agradecido por la ayuda recibida.

  • #52071

    LGrusin
    Miembro

    Te puedo responder a las preguntas.

    1 – El esfuerzo es inútil, no te sirve de mucho.

    2 – Malísimo pero también se le puede decir a Google que esas páginas han dejado de existir. El problema es que son miles…

    Lo que tienes que hacer es desaparecer de una vez por todas el supuesto archivo fcl.php o el código que lo genera.

    Un saludo

  • #52081

    coque
    Participante

    Muchas gracias LGrusin, ya os contaré en cuanto tenga enfocado el asunto.

  • #52125

    coque
    Participante

    He pensado este fin de semana en eso que me decías de hacer LGrusin. El caso es que no tengo casi idea de WP, pero llevo unos años en esto y creo que más o menos se de qué va el tema.
    El servidor me dice que los códigos maliciosos han sido eliminados. A pesar de ello las páginas 404 crecen en número. Entonces esto no lo entiendo, y eso que debería ser muy básico. En las páginas 500 no aparecen nuevas, con la sentencia disallow baja el número y aumenta el número de páginas restringidas por robots, yo entiendo que las no accesibles las está pasando a esta última categoría.
    Tengo un backup de hace unos meses de todo el WP que funcionaba entonces, no se si será de hace unos seis meses, desde luego de antes del ataque. Mi theme es muy sencillo, lo único que todos los días pongo un post nuevo, porque es de horóscopos. No modifico nada sustancial del WP desde hace lo menos un año.
    Como no se mucho, lo que se me ocurre es coger esa carpeta de backup, que son todos los archivos del WP que tengo, no las database, y sobreescribir la carpeta que hay en el servidor. En cuanto lo tenga hecho, actualizo todos los pluggins y versión de WP, que me dice el servidor que eso es fundamental. Y como no se hacerlo lo haría así a lo bestia, tomar la carpeta de mi ordenador y sobreescribir la que hay en el servidor. No sé si para hacer eso tengo que modificar el archivo index,php o el index.html, pero me es un poco igual, son 43 MB y en unos 30 minutos debe estar sobre escrita la carpeta. Si en ese tiempo alguien no puede entrar, total serían muy pocos, no me importa.
    Le he preguntado al hosting de hacer esto y lo único que me contesta es que el código malicioso ha sido removido y que envía un sitemap. De mi idea ni contestar.
    En fin, que quería saber qué opinabais de mi idea de proceder. No me quedan muchas soluciones, el servidor me dice que ha eliminado los códigos maliciosos, las páginas 404 aumentan y esta es la única solución que se me ocurre antes de abandonar este minisite. Y es una pena, he currado 2 años y tenía 2000 usuarios al día.
    Bueno, y que muchas gracias por la ayuda que me estás dando.

  • #52126

    LGrusin
    Miembro

    Creo que con las copias que tienes puedes hacer lo que te digo.

    Pues si, era fundamental tener actualizado WordPress, la gente parece tenerle pánico a las actualizaciones cuando es la única forma de mantener el blog seguro, no lo entiendo.

    Como te he dicho antes, debes tener una copia completa de la carpeta wp-content, del archivo wp-config.php y del archivo .htaccess. Esta carpeta y archivos NO los reemplaces por otros. El resto los puedes eliminar y restaurar de nuevo.

    Como te dije al eliminar todos los archivos del raiz (menos los dos que he dicho antes) eliminas el sitemap, incluso puedes empezar YA por eliminarlo. El sitemap es como un indice del contenido de tu blog, incluyendo esas páginas que no existen. Eliminalo, ya se creará sólo o lo creas después de que todo vaya bien.

    La base de datos no se verá afectada por esto y no perderás ninguna entrada, artículo o post (como prefieras llamarlo). Sólo hablamos de los archivos de WordPress.

    Lo del index.php es fácil de entender. Imagina que mientras haces estas operaciones alguien o algo vuelve a manipular tu sitio. Pues habrás perdido el tiempo. Puesto que afecta a los archivos de WordPress de lo que se trata es de que NO actue ningún archivo de WordPress. Eso sólo se logra con una instalación limpia. Para crear un archivo index.php sólo tienes que crearlo con el Bloc de notas (Notepad) no vale Word ni similares. Lo dejas vacio si no sabes qué poner dentro. El que acceda a tu sitio verá una página en blanco hasta que acabes de hacer todo el trabajo.

    Por cierto, debes plantearte cambiar TODAS las contraseñas y usuarios. Incluso antes de hacer el proceso anterior. Nombre de usuario y contraseña de acceso al blog, nombre de usuario y contraseña de acceso a FTP, nombre de usuario y contraseña de acceso a la base de datos (aunque esto es bastante complicado de hacer si no sabes cómo). Por lo menos cambia las contraseñas.

    Un saludo

  • #52132

    coque
    Participante

    Estímadísimo LGrusin,
    He hecho lo que me has dicho tal y como lo ponías. He sobreescrito la carpeta del servidor con tus instrucciones. No entiendo muy bien lo que he hecho, pero ha sido tal y como tú me lo has dicho.
    Increíblemente el blog funciona, y parece que todo está correcto. He actualizado la versión de WP, he hecho un nuevo sitemap manualmente, y luego veré si se lo envío a Google desde las herramientas de Webmasters, porque el admin de WP me dice que lo envía automáticamente a Google.
    No sé lo que pasará a partir de ahora, pero de verdad que ya no podía seguir con la marcha antigua. Espero que todo funcione mejor ahora, pero lo que sí te puedodecir es que te estoy eternamente agradecido, no podía estar sin hacer nada. Según vayan sucediendo los acontecimientos te iré informando, a ver si hay suerte.
    Muchísimas gracias.

  • #52163

    LGrusin
    Miembro

    Exacto hazle un seguimiento al “paciente”. No olvides cambiar las contraseñas, es lo más importante.

    Me alegro de que todo haya salido bien.

    Marca el hilo como cerrado puesto que eso ayuda a otros usuarios.

    Un saludo

  • #52167

    coque
    Participante

    Apreciadísimo LGrusin, y verás por qué te lo digo.
    Desde el mismo instante que hice lo que me recomendaste,empezaron a entrar visitas de una manera espectacular. Estaba haciendo unos 200 vistas únicas día, y hoy me dice el contador que iré para unas 900. Antes del ataque tenía casi 2000 al día. Pero imagínate la alegría que me dio. Yo no entiendo qué ha pasado, porque fue instantáneo, parece que lo indexan de otra manera ahora.
    No he puesto el hilo como resuelto porque esperaba a ver hoy qué me decía Herramientas Webmasters sobre las páginas 404, que no sé si siguen aumentando, pero lo pongo como resuelto si crees que es lo mejor, no me cuesta nada. Lo que veas mejor, esperar un día más o darlo resuelto ahora.
    Seguiré buscando el modo de eliminarlas, que las 500y a están descendiendo con el disallow del robots.txt, he pasado de 22000 a 15000 en unos 10 días.
    Muchas gracias de nuevo.

  • #52172

    LGrusin
    Miembro

    Es un tema que requiere tiempo. Google por ejemplo tiene un caché que necesita ser actualizado y eso es un proceso lento. Deben pasar algunos meses para que la situación se reconduzca. Por así decirlo puedes haber eliminado el problema pero quedarán rastros de las consecuencias.

    En esta [url=http://www.google.com/support/webmasters/bin/answer.py?hl=es&answer=164734]página de Google[/url] hay información que te puede interesar. Lee con calma.

    Paciencia..

    Saludos

  • #52175

    coque
    Participante

    Las páginas 404 siguen aumentando y las error 500 descendiendo. Tendré que seguir investigando, que es muy posible que vía robots.txt se puede eliminar ese dichoso fcl.php y que no aumenten las 404.
    Por lo menos el aumento de visitas desde ayer ha sido bestial. Bueno, con todo lo dicho, expresando mi enorme agradecimiento a LGrusin, voy a cerrar este hilo como resuelto por no hacerlo más extenso.

  • #52178

    imported_fliberty
    Participante

    Disculpen que me meta, pero tengo un problema parecido creo yo, y como el tema al parecer es lo mismo no quise abrir otro hilo, pienso que se debe a algo de google por que he encontrado información referente en la web pero no he visto una forma de resolverlo, al menos no una que entienda, y esto es que en webmasters de google e incluso en el detalle del plugin wp-usersonline, existen errores 404 referido a un enlace que empieza con _utm.gif lo cual no puedo corregir; si bien es cierto se puede restringir mediante el robots.txt, la cantidad de URLs restringida por robots sigue en aumento aunque las 404 y 500 hayan disminuido.

  • #52180

    coque
    Participante

    Hola fliberty, a mi me sucede lo mismo, aunque en el robots.txt sólo he puesto disallow para las paginas error 500. No sé si se pueden poner 2 disallow en robots.txt
    mis páginas 404 tienen la URL misitio/fcl.php=q/ y no me atrevo a hacerlo.
    Acabo de leer en otro foro que Google no está prestando mucha atención a las páginas 404, pero de eso no entiendo nada.
    Todas mis páginas error 500 están pasando a restringidas por robots.txt, pero mi indexación ha mejorado un montón desde que hice lo que se comenta en este hilo.

  • #52200

    LGrusin
    Miembro

    Al contrario Fliberty, cualquier ayuda es bienvenida. Además cuatro ojos ven más que dos… 😉

    A ver, deben tener en cuenta que esas páginas pueden no existir, es decir, salen en Google porque en su momento las detectó, lo cual no significa que estén ahora. Actualizar esa información lleva bastante tiempo, por eso dije que comunicaran a Google que esas páginas ya no existen.

    Supongo que eliminarlas de una en una es un trabajo inmenso, no sé si Google tendrá otra forma de hacerlo. De todas formas con el tiempo la situación se irá reconduciendo.

    No sé si me he explicado…

    Un saludo

El foro ‘SEO – SEM’ está cerrado y no se permiten nuevos debates ni respuestas.

Pin It on Pinterest

Ir al contenido