WordPress Hosting

vigia analitica ias gratis

Analítica IA, generación de LLMs.txt, control y bloqueo de bots rastreadores de Inteligencia Artificial en WordPress (GRATIS) = VigIA

Si tienes una web WordPress, hay algo que probablemente no sepas: los bots de inteligencia artificial ya están visitando tu sitio. GPTBot de OpenAI, ClaudeBot de Anthropic, PerplexityBot… decenas de rastreadores pasan por tu web recopilando información para entrenar sus modelos o alimentar sus buscadores y chats.

Las preguntas son: ¿sabes cuáles? ¿con qué frecuencia? ¿qué páginas miran? Y más importante: ¿puedes hacer algo al respecto?

Hasta ahora no había forma sencilla de saberlo, y mucho menos de controlarlo, pero sobre todo es que no veo más que anunciar analíticas IA que encima son todas de pago, y sin aportar mucho más así que…

Por eso – y por mucho más – he creado VigIA.

¿Qué es VigIA?

logo completo vigia color

Y no, no es otro servicio de analítica y rastreo de IAs de pago como hay por ahí, ni muchísimo menos, es muchísimo más.

VigIA (un juego de palabras entre «vigía» y «IA») es un plugin gratuito que monitoriza, analiza y te permite controlar la actividad de más de 50 rastreadores de inteligencia artificial en tu WordPress.

La diferencia con otros plugins similares es que VigIA no se limita a mostrarte estadísticas bonitas, te da también herramientas para actuar.

Puedes bloquear rastreadores, gestionar tu robots.txt, recibir alertas y generar archivos llms.txt y llms-full.txt, todo desde el mismo sitio, y por si fuera poco … gratis 100%.

Un desarrollo intenso antes del lanzamiento

Aunque hoy podría decirse que es la presentación «oficial», VigIA ya lleva varias versiones de desarrollo a sus espaldas.

La versión inicial era funcional pero básica: detección de bots rastreadores, gráficos, comparativas, exportación a CSV y poco más.

En serio, estaba bien, más que bien, pero enseguida me di cuenta de que al poco tiempo te surgía la pregunta: Vale, veo la analítica y se qué IAs rastrean mi web pero ¿qué puedo hacer con esta información?, ¿y si quiero bloquear un bot que prácticamente vive en mi web?, ¿puedo hacer algo para conseguir que me visiten más IAs?

Así que antes de anunciarlo públicamente quise que el plugin estuviera a la altura, así que en poco tiempo ha pasado de ser un simple monitor de IAs a una suite completa de analítica y gestión de tráfico de bots rastreadores de IAs.

La versión 1.1 ya incorporaba bloqueo de bots mediante PHP, gestión de robots.txt y alertas por email, y con la 1.2 llegó una reconstrucción completa del generador de llms.txt con selección por tipos de contenido, filtros por taxonomías e integración con plugins SEO, para que no dependas de otros plugins y lo tengas todo integrado con la analítica.

El resultado es un plugin que hace lo que me hubiera gustado encontrar cuando busqué algo así. Y lo mejor de todo es que te lo regalo, es totalmente gratis.

Rastreo, estadísticas y analítica de IAs

El panel principal de VigIA te da una visión completa de la actividad de los bot crawlers de las IAs en tu web.

Seguimiento de más de 50 rastreadores de IA

VigIA detecta rastreadores de:

  • OpenAI: GPTBot, OAI-SearchBot, ChatGPT-User
  • Anthropic: ClaudeBot, Claude-Web, Claude-SearchBot
  • Google: Google-Extended, GoogleOther, Gemini-Deep-Research
  • Perplexity: PerplexityBot, Perplexity-User
  • Meta: Meta-ExternalAgent, FacebookBot
  • Microsoft: BingBot
  • ByteDance: Bytespider
  • Amazon: Amazonbot
  • Apple: Applebot-Extended
  • Y muchos más…

La lista se actualiza con cada versión del plugin.
vigia rastreadores monitorizados por defecto

Métricas principales

En la parte superior tienes los tres datos clave de un vistazo: total de visitas de rastreadores IA, número de rastreadores únicos que han pasado por tu web y páginas rastreadas.

Cada métrica incluye la comparativa con el período anterior, así que sabes si la actividad está subiendo o bajando.

vigia analítica control actividad rastreadores ia escritorio

Gráfico temporal

El gráfico de evolución de actividad muestra la evolución diaria de visitas. Puedes seleccionar el rango de fechas que quieras analizar: últimos 7 días, 30 días, este mes, el anterior o un rango personalizado.

Y si activas la comparativa, verás superpuesto el período anterior para detectar tendencias.

vigia – analítica y control de actividad de rastreadores ia linea temporal

Distribución por categorías

No todos los rastreadores de IA son iguales. VigIA los clasifica en cuatro categorías para que entiendas qué tipo de bots te visitan:

  • Entrenamiento IA (AI Training): Rastreadores que recopilan datos para entrenar modelos (GPTBot, ClaudeBot, Bytespider…)
  • Búsqueda IA (AI Search): Bots de buscadores con IA (PerplexityBot, OAI-SearchBot…)
  • Asistente IA (AI Assistant): Agentes que navegan en nombre de usuarios (ChatGPT-User, Claude-User…)
  • Raspador de datos (Data Scraper): Bot genéricos asociados a empresas de IA

El gráfico estilo dónut te muestra la proporción de cada categoría.

vigia rastreadores por categoria

Rankings y tablas

Debajo de los gráficos tienes dos tablas esenciales:

  • Principales rastreadores: Los bots más activos, con número de visitas y porcentaje del total.
  • Páginas más rastreadas: Qué URLs atraen más atención de las IAs.

vigia principales rastreadores y paginas

Registro de actividad, filtrado y bloqueo rápido de bots

La tabla de actividad reciente muestra cada visita individual con filtros por rastreador, categoría y fecha. Puedes ver exactamente qué bot visitó qué página y cuándo, incluyendo la dirección IP.

Desde esta misma tabla puedes actuar, pues cada fila tiene un desplegable con acciones rápidas para bloquear el rastreador o añadirlo a robots.txt.

vigia analitica registro actividad

Exportación CSV

Todo se puede exportar a CSV para análisis externo o informes, tanto periodos predefinidos, personalizados, como también incluir comparativa entre periodos.

vigia exportar

 

Rastreadores personalizados

¿Detectas un bot que no está en la lista? Puedes añadir rastreadores personalizados introduciendo el patrón de User-Agent. VigIA los monitorizará igual que los predefinidos.

vigia rastreadores bot ia personalizados

Los ‘Extras’ de VigIA

Todo esto de la analítica es, a grandes rasgos, lo que ofrecía el plugin en su primera versión, pero aquí empieza la parte más jugosa, los extras, lo que hace que el plugin pase de ser práctico a imprescindible.

Gestión de robots.txt para IAs

VigIA te permite gestionar las reglas de robots.txt específicas para rastreadores de IA sin editar archivos manualmente.

vigia disallow robots

Añadir reglas Disallow

Selecciona los rastreadores que quieres bloquear vía robots.txt y VigIA añade las reglas automáticamente. El plugin funciona tanto con robots.txt virtuales (generados por WordPress) como con archivos físicos creados por ti o plugins de SEO.

Vista previa

Un panel te muestra cómo queda tu robots.txt actual, incluyendo las reglas que añade VigIA.

Monitorización de cumplimiento

Esta es la función más potente: VigIA cruza los datos de visitas con tus reglas Disallow y te dice qué rastreadores las están ignorando.

Si tienes GPTBot en Disallow pero sigue apareciendo en tus registros de visitas, VigIA te lo muestra con un botón para bloquearlo vía PHP. Así pasas de «te pido que no entres» a «no vas a entrar».

vigia cumplimiento robots y bloqueo

Bloqueo de bots de IA

Aquí está una de las características que marcan diferencia.

El robots.txt es una sugerencia. Un bot bien educado lo respeta, pero no tiene obligación de hacerlo. De hecho, VigIA incluye monitorización de cumplimiento que te muestra qué bots están ignorando tus reglas.

El bloqueo PHP es otra cosa: devuelve un error 403 Forbidden antes de que el rastreador acceda a nada. Da igual que el bot ignore el robots.txt, no va a poder entrar.

vigia bloqueo bots php

Cómo funciona

VigIA intercepta cada petición al principio del proceso de WordPress. Si el User-Agent coincide con un rastreador bloqueado, corta la conexión inmediatamente con un 403.

El bloqueo se ejecuta en PHP puro, sin tocar archivos de configuración del servidor. Funciona igual en Apache, Nginx, LiteSpeed o cualquier otro servidor. No necesitas acceso root ni conocimientos de administración de sistemas.

Dos formas de bloquear

  • Por User-Agent: Bloqueas el nombre del rastreador. Por ejemplo, si bloqueas al GPTBot cualquier petición con ese User-Agent recibirá un 403.
  • Por IP: Para casos específicos, puedes bloquear direcciones IP concretas. Útil si detectas un bot que cambia de User-Agent o un scraper agresivo.

Formas de añadir bloqueos

Tienes varias formas de bloquear rastreadores:

  1. Desde el panel de analítica: En la tabla de actividad reciente, cada fila tiene un desplegable con opciones para  «Bloquear U.A.» o «Bloquear IP».
  2. Desde la tabla de rastreadores: En el listado de rastreadores monitorizados de la página de extras.
  3. Desde la página Extras: Formulario para añadir bloqueos manualmente, tanto por User-Agent como por IP.
  4. Desde cumplimiento de robots.txt: Si un rastreador ignora tu Disallow, aparece con un botón para bloquearlo directamente.

vigia bloquo de bots desde filtro de actividad

Alertas por email

No tienes que entrar al panel todos los días para saber qué pasa. VigIA puede enviarte informes periódicos automáticamente, una herramienta fundamental para no perderte nada.

vigia alertas email

Frecuencia configurable

Elige cuándo quieres recibir los informes:

  • Diario: Resumen de las últimas 24 horas.
  • Semanal: Resumen de los últimos 7 días.
  • Mensual: Resumen de los últimos 30 días.

Tres niveles de detalle

  • Mínimo: Solo te avisa de rastreadores nuevos que no habías visto antes. Ideal si solo quieres estar al tanto de novedades.
  • Normal: Incluye rastreadores nuevos, aviso de bots que ignoran robots.txt, resumen de estadísticas y comparativa con el período anterior.
  • Completo: Todo lo anterior más los picos de actividad detectados, top de páginas más rastreadas y ranking de rastreadores.

Los informes incluyen automáticamente la comparativa con el período anterior. Si esta semana has tenido un 40% de incremento o disminución de visitas de rastreadores que la anterior, lo verás reflejado.

vigia informe semanal de rastreadores ia fernando tellado wordpress vibe coding fernando tellado

Generador de llms.txt y llms-full.txt

El archivo llms.txt es una propuesta de estándar para ayudar a las IAs a entender qué contenido de tu web es relevante y cómo usarlo.

VigIA incluye un generador completo que va mucho más allá de lo básico. Hay muchos plugins para esta funcionalidad, casi demasiados, y he incluido en el plugin VigIA todo lo que ofrecen los otros, y más, en ocasiones características solo disponibles en sus versiones premium, pero aquí todo gratis.

No vas a encontrar otro plugin que te permita tanto con los archivos llms.txt y llms-full.txt, pero sobre todo ningún otro plugin de este tipo incluye una analítica que te permita comprobar si todo esto sirve de algo (o no).

extras de vigia generador llms full

Selección por tipo de contenido

Con un clic seleccionas qué tipos de contenido incluir: entradas, páginas y cualquier tipo de contenido personalizado que tengas registrado (productos de WooCommerce, porfolio, recetas…). VigIA detecta automáticamente todos los CPT que haya en tu instalación.

Filtrado por taxonomías

Puedes afinar más con filtros de taxonomías. Por ejemplo: incluir solo las entradas de determinadas categorías, excluir ciertas etiquetas, o filtrar por cualquier taxonomía personalizada.

Esto es útil si tienes secciones de tu web que no quieres que las IAs indexen, como contenido premium, páginas de aterrizaje privadas o categorías específicas.

Inclusión y exclusión manual

Con el buscador AJAX puedes añadir contenidos específicos a la lista de inclusión o exclusión. Escribes el título, seleccionas y listo.

Exclusión por patrones de URL

Si necesitas excluir grupos de URLs, puedes usar patrones con comodines. Por ejemplo:

  • /tienda/* excluye todo lo que cuelgue de /tienda/
  • */feed/ excluye todos los feeds
  • /landing-* excluye todas las URLs que empiecen por /landing-

extras de vigia excluir contenido personalizado

Integración con plugins SEO

VigIA se integra con los principales plugins SEO para excluir automáticamente el contenido marcado como noindex:

  • Yoast SEO
  • Rank Math
  • All in One SEO
  • SEOPress
  • The SEO Framework

Si tienes páginas marcadas como noindex en tu plugin SEO, VigIA las excluye del llms.txt y llms-full.txt automáticamente. Así mantienes coherencia entre lo que le dices a Google y lo que le dices a las IAs.

Dos archivos: llms.txt y llms-full.txt

Puedes generar ambos:

  • llms.txt: Versión resumida con títulos y extractos
  • llms-full.txt: Versión completa con el contenido íntegro

El modo de archivo completo, del llms-full.txt, es configurable: contenido completo o solo extractos, y puedes elegir también si incluir referencia a los archivos LLMs generados en tu robots.txt

Además, en la parte superior de la pantalla de extras tienes un enlace a cada uno de los archivos, para que todo sea más sencillo de usar.

Regeneración automática

No tienes que acordarte de regenerar los archivos cuando publiques contenido nuevo. VigIA puede hacerlo automáticamente con la frecuencia que elijas: diaria, semanal o mensual. De este modo se actualizará a medida que publiques nuevos contenidos, sin que tengas que estar pendiente.

Widget de escritorio

Por último, una funcionalidad que gusta a muchos es un vistazo rápido en el escritorio. Así que, para tener los datos siempre a la vista sin entrar a tu WordPress, VigIA añade un widget al escritorio de admin con un resumen de la actividad reciente.

No es completísimo, para eso está la analítica completa, pero te recuerda que estás analizando eso y te anima a revisarlo ¿no?

vigia widget escritorio

Privacidad

Por si las dudas, no hago ningún tipo de telemetría ni capto datos de ningún tipo desde el plugin. Te he dicho que es gratis y lo es del todo, tus datos están a salvo.

Todo se almacena en tu base de datos de WordPress, en una tabla propia (wp_vigia_visits). Ningún dato sale de tu servidor. No hay conexiones a servicios externos, no hay tracking, no hay por ahí escondido un Google Analytics de nadie, tampoco mío. Tus datos son tuyos, y para ti.

Además, relacionado con esto, y también con el siguiente punto, puedes decidir cómo y cuánto tiempo guardar los datos, y por supuesto si también borrarlos si un día desinstalas el plugin.

vigia ajustes de retencion de datos

Rendimiento

VigIA está optimizado para no afectar a la velocidad de tu web. La detección de rastreadores es una simple comprobación del User-Agent que se ejecuta en milisegundos.

Y, como te comento en el punto anterior, puedes configurar el periodo de retención en tu base de datos, desde 7 días a ilimitado, pasando por quincenal, mensual, trimestral, semestral o anual, lo que prefieras.

De todos modos ya te digo que no es el típico plugin que llena de basura tu base de datos, solo almacena lo imprescindible y en formato lo más óptimo posible, que yo también soy un obsesivo del rendimiento.

¿Qué ventajas tiene VigIA para bloquear rastreadores IA frente a otros plugins?

VigIA tiene como ventaja principal que combina bloqueo «real» vía PHP con gestión avanzada de robots.txt y analítica específica de rastreadores IA, mientras que muchos plugins sólo tocan robots.txt o añaden meta‑tags sin control ni visibilidad detallada.​

Bloqueo efectivo en cualquier servidor

  • VigIA bloquea bots devolviendo un 403 Forbidden desde PHP, de modo que aunque ignoren el robots.txt no pueden acceder al contenido, y funciona igual en Apache, Nginx, LiteSpeed, etc.​
  • Otros plugins de «Block AI Crawlers» suelen limitarse a añadir Disallow en robots.txt o meta noai/noimageai, que los rastreadores agresivos pueden ignorar porque son mecanismos meramente declarativos.​

Bloqueo vinculado a analítica

  • VigIA decide a quién bloqueas en base a datos: ves qué bots entran, cuántas veces y qué URLs rastrean antes de aplicar el bloqueo con un clic desde el propio panel de analítica.​
  • La mayoría de plugins que bloquean IA lo hacen de forma «ciega» (lista fija de bots, sin paneles ni estadísticas detalladas), así que no sabes realmente quién estás parando ni qué impacto tiene.​

Robots.txt con monitorización de cumplimiento

  • VigIA no sólo escribe reglas en robots.txt, también muestra qué rastreadores las respetan y cuáles las incumplen, permitiendo pasar de «sólo avisar» a bloqueo duro para los que no obedecen.​
  • Otros plugins se quedan en la parte de añadir Disallow para una lista de bots, sin feedback sobre si esas normas se cumplen ni automatismos para reaccionar ante los que las ignoran.​

Integración con llms.txt y bloqueo personalizado de IAs

  • VigIA complementa el bloqueo con llms.txt y llms-full.txt para definir qué contenidos se pueden usar (y cómo) por parte de sistemas IA, con filtros por tipo de contenido y exclusiones automáticas desde plugins SEO.​
  • Los plugins centrados en bloquear IA rara vez gestionan llms.txt o una política genérica; suelen aplicar reglas globales de «bloquear todo» o «decir que no» sin ese nivel de control fino sobre el entrenamiento, asistentes o búsquedas​.

Flujo de trabajo múltiple y mantenimiento

  • VigIA ofrece menú de bloqueo rápido, página específica para gestionar bots bloqueados y alertas por email con avisos de rastreadores que no cumplen tus normas, lo que facilita el mantenimiento continuo.​
  • Otros plugins de bloqueo suelen ser más estáticos: activas la opción, añaden directivas y rara vez incorporan informes periódicos ni un flujo claro para revisar y ajustar la estrategia según la actividad real de los rastreadores.

Podría resumirse en que la principal ventaja de VigIA es que te da un bisturí para gestionar el tráfico de IA, mientras que otros plugins te ofrecen un martillo (bloqueo general) o un pincel (sugerencias de robots.txt). VigIA ofrece ese enfoque de bloqueo quirúrgico, basado en identidad y contexto, frente a soluciones genéricas que bloquean por IP o comportamiento.

O lo que sería un listado rápido:

  • Bloqueo por IA concreta, no indiscriminado.
  • Visibilidad previa del impacto antes de bloquear.
  • Bloqueo real mediante HTTP 403.
  • Combinación de robots.txt y bloqueo activo.
  • No afecta al SEO ni a buscadores clásicos.
  • Decisiones claras, auditables y sin heurísticas opacas.

Sorpresa: esta comparación no te la digo yo, te la dicen las mismas IAs cuando les he preguntado: ChatGPTPerplexity – Google Gemini.

Gratis, en WordPress.org y en tu escritorio de admin

VigIA es completamente gratuito. Sin versión premium oculta, sin funciones capadas, sin límites artificiales en el número de visitas registradas o rastreadores monitorizados.

Está disponible en el repositorio oficial de WordPress.org, lo que significa actualizaciones automáticas desde tu WordPress y revisión de código exhaustiva por parte del equipo de plugins de WordPress. Está ahí sin trampa ni cartón.

Si quieres controlar a los bots de IA puedes descargar cuando quieras VigIA desde WordPress.org → es.wordpress.org/plugins/vigia/

¿Que por qué es gratis cuando hay montones de servicios que ofrecen incluso menos pagando?

Pues por lo mismo que el resto de plugins que subo gratis a WordPress.org, por varios motivos:

  • Muchas veces son versiones ampliadas de plugins que en su día desarrollamos para nuestros clientes.
  • Me jode muchísimo que cada vez haya menos plugins completos en WordPress.org
  • Siempre me sirve para aprender más sobre programación.
  • Subir plugins a WordPress.org tiene muchas ventajas.
  • Me lo paso bien.
  • Me gusta compartir lo que hago. Este blog también existe por ese mismo motivo.
  • A veces incluso me lo agradece algún usuario con una buena reseña o comentario.

Pero vamos, que si te parece mal o algo me lo cuentas ahí abajo, en los comentarios 😀

Compartir en redes
Resumir con IA

¿De cuánta utilidad te ha parecido este contenido?

¡Haz clic en las estrellas para valorarlo!

Promedio de puntuación 5 / 5. Total de votos: 13

¡Todavía no hay votos! Sé el primero en valorar este contenido.

Ya que has encontrado útil este contenido...

¡Sígueme en las redes sociales!

¿Te gustó este artículo? ¡Ni te imaginas lo que te estás perdiendo en YouTube!



Sobre el autor

11 comentarios en “Analítica IA, generación de LLMs.txt, control y bloqueo de bots rastreadores de Inteligencia Artificial en WordPress (GRATIS) = VigIA”

  1. Como siempre Fernando te sales, muchas gracias por poner a nuestra disposición un plugin tan completo, pero me surge una duda, ¿si instalo VigIA puedo quitar Native Sitemap Customizer?
    Gracias y saludos.

    1. Hola Jose,

      No veo el motivo, yo los tengo conviviendo y uno no interfiere en absoluto en el otro, de hecho se complementan de maravilla. Yo tengo el native, el de content signals y este funcionando sin configuraciones raras y cada uno hace lo suyo sin interferir en el resto. El content signals añade reglas a robots.txt, VigIA también (lo de los llms.txt) y el native sitemap solo se ocupa del mapa del sitio, nada más.

      ¿lo dices por alguna duda concreta que te haya hecho dudar?

  2. a pesar que Fernando explica el por qué es gratis, no termino de entenderlo.

    Me imagino tener que escribir esta nota, no el plugin, solo explicar su funcionalidad con tanto detalle. Yo cobraría para ponerle tantas horas, correcciones, relecturas. Es de altísimo nivel técnico.
    Y no sólo lo explica profesionalmente, sino que, además, desarrolló el plugin…

    No se cómo lo hace, pero así como hay Messis, Jordan y demás, está Fernando.

    Felicitaciones y gracias.

    1. jaja

      Gracias Roberto, es simplemente que soy así de intenso, y me apasiona lo que hago. Luego, viene alguien como tú, deja este comentario … y te juro que solo por eso ha valido la pena 🙂

  3. Hola, Fernando. Lo acabo de instalar en una web para probarlo y la sensación ha sido clara desde el minuto uno: esto está muy bien pensado. ¡¡¡Gracias!!!

    En segundos ya sabes qué IAs entran en la web, para qué lo hacen y qué están tocando dentro. Sin rodeos.
    La configuración básica es literal: 0 segundos. Y si quieres afinar con los extras, en un minuto lo tienes listo.

    Los datos se muestran de forma sencilla, clara y directa. ¡Es brutal» De verdad.

    Haz creado un buen plugin muy, muy necesario. De los que instalas “para probar…” y no lo quitas nunca.

    Un 10 sobre 10 y en wordpress.org sus 5 estrellas bien merecidas.

  4. Hola Fernando, gracias por el post y por el plugin. Como siempre, responden a un esfuerzo que, como dicen en otro comentarios, no se entiende que no sea remunerado.
    Sólo indicarte que los textos generados en el llms.txt no respetan acentos, eñes, etc. Yo no entiendo de informática y menos de IAs, pero, ¿no puede afectar esto a cómo leen las IAs esos textos?
    Graciask de nuevo

    1. A las IAs, como a Google, las tildes no les aportan nada, de nunca, y cuando entregas un fichero en modo código es más «universal» entregarlo sin tildes o caracteres que los navegadores puedan mostrar mal, como … eso, las tildes por ejemplo. Es el. mismo concepto que lo de no usar ñ en dominios: se puede, pero mejor no, o que no acepten tildes 🙂

    2. He estado dándole vueltas al tema y sí que había un posible pequeño fallo en algunos navegadores (Firefox sobre todo) y servidores, así que le he añadido un poco de refuerzo extra para forzar la codificación correcta. Ahora debería verse bien en cualquier situación.

      1. Hola Fernando. Gracias una vez más. Acabamos de actualizarlo y hemos comprobado que se ven perfecto. Efectivamente usamos normalmente Firefox estamos en Siteground.

Los comentarios están cerrados.

Scroll al inicio