WordPress Hosting

llms llms full txt aio wordpress

Archivos llms.txt y llms-full.txt ¿qué son? ¿sirven de algo? (actualizado)

Quizás, si estás pendiente de las noticias sobre los cambios que se están sucediendo en el posicionamiento en buscadores o SEO desde la aparición de las inteligencias artificiales conversacionales, te hayan empezado a sonar dos nombres de ficheros que hasta ahora no existían: llms.txt y llms-full.txt, asociados a las nuevas técnicas de presencia y posicionamiento de marca en las IA.

Si no sabes aún qué son y para qué sirven estos archivos, mi objetivo hoy es explicártelo de la manera más sencilla y humana posible, pues te recomiendo que también a mi me ha costado entender su objetivo real, e incluso su funcionamiento, pues parece algo sencillo pero no lo es, y técnicamente también tienen su miga los archivos llms.txt y llms-full.txt, que ya son, actualmente, un estándar.

¿Qué son los archivos llms.txt y llms-full.txt?

Los archivos llms.txt y llms-full.txt son propuestas emergentes de estándares para ayudar a los grandes modelos de lenguaje (LLMs) a entender y procesar el contenido de una web de manera más eficiente y precisa.

Son una especie de guía diseñada específicamente para las inteligencias artificiales, a diferencia de los archivos de mapa del sitio tipo sitemap.xml que son para motores de búsqueda o robots.txt que controlan el rastreo de los bots de esos mismos buscadores.

¿En qué se diferencian los archivos llms.txt y llms-full.txt?

El objetivo de estos archivos es diferente, a pesar de ser complementarios, y por supuesto no obligatorios lo mires por donde lo mires.

llms.txt

Es un archivo de texto plano, generalmente en formato markdown, que actúa como un mapa personalizado y resumido del contenido más importante y valioso de un sitio web para los LLMs.

Sus objetivos son:

  • Mejorar la comprensión del contexto: Ayuda a los LLMs a entender rápidamente de qué trata tu sitio y dónde encontrar la información clave, evitando que tengan que «adivinar» o rastrear páginas irrelevantes.
  • Optimizar la recuperación de información: Al proporcionar una lista clara y priorizada de URLs con descripciones concisas, los LLMs pueden recuperar información relevante de forma más rápida y precisa, lo que es crucial para herramientas como chatbots o asistentes de IA.
  • Superar limitaciones de la ventana de contexto: Los LLMs tienen una capacidad limitada para procesar texto de manera masiva (a lo que se denomina actualmente como ventana de contexto). llms.txt ayuda a enfocar al modelo en el contenido más esencial, maximizando el uso de esa ventana.
  • Mejorar la capacidad de cita y visibilidad de la IA: Permite que tu contenido sea mejor interpretado y citado en respuestas generadas por IA, mejorando (teóricamente) la posibilidad de visibilidad de tu marca en las respuestas conversacionales de los LLMs.

llms-full.txt

Este archivo es una versión más completa de todo el contenido de tu sitio o de secciones específicas, también en texto plano (markdown).

A diferencia de llms.txt, que es un índice, llms-full.txt contiene el texto detallado de la documentación o las páginas.

Su propósito es ofrecer:

  • Acceso directo a la información: Proporciona a los LLMs el contenido completo sin necesidad de seguir enlaces.
  • Contexto enriquecido: Ideal para documentación técnica, manuales o bases de conocimiento donde la profundidad de la información es clave.
  • Uso en IDEs y herramientas de desarrollo: Puede ser utilizado para que los LLMs accedan a documentación de APIs o bibliotecas de programación dentro de entornos de desarrollo integrados.

Diferencias clave resumidas entre los archivos llms.txt y llms-full-txt

No me enrollo, te lo resumo:

Archivo Qué es
llms.txt Un archivo de texto sencillo, tipo lista, que indica qué IAs pueden o no acceder a tu contenido. Ideal para empezar.
llms-full.txt Una versión más completa y detallada donde puedes definir reglas específicas para cada modelo de IA (qué pueden hacer, si pueden entrenarse con tu contenido, etc.).
Archivo Objetivo
llms.txt Permitir o bloquear ciertos modelos IA de forma rápida.
llms-full.txt Definir con más precisión cómo puede o no puede usarse tu contenido (lectura, resumen, entrenamiento, etc.).
llms.txt llms-full.txt
Propósito Índice seleccionado, es una especie de mapa de navegación para LLMs.
Contenido completo detallado.
Contenido URLs con títulos y descripciones concisas.
Texto completo de páginas o documentos en markdown.
Cómo lo usa el LLM El LLM sigue los enlaces para obtener detalles.
El LLM procesa el contenido directamente.
Ventaja principal Enfoca al LLM, optimiza la ventana de contexto.
Proporciona contexto enriquecido, reduce la necesidad de navegación.

¿Los archivos llms.txt y llms-full.txt son un estándar establecido?

Los archivos llms.txt y llms-full.txt se están popularizando en el SEO orientado a inteligencia artificial, AIO, GEO, LLMO o como termine denominándose, y la gestión de la visibilidad web en la era de las IAs conversacionales, pero aún no son. un estándar oficial.

Para que te quede claro, lo repito, no son un estándar oficial aún, como lo es robots.txt, son una propuesta que algunos desarrolladores, creadores y empresas están empezando a usar como parte de movimientos de ética en la inteligencia artificial.

¿Qué IAs hacen caso a los archivos llms.txt y llms-full.txt?

Que yo haya podido comprobar analizando los datos de VigIA, a día de hoy ninguna IA lo lee siquiera.

¿Aportan algo los archivos llms.txt y llms-full.txt al SEO o a la visibilidad en las IAs?

Los archivos llms.txt y llms-full.txt están enfocados en la optimización para inteligencias artificiales o AIO, no para el SEO, aunque de manera secundaria, residual diría yo, puede que en según que situaciones puedan mejorar – algo – el posicionamiento en buscadores, mientras estos sigan existiendo como los conocíamos hasta ahora.

Esto es lo que prometen:

Ámbito Beneficio Detalle Alcance
Comprensión de la IA Mejora de la precisión de las respuestas de las IAs Guía a los modelos de IA para proporcionar respuestas más exactas y relevantes a las consultas de los usuarios. AIO
Visibilidad Aumento de las citas y la visibilidad en las IAs Incrementa las posibilidades de que el sitio sea referenciado y enlazado por chatbots y herramientas de IA. AIO
Control del contenido Mayor control sobre el uso del contenido por parte de las IAs Permite a los propietarios de sitios web influir en cómo los modelos de IA interpretan y utilizan su información. AIO
Eficiencia Reducción de errores y optimización de recursos Ayuda a la IA a evitar alucinaciones y reduce la carga del servidor al dirigirla solo al contenido relevante. AIO
Estratégico Preparación para la nueva Internet Optimiza la web para el auge de las IAs conversacionales, mejorando la visibilidad en las mismas, frente a quien no optimice AIO
SEO indirecto Potencial de tráfico de referencia Las citas de las IAs pueden generar visitas orgánicas al sitio cuando acompañan sus respuestas de enlaces
Ambos (principalmente AIO, y potencialmente impacto indirecto en SEO)

¿Cómo se crean en WordPress los archivos llms.txt y llms-full.txt?

Si ya te has decidido hay básicamente 2 maneras de crear estos archivos:

Manual

  1. Crea el archivo llms.txt o llms-full.txt con el contenido que desees.

  2. Sube el archivo a la raíz de tu instalación WordPress (/public_html/ o /).

Plugins

Hay ya varios plugins con los que generar y mantener estos archivos desde el escritorio de WordPress, que te permitirán:

    • Seleccionar modelos permitidos

    • Configurar algunos parámetros

No te recomiendo hacerlo manualmente, mucho mejor con plugins, y actualmente el panorama en cuanto a la generación de archivos llms.txt y llms-full.txt es este:

Plugin llms.txt llms-full.txt Configuración Notas
Yoast SEO NO Baja (activar/desactivar) Opción sencilla, no personalizable, automático
All in One SEO NO Baja-Básica Lo genera automáticamente, opción de editar contenido simple
Rank Math NO No genera aún archivos llms.txt
SEOPress NO NO No genera aún archivos llms.txt
VigIA Muy alta (selección por tipos de contenido, taxonomías, exclusiones manuales y por patrón, integración con plugins SEO, auto-regeneración programada) Todo en uno: genera ambos archivos + analítica y bloqueo de crawlers IA, gratuito
LLMs.txt and LLMs‑Full.txt Generator Alta (selección, exclusiones, manual/auto) Muy completo, gratuito
LLMs Text Generator (Fulgid) Alta (selectivo, SEO, analítica, emojis) Ambos archivos, personalización de contenido, integración SEO, automatización, interfaz moderna
Website LLMs.txt NO Media (tipos de contenido, frecuencia) Se integra con Yoast y Rank Math, fácil de usar
LLMs.txt Generator NO Básica en la gratuita, media en premium Gratis solo páginas y actualización mensual, ampliable en versión de pago
Advanced LLMs.txt Generator NO Media Muy automatizado, escasas opciones avanzadas

Si buscas una solución integral, VigIA merece mención especial, no porque lo diga yo, también, sino porque no solo genera ambos archivos con todas las opciones de configuración imaginables (tipos de contenido, taxonomías, exclusiones por patrón, integración con los principales plugins SEO para respetar noindex, auto-regeneración programada…), sino que además incluye analítica e informes te permiten monitorizar qué crawlers de IA están visitando tu web y bloquearlos si lo deseas.

Es el único plugin que combina la generación de llms.txt, analítica de IAs y gestión activa de los bots de inteligencia artificial.

Resumiendo, ¿quieres ambos archivos (llms.txt + llms-full.txt) y control total?, usa VigIA (que además te permite monitorizar y bloquear crawlers de IA), o sino LLMs.txt and LLMs‑Full.txt Generator o LLMs Text Generator, menos completos pero también válidos. Pero vamos, que cualquiera de los específicos también te vale, o espera a que tu plugin de SEO los implemente.

Quiero crear manualmente los archivos llms.txt y llms-full.txt ¿cómo se hace?

La implementación es en principio sencilla:

  1. Crea el archivo llms.txt y/o llms-full.txt con el contenido que desees.

  2. Sube el archivo a la raíz de tu instalación WordPress (/public_html/ o /).

Estructura de los archivos lms.txt y llms-full.txt

Los archivos están escritos en markdown para ser legibles tanto por humanos como por máquinas. La estructura básica incluye:

  1. llms.txt:

    • Encabezado H1 (#): Un único encabezado con el nombre del proyecto o sitio web (obligatorio).
    • Bloque de resumen: Un resumen breve del proyecto o sitio, generalmente en una cita en bloque (>).
    • Secciones con encabezados H2 (##): Organizan el contenido en categorías como documentación, guías, APIs, o casos de uso.
    • Enlaces a recursos: URLs (absolutas, no relativas) que dirigen a documentación técnica, guías rápidas, o ejemplos relevantes.
    • Jerarquía clara: Uso de encabezados y listas para estructurar la información de manera lógica.
  2. llms-full.txt:

    • Similar a llms.txt, pero incluye información más detallada, como contenido completo de documentación, referencias a APIs, o ejemplos extensos.
    • Puede contener múltiples secciones con subsecciones (H3, H4, etc.) para cubrir todos los aspectos relevantes del sitio.
    • Es menos común y se usa cuando el sitio requiere proporcionar un contexto exhaustivo a los LLMs.

Parámetros y reglas que puedes usar en los archivos lms.txt y llms-full.txt

Hay una serie de reglas o parámetros, que puedes usar en estos archivos. Son reglas similares a las que añades al archivo robots.txt, como permitir o restringir acceso a ciertas áreas, o requerir atribución a tu sitio y cosas así.

Estos son los parámetros, para un uso básico, sencillo, que es el que aplican la mayoría de los plugins WordPress:

Parámetro Archivo ¿Para qué sirve?
model Ambos Nombre del modelo IA (ej: gpt-4, claude-3)
provider llms-full.txt Quién lo ha desarrollado (OpenAI, Anthropic, Meta, etc.)
access Ambos allow o disallow. Si se permite el acceso de esa IA al contenido
usage llms-full.txt Qué usos están permitidos: read-only, chat, summarization, etc.
training llms-full.txt Si se permite usar el contenido para entrenar al modelo (allowed / disallowed)
comment llms-full.txt Campo opcional para explicar tus decisiones

Se aplicarían así:

model: gpt-4
provider: openai
access: allow
usage: read-only
training: disallowed

Y luego están las reglas o directivas, de uso avanzado:

Directiva Descripción Valores permitidos Ejemplo
LLM Especifica el modelo de IA al que se aplican las reglas. Puede ser general o específico. * (todos los LLMs) o nombre del modelo (p.ej.: ChatGPT, Claude, Grok)
LLM: * o LLM: ChatGPT
$trainingAllowed Indica si el contenido puede usarse para entrenar modelos de IA. true, false
$trainingAllowed: false
$chatAllowed Permite o prohíbe el uso del contenido en respuestas de chat generadas por LLMs. true, false
$chatAllowed: true
$embedded Controla si el contenido puede incrustarse en otros contextos (p.ej.: resúmenes). allowed, disallowed
$embedded: allowed
$responseLength Limita la longitud de las respuestas generadas por el LLM (en palabras). Número entero (p.ej.: 150)
$responseLength: 150
Path Especifica una ruta del sitio a la que se aplican las reglas. Ruta absoluta (p.ej.: /area-registrados/)
Path: /area-registrados/

Una implementación de este tipo de directivas avanzadas sería como en este ejemplo:

LLM: *
$trainingAllowed: false
$chatAllowed: true
$embedded: allowed
$responseLength: 150

LLM: ChatGPT
$trainingAllowed: false
$chatAllowed: true

LLM: *
Path: /area-registrados/
$trainingAllowed: false
$chatAllowed: false

Para finalizar, aquí tienes un ejemplo de un poco de todo…

Ejemplo de llms.txt con parámetros básicos:

gpt-4: allow
claude-3: disallow
gemini-pro: allow
llama-3: disallow

# Mi contenido (ejemplo)
# / (Portada)
# Bienvenido a nuestra empresa. Ofrecemos soluciones digitales a medida, con enfoque humano.

# /contacto
# Escríbenos para agendar una reunión. Te responderemos en menos de 24h.

# /servicios
# Desarrollo web, diseño UX/UI y posicionamiento SEO para autónomos y pymes.

Ejemplo de llms-full.txt con parámetros básicos:

model: gpt-4
provider: openai
access: allow
usage: read-only
training: disallowed
comment: Se permite solo lectura en toda la web.

model: claude-3
provider: anthropic
access: disallow
comment: No se permite acceder a ningún contenido.

model: gemini-pro
provider: google
access: allow
usage: summarization, chat
training: disallowed

model: llama-3
provider: meta
access: disallow

# Mi contenido (ejemplo)
# / (Portada)
# Bienvenido a nuestra empresa. Ofrecemos soluciones digitales a medida, con enfoque humano.

# /contacto
# Escríbenos para agendar una reunión. Te responderemos en menos de 24h.

# /servicios
# Desarrollo web, diseño UX/UI y posicionamiento SEO para autónomos y pymes.

Ejemplo de llms.txt con directrices avanzadas:

LLM: gpt-4
$trainingAllowed: false
$chatAllowed: true
$responseLength: 200
Path: /

LLM: gpt-4
$chatAllowed: false
Path: /contacto

LLM: claude-3
$trainingAllowed: false
$chatAllowed: false
Path: /

LLM: gemini-pro
$trainingAllowed: false
$chatAllowed: true
$embedded: allowed
$responseLength: 100
Path: /servicios

# Mi contenido (ejemplo)
Path: /
# Bienvenido a nuestra empresa. Ofrecemos soluciones digitales a medida, con enfoque humano.

Path: /contacto
# Escríbenos para agendar una reunión. Te responderemos en menos de 24h.

Path: /servicios
# Desarrollo web, diseño UX/UI y posicionamiento SEO para autónomos y pymes.

Ejemplo de llms-full.txt con directrices avanzadas:

LLM: gpt-4
$trainingAllowed: false
$chatAllowed: true
$responseLength: 200
Path: /

LLM: gpt-4
$chatAllowed: false
$responseLength: 0
Path: /contacto
# Comentario: No se permite chat ni respuestas en la página de contacto.

LLM: claude-3
$trainingAllowed: false
$chatAllowed: false
$embedded: disallowed
Path: /

LLM: gemini-pro
$trainingAllowed: false
$chatAllowed: true
$embedded: allowed
$responseLength: 100
Path: /servicios

LLM: llama-3
$trainingAllowed: false
$chatAllowed: false
Path: /

# Mi contenido (ejemplo)
Path: /
# Bienvenido a nuestra empresa. Ofrecemos soluciones digitales a medida, con enfoque humano.

Path: /contacto
# Escríbenos para agendar una reunión. Te responderemos en menos de 24h.

Path: /servicios
# Desarrollo web, diseño UX/UI y posicionamiento SEO para autónomos y pymes.

¿Y por qué debería yo facilitar el acceso a mis contenidos a las IAs? ¿no hemos dejado claro que nos roban sin pedir ni permiso ni disculpas?

Tienes toda la razón, pero hay 2 verdades que están ahí, que son el elefante en la habitación:

  1. Las IAs YA han robado todo nuestro contenido hasta la fecha.
  2. Lo van a seguir haciendo, porque nadie – desde la política o la ley – lo está impidiendo.

Así que, implementar estos archivos, al menos, podría servir para mejorar en visibilidad, consciencia de marca y todas esas mierdas que ahora nos venden para que no lloremos tanto porque haya desaparecido la Internet de los enlaces y el SEO, o dicho de otro modo, para que, ya que roban todo nuestro contenido y lo van a seguir haciendo, que al menos lo hagan de la manera menos perjudicial posible.

¿Entonces qué, los añado a mi WordPress?

Por resumir a la brava, los archivos llms.txt y llms-full.txt son una iniciativa emergente, interesante si quieres, para mejorar la forma en que los modelos de lenguaje grandes interactúan y extraen información de los sitios web.

Aunque aún no son un estándar adoptado por las IAs, los archivos llms.txt y llms-full.txt son, de momento, el único paso posible hacia una web que, al mismo tiempo, sea más «amigable para la IA» y «respetuoso con los creadores», y ofrecen a los propietarios de webs un mayor control sobre cómo se interpreta su información si esta aparece en las IAs, o incluso si quiere que su contenido aparezca en las IAs.

Así que, respuesta simple: tú decides

No hay nada seguro, no hay nada aún estandarizado del todo, pero hay ahí afuera montones de modelos de lenguaje de IA peleando por nuestro contenido y si los archivos llms.txt y llms-full.txt pueden ayudar a poner un poco de orden y reglas en esta selva en que se ha convertido Internet, de momento es lo único que tenemos, aparte de tratar de bloquear a los rastreadores de las IAs.

Compartir en redes
Resumir con IA

¿De cuánta utilidad te ha parecido este contenido?

¡Haz clic en las estrellas para valorarlo!

Promedio de puntuación 5 / 5. Total de votos: 9

¡Todavía no hay votos! Sé el primero en valorar este contenido.

Ya que has encontrado útil este contenido...

¡Sígueme en las redes sociales!

¿Te gustó este artículo? ¡Ni te imaginas lo que te estás perdiendo en YouTube!



Sobre el autor

Scroll al inicio