Quizás, si estás pendiente de las noticias sobre los cambios que se están sucediendo en el posicionamiento en buscadores o SEO desde la aparición de las inteligencias artificiales conversacionales, te hayan empezado a sonar dos nombres de ficheros que hasta ahora no existían: llms.txt y llms-full.txt, asociados a las nuevas técnicas de presencia y posicionamiento de marca en las IA.
Si no sabes aún qué son y para qué sirven estos archivos, mi objetivo hoy es explicártelo de la manera más sencilla y humana posible, pues te recomiendo que también a mi me ha costado entender su objetivo real, e incluso su funcionamiento, pues parece algo sencillo pero no lo es, y técnicamente también tienen su miga los archivos llms.txt y llms-full.txt, que ya son, actualmente, un estándar.
¿Qué son los archivos llms.txt y llms-full.txt?
Los archivos llms.txt y llms-full.txt son propuestas emergentes de estándares para ayudar a los grandes modelos de lenguaje (LLMs) a entender y procesar el contenido de una web de manera más eficiente y precisa.
Son una especie de guía diseñada específicamente para las inteligencias artificiales, a diferencia de los archivos de mapa del sitio tipo sitemap.xml que son para motores de búsqueda o robots.txt que controlan el rastreo de los bots de esos mismos buscadores.
¿En qué se diferencian los archivos llms.txt y llms-full.txt?
El objetivo de estos archivos es diferente, a pesar de ser complementarios, y por supuesto no obligatorios lo mires por donde lo mires.
llms.txt
Es un archivo de texto plano, generalmente en formato markdown, que actúa como un mapa personalizado y resumido del contenido más importante y valioso de un sitio web para los LLMs.
Sus objetivos son:
- Mejorar la comprensión del contexto: Ayuda a los LLMs a entender rápidamente de qué trata tu sitio y dónde encontrar la información clave, evitando que tengan que «adivinar» o rastrear páginas irrelevantes.
- Optimizar la recuperación de información: Al proporcionar una lista clara y priorizada de URLs con descripciones concisas, los LLMs pueden recuperar información relevante de forma más rápida y precisa, lo que es crucial para herramientas como chatbots o asistentes de IA.
- Superar limitaciones de la ventana de contexto: Los LLMs tienen una capacidad limitada para procesar texto de manera masiva (a lo que se denomina actualmente como ventana de contexto).
llms.txtayuda a enfocar al modelo en el contenido más esencial, maximizando el uso de esa ventana. - Mejorar la capacidad de cita y visibilidad de la IA: Permite que tu contenido sea mejor interpretado y citado en respuestas generadas por IA, mejorando (teóricamente) la posibilidad de visibilidad de tu marca en las respuestas conversacionales de los LLMs.
llms-full.txt
Este archivo es una versión más completa de todo el contenido de tu sitio o de secciones específicas, también en texto plano (markdown).
A diferencia de llms.txt, que es un índice, llms-full.txt contiene el texto detallado de la documentación o las páginas.
Su propósito es ofrecer:
- Acceso directo a la información: Proporciona a los LLMs el contenido completo sin necesidad de seguir enlaces.
- Contexto enriquecido: Ideal para documentación técnica, manuales o bases de conocimiento donde la profundidad de la información es clave.
- Uso en IDEs y herramientas de desarrollo: Puede ser utilizado para que los LLMs accedan a documentación de APIs o bibliotecas de programación dentro de entornos de desarrollo integrados.
Diferencias clave resumidas entre los archivos llms.txt y llms-full-txt
No me enrollo, te lo resumo:
| Archivo | Qué es |
|---|---|
llms.txt |
Un archivo de texto sencillo, tipo lista, que indica qué IAs pueden o no acceder a tu contenido. Ideal para empezar. |
llms-full.txt |
Una versión más completa y detallada donde puedes definir reglas específicas para cada modelo de IA (qué pueden hacer, si pueden entrenarse con tu contenido, etc.). |
| Archivo | Objetivo |
|---|---|
llms.txt |
Permitir o bloquear ciertos modelos IA de forma rápida. |
llms-full.txt |
Definir con más precisión cómo puede o no puede usarse tu contenido (lectura, resumen, entrenamiento, etc.). |
llms.txt |
llms-full.txt |
|
| Propósito | Índice seleccionado, es una especie de mapa de navegación para LLMs. |
Contenido completo detallado.
|
| Contenido | URLs con títulos y descripciones concisas. |
Texto completo de páginas o documentos en markdown.
|
| Cómo lo usa el LLM | El LLM sigue los enlaces para obtener detalles. |
El LLM procesa el contenido directamente.
|
| Ventaja principal | Enfoca al LLM, optimiza la ventana de contexto. |
Proporciona contexto enriquecido, reduce la necesidad de navegación.
|
¿Los archivos llms.txt y llms-full.txt son un estándar establecido?
Los archivos llms.txt y llms-full.txt se están popularizando en el SEO orientado a inteligencia artificial, AIO, GEO, LLMO o como termine denominándose, y la gestión de la visibilidad web en la era de las IAs conversacionales, pero aún no son. un estándar oficial.
Para que te quede claro, lo repito, no son un estándar oficial aún, como lo es robots.txt, son una propuesta que algunos desarrolladores, creadores y empresas están empezando a usar como parte de movimientos de ética en la inteligencia artificial.
¿Qué IAs hacen caso a los archivos llms.txt y llms-full.txt?
Que yo haya podido comprobar analizando los datos de VigIA, a día de hoy ninguna IA lo lee siquiera.
¿Aportan algo los archivos llms.txt y llms-full.txt al SEO o a la visibilidad en las IAs?
Los archivos llms.txt y llms-full.txt están enfocados en la optimización para inteligencias artificiales o AIO, no para el SEO, aunque de manera secundaria, residual diría yo, puede que en según que situaciones puedan mejorar – algo – el posicionamiento en buscadores, mientras estos sigan existiendo como los conocíamos hasta ahora.
Esto es lo que prometen:
| Ámbito | Beneficio | Detalle | Alcance |
| Comprensión de la IA | Mejora de la precisión de las respuestas de las IAs | Guía a los modelos de IA para proporcionar respuestas más exactas y relevantes a las consultas de los usuarios. | AIO |
| Visibilidad | Aumento de las citas y la visibilidad en las IAs | Incrementa las posibilidades de que el sitio sea referenciado y enlazado por chatbots y herramientas de IA. | AIO |
| Control del contenido | Mayor control sobre el uso del contenido por parte de las IAs | Permite a los propietarios de sitios web influir en cómo los modelos de IA interpretan y utilizan su información. | AIO |
| Eficiencia | Reducción de errores y optimización de recursos | Ayuda a la IA a evitar alucinaciones y reduce la carga del servidor al dirigirla solo al contenido relevante. | AIO |
| Estratégico | Preparación para la nueva Internet | Optimiza la web para el auge de las IAs conversacionales, mejorando la visibilidad en las mismas, frente a quien no optimice | AIO |
| SEO indirecto | Potencial de tráfico de referencia | Las citas de las IAs pueden generar visitas orgánicas al sitio cuando acompañan sus respuestas de enlaces |
Ambos (principalmente AIO, y potencialmente impacto indirecto en SEO)
|
¿Cómo se crean en WordPress los archivos llms.txt y llms-full.txt?
Si ya te has decidido hay básicamente 2 maneras de crear estos archivos:
Manual
-
Crea el archivo
llms.txtollms-full.txtcon el contenido que desees. -
Sube el archivo a la raíz de tu instalación WordPress (
/public_html/o/).
Plugins
Hay ya varios plugins con los que generar y mantener estos archivos desde el escritorio de WordPress, que te permitirán:
-
-
Seleccionar modelos permitidos
-
Configurar algunos parámetros
-
No te recomiendo hacerlo manualmente, mucho mejor con plugins, y actualmente el panorama en cuanto a la generación de archivos llms.txt y llms-full.txt es este:
| Plugin | llms.txt |
llms-full.txt |
Configuración | Notas |
|---|---|---|---|---|
| Yoast SEO | SÍ | NO | Baja (activar/desactivar) | Opción sencilla, no personalizable, automático |
| All in One SEO | SÍ | NO | Baja-Básica | Lo genera automáticamente, opción de editar contenido simple |
| Rank Math | SÍ | NO | — | No genera aún archivos llms.txt |
| SEOPress | NO | NO | — | No genera aún archivos llms.txt |
| VigIA | SÍ | SÍ | Muy alta (selección por tipos de contenido, taxonomías, exclusiones manuales y por patrón, integración con plugins SEO, auto-regeneración programada) | Todo en uno: genera ambos archivos + analítica y bloqueo de crawlers IA, gratuito |
| LLMs.txt and LLMs‑Full.txt Generator | SÍ | SÍ | Alta (selección, exclusiones, manual/auto) | Muy completo, gratuito |
| LLMs Text Generator (Fulgid) | SÍ | SÍ | Alta (selectivo, SEO, analítica, emojis) | Ambos archivos, personalización de contenido, integración SEO, automatización, interfaz moderna |
| Website LLMs.txt | SÍ | NO | Media (tipos de contenido, frecuencia) | Se integra con Yoast y Rank Math, fácil de usar |
| LLMs.txt Generator | SÍ | NO | Básica en la gratuita, media en premium | Gratis solo páginas y actualización mensual, ampliable en versión de pago |
| Advanced LLMs.txt Generator | SÍ | NO | Media | Muy automatizado, escasas opciones avanzadas |
Si buscas una solución integral, VigIA merece mención especial, no porque lo diga yo, también, sino porque no solo genera ambos archivos con todas las opciones de configuración imaginables (tipos de contenido, taxonomías, exclusiones por patrón, integración con los principales plugins SEO para respetar noindex, auto-regeneración programada…), sino que además incluye analítica e informes te permiten monitorizar qué crawlers de IA están visitando tu web y bloquearlos si lo deseas.
Es el único plugin que combina la generación de llms.txt, analítica de IAs y gestión activa de los bots de inteligencia artificial.
Resumiendo, ¿quieres ambos archivos (llms.txt + llms-full.txt) y control total?, usa VigIA (que además te permite monitorizar y bloquear crawlers de IA), o sino LLMs.txt and LLMs‑Full.txt Generator o LLMs Text Generator, menos completos pero también válidos. Pero vamos, que cualquiera de los específicos también te vale, o espera a que tu plugin de SEO los implemente.
Quiero crear manualmente los archivos llms.txt y llms-full.txt ¿cómo se hace?
La implementación es en principio sencilla:
-
Crea el archivo
llms.txty/ollms-full.txtcon el contenido que desees. -
Sube el archivo a la raíz de tu instalación WordPress (
/public_html/o/).
Estructura de los archivos lms.txt y llms-full.txt
Los archivos están escritos en markdown para ser legibles tanto por humanos como por máquinas. La estructura básica incluye:
-
llms.txt:- Encabezado H1 (#): Un único encabezado con el nombre del proyecto o sitio web (obligatorio).
- Bloque de resumen: Un resumen breve del proyecto o sitio, generalmente en una cita en bloque (>).
- Secciones con encabezados H2 (##): Organizan el contenido en categorías como documentación, guías, APIs, o casos de uso.
- Enlaces a recursos: URLs (absolutas, no relativas) que dirigen a documentación técnica, guías rápidas, o ejemplos relevantes.
- Jerarquía clara: Uso de encabezados y listas para estructurar la información de manera lógica.
-
llms-full.txt:- Similar a
llms.txt, pero incluye información más detallada, como contenido completo de documentación, referencias a APIs, o ejemplos extensos. - Puede contener múltiples secciones con subsecciones (H3, H4, etc.) para cubrir todos los aspectos relevantes del sitio.
- Es menos común y se usa cuando el sitio requiere proporcionar un contexto exhaustivo a los LLMs.
- Similar a
Parámetros y reglas que puedes usar en los archivos lms.txt y llms-full.txt
Hay una serie de reglas o parámetros, que puedes usar en estos archivos. Son reglas similares a las que añades al archivo robots.txt, como permitir o restringir acceso a ciertas áreas, o requerir atribución a tu sitio y cosas así.
Estos son los parámetros, para un uso básico, sencillo, que es el que aplican la mayoría de los plugins WordPress:
| Parámetro | Archivo | ¿Para qué sirve? |
|---|---|---|
model |
Ambos | Nombre del modelo IA (ej: gpt-4, claude-3) |
provider |
llms-full.txt |
Quién lo ha desarrollado (OpenAI, Anthropic, Meta, etc.) |
access |
Ambos | allow o disallow. Si se permite el acceso de esa IA al contenido |
usage |
llms-full.txt |
Qué usos están permitidos: read-only, chat, summarization, etc. |
training |
llms-full.txt |
Si se permite usar el contenido para entrenar al modelo (allowed / disallowed) |
comment |
llms-full.txt |
Campo opcional para explicar tus decisiones |
Se aplicarían así:
model: gpt-4 provider: openai access: allow usage: read-only training: disallowed
Y luego están las reglas o directivas, de uso avanzado:
| Directiva | Descripción | Valores permitidos | Ejemplo |
LLM |
Especifica el modelo de IA al que se aplican las reglas. Puede ser general o específico. | * (todos los LLMs) o nombre del modelo (p.ej.: ChatGPT, Claude, Grok) |
LLM: * o LLM: ChatGPT |
$trainingAllowed |
Indica si el contenido puede usarse para entrenar modelos de IA. | true, false |
$trainingAllowed: false |
$chatAllowed |
Permite o prohíbe el uso del contenido en respuestas de chat generadas por LLMs. | true, false |
$chatAllowed: true |
$embedded |
Controla si el contenido puede incrustarse en otros contextos (p.ej.: resúmenes). | allowed, disallowed |
$embedded: allowed |
$responseLength |
Limita la longitud de las respuestas generadas por el LLM (en palabras). | Número entero (p.ej.: 150) |
$responseLength: 150 |
Path |
Especifica una ruta del sitio a la que se aplican las reglas. | Ruta absoluta (p.ej.: /area-registrados/) |
Path: /area-registrados/ |
Una implementación de este tipo de directivas avanzadas sería como en este ejemplo:
LLM: * $trainingAllowed: false $chatAllowed: true $embedded: allowed $responseLength: 150 LLM: ChatGPT $trainingAllowed: false $chatAllowed: true LLM: * Path: /area-registrados/ $trainingAllowed: false $chatAllowed: false
Para finalizar, aquí tienes un ejemplo de un poco de todo…
Ejemplo de llms.txt con parámetros básicos:
gpt-4: allow claude-3: disallow gemini-pro: allow llama-3: disallow # Mi contenido (ejemplo) # / (Portada) # Bienvenido a nuestra empresa. Ofrecemos soluciones digitales a medida, con enfoque humano. # /contacto # Escríbenos para agendar una reunión. Te responderemos en menos de 24h. # /servicios # Desarrollo web, diseño UX/UI y posicionamiento SEO para autónomos y pymes.
Ejemplo de llms-full.txt con parámetros básicos:
model: gpt-4 provider: openai access: allow usage: read-only training: disallowed comment: Se permite solo lectura en toda la web. model: claude-3 provider: anthropic access: disallow comment: No se permite acceder a ningún contenido. model: gemini-pro provider: google access: allow usage: summarization, chat training: disallowed model: llama-3 provider: meta access: disallow # Mi contenido (ejemplo) # / (Portada) # Bienvenido a nuestra empresa. Ofrecemos soluciones digitales a medida, con enfoque humano. # /contacto # Escríbenos para agendar una reunión. Te responderemos en menos de 24h. # /servicios # Desarrollo web, diseño UX/UI y posicionamiento SEO para autónomos y pymes.
Ejemplo de llms.txt con directrices avanzadas:
LLM: gpt-4 $trainingAllowed: false $chatAllowed: true $responseLength: 200 Path: / LLM: gpt-4 $chatAllowed: false Path: /contacto LLM: claude-3 $trainingAllowed: false $chatAllowed: false Path: / LLM: gemini-pro $trainingAllowed: false $chatAllowed: true $embedded: allowed $responseLength: 100 Path: /servicios # Mi contenido (ejemplo) Path: / # Bienvenido a nuestra empresa. Ofrecemos soluciones digitales a medida, con enfoque humano. Path: /contacto # Escríbenos para agendar una reunión. Te responderemos en menos de 24h. Path: /servicios # Desarrollo web, diseño UX/UI y posicionamiento SEO para autónomos y pymes.
Ejemplo de llms-full.txt con directrices avanzadas:
LLM: gpt-4 $trainingAllowed: false $chatAllowed: true $responseLength: 200 Path: / LLM: gpt-4 $chatAllowed: false $responseLength: 0 Path: /contacto # Comentario: No se permite chat ni respuestas en la página de contacto. LLM: claude-3 $trainingAllowed: false $chatAllowed: false $embedded: disallowed Path: / LLM: gemini-pro $trainingAllowed: false $chatAllowed: true $embedded: allowed $responseLength: 100 Path: /servicios LLM: llama-3 $trainingAllowed: false $chatAllowed: false Path: / # Mi contenido (ejemplo) Path: / # Bienvenido a nuestra empresa. Ofrecemos soluciones digitales a medida, con enfoque humano. Path: /contacto # Escríbenos para agendar una reunión. Te responderemos en menos de 24h. Path: /servicios # Desarrollo web, diseño UX/UI y posicionamiento SEO para autónomos y pymes.
¿Y por qué debería yo facilitar el acceso a mis contenidos a las IAs? ¿no hemos dejado claro que nos roban sin pedir ni permiso ni disculpas?
Tienes toda la razón, pero hay 2 verdades que están ahí, que son el elefante en la habitación:
- Las IAs YA han robado todo nuestro contenido hasta la fecha.
- Lo van a seguir haciendo, porque nadie – desde la política o la ley – lo está impidiendo.
Así que, implementar estos archivos, al menos, podría servir para mejorar en visibilidad, consciencia de marca y todas esas mierdas que ahora nos venden para que no lloremos tanto porque haya desaparecido la Internet de los enlaces y el SEO, o dicho de otro modo, para que, ya que roban todo nuestro contenido y lo van a seguir haciendo, que al menos lo hagan de la manera menos perjudicial posible.
¿Entonces qué, los añado a mi WordPress?
Por resumir a la brava, los archivos llms.txt y llms-full.txt son una iniciativa emergente, interesante si quieres, para mejorar la forma en que los modelos de lenguaje grandes interactúan y extraen información de los sitios web.
Aunque aún no son un estándar adoptado por las IAs, los archivos llms.txt y llms-full.txt son, de momento, el único paso posible hacia una web que, al mismo tiempo, sea más «amigable para la IA» y «respetuoso con los creadores», y ofrecen a los propietarios de webs un mayor control sobre cómo se interpreta su información si esta aparece en las IAs, o incluso si quiere que su contenido aparezca en las IAs.
Así que, respuesta simple: tú decides
No hay nada seguro, no hay nada aún estandarizado del todo, pero hay ahí afuera montones de modelos de lenguaje de IA peleando por nuestro contenido y si los archivos llms.txt y llms-full.txt pueden ayudar a poner un poco de orden y reglas en esta selva en que se ha convertido Internet, de momento es lo único que tenemos, aparte de tratar de bloquear a los rastreadores de las IAs.
¿Te gustó este artículo? ¡Ni te imaginas lo que te estás perdiendo en YouTube!






