Qué es llms.txt y por qué empieza a importar en SEO

llms.txt es un archivo de texto plano que colocas en la raíz de tu web para guiar a los modelos de lenguaje (LLMs) cuando rastrean o consultan tu contenido. Si alguna vez te has preguntado por qué tu web no aparece en las respuestas de herramientas como Perplexity o ChatGPT Browse, parte del problema puede estar aquí. No es un factor de ranking en Google (todavía), pero sí es una señal de que el ecosistema de búsqueda está cambiando y que esperar no es la estrategia más inteligente.

Qué es llms.txt antes de implementarlo

Un LLM (Large Language Model, o modelo de lenguaje de gran tamaño) no lee tu web como un humano. Cuando accede a ella, ve código HTML, scripts, menús de navegación, banners de cookies y un montón de ruido que dificulta extraer lo que realmente importa: tu contenido.

llms.txt es una propuesta de estándar que nació en 2024 para resolver eso. La idea es simple: tú le ofreces al modelo un índice limpio y estructurado de tu web en Markdown, con los enlaces a las páginas relevantes y una descripción breve de cada una. El modelo lo lee en segundos, sin parsear HTML, y entiende de qué va tu sitio.

Piénsalo como el sumario de un libro: puedes leer el libro entero página a página, o puedes leer el sumario y saber exactamente dónde está cada capítulo.

¿Es lo mismo que robots.txt o el sitemap?

No, y confundirlos es el error más habitual. robots.txt le dice a los rastreadores qué pueden y qué no pueden indexar. El sitemap.xml lista todas las URLs para que los motores de búsqueda las encuentren. llms.txt no bloquea ni lista: explica. Su función es orientar, no controlar.

Los tres pueden coexistir sin conflicto. De hecho, lo recomendable es tenerlos todos activos y actualizados. robots.txt para gestionar el rastreo, sitemap para la indexación y llms.txt para que la IA entienda el contexto de tu contenido.

Por qué esto empieza a importar en tu estrategia de contenido

La búsqueda está fragmentándose. Una parte creciente de las consultas ya no terminan en un clic a tu web, sino en una respuesta generada directamente por un modelo de IA. Si ese modelo no sabe que existes o no entiende bien qué haces, no te va a citar.

Lo que vemos en clientes que producen contenido especializado es que los LLMs tienden a citar las fuentes que estructuran su información de forma más clara y accesible. llms.txt es una palanca para eso.

El archivo no garantiza que te citen, pero reduce la fricción. Un modelo que tiene acceso a un resumen bien escrito de tu web y a tus páginas más relevantes va a poder usarte como fuente mucho mejor que uno que tiene que interpretar tu HTML desde cero.

Qué tipo de web se beneficia más del llms.txt

Blogs de nicho, medios especializados, tiendas con catálogos técnicos y cualquier web con contenido de valor que quiera aparecer en respuestas de IA. Si tu web es básicamente una landing de servicios con poco contenido, el impacto es menor. Pero si tienes artículos, guías o documentación que merezca ser citada, llms.txt puede ayudar.

También es especialmente útil si tienes contenido que no quieres que los LLMs usen (por ejemplo, datos de clientes, contenido de pago o páginas en desarrollo). El archivo permite indicar qué es público y qué no, con más granularidad que robots.txt.

Cómo se estructura un archivo llms.txt

El formato es Markdown, lo que lo hace legible tanto para humanos como para máquinas. La estructura básica tiene tres partes:

  1. Título y descripción general: un H1 con el nombre de tu web y un párrafo corto que explique qué ofreces.
  2. Sección de contenido destacado: una lista de enlaces a tus páginas más relevantes, cada uno con una línea descriptiva.
  3. Sección opcional de exclusiones: páginas o secciones que prefieres que los LLMs no usen como fuente.

Un ejemplo ilustrativo (no real) podría ser el de una agencia de marketing local: en su llms.txt listan sus guías de SEO, sus casos de estudio y su glosario, y excluyen expresamente las páginas de presupuesto y el área de clientes. El modelo sabe exactamente con qué puede trabajar.

El archivo llms-full.txt: el complemento que poca gente conoce

Además del llms.txt estándar, la propuesta original contempla un segundo archivo llamado llms-full.txt.

Este incluye el contenido completo de las páginas más importantes, no solo los enlaces. Es más pesado, pero le da al modelo todo lo necesario para responder sin tener que hacer peticiones adicionales a tu web.

No todas las webs necesitan implementarlo, pero si tu contenido es técnico o muy específico (documentación, tutoriales largos, guías paso a paso), puede ser la diferencia entre que te citen o que el modelo interpole con otras fuentes menos precisas.

Crea tu llms.txt en menos de 30 minutos

No necesitas ser developer para hacer esto. Estos son los pasos concretos:

  1. Identifica tus páginas más valiosas. Las que mejor explican qué haces, tus guías más completas, tus casos de uso. Máximo 20-30 URLs para empezar.
  2. Abre un editor de texto plano (el bloc de notas vale) y empieza con un H1: el nombre de tu web. Añade un párrafo de 2-3 frases describiendo de qué trata.
  3. Crea una sección llamada ## Docs o ## Contenido destacado y lista cada URL con este formato: - [Título de la página](URL): descripción breve de una línea.
  4. Añade una sección ## Opcional si quieres señalar contenido que no debe usarse como fuente (páginas de login, contenido de pago, borradores).
  5. Guarda el archivo como llms.txt en codificación UTF-8 y súbelo a la raíz de tu dominio: tudominio.com/llms.txt.
  6. Verifica que es accesible escribiendo la URL directamente en el navegador. Si ves el texto, está bien. Si da 404, revisa los permisos del servidor.

Hay herramientas que generan el archivo automáticamente a partir de tu sitemap, lo que ahorra tiempo si tienes webs grandes. En la mayoría de auditorías que hacemos, el proceso completo para una web mediana no supera los 20 minutos.

Errores comunes que invalidan el archivo llms.txt

La mayoría de los errores que vemos no son técnicos, son de criterio:

  • Listar todas las URLs del sitio en lugar de solo las relevantes. El modelo no necesita tu política de cookies.
  • Escribir descripciones genéricas («página de servicios») que no ayudan al modelo a entender el contenido.
  • No actualizar el archivo cuando publicas contenido nuevo. Un llms.txt desactualizado es casi peor que no tenerlo.
  • Confundir el formato con HTML o JSON. Tiene que ser Markdown puro, sin etiquetas.
  • Olvidar incluir el archivo en inglés si tu audiencia o los modelos que te interesan trabajan principalmente en ese idioma.

Si llevas un tiempo preguntándote cómo posicionar tu web ante la nueva ola de búsqueda generativa, en Seopedia auditamos tu presencia actual y te decimos qué ajustes técnicos y de contenido tienen más impacto en tu caso concreto.

Preguntas frecuentes sobre que es llm.txt

¿Tener llms.txt afecta a mi posicionamiento en Google?

De momento, Google no lo usa como señal de ranking en su buscador tradicional. Su impacto está en cómo los modelos de IA (Perplexity, ChatGPT, Gemini en modo búsqueda) leen e interpretan tu web. Si tu estrategia de contenido apunta también a la búsqueda generativa, sí tiene sentido implementarlo.

¿Puedo crear llms.txt yo mismo sin saber programar?

Sí. El archivo es texto plano en formato Markdown, sin código. Necesitas un editor de texto, saber cuáles son tus páginas más relevantes y acceso FTP o al gestor de archivos de tu hosting para subirlo a la raíz del dominio. No requiere tocar ningún archivo del servidor ni modificar el código de la web.

¿Qué pasa si lo implemento mal? ¿Puedo romper algo?

No. llms.txt es un archivo pasivo: si tiene errores de formato, los modelos simplemente lo ignoran o lo interpretan de forma parcial. No afecta al rastreo de Google, no bloquea nada y no modifica ninguna configuración de tu servidor. Lo peor que puede pasar es que no sirva de nada.

¿Funciona también si tengo una web pequeña o poco tráfico?

El tamaño del sitio no es el factor determinante. Lo que importa es si tienes contenido de calidad que los modelos de IA podrían usar como fuente. Una web pequeña con guías bien escritas y un llms.txt claro puede salir mejor parada que una web grande sin estructura legible para los LLMs.

¿Cuánto tiempo tarda en tener efecto?

No hay un plazo definido porque depende de con qué frecuencia cada modelo rastree tu web. En la mayoría de casos, el archivo empieza a ser procesado en días o semanas, no meses. Los resultados visibles (aparecer citado en respuestas de IA) dependen también de la calidad y relevancia de tu contenido, no solo del archivo.

¿llms.txt sustituye al robots.txt o al sitemap?

No, y no deberías elegir entre uno y otro. Cada archivo tiene una función distinta: robots.txt controla el acceso de rastreadores, el sitemap facilita la indexación en buscadores y llms.txt orienta a los modelos de IA. Los tres son complementarios y pueden coexistir sin conflicto en la raíz de tu dominio.

TRABAJAREMOS JUNTOS EN TU ESTRATEGIA

¿Listo para llevar tu web al éxito?

Contáctanos hoy para desarrollar un plan personalizado que catapulte tu sitio web a la cima de los resultados de búsqueda
Marta Higueras SEO Marta Higueras
Consultora SEO
Apasionada por el SEO desde 2015. Ayudo a mis clientes a conseguir más visibilidad online y más ventas. He trabajado con webs corporativas, ecommerce y blogs de todo tipo, algunos de ellos internacionales. Estoy al día de las novedades de Google para poder trasladar mis conocimientos a mis clientes.
¿No recibes visitas?
Realizamos una auditoría SEO a tu página.
  • Responsable: Seopedia
  • Finalidad: Gestión de solicitudes, recabar datos de contacto y enviar información de interés al usuario relacionada con nuestros servicios.
  • Legitimación: Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento: No se ceden o comunican datos a terceros para prestar este servicio.
  • Derechos: Acceder, rectificar, limitar y suprimir los datos.
  • Ejercicio de Derechos: Podrás ejercitar tus derechos en cualquier momento y de forma gratuita dirigiendo un correo a [email protected]

Información Adicional: Puedes consultar la información detallada en la Política de Privacidad.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Artículos relacionados

Qué es llms.txt y por qué empieza a importar en SEO

Qué es llms.txt y por qué empieza a importar en SEO

llms.txt es un archivo de texto que le explica a los modelos de lenguaje (ChatGPT, Perplexity, Claude…) qué partes de tu web merecen su atención. No es obligatorio, pero las webs que lo implementan bien empiezan a sacar ventaja en las respuestas generadas por IA.
que es query fun-out

Query fan-out: qué es y cómo afecta al SEO que conoces

El query fan-out es el mecanismo por el que la IA de Google descompone una sola pregunta en varias subconsultas antes de darte una respuesta. Si no entiendes cómo funciona, es probable que estés optimizando para un sistema de búsqueda que ya ha cambiado.
que es un rag en ia

Que es un RAG en IA (Retrieval-Augmented Generation)

Cuando preguntas a ChatGPT, Perplexity o Gemini por tu sector, la IA cita a alguien. Si esa fuente no eres tú, no estás compitiendo en posiciones más bajas, no estás en la conversación. Detrás de esa decisión hay un mecanismo concreto llamado RAG, y entender cómo funciona cambia la forma en que trabajas tu contenido.…
como recuperar ficha google business profile

Cómo recuperar la ficha de tu negocio en Google Business Profile

Esa sensación de ver tu negocio en Google Maps, con reseñas y datos, pero no poder cambiar ni una coma… Es un puñal directo a la facturación. Puede que un antiguo empleado la creara, que una agencia de marketing se quedara con los accesos o que simplemente hayas perdido la contraseña. El resultado es el…
factor decay rate en seo local

El factor decay rate: tu ficha de Google Maps muere si no la tocas

Hace un año optimizaste tu ficha, conseguiste unas cuantas reseñas y te colocaste primero en el mapa. Pero sin saber por qué, en los últimos meses has empezado a bajar posiciones poco a poco hasta desaparecer de la primera página. No has hecho nada malo, ¿verdad? Exacto. Ese es el problema. No has hecho nada.…

Visítanos en las redes

¿Te ayudamos?