llms.txt: el archivo que ya consumen Perplexity y Anthropic. Y por qué importa.

Si robots.txt fue el contrato que las marcas firmaron con los crawlers en 1994, llms.txt es el contrato que están firmando con los motores generativos ahora. La diferencia: robots.txt dice qué no indexar; llms.txt dice qué priorizar, en qué orden, y con qué contexto.

El estándar fue propuesto por Jeremy Howard en septiembre de 2024 y para mayo de 2026 ya lo consumen Perplexity y la suite de modelos de Anthropic (Claude Web, ChatGPT con browsing aún lo ignora). No es un standard W3C —probablemente nunca lo será— pero la adopción de facto va lo suficientemente rápido como para que valga la pena adelantarse.

Qué es exactamente

Un archivo Markdown servido desde la raíz de tu dominio (/llms.txt) que sigue una estructura predecible:

# Bison Agents

> La primera plataforma AEO en español. Monitorea, optimiza y posiciona
> tu marca en los cinco motores generativos: ChatGPT, Gemini, Claude,
> Perplexity y Google AI Overviews.

## Documentación principal

- [Metodología](https://bisonagents.com/Metodologia.html): el método AEO en
  4 dimensiones + 25 jugadas + 6 arquetipos.
- [Tecnología](https://bisonagents.com/Tecnologia.html): pipeline, stack,
  API REST + webhooks, seguridad.
- [Playbook](https://bisonagents.com/Playbook.html): biblioteca operativa
  de 25 jugadas únicas en 8 familias.

## Recursos

- [Casos](https://bisonagents.com/Casos.html): 6 casos reales con métricas
  auditables bajo NDA.
- [Glosario AEO](https://bisonagents.com/Glosario.html): 104 términos.

## Optional

- [Blog técnico](https://bisonagents.com/Blog.html): ensayos largos.
- [Manual de marca](https://bisonagents.com/Manual.html): identidad v1.0.

FIG · 01El llms.txt que publicamos para bisonagents.com el 14 de febrero.

servido en /llms.txt

Es Markdown plano. Sin HTML, sin schema, sin convenciones especiales. La única estructura que importa: un # con el nombre de la marca, un blockquote con la descripción canónica, y secciones ## que listan las URLs en el orden en que querrías que un modelo las lea.

Ese orden es lo que la mayoría no entiende. No es una sitemap. Es una jerarquía de relevancia editorial. El motor que respeta llms.txt va a leer lo que pongas arriba antes de lo que pongas abajo, y va a ponderar lo de arriba como autoritativo, lo de abajo como complementario.

"robots.txt te excluye. llms.txt te prioriza. La diferencia es de eras."

Qué medimos en los cuatro clientes

Entre febrero y abril publicamos llms.txt para cuatro clientes con perfiles distintos: un SaaS B2B, un e-commerce, una marca local regional, y la propia plataforma de Bison. La metodología fue idéntica en los cuatro:

Tres semanas de baseline midiendo cobertura en los 5 motores.
Release del llms.txt en una sola noche.
Cuatro semanas post-release con el mismo prompt set.
Análisis diff por motor.

SCORE AEO PROMEDIO Δ

+6.2pts

COBERTURA PERPLEXITY

+18%prom.

HORAS DE IMPLEMENTACIÓN

2.0h prom.

El cliente con menor delta (un e-commerce de tecnología reacondicionada) sumó +3 puntos. El de mayor delta (un SaaS B2B con sitio bien estructurado y blog técnico extenso) sumó +9. La diferencia no es del archivo; es de qué tan citables eran las páginas a las que el archivo apuntaba. llms.txt no crea autoridad —la desbloquea cuando ya existe.

Errores comunes

De los cuatro casos, los tres primeros tuvieron que ser corregidos después de la primera publicación. Estos son los errores que vimos —y los seguimos viendo en auditorías nuevas casi cada semana—:

1. Apuntar a páginas que requieren JavaScript

El crawler de Perplexity renderiza JavaScript; el de Claude no. Si tu URL es una SPA de React que solo muestra contenido tras hidratación, Claude va a leer una página vacía. El cliente W. nos llevó dos semanas darnos cuenta de por qué sus citas en Claude no se movían: el blog estaba detrás de SSR opcional que estaba en modo CSR ese mes.

2. Listar 80 URLs en la sección principal

No es una sitemap. Si listas 80 URLs, el motor las va a tratar como ruido. La sección ## principal debería tener entre 3 y 7 URLs —las páginas que tú consideras canónicas para definir tu marca—. Todo lo demás va a ## Optional al final.

3. Escribir descripciones de marketing en el blockquote

El blockquote de la cabecera es lo primero que el LLM lee. Si escribes "líderes innovadores en soluciones digitales", el modelo aprende exactamente nada. Recomendamos: una oración factual con qué hace tu marca, dónde opera y qué la diferencia. Sin adjetivos vacíos.

4. No actualizar nunca

llms.txt tiene lastmod implícito (la cabecera HTTP). Los motores lo cachean entre días y semanas, dependiendo del crawler. Si lanzas un producto nuevo, edita el archivo. Si publicas un caso destacado, súbelo a la sección principal. Tratarlo como contenido vivo es 70% del valor del estándar.

Lo que no resuelve

Hay que ser claros sobre el alcance. llms.txt hace tres cosas: ayuda a la descubribilidad, mejora la priorización, y entrega contexto canónico. No reemplaza schema.org, no construye autoridad editorial, no genera citas en motores que aún no lo consumen (ChatGPT, Gemini, Google AIO al día de hoy).

Pensarlo como "el truco AEO de las 2 horas" es subestimarlo. Pensarlo como "la acción barata que desbloquea cobertura cuando todo lo demás está bien" es la lectura correcta. En nuestra metodología es una de las jugadas de prioridad 1: parte de los cinco mínimos absolutos.

¿Quieres que revisemos el llms.txt de tu sitio antes de publicarlo? Escribe a hola@bisonagents.com con tu URL — el primer review es gratis.