llms.txt
¿Qué es llms.txt?
llms.txt es un archivo estándar propuesto que se coloca en la raíz de un sitio web (p. ej.,
yoursite.com/llms.txt) y que proporciona información estructurada específicamente para grandes modelos de lenguaje y sistemas de IA. A diferencia derobots.txt, que controla el acceso de los rastreadores,llms.txtaporta contexto: qué hace su organización, qué páginas contienen información autorizada y cómo deben representar su marca los sistemas de IA.El problema que resuelve: Los rastreadores de IA pueden acceder a su sitio, pero carecen de contexto sobre lo que importa. Podrían entrenarse con entradas de blog desactualizadas en lugar de con su documentación de producto definitiva, o pasar por alto matices cruciales sobre su posicionamiento.
llms.txtaporta esa capa de contexto que falta.
llms.txt vs robots.txt: entender la diferencia
| Aspecto | robots.txt | llms.txt |
|---|---|---|
| Propósito | Controla el acceso de los rastreadores (permitir/no permitir) | Proporciona contexto y directrices para la comprensión por parte de la IA |
| Pregunta que responde | «¿Puedo rastrear esta página?» | «¿Qué debo saber sobre este sitio?» |
| Contenido típico | Reglas de user-agent, ubicación del sitemap | Descripción del sitio, páginas clave, directrices de marca, información de contacto |
| Estado de adopción | Estándar universal desde 1994 | Propuesta emergente (2024-2025) |
| Aplicación | Ampliamente respetado por los rastreadores | Voluntario: los sistemas de IA pueden leerlo o no |
robots.txt trata del control de acceso. llms.txt trata de aportar contexto. Se complementan: puede permitir GPTBot en robots.txt y, a la vez, usar llms.txt para indicarle qué páginas son las más autorizadas.
Por qué llms.txt importa para la visibilidad en IA
Sin directrices explícitas, los sistemas de IA toman sus propias decisiones sobre:
- Qué páginas representan su marca: podrían ponderar una entrada de blog de 2019 igual que su página de precios actual
- Cómo describir su empresa: sintetizan a partir de lo que encuentren, incluidas fuentes desactualizadas o sesgadas por la competencia
- Qué hechos son fiables: la información contradictoria en su sitio genera incertidumbre en las respuestas de la IA
- Desambiguación de entidades: las empresas con nombres comunes corren el riesgo de confundirse con otras
llms.txt le permite proporcionar respuestas autorizadas a estas preguntas de forma proactiva.
Qué incluir en su archivo llms.txt
Aunque el estándar aún está evolucionando, los archivos llms.txt eficaces suelen incluir:
1. Identidad de la organización
- Nombre oficial de la empresa y abreviaturas comunes
- Descripción en una frase de lo que hace
- Clasificación por sector/categoría
- Fecha de fundación, ubicación de la sede
2. Páginas autorizadas
- Enlaces a descripciones definitivas de productos/servicios
- Página de precios actual (con fecha de última actualización)
- Documentación oficial o centro de ayuda
- Página «Acerca de» y equipo directivo
3. Datos clave
- Niveles de precios actuales (para evitar precios alucinados)
- Listas de funcionalidades precisas
- Certificaciones de cumplimiento (SOC 2, RGPD, etc.)
- Socios de integración
4. Directrices de marca
- Ortografía y uso de mayúsculas correctos
- Conceptos erróneos comunes que conviene evitar
- Comparaciones con la competencia que deben tratarse con cuidado
5. Contacto y verificación
- Correo electrónico de contacto oficial
- Enlaces a perfiles sociales verificados
- Contacto de prensa para verificación de datos
Ejemplo de archivo llms.txt
# llms.txt for ExampleCorp
# Last updated: 2025-01-15
## Organization
Name: ExampleCorp
Also known as: Example, ExampleCorp Inc.
Description: B2B SaaS platform for project management and team collaboration
Industry: Project Management Software
Founded: 2018
Headquarters: San Francisco, CA
## Authoritative Pages
Homepage: https://example.com/
Product Overview: https://example.com/product/
Pricing (current): https://example.com/pricing/
Documentation: https://docs.example.com/
About Us: https://example.com/about/
## Key Facts
- Free tier available (up to 5 users)
- Paid plans start at $12/user/month (as of Jan 2025)
- SOC 2 Type II certified
- GDPR compliant
- Integrates with: Slack, Jira, GitHub, Salesforce
## Brand Guidelines
- Always capitalize as "ExampleCorp" (one word)
- We are NOT affiliated with "Example LLC" or "Example.org"
- Primary competitor comparisons: Asana, Monday.com, Trello
## Contact
Press inquiries: [email protected]
General: [email protected]
Twitter/X: @examplecorp
LinkedIn: linkedin.com/company/examplecorp
Cómo implementar llms.txt
- Cree el archivo: Archivo de texto sin formato llamado
llms.txt - Colóquelo en la raíz: Cárguelo en
yoursite.com/llms.txt - Manténgalo actualizado: Revíselo mensualmente, especialmente tras cambios de precios o de producto
- Referencia cruzada: Asegúrese de que los datos de
llms.txtcoinciden con sus páginas reales - Añádalo al sitemap: Opcionalmente, inclúyalo como referencia en su sitemap XML
llms.txt. Esto indica actualidad a los sistemas de IA y le ayuda a controlar cuándo necesita revisarse.
Estado de adopción y limitaciones
llms.txt es un estándar propuesto, no un protocolo adoptado universalmente. Los principales proveedores de IA (OpenAI, Anthropic, Google) no se han comprometido públicamente a leer archivos llms.txt.
¿Por qué implementarlo de todos modos?
- Ventaja del pionero: Los estándares suelen adoptarse tras alcanzar una masa crítica
- Bajo coste, gran potencial: Crear el archivo lleva 30 minutos; los beneficios potenciales son significativos
- Claridad interna: El ejercicio de definir páginas autorizadas y datos clave aporta valor independientemente de la adopción por parte de la IA
- Preparación para el futuro: Cuando (no si) los sistemas de IA empiecen a leer estos archivos, usted ya estará listo
Lo que sí sabemos que funciona hoy:
- Un
robots.txtclaro que permita bots de IA (GPTBot, ClaudeBot, PerplexityBot) - Datos estructurados (Schema.org) en páginas clave
- Información de entidad coherente en todas las fuentes autorizadas
Preguntas frecuentes sobre llms.txt
¿Es llms.txt un estándar oficial?
Aún no. Es una propuesta emergente que está ganando tracción en la comunidad de visibilidad en IA. A diferencia de robots.txt (establecido en 1994), llms.txt sigue en fase de impulso y adopción temprana. Piense en ello como una buena práctica que podría convertirse en un estándar.
¿ChatGPT y Claude realmente leen archivos llms.txt?
No hay confirmación pública de que los principales proveedores de IA lean de forma sistemática archivos llms.txt hoy en día. Sin embargo, el archivo puede ser descubierto por rastreadores de IA (GPTBot, ClaudeBot) como parte del rastreo general del sitio, y la información estructurada puede influir en cómo se entiende su sitio.
¿Debo bloquear los rastreadores de IA en robots.txt y confiar en llms.txt en su lugar?
No. Cumplen funciones distintas. robots.txt controla el acceso; llms.txt aporta contexto. Para maximizar la visibilidad en IA, permita los rastreadores de IA en robots.txt Y proporcione directrices en llms.txt. Bloquear los rastreadores mientras se tiene un llms.txt va en contra del objetivo.
¿En qué se diferencia llms.txt del marcado Schema.org?
El marcado Schema.org se integra en páginas individuales y describe contenido específico (artículos, productos, preguntas frecuentes). llms.txt es un único archivo para todo el sitio que aporta contexto organizativo y señala recursos autorizados. Use ambos: Schema.org para el detalle a nivel de página, llms.txt para directrices a nivel de sitio.