llms.txt
Was ist llms.txt?
llms.txt ist eine vorgeschlagene Standarddatei, die im Stammverzeichnis einer Website (z. B.
yoursite.com/llms.txt) platziert wird und strukturierte Informationen speziell für große Sprachmodelle und KI-Systeme bereitstellt. Im Gegensatz zurobots.txt, das den Zugriff von Crawlern steuert, bietetllms.txtKontext: Was Ihre Organisation tut, welche Seiten maßgebliche Informationen enthalten und wie KI-Systeme Ihre Marke darstellen sollen.Das Problem, das es löst: KI-Crawler können auf Ihre Website zugreifen, aber es fehlt ihnen der Kontext, was wichtig ist. Sie könnten auf veralteten Blogbeiträgen statt auf Ihrer maßgeblichen Produktdokumentation trainieren oder entscheidende Nuancen Ihrer Positionierung übersehen.
llms.txtbietet diese fehlende Kontextebene.
llms.txt vs. robots.txt: Den Unterschied verstehen
| Aspekt | robots.txt | llms.txt |
|---|---|---|
| Zweck | Steuert den Zugriff von Crawlern (zulassen/verbieten) | Bietet Kontext und Anleitung für das KI-Verständnis |
| Beantwortete Frage | „Kann ich diese Seite crawlen?“ | „Was sollte ich über diese Website wissen?“ |
| Typischer Inhalt | User-Agent-Regeln, Sitemap-Standort | Website-Beschreibung, wichtige Seiten, Markenrichtlinien, Kontaktinformationen |
| Adoptionsstatus | Universeller Standard seit 1994 | Aufkommender Vorschlag (2024-2025) |
| Durchsetzung | Weitgehend von Crawlern respektiert | Freiwillig – KI-Systeme lesen sie möglicherweise nicht |
robots.txt betrifft die Zugriffskontrolle. llms.txt betrifft die Bereitstellung von Kontext. Sie ergänzen sich – Sie könnten GPTBot in robots.txt zulassen, während Sie llms.txt verwenden, um ihm mitzuteilen, welche Seiten am maßgeblichsten sind.
Warum llms.txt für die KI-Sichtbarkeit wichtig ist
Ohne explizite Anleitung treffen KI-Systeme ihre eigenen Entscheidungen über:
- Welche Seiten Ihre Marke repräsentieren: Sie könnten einen Blogbeitrag von 2019 genauso gewichten wie Ihre aktuelle Preisseite
- Wie Ihr Unternehmen beschrieben wird: Sie synthetisieren aus allem, was sie finden – einschließlich veralteter oder von Wettbewerbern beeinflusster Quellen
- Welchen Fakten zu vertrauen ist: Widersprüchliche Informationen auf Ihrer Website führen zu Unsicherheiten in KI-Antworten
- Entitätsdisambiguierung: Unternehmen mit gebräuchlichen Namen laufen Gefahr, mit anderen verwechselt zu werden
llms.txt ermöglicht es Ihnen, proaktiv maßgebliche Antworten auf diese Fragen zu geben.
Was in Ihre llms.txt-Datei aufgenommen werden sollte
Obwohl der Standard noch in der Entwicklung ist, enthalten effektive llms.txt-Dateien typischerweise:
1. Organisationsidentität
- Offizieller Firmenname und gebräuchliche Abkürzungen
- Ein-Satz-Beschreibung Ihrer Tätigkeit
- Branchen-/Kategorieklassifizierung
- Gründungsdatum, Standort des Hauptsitzes
2. Maßgebliche Seiten
- Links zu definitiven Produkt-/Dienstleistungsbeschreibungen
- Aktuelle Preisseite (mit Datum der letzten Aktualisierung)
- Offizielle Dokumentation oder Hilfezentrum
- Über-uns-Seite und Führungsteam
3. Wichtige Fakten
- Aktuelle Preisstufen (um halluzinierte Preise zu vermeiden)
- Genaue Feature-Listen
- Compliance-Zertifizierungen (SOC 2, DSGVO usw.)
- Integrationspartner
4. Markenrichtlinien
- Korrekte Schreibweise und Groß-/Kleinschreibung
- Häufige Missverständnisse, die vermieden werden sollten
- Wettbewerbsvergleiche, die sorgfältig zu behandeln sind
5. Kontakt und Verifizierung
- Offizielle Kontakt-E-Mail
- Links zu verifizierten sozialen Profilen
- Pressekontakt zur Faktenprüfung
Beispiel llms.txt-Datei
# llms.txt for ExampleCorp
# Last updated: 2025-01-15
## Organization
Name: ExampleCorp
Also known as: Example, ExampleCorp Inc.
Description: B2B SaaS platform for project management and team collaboration
Industry: Project Management Software
Founded: 2018
Headquarters: San Francisco, CA
## Authoritative Pages
Homepage: https://example.com/
Product Overview: https://example.com/product/
Pricing (current): https://example.com/pricing/
Documentation: https://docs.example.com/
About Us: https://example.com/about/
## Key Facts
- Free tier available (up to 5 users)
- Paid plans start at $12/user/month (as of Jan 2025)
- SOC 2 Type II certified
- GDPR compliant
- Integrates with: Slack, Jira, GitHub, Salesforce
## Brand Guidelines
- Always capitalize as "ExampleCorp" (one word)
- We are NOT affiliated with "Example LLC" or "Example.org"
- Primary competitor comparisons: Asana, Monday.com, Trello
## Contact
Press inquiries: [email protected]
General: [email protected]
Twitter/X: @examplecorp
LinkedIn: linkedin.com/company/examplecorp
So implementieren Sie llms.txt
- Datei erstellen: Eine reine Textdatei namens
llms.txt - Im Stammverzeichnis platzieren: Hochladen nach
yoursite.com/llms.txt - Aktualisiert halten: Monatlich überprüfen, insbesondere nach Preis- oder Produktänderungen
- Querverweis: Stellen Sie sicher, dass die Fakten in
llms.txtmit Ihren tatsächlichen Seiten übereinstimmen - Zur Sitemap hinzufügen: Optional in Ihrer XML-Sitemap referenzieren
llms.txt ein. Dies signalisiert KI-Systemen Aktualität und hilft Ihnen, zu verfolgen, wann eine Überarbeitung erforderlich ist.
Adoptionsstatus und Einschränkungen
llms.txt ein vorgeschlagener Standard, kein universell angenommenes Protokoll. Große KI-Anbieter (OpenAI, Anthropic, Google) haben sich nicht öffentlich dazu verpflichtet, llms.txt-Dateien zu lesen.
Warum es trotzdem implementieren?
- Vorteil des Early Movers: Standards werden oft erst nach Erreichen einer kritischen Masse angenommen
- Geringe Kosten, hoher Nutzen: Die Erstellung der Datei dauert 30 Minuten; die potenziellen Vorteile sind erheblich
- Interne Klarheit: Die Übung, maßgebliche Seiten und wichtige Fakten zu definieren, hat unabhängig von der KI-Adoption einen Wert
- Zukunftssicherheit: Wenn (nicht ob) KI-Systeme diese Dateien lesen, sind Sie bereits bereit
Was wir wissen, funktioniert heute:
- Klares
robots.txt, das KI-Bots (GPTBot, ClaudeBot, PerplexityBot) zulässt - Strukturierte Daten (Schema.org) auf wichtigen Seiten
- Konsistente Entitätsinformationen über maßgebliche Quellen hinweg
llms.txt FAQs
Ist llms.txt ein offizieller Standard?
Noch nicht. Es ist ein aufkommender Vorschlag, der in der KI-Sichtbarkeits-Community an Bedeutung gewinnt. Im Gegensatz zu robots.txt (seit 1994 etabliert) befindet sich llms.txt noch in der Phase der Befürwortung und frühen Einführung. Betrachten Sie es als eine Best Practice, die zu einem Standard werden kann.
Lesen ChatGPT und Claude tatsächlich llms.txt-Dateien?
Es gibt keine öffentliche Bestätigung, dass große KI-Anbieter llms.txt-Dateien heute systematisch lesen. Die Datei kann jedoch von KI-Crawlern (GPTBot, ClaudeBot) im Rahmen des allgemeinen Site-Crawlings entdeckt werden, und die strukturierten Informationen können beeinflussen, wie Ihre Website verstanden wird.
Sollte ich KI-Crawler in robots.txt blockieren und stattdessen auf llms.txt setzen?
Nein. Sie dienen unterschiedlichen Zwecken. robots.txt steuert den Zugriff; llms.txt bietet Kontext. Für maximale KI-Sichtbarkeit sollten Sie KI-Crawler in robots.txt zulassen UND Anleitungen in llms.txt bereitstellen. Das Blockieren von Crawlern bei gleichzeitigem Vorhandensein einer llms.txt-Datei würde den Zweck verfehlen.
Wie unterscheidet sich llms.txt von Schema.org-Markup?
Schema.org-Markup ist in einzelne Seiten eingebettet und beschreibt spezifische Inhalte (Artikel, Produkte, FAQs). llms.txt ist eine einzelne websiteweite Datei, die organisatorischen Kontext bietet und auf maßgebliche Ressourcen verweist. Verwenden Sie beides: Schema.org für seitenbezogene Details, llms.txt für websiteweite Anleitungen.