Startseite Hub Funktionen Anwendungsfälle Anleitungen Plattform Preise Anmelden
Claude KI Leitfaden 2026

Claude KI: Vollständiger Leitfaden zu Modellen, Funktionen, Preisen und Benchmarks (2026)

Claude ist eine Familie von KI-Assistenten, die von Anthropic entwickelt wurde, einem US-Unternehmen für KI-Sicherheit, das 2021 von ehemaligen OpenAI-Forschern gegründet wurde. Stand Mai 2026 ist das öffentlich verfügbare Flaggschiff Claude Opus 4.7, veröffentlicht am 16. April 2026, mit einem Eingabe-Kontextfenster von 1 Million Token, 128.000 Token Ausgabe, nativer Text- und Bildverarbeitung sowie einer Adaptive-Reasoning-Architektur, die interne Rechenleistung dynamisch je nach Problemkomplexität zuweist. Das Produkt wird über claude.ai, iOS- und Android-Apps, dedizierte macOS- und Windows-Desktop-Apps, die Anthropic API sowie verwaltete Plattformen (Amazon Bedrock, Google Cloud Vertex AI, Microsoft Azure AI Foundry) bereitgestellt.

Die prägende These zu Claude im Jahr 2026 lautet: Kalibrierung statt Abdeckung. Claude Opus 4.7 hält den zweithöchsten Omniscience Index aller aktuellen Modelle (26, nur hinter Gemini 3.1 Pro mit 33) – erreicht durch eine „Refusal-when-uncertain“-Architektur statt durch maximierte Antwortraten. Laut Suprmind Multi-Model Divergence Index, Ausgabe April 2026 (n=1.324 Production-Turns), sinkt Claudes confidence-contradicted rate von 33,9 % über alle Turns auf 26,4 % bei High-Stakes-Turns – ein Kalibrierungsdelta von -7,5 Punkten, das kein anderer getesteter Anbieter erreicht. Claude wird messbar langsamer, wenn die Konsequenzen real sind; andere nicht.

Diese Seite behandelt, was Claude ist, die vollständige aktive und eingestellte Modellpalette, was jede Stufe kostet und welches Modell Sie tatsächlich erhalten, den Funktionsumfang (Stand Mai 2026), das Benchmark-Bild (wo Claude führt, wo es zurückliegt und wie die Lücken zwischen Hersteller- und unabhängigen Messungen zu interpretieren sind), die Halluzinationsmuster, die Ihre Nutzung prägen sollten, was Produktionsdaten aus Multi-Model-Setups über Claude im Vergleich zu Peers zeigen, die aktuellen Kontroversen sowie die Fragen, nach denen am häufigsten gesucht wird. Zahlen sind datiert. Das Produkt ändert sich wöchentlich. Wo eine Aussage volatil ist, wird sie gekennzeichnet.

Siehe auch: Suprmind Multi-Model Divergence Index →

Was Claude ist

Claude ist ein konversationelles KI-Produkt von Anthropic, das (Stand April 2026) das Sprachmodell Claude Opus 4.7 nutzt, um Fragen zu beantworten, Text und Code zu erzeugen, Dokumente zu analysieren, Webbrowser und Betriebssysteme zu steuern und mehrstufige agentische Aufgaben zu erledigen. Das Produkt ist von der zugrunde liegenden Claude-Modellfamilie zu unterscheiden, die es antreibt – dieselben Modelle können auch direkt über die Anthropic API unter platform.claude.com, auf Amazon Bedrock, auf Google Vertex AI und auf Microsoft Azure AI Foundry zu unterschiedlichen Preisen genutzt werden.

Anthropic wurde 2021 von Dario Amodei (CEO) und Daniela Amodei (President) zusammen mit sieben weiteren ehemaligen OpenAI-Mitarbeitern mitgegründet. Das Unternehmen ist als Delaware Public Benefit Corporation strukturiert. Anfang 2026 erreichte der annualisierte Umsatz etwa 14 Mrd. $, und eine Series-G-Runde über 30 Mrd. $ wurde am 11.02.2026 zu einer Post-Money-Bewertung von 380 Mrd. $ abgeschlossen. Eine weitere Runde mit einer Bewertung von 850–900 Mrd. $+ wurde Ende April 2026 als aktiv in Abschluss berichtet (TechCrunch, 2026-04-29, Abschluss nicht bestätigt).

Claude vs. die Anthropic API

claude.ai ist das Consumer- und Prosumer-Produkt. Die Anthropic API (platform.claude.com, früher console.anthropic.com) ist die Entwickleroberfläche. Beide laufen auf Claude-Modellen, aber Nutzererlebnis und Kostenstruktur unterscheiden sich. claude.ai bietet die Stufen Free, Pro, Max 5x, Max 20x, Team Standard, Team Premium und Enterprise mit gebündeltem Zugriff auf Funktionen wie Projekte, Artifacts, Memory, Computer Use, Skills, MCP und Microsoft-365-Integration. Die API stellt rohe Modell-Endpunkte mit gemessener Preisgestaltung pro Token bereit, ohne Chat-UI und mit entwicklergesteuerter Funktionsnutzung.

Claude vs. Claude Opus 4.7 – ist das dasselbe?

Nein. Claude Opus 4.7 ist ein zugrunde liegendes Modell. claude.ai ist das Produkt, das Ihre Anfrage je nach Stufe und Prompt-Komplexität an Claude Opus 4.7, Claude Sonnet 4.6 oder Claude Haiku 4.5 weiterleitet. Claude Sonnet 4.6 ist seit Februar 2026 das Standardmodell in den Plänen Free und Pro. Opus 4.7 ist in Pro mit Limits und in Max, Team und Enterprise ohne Limits verfügbar. Das Dropdown zur Modellauswahl zeigt die je Stufe verfügbaren Optionen, aber claude.ai zeigt pro Nachricht nicht an, welcher datierte Snapshot eine Anfrage verarbeitet hat – ein dokumentierter Pain Point. Entwickler, die API-Calls nutzen, erhalten den gepinnten Snapshot in den Response-Metadaten.

Ein separat angekündigtes Claude Mythos Preview (2026-04-07) liegt in der Leistungsfähigkeit über Opus 4.7, bleibt jedoch über Project Glasswing, eine Cybersicherheits-Forschungsinitiative, nur per Einladung zugänglich. Mythos erzielt zum Zeitpunkt der Erstellung die höchsten Benchmark-Scores aller Claude-Modelle – SWE-bench Verified 93,9 %, GPQA Diamond 94,6 %, CyberGym 83,1 % – ist aber weder auf claude.ai noch über die Standard-API verfügbar.

Siehe auch: Suprmind Multi-Model Divergence Index →

Alle Claude-Modelle — aktuell und eingestellt (2026)

Anthropic stellt Claude in drei parallelen Fähigkeitsstufen bereit – Opus (höchste Leistungsfähigkeit), Sonnet (ausgewogen) und Haiku (schnell und wirtschaftlich) – wobei mehrere Generationen gleichzeitig aktiv sind. Die Architektur bleibt vollständig proprietär. Anthropic hat weder Parameterzahlen noch Layer-Zahlen öffentlich bestätigt und auch nicht, ob ein Claude-Modell eine Mixture-of-Experts-Konfiguration nutzt. Mehrere Drittquellen beschreiben die Architektur als dichten Transformer.

Unten finden Sie den Stand der aktiven und eingestellten Modelle per Mai 2026. Varianten und Daten stammen aus Anthropics offiziellem Modellkatalog unter platform.claude.com/docs/en/about-claude/models und wurden gegen unabhängiges Tracking verifiziert. Diese Tabelle ändert sich häufig – prüfen Sie die Quell-URL für die aktuelle Liste.

Aktive Claude-Modelle (Mai 2026)

Quelle: platform.claude.com – zuletzt verifiziert am 2026-05-07

Aktuelles Flaggschiff
Claude Opus 4.7
  • Veröffentlicht 2026-04-16
  • 1 Mio. Token Kontext, 128K Ausgabe
  • Multimodal (Eingabe): Text, Bild (Vision bis 2.576 px)
  • API: 5,00 $ / 25,00 $ pro 1 Mio. Token; Cached Read 0,50 $
Standard für Free + Pro
Claude Sonnet 4.6
  • Veröffentlicht 2026-02-17
  • 1 Mio. Token Kontext, 128K Ausgabe (300K via Batch)
  • API: 3,00 $ / 15,00 $ pro 1 Mio. Token
  • Standardmodell für Free- und Pro-Nutzer von claude.ai
Schnell und wirtschaftlich
Claude Haiku 4.5
  • Veröffentlicht 2025-10-15
  • 200K Kontext / 64K Ausgabe
  • API: 1,00 $ / 5,00 $ pro 1 Mio. Token
  • Near-Frontier-Coding zum Small-Tier-Preis (SWE-bench 73,3 %)
Vorheriges Opus, weiterhin aktiv
Claude Opus 4.6
  • Veröffentlicht 2026-02-05
  • 1 Mio. Kontext (die Generation, die 1 Mio. zu Standardpreisen eingeführt hat)
  • API: 5,00 $ / 25,00 $ pro 1 Mio. Token
  • 67 % Preisreduktion gegenüber Opus 4.1 (15/75 $)
Cybersicherheits-Preview
Claude Mythos Preview
  • Angekündigt 2026-04-07
  • Nur per Einladung (Project Glasswing)
  • SWE-bench Verified 93,9 %, GPQA Diamond 94,6 %, CyberGym 83,1 %
  • Interner Codename: „Capybara“ (laut Leak aus März 2026)
Legacy-Generation
Claude 3.x und früher
  • Claude 3 Opus, Sonnet, Haiku: Legacy auf der Preisseite
  • Claude 3.5 Sonnet (v1, v2), 3.5 Haiku: unterstützt/Legacy
  • Claude 3.7 Sonnet (2025-02-24): führte Extended Thinking ein
  • Claude 1, 2, 2.1, Instant 1.2: vollständig eingestellt

Claude-4-Generation: Opus 4.7, Opus 4.6, Sonnet 4.6, Haiku 4.5

Claude Opus 4.7 (2026-04-16) ist das aktuelle Flaggschiff. Es führte das xhigh-Effort-Level für Adaptive Reasoning (zwischen high und max) ein, erhöhte die Vision-Eingabeobergrenze von Computer Use auf 2.576 Pixel an der langen Kante (von zuvor etwa 850 Pixeln) und führte einen neuen Tokenizer ein, bei dem dieselbe Eingabe je nach Inhaltstyp auf 1,0–1,35x mehr Token abgebildet wird. SWE-bench Verified 87,6 %, SWE-bench Pro 64,3 % (aktueller Branchenhöchstwert), GPQA Diamond 94,2 %, MCP-Atlas 77,3 %, OSWorld 78 %. Verlässlicher Knowledge Cutoff: Januar 2026. Manuelles Extended Thinking über budget_tokens ist für Opus 4.7 und später deprecated; der Versuch führt zu einem 400-Fehler. Preise 5/25 $ pro Million Input-/Output-Token, unverändert gegenüber Opus 4.6.

Claude Opus 4.6 (2026-02-05) ist die Generation, die erstmals ein Kontextfenster von 1 Million Token zu Standardpreisen geliefert hat – und damit den Long-Context-Aufpreis beseitigte, der zuvor in der gesamten KI-Branche existierte. Der Launch von Opus 4.6 senkte zudem den Opus-Preis um 67 % (von Opus 4.1 mit 15/75 $ auf 5/25 $ pro Million Token) – die größte jemals verzeichnete Opus-Preisreduktion in einer einzelnen Generation. Claude Opus 4.6 war am 26.02.2026 das erste KI-Modell, das in allen drei LMArena-Arenen #1 hielt (Text 1503–1504, Code 1560, Search 1255).

Claude Sonnet 4.6 (2026-02-17) wurde zum Launch das Standardmodell für Free- und Pro-Nutzer von claude.ai. 1 Mio. Kontext (zunächst Beta, allgemein verfügbar ab März 2026), Preis 3/15 $, 128K Ausgabe (300K via Batch mit dem output-300k-2026-03-24-Beta-Header). Auf dem schwierigeren neuen Vectara-Datensatz erzielte Sonnet 4.6 10,6 % Halluzination – unter GPT-5.2-high mit 10,8 % im selben Benchmark. AA-Omniscience-Halluzination etwa 38 % (weniger als die Hälfte von GPT-5.2 mit ~78 %). Verlässlicher Knowledge Cutoff: August 2025; Training-Data-Cutoff: Januar 2026.

Claude Haiku 4.5 (2025-10-15) ist Anthropics aktuelles Small-/Fast-Modell mit Near-Frontier-Coding-Performance. 200K Kontext, 64K Ausgabe, Preis 1/5 $. SWE-bench 73,3 % mit Extended Thinking (gemittelt über 50 Trials), AA-Omniscience-Halluzination 25 % – das beste Halluzinationsresultat der Haiku-Stufe in der Kohorte. Veröffentlicht unter ASL-2-Sicherheitsklassifizierung (Sonnet 4.5 und Opus 4.1 sind ASL-3).

Claude 3.x und früher (historischer Kontext)

Claude 3.7 Sonnet (2025-02-24) war das erste Claude-Modell mit Hybrid-Reasoning – fähig zu nahezu sofortigen Antworten oder sichtbarem Schritt-für-Schritt-Extended Thinking mit einem entwicklergesteuerten budget_tokens-Parameter. Es erzielte 4,4 % im Vectara-Old-Summarization-Benchmark (faktische Konsistenz 95,6 %) und 70,3 % in SWE-bench Verified mit Extended Thinking. Die Modelle 3.5 Sonnet (v1, v2) und 3.5 Haiku bleiben laut Plattform-Dokumentation (Stand 2026-05-07) aktiv und als supported/legacy markiert. Claude 3 Opus, Sonnet und Haiku sind auf Anthropics Preisseite als Legacy gelistet. Claude 1, 2, 2.1 und Instant 1.2 sind vollständig eingestellt. Claude Opus 4.1 hat auf AWS Bedrock ein End-of-Life-Datum am 2026-05-31.

Welches Modell nutze ich? Zuordnung Stufe → Modell

Dies ist die mit Abstand am häufigsten gestellte Frage in der Claude-Dokumentation, und Anthropics UI zeigt pro Nachricht nicht an, welcher exakte Modell-Snapshot eine Anfrage verarbeitet hat. Stand Mai 2026:

Stufe
Standardmodell
Opus-Zugriff
Extended Thinking

Free (0 $)
Claude Sonnet 4.6
Nein
Begrenzt

Pro (20 $/Monat)
Claude Sonnet 4.6
Begrenzt
Ja (Sonnet)

Max 5x (100 $/Monat)
Sonnet 4.6
Ja (Opus 4.7)
Ja

Max 20x (200 $/Monat)
Sonnet 4.6
Ja (Opus 4.7, erweiterte Rechenleistung)
Ja

Team Standard (25 $/Sitz/Monat)
Sonnet 4.6
Begrenzt
Ja

Team Premium (125 $/Sitz/Monat)
Sonnet 4.6
Ja
Ja

Enterprise (individuell)
Vollständige Suite
Ja
Ja

Das Dropdown zur Modellauswahl zeigt die verfügbaren Optionen. Der System-Prompt ist technisch per Probing zugänglich (der Claude-Opus-4.6-System-Prompt wurde am 2026-02-05 extrahiert und auf GitHub veröffentlicht). Die persistente UI zeigt den datierten Snapshot nicht an. Wechsel des Standardmodells (z. B. der Wechsel von Sonnet 4.5 zu Sonnet 4.6 im Februar 2026) werden über Anthropics Newsroom angekündigt, jedoch nicht per In-Product-Benachrichtigung für bestehende Nutzer.

Siehe auch: Claude-Preisdetails →

Claude-Funktionen: Was jede Funktion macht

Anthropic liefert Funktionen über eine kohärente claude.ai-Weboberfläche, native iOS- und Android-Apps, macOS- und Windows-Desktop-Apps sowie entwicklerseitige Oberflächen (Anthropic API, Claude Code CLI, MCP). Bis April 2026 erreichte die Plattform über alle bezahlten Stufen hinweg weitgehend Feature-Parität; Feature-Gates fokussieren sich eher auf Nutzungsvolumen als auf Funktions-Exklusivität.

Adaptive Reasoning vs. Extended Thinking

Extended Thinking, eingeführt mit Claude 3.7 Sonnet (2025-02-24), zwingt Claude dazu, vor der Antwort eine sichtbare Chain-of-Thought-Spur zu erzeugen. Der Entwickler setzt einen budget_tokens-Parameter, um die Reasoning-Rechenleistung zu steuern. Adaptive Reasoning (auch Adaptive Thinking genannt), eingeführt mit der 4.6-Generation im Februar 2026, ersetzt dieses Paradigma. Claude bewertet die Problemkomplexität intern und weist Reasoning-Compute dynamisch zu. Der Entwickler gibt ein Effort-Level (standard, high, xhigh, max) statt eines Token-Budgets an. Bei high Effort denkt Claude fast immer, bevor es antwortet. Bei niedrigeren Effort-Levels kann Claude das Denken bei einfachen Problemen überspringen. Das mit Opus 4.7 eingeführte Level xhigh liegt zwischen high und max und stellt zusätzliche Rechenleistung für schwierige Aufgaben bereit, ohne sich auf maximale Ausgaben festzulegen. Adaptive Reasoning aktiviert automatisch Interleaved Thinking – Reasoning zwischen Tool-Calls – und ist damit strukturell besser für agentische Workflows geeignet als das vorherige Paradigma. Manuelles Extended Thinking über budget_tokens ist für Opus 4.7 und später deprecated; der Versuch führt zu einem 400-Fehler.

Projekte und Artifacts

Projekte erstellen isolierte Arbeitsbereiche, in denen Nutzer Referenzdokumente und Systemanweisungen hochladen, die über Gespräche hinweg bestehen bleiben. Claude führt retrieval-basiertes Reasoning über Projektinhalte aus – relevante Abschnitte werden in den aktiven Kontext gezogen, statt das gesamte Projekt auf einmal zu laden. Projektinhalte werden gecacht und zählen nicht gegen die Nutzungsgrenzen pro Nachricht. Das Upload-Limit pro Chat liegt unabhängig von der Stufe bei maximal 20 Dateien à 30 MB. Im Enterprise-Plan erweitert sich der Chat-Kontext auf 500K Token; alle anderen Pläne nutzen 200K Token im Chat (1 Mio. Token über die API für Opus und Sonnet 4.6+). Projekte starteten im September 2024 und erweiterten den Kontext im Juni 2025 um den Faktor 10.

Artifacts ist Claudes Ausgabeformat für Code, Dokumente, Diagramme und interaktive Inhalte, die direkt in der Konversationsoberfläche gerendert, bearbeitet und exportiert werden können. Wenn Claude umfangreiche eigenständige Inhalte erzeugt – Code, HTML, SVG, Mermaid-Diagramme, React-Komponenten, formatiertes Markdown – öffnet sich ein Seitenpanel mit Live-Vorschau. Nutzer können Artifacts iterieren, öffentlich teilen oder (in Team und Enterprise) innerhalb organisatorischer Grenzen teilen. Artifacts startete im Preview im Juni 2024 und erreichte am 26.08.2024 allgemeine Verfügbarkeit über alle Stufen hinweg. Stand April 2026 ist Artifacts in allen bezahlten Plänen und innerhalb von Projekten verfügbar.

Claude Code

Claude Code ist Anthropics terminal-first agentisches Coding-Tool, allgemein verfügbar seit 2025-05-22. Es führt Claude als autonomen Coding-Agent aus, der Code durchsucht, Dateien bearbeitet, Tests ausführt und nach GitHub committet. Native Integrationen umfassen VS Code- und JetBrains-Erweiterungen (Edits erscheinen inline in Dateien), GitHub-PR-Tagging sowie ein Claude Code SDK zum Aufbau eigener Agenten. Claude Opus 4.7 erhöhte beim Launch das Standard-Effort-Level auf xhigh für alle Pläne und führte Task Budgets (Public Beta) ein, um Token-Ausgaben über längere agentische Runs zu steuern. Der Launch im April 2026 führte außerdem den Befehl /ultrareview für dedizierte Review-Sessions sowie eine Multi-Session-Sidebar ein.

Die Pro-Stufe (20 $/Monat) mit enthaltenem Claude Code ist Stand 2026-05-07 volatil und umstritten. Die aktuelle anthropic.com/pricing-Seite listet unter Pro „Includes Claude Code“; ein unabhängiger Changelog-Tracker (scriptbyai.com, April 2026) behauptet, Anthropic habe Claude Code im April 2026 aus Pro entfernt. Konflikt ungeklärt – prüfen Sie direkt auf anthropic.com/pricing. Max-Pläne enthalten Claude Code, Enterprise enthält Claude Code, und API-Zugriff über das Claude Code SDK ist durchgängig verfügbar.

Siehe auch: Claude-Code-Funktionen und Preise →

Computer Use

Computer Use wurde ursprünglich als Beta mit Claude 3.5 Sonnet am 2024-10-22 veröffentlicht, über Claude 3.7 und die Claude-4-Generation hinweg ausgebaut und erreichte auf claude.ai im März 2026 allgemeine Verfügbarkeit. Entwickler stellen Claude über die Messages API Computer-Use-Tools und einen Nutzer-Prompt bereit. Claude bewertet die Aufgabe und konstruiert Tool-Use-Requests; der Entwickler führt Aktionen in einer sandboxed virtuellen Maschine mit X11/Xvfb-Display, leichtgewichtigem Desktop-Environment und vorinstallierten Anwendungen aus. Das Standard-Limit für Loop-Iterationen liegt bei 10 (entwicklerseitig anpassbar). Claude Opus 4.7 verbesserte die Zuverlässigkeit von Computer Use deutlich durch Unterstützung hochauflösender Bilder und erreichte 98,5 % in XBOWs Visual-Acuity-Benchmark gegenüber 54,5 % bei Opus 4.6 sowie 78 % in OSWorld – gleichauf mit GPT-5.5 bei 78,7 %.

Siehe auch: Details zur Computer-Use-Funktion →

Memory und Cowork

Memory arbeitet in zwei Modi. Chat-Memory leitet Zusammenfassungen vergangener Gespräche ab und trägt sie über Sessions hinweg, einsehbar und bearbeitbar unter Settings → Capabilities → Memory. File-System-Memory für agentische Nutzung schreibt in einen /memory-Ordner, der zu Session-Beginn gelesen wird, mit optionalem Auto-Memory-Modus, in dem Claude entscheidet, was gespeichert wird. Opus 4.7 verbesserte insbesondere die Zuverlässigkeit von File-System-Memory für lange, multi-session agentische Arbeit. Chat-Memory wurde im September 2025 für Team- und Enterprise-Pläne ausgeliefert und im März 2026 für Free. Die Datenrichtlinien-Änderung im August 2025 verlängerte die Aufbewahrung von Konversationsdaten auf 5 Jahre für Nutzer, die nicht vom Training abgemeldet sind; dies ist von der aktiven Memory-Aufbewahrung zu unterscheiden.

Claude Cowork startete im Research Preview im Januar 2026 und erreichte im April 2026 allgemeine Verfügbarkeit über alle bezahlten Pläne hinweg. Cowork gewährt Claude Zugriff auf einen vom Nutzer festgelegten Ordner auf dem lokalen Computer; Claude kann Dateien autonom lesen, bearbeiten und erstellen und unterstützt mehrstufige Ausführung sowie Sub-Agent-Koordination für parallelisierbare Arbeit. Der initiale Launch war nur für macOS.

MCP und Integrationen

MCP (Model Context Protocol) ist ein offener Standard, den Anthropic entwickelt hat, damit Claude über eine standardisierte Schnittstelle mit externen Tools, Datenquellen und Services verbunden werden kann. Drittanbieter-MCP-Server existieren für Notion, Zapier, GitHub und große IDE-Tools. Claude Opus 4.7 erzielt 77,3 % auf MCP-Atlas und liegt damit 9,2 Punkte vor GPT-5.4 und 3,4 Punkte vor Gemini 3.1 Pro (73,9 %), was auf starke reale Tool-Orchestrierung-Performance hinweist.

Claude in Excel startete als Beta-Research-Preview im Oktober 2025 und bietet Workbook-Verständnis mit zellgenauen Zitaten für Erklärungen sowie die Möglichkeit, Annahmen zu aktualisieren, während Formeln erhalten bleiben. Claude für Word startete im April 2026 (Pro und Max). Claude für Microsoft 365 (Outlook, weitere 365-Oberflächen) ist in Pro, Max, Team und Enterprise enthalten. Die Free-Stufe enthält keine Microsoft-365-Integration.

Siehe auch: Deep Guide zu Custom GPTs →

Claude-Benchmarks und Genauigkeit

Benchmarks erzählen unterschiedliche Geschichten – je nachdem, was sie messen. Claude führt bei autonomem Multi-File-Coding (SWE-bench Pro), agentischer Tool-Nutzung (MCP-Atlas), tool-gestütztem HLE und Kalibrierungsmetriken. Es liegt zurück bei reiner Wissensbreite (AA-Omniscience-Accuracy), multimodaler Abdeckung (kein Audio- oder Video-Input) und ARC-AGI-2. Beide Richtungen sind reale Signale unterschiedlicher Qualitäten.

Benchmark-Scores – aktuelle Flaggschiffe

Benchmark
Claude Opus 4.7
GPT-5.5 / 5.4
Gemini 3.1 Pro
Datum verifiziert

SWE-bench Verified
87.6%
für 5.5 nicht öffentlich bestätigt
80.6%
2026-04-16

SWE-bench Pro
64,3 % (Branchenhöchstwert)
GPT-5.4: 57,7 %
nicht berichtet
2026-04-16

GPQA Diamond
94.2%
GPT-5.4: 94,4 %
94.3%
2026-04-16

AA Intelligence Index
57 (3-facher Gleichstand)
GPT-5.4: 57
57
2026-04-16

HLE (ohne Tools)
39.6%
nicht berichtet
44.7%
2026-05-05

HLE (mit Tools)
54,7 % (1.)
nicht berichtet
51.4%
2026-04-16

LMArena Elo (Text)
1504
~1482
~1493
2026-04-21

OSWorld (Computer Use)
78%
GPT-5.5: 78,7 %
nicht veröffentlicht
2026-04-16

CursorBench
70 % (erstes Modell >70 %)
nicht öffentlich offengelegt
nicht berichtet
2026-04-16

MCP-Atlas
77.3%
GPT-5.4: 68,1 %
73.9%
2026-04-16

Finance Agent
64.4%
nicht öffentlich offengelegt
59.7%
2026-04-16

BrowseComp
79.3%
nicht öffentlich offengelegt
85.9%
2026-04-16

ARC-AGI-2
Opus 4.6: 68,8 %
nicht berichtet
77.1%
2026-02

AA-Omniscience Genauigkeit
~47 %
nicht berichtet
55.3%
2026-04

AA-Omniscience Halluzination
36%
GPT-5.5: 86 %
50%
2026-04

AA-Omniscience Index
26 (2. insgesamt)
GPT-5.5: 20
33
2026-04

Quellen: Vellum AI, 2026-04-15; Suprmind KI-Halluzinationsraten, 2026-04-26; pricepertoken.com; DataCamp, 2026-04-26; ofox.ai. Zuletzt verifiziert am 2026-05-07.

Hinweis zur Methodik: AIME 2025 ist an der Frontier faktisch gesättigt (mehrere Modelle erzielen >99 %) und differenziert nicht mehr; behandeln Sie AIME-Vorteile mit Skepsis. Der schwierigere neue Vectara-Datensatz berichtet, dass Reasoning-Modelle >10 % Halluzination erreichen, weil sie beim Zusammenfassen „overthinken“ und vom Quellmaterial abweichen – daher sind rohe Vectara-Vergleiche zwischen Reasoning- und Non-Reasoning-Modellen ohne Kontext irreführend. CursorBench wird von Cursor betrieben, einem bedeutenden Claude-Distributionspartner; es wurde keine unabhängige Replikation gefunden. Die MRCR-v2-Regression von Claude Opus 4.7 auf 32,2 % bei 1 Mio. Kontext (von 78,3 % bei Opus 4.6) wird von Anthropic auf bewusstes Fehler-Reporting zurückgeführt, wenn Informationen fehlen, statt Antworten zu erfinden; unabhängige Verifikation des Mechanismus ist dünn.

Claude-Halluzinationsraten

Claudes Halluzinationsprofil ist der zentrale Differenzierungsfaktor gegenüber Peer-Modellen. Laut Suprminds Referenz „KI-Halluzinationsraten und Benchmarks“ (Update Mai 2026) erreicht Claude 4.1 Opus eine AA-Omniscience-Halluzinationsrate von 0 %, indem es unsichere Anfragen mathematisch ablehnt – die niedrigste aller getesteten Modelle in jeder Größenordnung. Claude Opus 4.7 liegt bei AA-Omniscience-Halluzination bei 36 % (Index 26, zweithöchster Wert insgesamt hinter Gemini 3.1 Pro mit 33), 50 Prozentpunkte niedriger als GPT-5.5 mit 86 % im selben Benchmark. Claude Opus 4.5 mit Websuche erzielte 30 % auf HalluHard – der niedrigste Wert aller Modelle im realistischen Konversations-Halluzinationsbenchmark.

Das Claude-Muster ist Kalibrierung durch Verweigerung: Claude verweigert Antworten häufiger als Peers und halluziniert weniger, wenn es antwortet. Das führt sowohl zu den niedrigsten Halluzinationsraten als auch zu geringerer Rohgenauigkeit (~47 % AA-Omniscience-Accuracy vs. 55,3 % bei Gemini 3.1 Pro). Reasoning-Modelle, einschließlich der 4.5- und 4.6-Generationen, liegen auf Vectaras schwierigeren Summarization-Datensatz über 10 %, aufgrund dokumentierten „Overthinking“ – Reasoning, das vom Quellmaterial abweicht. Das ist keine Fähigkeitsbehauptung über Claudes Korrektheit; es ist eine Konsistenzbehauptung über Claudes Kalibrierung.

Siehe auch: Claudes Halluzinationsraten über Benchmarks hinweg →

Was Claude anders macht — der Kalibrierungsvorteil

Akademische Benchmarks ordnen Claude Opus 4.7 an der Frontier in einem Dreifach-Gleichstand ein (AA Intelligence Index 57). Produktionsdaten aus Multi-Model-Setups erzählen eine spezifischere Geschichte – und diese ist die nützlichste, wenn es darum geht, KI-Tools für echte Arbeit auszuwählen.

Laut Suprmind Multi-Model Divergence Index (Ausgabe April 2026, n=1.324 Production-Turns) sinkt Claudes confidence-contradicted rate von 33,9 % über alle Turns auf 26,4 % bei High-Stakes-Turns – ein Kalibrierungsdelta von -7,5 Punkten. Kein anderer getesteter Anbieter zeigt ein Delta steiler als -3,4 Punkte (ChatGPT/GPT). Das ist die am besten empirisch belegbare Unterscheidung für Claude im Multi-Model-Kontext. Claude wird messbar langsamer, wenn die Konsequenzen real sind; andere nicht.

Wie Claude in Multi-Model-Kontexten performt

Catch Ratio misst gemachte Korrekturen geteilt durch die Anzahl der Male, die ein Modell „erwischt“ wurde. Ein Wert über 1,0 bedeutet, dass ein Modell andere häufiger korrigiert, als es selbst korrigiert wird. Laut Suprmind Multi-Model Divergence Index lag die Verteilung in der Ausgabe April 2026 bei: Perplexity 2,54, Claude 2,25, Grok 0,72, ChatGPT 0,38, Gemini 0,26. Claude machte 304 Korrekturen und wurde 135-mal erwischt – die zweithöchste Catch Ratio von fünf Anbietern. Zusammen mit Perplexity (Catch Ratio 2,54) entfallen auf diese beiden Anbieter 60,7 % aller Korrekturen in der Studie. Das positioniert Claude als Verifikations-Layer-Modell statt als alleinigen Orakel.

Unique Insights folgten demselben Muster. Claude erzeugte 631 Unique Insights (24,5 % Anteil, nur knapp hinter Perplexity mit 636/24,7 %) mit 268 als kritisch eingestuften (Severity ≥7 auf einer 10-Punkte-Skala). Zum Vergleich: ChatGPT lieferte 339 (13,2 % Anteil, 85 kritisch), womit Claude im selben Datensatz bei kritischen Unique Insights etwa 3,15x produktiver war als ChatGPT. Claude ist die zweitbeste Engine für die Generierung neuer Insights in einem Multi-Model-Ensemble.

Siehe auch: KI-Catch-Ratio-Daten →

Wo Claude Einschränkungen hat

Drei dokumentierte Einschränkungen prägen, wann Claude allein das falsche Tool ist.

Erstens: breite Wissensabfrage. Claude Opus 4.7 liegt mit einer AA-Omniscience-Accuracy von etwa 47 % um 8 Punkte hinter Gemini 3.1 Pro mit 55,3 %. Das ist der direkte Preis von refusal-by-design – Claude beantwortet insgesamt weniger Fragen korrekt, aber einen höheren Anteil dessen korrekt, was es beantwortet. Nutzer, die maximale Breite statt maximaler Präzision benötigen, sollten Claude mit einem Modell mit höherer Abdeckung kombinieren.

Zweitens: multimodale Eingaben. Claude akzeptiert nur Text und Bild. Audio- und Video-Inputs werden nicht unterstützt. Der FACTS multidimensionale Factuality-Score von Gemini 3 Pro von 68,8 gegenüber 51,3 bei Claude Opus 4.5 (ein Defizit von 17 Punkten) ist teilweise strukturell – FACTS misst Ingestion über Modalitäten hinweg, die Claude nicht lesen kann.

Drittens: Selbstkonsistenz in iterativer Recherche. Laut Suprmind Multi-Model Divergence Index (April 2026) ist Claude vs. Claude das konfliktträchtigste Pair im ResearchAnalysis-Domain – 10 Widersprüche über 74 Turns, eine Intra-Model-Contradiction-Rate von 13,5 %. Das Claude-vs-Claude-Muster ist das wichtigste Orchestrierungssignal für Nutzer, die Claude in iterativen Research-Workflows einsetzen. Gegenprüfung gegen sich selbst oder Peers reduziert die Volatilität.

Siehe auch: Claude vs. ChatGPT vs. Gemini Vergleich →

Claude-Preise — Free, Pro, Max, Team, Enterprise

Anthropic betreibt eine siebenstufige Consumer- und Business-Preisstruktur. Zwei volatile Elemente sind Stand Mai 2026 dokumentiert: der Inklusionsstatus von Claude Code in Pro (anthropic.com/pricing listet es; ein unabhängiger Changelog behauptet, es sei im April 2026 entfernt worden) sowie die Message-Volume-Caps pro Stufe (beschrieben als „usage limits apply“ oder „conversation budget“ ohne konkrete Zahlen).

Vergleich der Abonnementstufen

Stufe
Monatliche Kosten
Jährliche Kosten
Zugrunde liegende Modelle
Harte Limits

**Free**
0 $
0 $
Sonnet 4.6 (Standard); Haiku 4.5 begrenzt
Conversation Budget nicht spezifiziert; kein Claude Code; kein Research-Modus; Memory verfügbar; einige Web-Connector-Zugriffe

**Pro**
20 $/Monat
17 $/Monat (204 $/Jahr)
Sonnet 4.6 Standard; Opus 4.7 begrenzt; Haiku 4.5
Claude Code (Status widersprüchlich); Research-Modus; unbegrenzte Projekte; Microsoft-365-Integration; Voice-Modus

**Max 5x**
100 $/Monat
nicht öffentlich offengelegt
Wie Pro plus Early Access
5x mehr Nutzung als Pro; höhere Output-Limits; priorisierter Zugriff bei hoher Auslastung

**Max 20x**
200 $/Monat
nicht öffentlich offengelegt
Wie Max 5x
20x mehr Nutzung als Pro

**Team Standard**
25 $/Sitz/Monat
20 $/Sitz/Monat
Wie Pro plus Enterprise-Funktionen
Min. 5 Sitze, max. 150; SSO; zentrale Abrechnung; Admin-Kontrollen; standardmäßig kein Modelltraining

**Team Premium**
125 $/Sitz/Monat
100 $/Sitz/Monat
Wie Team Standard
5x Nutzung der Standard-Sitze

**Enterprise**
20 $+/Sitz + API
Nur jährlich
Vollständige Modell-Suite
SCIM, Audit-Logs, Compliance API, benutzerdefinierte Datenaufbewahrung, HIPAA-ready (Beta); IP-Allowlisting; 500K Kontextfenster auf einigen Modellen

Quelle: anthropic.com/pricing, abgerufen am 2026-05-07.

Siehe auch: Claude-Preisdetails →

API-Preise für Entwickler und Enterprise

Die API-Preise für Modelle der aktuellen Generation werden pro Million Token gemessen, mit separaten Raten für Input, Cached-Input-Write, Cached-Input-Read und Output.

Modell
Input $/1M
Cached Write
Cached Read
Output $/1M

Claude Opus 4.7
5,00 $
6,25 $
0,50 $
25,00 $

Claude Sonnet 4.6
3,00 $
3,75 $
0,30 $
15,00 $

Claude Haiku 4.5
1,00 $
1,25 $
0,10 $
5,00 $

Quelle: anthropic.com/pricing, abgerufen am 2026-05-07.

Zusätzliche API-Level-Gebühren: Managed Agents zu 0,08 $ pro Session-Stunde aktiver Laufzeit; Web Search zu 10 $ pro 1.000 Suchen; Code Execution kostenlos für die ersten 50 Stunden pro Tag und Organisation, danach 0,05 $ pro Stunde und Container; US-only Inferenz zu 1,1x Input- und Output-Preisen; Prompt-Caching mit 5 Minuten Standard-TTL (verlängerte TTL verfügbar). Batch API: 50 % Rabatt auf alle Modelle, unterstützt bis zu 10.000 Queries für asynchrone Verarbeitung in unter 24 Stunden.

Aktuelle Preisänderungen (2025–2026)

Das bedeutendste Preisereignis in der API-Historie von Claude war die 67%ige Opus-Preisreduktion beim Launch von Opus 4.6 (2026-02-05): von 15/75 $ pro Million Token (Opus 4.1) auf 5/25 $ pro Million Token (ab Opus 4.6). Das Kontextfenster von 1 Mio. Token wurde ebenfalls ab Opus 4.6 und Sonnet 4.6 ohne Aufpreis zum Standard. Claude Opus 4.7 hielt die neuen 5/25-$-Preise. Claude Opus 4.1 hat auf AWS Bedrock ein End-of-Life-Datum am 2026-05-31 und nimmt damit die frühere Opus-Stufe zu 15/75 $ aus der aktiven Produktlinie.

Claude-Kontroversen und bekannte Probleme

Anthropic war Anfang 2026 häufiger von regulatorischen und technischen Kontroversen betroffen als jedes andere KI-Lab – getrieben durch Safety-first-Verpflichtungen, die direkte Konflikte mit prominenten Kunden erzeugten, sowie durch Performance-Regressionen in Claude Code, die zu Community-Brennpunkten wurden.

Die Pentagon-Verweigerung und die „Department of War“-Klage (Februar–März 2026)

Am 26.02.2026 verweigerte Anthropic öffentlich eine Vertragsklausel des Department of Defense, die „jede rechtmäßige Nutzung“ von Claude erlaubt hätte, einschließlich vollständig autonomer Waffenzielerfassung und inländischer Überwachung von Amerikanern ohne richterliche Aufsicht. CEO Dario Amodei erklärte, das Unternehmen könne „nach bestem Gewissen nicht zustimmen“. Das Pentagon stufte Anthropic als „supply-chain risk to national security“ ein – die erste derartige Einstufung, die jemals auf ein amerikanisches Unternehmen angewandt wurde. Präsident Trump erließ am 27./28.02.2026 eine Executive Order, die die Nutzung von Claude durch die US-Regierung untersagte. Das Department of War setzte Claude weniger als 24 Stunden nach dem Verbot gegen Iran ein. Anthropic reichte am 09.03.2026 Klage ein und machte staatliche Vergeltung geltend. Die Klage war zum Research-Datum aktiv.

Die architektonische Ursache ist wesentlich: Claudes Constitutional-AI-Framework vom Januar 2026 enthält explizite harte Constraints gegen die Unterstützung von Massenüberwachung und autonomer tödlicher Zielerfassung ohne menschliche Aufsicht. Das sind Modell-Constraints, nicht rein Policy-Constraints – sie können daher nicht über System-Prompt-Konfiguration überschrieben werden.

Claude-Code-Performance-Regression (März–April 2026)

Zwischen dem 4. März und dem 13. April 2026 entstand eine breit rezipierte „Claude ist dümmer geworden“-Erzählung. AMD Senior Director of AI Stella Laurenzo veröffentlichte eine forensische Analyse von 6.852 Claude-Code-Sessions (234.760 Tool-Calls, 17.871 Thinking-Blocks), die eine Verschiebung von research-first zu edit-first, steigende Stop-Hook-Verstöße und geringere Reasoning-Tiefe zeigte. Anthropic veröffentlichte am 23.04.2026 ein vollständiges Engineering-Postmortem und bestätigte drei separate Ursachen: (1) Standard-Reasoning-Effort wurde am 04.03.2026 von high auf medium geändert (zurückgesetzt am 07.04.2026); (2) ein Cache-Optimierungsbug löschte ab 26.03.2026 bei stale Sessions in jedem Turn die Thinking-History (behoben am 10.04.2026); (3) eine System-Prompt-Verbosity-Constraint am 16.04.2026 verursachte einen 3%igen Eval-Drop (zurückgesetzt am 20.04.2026).

Der Vorwurf der „intentional degradation“ war unbelegt. Alle drei Ursachen waren Engineering-Entscheidungen mit legitimen Begründungen, die unvorhergesehene Wechselwirkungen hatten. Separat basierte ein viraler BridgeMind-Benchmark, der einen 15-Punkte-Performance-Drop behauptete, auf n=6 Tasks; ein unabhängiger Retest mit n=30 zeigte kaum Bewegung (87,6 % auf 85,4 %). Die eigentliche Governance-Sorge ist die Verzögerung von über 6 Wochen zwischen der ersten Änderung und dem öffentlichen Postmortem.

Datenrichtlinie und Training-Opt-out (August 2025)

Am 28.08.2025 kehrte Anthropic seine frühere Richtlinie um, Consumer-Konversationen nicht zum Training zu verwenden. Konversationen und Coding-Sessions von Nutzern der Pläne Free, Pro und Max wurden standardmäßig zu Trainingsdaten. Die Datenaufbewahrung wurde von 30 Tagen auf 5 Jahre verlängert, sofern Nutzer nicht bis zum 28.09.2025 manuell opt-out wählten; die vollständige Durchsetzung begann im Oktober 2025. Lawfare Media merkte an, dass dies einen Wechsel von expliziter Einwilligung zu berechtigtem Interesse unter der DSGVO darstellt und Compliance-Fragen für europäische Nutzer aufwirft. Enterprise- und Team-Pläne enthalten vertragliche Non-Training-Regelungen ohne Opt-out pro Nutzer.

Constitutional AI und Verweigerungsmuster

Anthropic veröffentlichte am 22.01.2026 eine neue Claude Constitution (ca. 84 Seiten, Creative Commons Public Domain) und ersetzte damit den Constitutional-AI-Ansatz von 2023. Das Framework verschiebt sich von regelbasierten Vorschriften zu begründungsbasierter Alignment, die erklärt, warum bestimmte Verhaltensweisen wichtig sind, mit dem Ziel der Generalisierung auf neue Situationen. Es etabliert eine 4-stufige Prioritätshierarchie: Sicherheit > Ethik > Richtlinien > Hilfsbereitschaft. Es erkennt formal die Möglichkeit von Claudes Bewusstsein und moralischem Status an – die erste derartige Anerkennung durch ein großes KI-Lab. Der Oxford AI Ethics Blog merkte an, dies stelle „zwei evaluative continua“ statt eines festen Regelwerks dar. Harte Constraints umfassen die Verweigerung von Unterstützung bei autonomer tödlicher Zielerfassung ohne menschliche Aufsicht, Massenüberwachung ohne richterliche Aufsicht, CBRN-Waffenentwicklung sowie Inhalte, die illegitime gesellschaftliche Kontrolle an sich reißen würden.

Siehe auch: ChatGPT-Halluzination nach Version →

Claude in Enterprise — Einführung und Integrationen

Die Durchdringung von Claude im Unternehmensbereich ist nach Anzahl der Implementierungen die tiefste aller führenden KI-Modellfamilien, angetrieben durch die Constitutional-AI-Sicherheitsarchitektur, die den Beschaffungsanforderungen von Unternehmen entspricht, an denen reine Leistungskonkurrenten scheitern.

Anwendungsfälle und Implementierungen in Unternehmen

70 % der Fortune-100-Unternehmen sind Claude-Kunden; 8 der Fortune 10; über 500 Kunden geben jährlich mehr als 1 Mio. $ aus. Unternehmenskunden (über 300.000 Unternehmen) machen etwa 80 % des Umsatzes von Anthropic aus. Die Zahl der Kunden, die jährlich über 100.000 $ ausgeben, ist im vergangenen Jahr um das Siebenfache gestiegen. Claudes Anteil an den LLM-Ausgaben von Unternehmen erreichte bis 2025 etwa 40 %, gegenüber 12 % zwei Jahre zuvor. Der annualisierte Umsatz wuchs in jedem der letzten drei Jahre um das Zehnfache auf 14 Mrd. $ bis Anfang 2026.

Zu den namhaften Implementierungen gehören Deloitte (470.000 Mitarbeiter weltweit nutzen Claude), Cognizant (350.000 Mitarbeiter nutzen Claude Code, sowie Claude in weiteren Funktionen), Thomson Reuters CoCounsel für Rechtsrecherche und Dokumentenerstellung (über 1 Mio. Nutzer), Lyft (Automatisierung des Kundensupports, die die Supportzeit um über 87 % reduzierte und die Entscheidungsgenauigkeit um 30 % verbesserte), TELUS (Zehntausende von Nutzern, Milliarden von Token monatlich) und Zapier (Workflow-Automatisierung in großem Maßstab).

Plattform-Integrationen (Bedrock, Vertex, GitHub Copilot, Cursor)

Das Entwickler-Ökosystem umfasst mehr als 6.000 Apps mit nativer Claude-Integration und über 75 Enterprise-Workflow-Connectoren. Namhafte Integrationen sind: Microsoft 365 (Excel, Word, Outlook), GitHub Copilot (Claude Sonnet 4 war das zugrunde liegende Modell beim Launch), Cursor (CursorBench-Partnerschaft), Slack, Notion (Notion Skills für Claude), Amazon Bedrock (alle aktiven Modelle), Google Vertex KI (alle aktiven Modelle) und Microsoft Azure KI Foundry (allgemein verfügbar für ausgewählte Modelle mit EU-Inferenz „Erscheint 2026“). Es besteht eine starke Branchenkonzentration in den Bereichen Recht (Thomson Reuters CoCounsel), Finanzdienstleistungen (führend im Finance Agent Benchmark), professionelle Dienstleistungen (Deloitte, Cognizant), Software-Engineering (GitHub Copilot, Cursor, IDE-Integrationen), Telekommunikation (TELUS) und Kundensupport (87 % Zeitersparnis bei Lyft).

Hardware- und OS-Integrationen: macOS-Desktop-App (Cowork war beim Start im Januar 2026 nur für macOS verfügbar), Windows-Desktop-App, iOS-App, Android-App, GitHub Copilot, Cursor und eine Mitte 2025 bekannt gegebene SpaceX-Rechenpartnerschaft (Bedingungen nicht öffentlich bestätigt).

Siehe auch: Claude vs. ChatGPT im Vergleich →

Quellen

Autoritative Quellen, die bei der Erstellung dieses Leitfadens herangezogen wurden. Zur Wartung überwachen Sie bitte die im JSON-SSOT-Abschnitt angegebenen URLs.

  • Anthropic – anthropic.com (Ankündigungen, Preise, Business-Seiten)
  • Anthropic Help Center – support.claude.com (Funktionsdokumentation)
  • Anthropic Platform – platform.claude.com (API-Dokumentation, Modellkatalog, Abkündigungen)
  • Anthropic Status – status.claude.com (Vorfälle)
  • Suprmind Multi-Model Divergence Index – suprmind.ai/hub/multi-model-ai-divergence-index/ (Multi-Modell-Produktionsdaten)
  • Suprmind KI-Halluzinationsraten und Benchmarks – suprmind.ai/hub/ai-hallucination-rates-and-benchmarks/ (kanonische Halluzinationsdaten)
  • Artificial Analysis – artificialanalysis.ai (AA Intelligence Index, AA-Omniscience)
  • LMArena – arena.ai/leaderboard (Ranking der Nutzerpräferenzen)
  • Vellum AI – vellum.ai/blog (Claude Opus 4.7 Benchmarks)
  • DataCamp – datacamp.com (Berichterstattung Claude vs. Gemini)
  • Reuters – reuters.com (Berichterstattung zum DoW-Rechtsstreit)
  • TechCrunch – techcrunch.com (Berichterstattung zur Serie H, Datenrichtlinie vom August 2025)
  • The Register – theregister.com (Berichterstattung zur Claude Code Regression)
  • Bloomberg – bloomberg.com (Berichterstattung zur Serie G über 30 Mrd. $)
  • AP News, CNBC – Berichterstattung zur Amazon-Investition von 25 Mrd. $/33 Mrd. $
  • Lawfare Media – lawfaremedia.org (Kritik an Constitutional AI)
  • BISI, Oxford AI Ethics – Constitution-Evaluierungen

Zuletzt verifiziert am 07.05.2026.

Häufig gestellte Fragen

Was ist Claude KI?

Claude ist eine Familie von KI-Assistenten, die von Anthropic entwickelt wurden, einem US-amerikanischen, auf Sicherheit fokussierten KI-Unternehmen, das 2021 von ehemaligen OpenAI-Forschern gegründet wurde. Das aktuelle Flaggschiff ist Claude Opus 4.7, veröffentlicht am 16. April 2026, mit einem Kontextfenster von 1 Mio. Token und einem SWE-bench Pro Score von 64,3 % – dem aktuellen Branchenhöchstwert für autonomes Coding. Claude ist über claude.ai, iOS, Android, Desktop-Apps, die Anthropic API, Amazon Bedrock und Google Vertex AI verfügbar.

Wer hat Claude entwickelt?

Anthropic hat Claude entwickelt. Anthropic wurde 2021 von Dario Amodei (CEO) und Daniela Amodei (Präsidentin) zusammen mit sieben weiteren ehemaligen OpenAI-Mitarbeitern mitbegründet. Seit Anfang 2026 beträgt der annualisierte Umsatz etwa 14 Mrd. $; eine Serie-G-Runde über 30 Mrd. $ wurde im Februar 2026 mit einer Post-Money-Bewertung von 380 Mrd. $ abgeschlossen.

Was ist die neueste Version von Claude?

Seit Mai 2026 ist das öffentlich verfügbare Flaggschiff Claude Opus 4.7 (veröffentlicht am 16.04.2026). Es bietet ein Eingabe-Kontextfenster von 1 Mio. Token, eine Ausgabe von 128.000 Token, Adaptive Reasoning und eine verbesserte Computer-Nutzung. Eine separat angekündigte Claude Mythos Preview (07.04.2026) ist oberhalb von Opus 4.7 angesiedelt, bleibt jedoch über Project Glasswing exklusiv für geladene Gäste.

Ist Claude kostenlos nutzbar?

Ja, aber mit Einschränkungen. Der kostenlose Tarif bietet Zugang zu Claude Sonnet 4.6 (Standard) und eingeschränkten Zugriff auf Haiku bei unbestimmten Nutzungsobergrenzen, die als „Konversationsbudget“ bezeichnet werden. Claude Code, der Research-Modus und der volle Zugriff auf Opus erfordern kostenpflichtige Tarife.

Halluziniert Claude?

Ja, aber mit deutlich niedrigeren Raten als vergleichbare Modelle. Claude 4.1 Opus erreicht eine AA-Omniscience-Halluzinationsrate von 0 %, indem es die Antwort verweigert, wenn es unsicher ist – der niedrigste Wert aller getesteten Modelle. Claude Opus 4.7 hält die AA-Omniscience-Halluzination bei 36 %, was 50 Punkte niedriger ist als die 86 % von GPT-5.5 im selben Benchmark, bei einem Omniscience-Index von 26 (der zweithöchste Gesamtwert).

Ist Claude besser als ChatGPT?

Das hängt von der Aufgabe ab. Claude führt beim autonomen Coding über mehrere Dateien (SWE-bench Pro 64,3 % vs. 57,7 % bei GPT-5.4), bei der Halluzinationskalibrierung (AA-Omniscience 36 % vs. 86 % bei GPT-5.5), bei der Analyse langer Kontexte und bei der Synthese professioneller Dokumente. ChatGPT führt bei der Bildgenerierung (Claude bietet keine an), der Breite des Plugin-Ökosystems, dem Sprachmodus und der reinen Geschwindigkeit bei einfachen Anfragen. Laut dem Suprmind Multi-Model Divergence Index (April 2026, n=1.324) liegt Claudes Rate für Konfidenz-Widersprüche in kritischen Szenarien bei 26,4 % und damit um 9,8 Punkte niedriger als die 36,2 % von ChatGPT.

Warum lehnt Claude manche Anfragen ab?

Das Constitutional-AI-Framework von Claude legt harte Grenzen fest: keine Unterstützung bei autonomer letaler Zielerfassung ohne menschliche Aufsicht, keine Massenüberwachung ohne richterliche Aufsicht, keine Entwicklung von CBRN-Waffen, keine Unterstützung bei der Erlangung unrechtmäßiger gesellschaftlicher Kontrolle. Dies sind Einschränkungen auf Modell-Ebene, nicht auf Richtlinien-Ebene. Standardmäßige Ablehnungen betreffen auch explizite sexuelle Inhalte und detaillierte Anleitungen für illegale Aktivitäten; Betreiber können diese Standards innerhalb der Nutzungsrichtlinien von Anthropic konfigurieren.

Warum verschlechtert sich Claude manchmal beim Coding?

Drei separate technische Änderungen verschlechterten die Leistung von Claude Code zwischen Anfang März und Mitte April 2026, was allesamt in Anthropics Post-Mortem-Analyse vom 23.04.2026 bestätigt wurde: Der standardmäßige Reasoning-Aufwand wurde von high auf medium reduziert (am 07.04.2026 rückgängig gemacht); ein Fehler bei der Cache-Optimierung löschte den Denkverlauf (am 10.04.2026 behoben); eine Einschränkung der Ausführlichkeit des System-Prompts verursachte einen Rückgang der Evaluierung um 3 % (am 20.04.2026 rückgängig gemacht). Der Vorwurf der „absichtlichen Verschlechterung“ war unbegründet.

Was bedeutet „Modell überlastet“ bei Claude?

Der Claude-spezifische Fehlercode 529 bedeutet, dass die Server von Anthropic ausgelastet sind, was sich vom allgemeinen Fehler 503 unterscheidet. Der größte dokumentierte Vorfall war ein 14-stündiger Ausfall am 2. und 3. März 2026, der claude.ai und die mobilen Apps betraf; die API blieb weitgehend funktionsfähig. Die Abhilfe ist ein exponentieller Backoff, beginnend bei 1–2 Sekunden.

Hat Claude offene Gewichte (Open Weights)?

Nein. Kein Claude-Modell hat offene Gewichte. Anthropic veröffentlicht keine Modellgewichte und erlaubt keine selbst gehostete Implementierung. Die API und verwaltete Plattformen (AWS Bedrock, Google Vertex AI, Microsoft Azure AI Foundry) sind die einzigen Zugangskanäle.

Hören Sie auf zu raten. Fangen Sie an gegenzuprüfen.

Suprmind führt Ihren Prompt parallel in ChatGPT, Claude, Gemini, Grok und Perplexity aus. Sehen Sie, wo sie übereinstimmen, wo sie voneinander abweichen und welche Erkenntnisse nur ein einziges Modell geliefert hat – bevor Sie handeln.