Claude IA : Guide complet des modèles, fonctionnalités, tarifs et benchmarks (2026)
Claude est une famille d’assistants IA développée par Anthropic, une entreprise américaine de sécurité de l’IA fondée en 2021 par d’anciens chercheurs d’OpenAI. En mai 2026, le modèle phare disponible publiquement est Claude Opus 4.7, sorti le 16 avril 2026, avec une fenêtre de contexte d’entrée de 1 million de jetons, une sortie de 128 000 jetons, un traitement natif du texte et des images, et une architecture de raisonnement adaptatif qui alloue dynamiquement le calcul interne en fonction de la complexité du problème. Le produit est distribué via claude.ai, des applications iOS et Android, des applications de bureau dédiées macOS et Windows, l’API Anthropic et des plateformes gérées (Amazon Bedrock, Google Cloud Vertex AI, Microsoft Azure AI Foundry).
La revendication déterminante concernant Claude en 2026 est la calibration plutôt que la couverture. Claude Opus 4.7 détient le deuxième indice d’omniscience le plus élevé de tous les modèles actuels (26, derrière seulement les 33 de Gemini 3.1 Pro), atteint grâce à une architecture de refus en cas d’incertitude plutôt qu’à des taux de réponse maximisés. Selon l’indice de divergence multi-modèle de Suprmind, édition d’avril 2026 (n=1 324 tours de production), le taux de contradiction par rapport à la confiance de Claude chute de 33,9 % sur l’ensemble des tours à 26,4 % sur les tours à enjeux élevés — un delta de calibration de -7,5 points qu’aucun autre fournisseur testé n’égale. Claude ralentit de manière mesurable lorsque les conséquences sont réelles ; les autres non.
Cette page présente ce qu’est Claude, la gamme complète des modèles actifs et obsolètes, le coût de chaque niveau et le modèle que vous obtenez réellement, l’ensemble des fonctionnalités telles qu’elles se présentent en mai 2026, le panorama des benchmarks (là où Claude mène, là où il stagne, ce qu’il faut lire dans les écarts entre les mesures des fournisseurs et les mesures indépendantes), les schémas d’hallucination qui devraient orienter votre utilisation, ce que les données multi-modèles de production montrent sur Claude par rapport à ses pairs, les controverses actives et les questions que les gens recherchent le plus souvent. Les chiffres sont datés. Le produit change chaque semaine. Lorsqu’une affirmation est volatile, elle est signalée.
Voir aussi : Indice de divergence multi-modèle Suprmind →
Ce qu’est Claude
Claude est un produit d’IA conversationnelle développé par Anthropic qui utilise le modèle de langage Claude Opus 4.7 depuis avril 2026 pour répondre à des questions, générer du texte et du code, analyser des documents, contrôler des navigateurs web et des systèmes d’exploitation, et accomplir des tâches agentiques en plusieurs étapes. Le produit est distinct de la famille de modèles Claude sous-jacente qui l’alimente — les mêmes modèles peuvent être consultés directement via l’API Anthropic sur platform.claude.com, sur Amazon Bedrock, sur Google Vertex AI et sur Microsoft Azure AI Foundry à des tarifs différents.
Anthropic a été cofondée en 2021 par Dario Amodei (PDG) et Daniela Amodei (Présidente) ainsi que sept autres anciens employés d’OpenAI. L’entreprise est structurée comme une Public Benefit Corporation du Delaware. Au début de 2026, le chiffre d’affaires annualisé a atteint environ 14 milliards de dollars et un tour de table de série G de 30 milliards de dollars a été clôturé le 11 février 2026 avec une valorisation post-monétaire de 380 milliards de dollars. Un tour suivant avec une valorisation de plus de 850-900 milliards de dollars a été signalé comme étant en cours de clôture fin avril 2026 (TechCrunch, 29/04/2026, clôture non confirmée).
Claude vs l’API Anthropic
claude.ai est le produit destiné aux consommateurs et aux prosommateurs. L’API Anthropic (platform.claude.com, anciennement console.anthropic.com) est l’interface pour les développeurs. Les deux fonctionnent sur des modèles Claude, mais l’expérience et la structure des coûts sont différentes. claude.ai propose les niveaux Gratuit, Pro, Max 5x, Max 20x, Team Standard, Team Premium et Enterprise avec un accès groupé à des fonctionnalités telles que les Projets, les Artifacts, la Mémoire, Computer Use, les Skills, le MCP et l’intégration Microsoft 365. L’API expose des points de terminaison de modèles bruts avec une tarification mesurée par jeton, sans interface de chat, et une utilisation des fonctionnalités contrôlée par le développeur.
Claude vs Claude Opus 4.7 — Est-ce la même chose ?
Non. Claude Opus 4.7 est un modèle sous-jacent. claude.ai est le produit qui dirige votre requête vers Claude Opus 4.7, Claude Sonnet 4.6 ou Claude Haiku 4.5 selon le niveau et la complexité du prompt. Claude Sonnet 4.6 est le modèle par défaut sur les forfaits Gratuit et Pro depuis février 2026. Opus 4.7 est disponible avec des limites sur Pro et sans limites sur Max, Team et Enterprise. Le menu déroulant du sélecteur de modèle affiche les choix disponibles selon le niveau, mais claude.ai ne montre pas d’indicateur par message de l’instantané daté qui a traité une requête donnée — c’est un point de friction documenté pour les utilisateurs. Les développeurs utilisant des appels API reçoivent l’instantané épinglé dans les métadonnées de réponse.
Une version Claude Mythos Preview annoncée séparément (07/04/2026) se situe au-dessus d’Opus 4.7 en termes de capacités, mais reste accessible uniquement sur invitation via Project Glasswing, une initiative de recherche en cybersécurité. Mythos affiche les scores de benchmark les plus élevés de tous les modèles Claude au moment de la rédaction — SWE-bench Verified 93,9 %, GPQA Diamond 94,6 %, CyberGym 83,1 % — mais n’est pas disponible sur claude.ai ni sur l’API standard.
Voir aussi : Indice de divergence multi-modèle Suprmind →
Tous les modèles Claude — Actuels et obsolètes (2026)
Anthropic déploie Claude sur trois niveaux de capacité simultanés — Opus (capacité la plus élevée), Sonnet (équilibré) et Haiku (rapide et économique) — avec plusieurs générations actives simultanément. L’architecture reste entièrement propriétaire. Anthropic n’a pas confirmé publiquement le nombre de paramètres, le nombre de couches ou si un modèle Claude utilise une configuration Mixture-of-Experts. Plusieurs sources tierces décrivent l’architecture comme un transformeur dense.
Voici l’état des lieux des modèles actifs et obsolètes en mai 2026. Les variantes et les dates sont tirées du catalogue de modèles officiel d’Anthropic sur platform.claude.com/docs/en/about-claude/models et confirmées par un suivi indépendant. Ce tableau change fréquemment — consultez l’URL source pour la liste actuelle.
Modèles Claude actifs (mai 2026)
Source : platform.claude.com — dernière vérification le 07/05/2026
- Sorti le 16/04/2026
- Contexte de 1M de jetons, sortie de 128K
- Multimodal en entrée : texte, image (vision jusqu’à 2 576 px)
- API : 5,00 $ / 25,00 $ par 1M de jetons ; lecture en cache 0,50 $
- Sorti le 17/02/2026
- Contexte de 1M de jetons, sortie de 128K (300K via Batch)
- API : 3,00 $ / 15,00 $ par 1M de jetons
- Modèle par défaut pour les utilisateurs claude.ai Gratuit et Pro
- Sorti le 15/10/2025
- Contexte 200K / sortie 64K
- API : 1,00 $ / 5,00 $ par 1M de jetons
- Codage proche de la frontière à prix réduit (SWE-bench 73,3 %)
- Sorti le 05/02/2026
- Contexte 1M (la génération qui a introduit le 1M au tarif standard)
- API : 5,00 $ / 25,00 $ par 1M de jetons
- Réduction de prix de 67 % par rapport aux 15 $/75 $ d’Opus 4.1
- Annoncé le 07/04/2026
- Sur invitation uniquement (Project Glasswing)
- SWE-bench Verified 93,9 %, GPQA Diamond 94,6 %, CyberGym 83,1 %
- Nom de code interne : « Capybara » (selon une fuite de source de mars 2026)
- Claude 3 Opus, Sonnet, Haiku : hérités sur la page des tarifs
- Claude 3.5 Sonnet (v1, v2), 3.5 Haiku : supportés/hérités
- Claude 3.7 Sonnet (24/02/2025) : a introduit la pensée étendue (Extended Thinking)
- Claude 1, 2, 2.1, Instant 1.2 : totalement obsolètes
Génération Claude 4 : Opus 4.7, Opus 4.6, Sonnet 4.6, Haiku 4.5
Claude Opus 4.7 (16/04/2026) est le modèle phare actuel. Il a introduit le niveau d’effort xhigh pour le raisonnement adaptatif (entre high et max), a relevé le plafond d’entrée de vision pour Computer Use à 2 576 pixels sur le bord long (contre environ 850 pixels auparavant), et a déployé un nouveau tokenizer où la même entrée correspond à 1,0-1,35x plus de jetons selon le type de contenu. SWE-bench Verified 87,6 %, SWE-bench Pro 64,3 % (record actuel de l’industrie), GPQA Diamond 94,2 %, MCP-Atlas 77,3 %, OSWorld 78 %. Date limite de connaissances fiable : janvier 2026. La pensée étendue manuelle via budget_tokens est obsolète pour Opus 4.7 et les versions ultérieures ; tenter de l’utiliser renvoie une erreur 400. Tarification 5 $/25 $ par million de jetons d’entrée/sortie, inchangée par rapport à Opus 4.6.
Claude Opus 4.6 (05/02/2026) est la génération qui a pour la première fois offert une fenêtre de contexte de 1 million de jetons au tarif standard — éliminant le supplément pour contexte long qui existait dans toute l’industrie de l’IA. Le lancement d’Opus 4.6 a également fait chuter le prix du niveau Opus de 67 % (passant des 15 $/75 $ d’Opus 4.1 à 5 $/25 $ par million de jetons), la plus forte réduction de prix pour une seule génération d’Opus enregistrée. Claude Opus 4.6 est devenu le premier modèle d’IA à occuper la première place dans les trois arènes LMArena (Texte 1503-1504, Code 1560, Recherche 1255) le 26 février 2026.
Claude Sonnet 4.6 (17/02/2026) est devenu le modèle par défaut pour les utilisateurs claude.ai Gratuit et Pro dès son lancement. Contexte 1M (initialement en bêta, disponible pour tous en mars 2026), tarif 3 $/15 $, sortie 128K (300K via Batch avec l’en-tête bêta output-300k-2026-03-24). Sur le nouveau jeu de données plus difficile de Vectara, Sonnet 4.6 a obtenu un score d’hallucination de 10,6 % — inférieur aux 10,8 % de GPT-5.2-high sur le même benchmark. Hallucination AA-Omniscience d’environ 38 % (moins de la moitié des ~78 % de GPT-5.2). Date limite de connaissances fiable : août 2025 ; date limite des données d’entraînement : janvier 2026.
Claude Haiku 4.5 (15/10/2025) est le modèle actuel d’Anthropic, petit et rapide, avec des performances de codage proches de la frontière. Contexte 200K, sortie 64K, tarif 1 $/5 $. SWE-bench 73,3 % avec pensée étendue (moyenne sur 50 essais), hallucination AA-Omniscience 25 % — le meilleur résultat d’hallucination du niveau Haiku dans la cohorte. Sorti sous la classification de sécurité ASL-2 (Sonnet 4.5 et Opus 4.1 sont ASL-3).
Claude 3.x et versions antérieures (contexte historique)
Claude 3.7 Sonnet (24/02/2025) était le premier modèle Claude doté d’un raisonnement hybride — capable de réponses quasi instantanées ou d’une pensée étendue (Extended Thinking) visible étape par étape avec un paramètre budget_tokens contrôlé par le développeur. Il a obtenu un score de 4,4 % sur l’ancien benchmark de résumé de Vectara (cohérence factuelle 95,6 %) et 70,3 % sur SWE-bench Verified avec pensée étendue. Les modèles 3.5 Sonnet (v1, v2) et 3.5 Haiku restent actifs selon la documentation de la plateforme au 07/05/2026, signalés comme supportés/hérités. Claude 3 Opus, Sonnet et Haiku sont répertoriés comme hérités sur la page des tarifs d’Anthropic. Claude 1, 2, 2.1 et Instant 1.2 sont totalement obsolètes. Claude Opus 4.1 a une date de fin de vie sur AWS Bedrock fixée au 31/05/2026.
Quel modèle est-ce que j’utilise ? Correspondance niveau-modèle
C’est la question la plus posée dans la documentation de Claude, et l’interface utilisateur d’Anthropic ne présente pas d’indicateur par message du snapshot exact du modèle qui a traité une requête donnée. En mai 2026 :
Le menu déroulant du sélecteur de modèle affiche le choix disponible. Le prompt système est techniquement accessible via sondage (le prompt système de Claude Opus 4.6 a été extrait et publié sur GitHub le 05/02/2026). L’interface utilisateur persistante n’affiche pas l’instantané daté. Les transitions de modèle par défaut (telles que le passage de Sonnet 4.5 à Sonnet 4.6 en février 2026) sont annoncées via la salle de presse d’Anthropic mais pas via une notification dans le produit pour les utilisateurs existants.
Voir aussi : Détails des tarifs Claude →
Fonctionnalités de Claude : ce que chacune fait
Anthropic déploie des fonctionnalités via une interface web claude.ai cohérente, des applications natives iOS et Android, des applications de bureau macOS et Windows, et des interfaces destinées aux développeurs (API Anthropic, CLI Claude Code, MCP). La plateforme a atteint une parité majeure des fonctionnalités en avril 2026 sur tous les niveaux payants, les restrictions se concentrant sur le volume d’utilisation plutôt que sur l’exclusivité des fonctionnalités.
Raisonnement adaptatif vs Pensée étendue
La pensée étendue (Extended Thinking), introduite avec Claude 3.7 Sonnet (24/02/2025), force Claude à générer une trace visible de sa chaîne de pensée avant de répondre. Le développeur définit un paramètre budget_tokens pour contrôler le calcul du raisonnement. Le raisonnement adaptatif (également appelé pensée adaptative), introduit avec la génération 4.6 en février 2026, remplace ce paradigme. Claude évalue la complexité du problème en interne et alloue le calcul du raisonnement de manière dynamique. Le développeur spécifie un niveau d’effort (standard, high, xhigh, max) plutôt qu’un budget de jetons. À l’effort high, Claude réfléchit presque toujours avant de répondre. À des niveaux d’effort inférieurs, Claude peut sauter la réflexion pour des problèmes simples. Le niveau xhigh introduit avec Opus 4.7 se situe entre high et max et fournit un calcul supplémentaire pour les tâches difficiles sans s’engager dans une dépense maximale. Le raisonnement adaptatif active automatiquement la pensée entrelacée (Interleaved Thinking) — le raisonnement entre les appels d’outils — ce qui le rend structurellement mieux adapté aux flux de travail agentiques que le paradigme précédent. La pensée étendue manuelle via budget_tokens est obsolète pour Opus 4.7 et les versions ultérieures ; tenter de l’utiliser renvoie une erreur 400.
Projets et Artifacts
Les Projets créent des espaces de travail isolés où les utilisateurs téléchargent des documents de référence et des instructions système qui persistent d’une conversation à l’autre. Claude effectue un raisonnement basé sur la récupération sur le contenu du projet — les sections pertinentes sont intégrées au contexte actif plutôt que de charger l’intégralité du projet en une seule fois. Le contenu du projet est mis en cache et n’est pas décompté des limites d’utilisation par message. Le téléchargement de fichiers par chat est limité à 20 fichiers maximum, de 30 Mo chacun, quel que soit le niveau. Le contexte de chat du forfait Enterprise s’étend à 500 000 jetons ; tous les autres forfaits utilisent 200 000 jetons en chat (1 million de jetons sur l’API pour Opus et Sonnet 4.6+). Les Projets ont été lancés en septembre 2024 et ont décuplé le contexte en juin 2025.
Les Artifacts sont le format de sortie de Claude pour le code, les documents, les diagrammes et le contenu interactif qui peuvent être rendus, modifiés et exportés directement depuis l’interface de conversation. Lorsque Claude génère un contenu autonome substantiel — code, HTML, SVG, diagrammes Mermaid, composants React, Markdown formaté — un panneau latéral s’ouvre avec un aperçu en direct. Les utilisateurs peuvent itérer sur les artifacts, les partager publiquement ou (sur Team et Enterprise) les partager au sein des limites de l’organisation. Les Artifacts ont été lancés en aperçu en juin 2024 et sont devenus disponibles pour tous sur tous les niveaux le 26 août 2024. En avril 2026, les Artifacts sont inclus dans tous les forfaits payants et à l’intérieur des Projets.
Claude Code
Claude Code est l’outil de codage agentique d’Anthropic axé sur le terminal, disponible pour tous depuis le 22/05/2025. Il fait fonctionner Claude comme un agent de codage autonome qui recherche du code, modifie des fichiers, exécute des tests et soumet des commits sur GitHub. Les intégrations natives incluent des extensions VS Code et JetBrains (les modifications apparaissent en ligne dans les fichiers), le marquage des PR GitHub et un SDK Claude Code pour créer des agents personnalisés. Claude Opus 4.7 a relevé le niveau d’effort par défaut à xhigh pour tous les forfaits lors de son lancement et a introduit les budgets de tâches (bêta publique) pour guider la dépense de jetons sur des exécutions agentiques plus longues. Le lancement d’avril 2026 a également introduit la commande /ultrareview pour des sessions de révision dédiées et une barre latérale multi-session.
L’inclusion de Claude Code dans le niveau Pro (20 $/mois) est volatile et contestée au 07/05/2026. La page actuelle anthropic.com/pricing indique « Inclut Claude Code » sous Pro ; un traqueur de journal des modifications indépendant (scriptbyai.com, avril 2026) affirme qu’Anthropic a retiré Claude Code de Pro en avril 2026. Conflit non résolu — vérifiez directement sur anthropic.com/pricing. Les forfaits Max incluent Claude Code, Enterprise inclut Claude Code, et l’accès API via le SDK Claude Code est uniformément disponible.
Voir aussi : Fonctionnalités et tarifs de Claude Code →
Computer Use
Computer Use a été initialement publié en version bêta avec Claude 3.5 Sonnet le 22/10/2024, étendu aux générations Claude 3.7 et Claude 4, et est devenu disponible pour tous sur claude.ai en mars 2026. Les développeurs fournissent à Claude des outils d’utilisation de l’ordinateur et un prompt utilisateur via l’API Messages. Claude évalue la tâche et construit des requêtes d’utilisation d’outils ; le développeur exécute les actions dans une machine virtuelle sécurisée avec un affichage X11/Xvfb, un environnement de bureau léger et des applications préinstallées. La limite par défaut d’itération de boucle est de 10 (ajustable par le développeur). Claude Opus 4.7 a considérablement amélioré la fiabilité de Computer Use grâce à la prise en charge d’images haute résolution, atteignant 98,5 % sur le benchmark d’acuité visuelle de XBOW contre 54,5 % pour Opus 4.6, et 78 % sur OSWorld — à égalité avec GPT-5.5 à 78,7 %.
Voir aussi : Détails de la fonctionnalité Computer Use →
Mémoire et Cowork
La mémoire fonctionne selon deux modes. La mémoire de chat génère des résumés des conversations passées et les transporte d’une session à l’autre, consultables et modifiables dans Paramètres → Fonctionnalités → Mémoire. La mémoire du système de fichiers pour l’utilisation agentique écrit dans un dossier /memory, lu au début de la session, avec un mode de mémoire automatique optionnel qui laisse Claude décider de ce qu’il doit stocker. Opus 4.7 a spécifiquement amélioré la fiabilité de la mémoire du système de fichiers pour les travaux agentiques longs sur plusieurs sessions. La mémoire de chat a été déployée sur les forfaits Team et Enterprise en septembre 2025 et sur le forfait Gratuit en mars 2026. Le changement de politique de données d’août 2025 a étendu la conservation des données de conversation à 5 ans pour les utilisateurs n’ayant pas refusé l’entraînement ; ceci est distinct de la conservation de la mémoire active.
Claude Cowork a été lancé en aperçu de recherche en janvier 2026 et est devenu disponible pour tous sur tous les forfaits payants en avril 2026. Cowork accorde à Claude l’accès à un dossier spécifié par l’utilisateur sur l’ordinateur local ; Claude peut lire, modifier et créer des fichiers de manière autonome, prenant en charge l’exécution de tâches en plusieurs étapes et la coordination de sous-agents pour des travaux parallélisables. Le lancement initial était réservé à macOS.
MCP et intégrations
Le MCP (Model Context Protocol) est un standard ouvert conçu par Anthropic pour permettre à Claude de se connecter à des outils externes, des sources de données et des services via une interface standardisée. Des serveurs MCP tiers existent pour Notion, Zapier, GitHub et les principaux outils d’IDE. Claude Opus 4.7 obtient un score de 77,3 % sur MCP-Atlas, devançant GPT-5.4 de 9,2 points et Gemini 3.1 Pro (73,9 %) de 3,4 points, ce qui indique de solides performances d’orchestration d’outils en conditions réelles.
Claude dans Excel a été lancé en tant qu’aperçu de recherche bêta en octobre 2025, offrant une compréhension des classeurs avec des citations au niveau des cellules pour les explications et la possibilité de mettre à jour les hypothèses tout en préservant les formules. Claude pour Word a été lancé en avril 2026 (Pro et Max). Claude pour Microsoft 365 (Outlook, surfaces 365 plus larges) est inclus dans Pro, Max, Team et Enterprise. Le niveau Gratuit n’inclut pas l’intégration Microsoft 365.
Voir aussi : Guide approfondi des GPT personnalisés →
Benchmarks et précision de Claude
Les benchmarks racontent des histoires différentes selon ce qu’ils mesurent. Claude mène sur le codage autonome multi-fichiers (SWE-bench Pro), l’utilisation d’outils agentiques (MCP-Atlas), le HLE activé par outils et les mesures de calibration. Il est en retrait sur l’étendue brute des connaissances (précision AA-Omniscience), la couverture multimodale (pas d’entrée audio ou vidéo) et ARC-AGI-2. Les deux directions sont des signaux réels de qualités différentes.
Scores de benchmark — Modèles phares actuels
Sources : Vellum AI, 15/04/2026 ; Taux d’hallucinations IA Suprmind, 26/04/2026 ; pricepertoken.com ; DataCamp, 26/04/2026 ; ofox.ai. Dernière vérification le 07/05/2026.
Note sur la méthodologie : AIME 2025 a effectivement atteint la saturation à la frontière (plusieurs modèles obtiennent un score > 99 %) et n’est plus différenciant ; traitez les avantages AIME avec scepticisme. Le nouveau jeu de données plus difficile de Vectara indique que les modèles de raisonnement dépassent 10 % d’hallucination car ils « réfléchissent trop » au résumé, s’écartant du matériel source — ainsi, les comparaisons brutes de Vectara entre modèles de raisonnement et modèles sans raisonnement sont trompeuses sans contexte. CursorBench est géré par Cursor, un partenaire de distribution important de Claude ; aucune réplication indépendante n’a été trouvée. La régression MRCR v2 de Claude Opus 4.7 à 32,2 % sur un contexte de 1M (contre 78,3 % pour Opus 4.6) est attribuée par Anthropic à un comportement intentionnel de signalement d’erreur lorsque l’information est manquante plutôt qu’à la fabrication de réponses ; la vérification indépendante du mécanisme est limitée.
Taux d’hallucinations de Claude
Le profil d’hallucination de Claude est le principal différenciateur par rapport aux modèles pairs. Selon la référence des taux d’hallucinations et benchmarks IA de Suprmind (mise à jour de mai 2026), Claude 4.1 Opus atteint un taux d’hallucination AA-Omniscience de 0 % en déclinant mathématiquement les requêtes incertaines — le plus bas de tous les modèles testés, quelle que soit l’échelle. Claude Opus 4.7 maintient l’hallucination AA-Omniscience à 36 % (Indice 26, deuxième plus élevé au général derrière les 33 de Gemini 3.1 Pro), soit 50 points de pourcentage de moins que les 86 % de GPT-5.5 sur le même benchmark. Claude Opus 4.5 avec recherche web a obtenu un score de 30 % sur HalluHard — le plus bas de tous les modèles sur le benchmark d’hallucination en conversation réaliste.
Le schéma de Claude est la calibration par le refus : Claude refuse de répondre plus souvent que ses pairs et hallucine moins lorsqu’il répond. Cela produit à la fois les taux d’hallucination les plus bas et une précision brute plus faible (~47 % de précision AA-Omniscience contre 55,3 % pour Gemini 3.1 Pro). Les modèles de raisonnement, y compris les générations 4.5 et 4.6, dépassent 10 % sur le jeu de données de résumé plus difficile de Vectara en raison d’une « réflexion excessive » documentée — un raisonnement qui s’écarte du matériel source. Il ne s’agit pas d’une affirmation sur la capacité de justesse de Claude ; c’est une affirmation de cohérence sur la calibration de Claude.
Voir aussi : Taux d’hallucinations de Claude à travers les benchmarks →
Ce qui rend Claude différent — L’avantage de la calibration
Les benchmarks académiques classent Claude Opus 4.7 à égalité à trois à la frontière (Indice d’intelligence AA 57). Les données multi-modèles de production racontent une histoire plus spécifique, et cette histoire est la plus utile pour choisir des outils d’IA pour un travail réel.
Selon l’Indice de divergence multi-modèle Suprmind (édition d’avril 2026, n=1 324 tours de production), le taux de contradiction par rapport à la confiance de Claude chute de 33,9 % sur l’ensemble des tours à 26,4 % sur les tours à enjeux élevés — un delta de calibration de -7,5 points. Aucun autre fournisseur testé ne montre un delta supérieur à -3,4 points (ChatGPT/GPT). C’est la distinction empirique la plus défendable pour Claude dans un contexte multi-modèle. Claude ralentit de manière mesurable lorsque les conséquences sont réelles ; les autres non.
Comment Claude se comporte dans des contextes multi-modèles
Le ratio de capture mesure les corrections effectuées divisées par le nombre de fois où le modèle a été pris en défaut. Un ratio supérieur à 1,0 signifie qu’un modèle corrige les autres plus qu’il n’est corrigé. Selon l’indice de divergence multi-modèle Suprmind, la répartition de l’édition d’avril 2026 était : Perplexity 2,54, Claude 2,25, Grok 0,72, ChatGPT 0,38, Gemini 0,26. Claude a effectué 304 corrections et a été pris en défaut 135 fois — le deuxième ratio de capture le plus élevé des cinq fournisseurs. Combinés à Perplexity (ratio de capture 2,54), les deux fournisseurs représentent 60,7 % de toutes les corrections de l’étude. Cela positionne Claude comme un modèle de couche de vérification plutôt que comme un oracle unique.
Les perspectives uniques ont suivi le même schéma. Claude a généré 631 perspectives uniques (part de 24,5 %, juste derrière les 636/24,7 % de Perplexity) dont 268 ont été jugées de gravité critique (gravité ≥ 7 sur une échelle de 10 points). À titre de comparaison, ChatGPT en a apporté 339 (part de 13,2 %, 85 critiques), ce qui rend Claude environ 3,15x plus productif que ChatGPT sur les perspectives uniques de gravité critique dans le même jeu de données. Claude est le deuxième meilleur moteur pour la génération de perspectives inédites dans un ensemble multi-modèle.
Voir aussi : Données sur le ratio de capture de l’IA →
Là où Claude a des limites
Trois limites documentées définissent les cas où Claude seul n’est pas le bon outil.
Premièrement, la récupération de connaissances étendues. La précision AA-Omniscience de Claude Opus 4.7 d’environ 47 % est en retrait par rapport aux 55,3 % de Gemini 3.1 Pro, avec un écart de 8 points. C’est le coût direct du refus par conception — Claude répond correctement à moins de questions au total, bien qu’il réponde plus correctement en proportion de ce à quoi il répond. Les utilisateurs qui ont besoin d’une étendue maximale plutôt que d’une précision maximale devraient coupler Claude avec un modèle à couverture plus élevée.
Deuxièmement, les entrées multimodales. Claude n’accepte que le texte et les images. Les entrées audio et vidéo ne sont pas prises en charge. Le score de factualité multidimensionnelle FACTS de Gemini 3 Pro de 68,8 contre 51,3 pour Claude Opus 4.5 (un déficit de 17 points) est en partie structurel — FACTS mesure l’ingestion à travers des modalités que Claude ne peut pas lire.
Troisièmement, l’auto-cohérence dans la recherche itérative. Selon l’indice de divergence multi-modèle Suprmind (avril 2026), Claude vs Claude est la paire la plus combative dans le domaine ResearchAnalysis — 10 contradictions sur 74 tours, soit un taux de contradiction intra-modèle de 13,5 %. Le schéma Claude-vs-Claude est le signal d’orchestration le plus important pour les utilisateurs déployant Claude sur des flux de travail de recherche itérative. Le recoupement avec lui-même ou avec ses pairs réduit la volatilité.
Voir aussi : Comparaison Claude vs ChatGPT vs Gemini →
Tarifs de Claude — Gratuit, Pro, Max, Team, Enterprise
Anthropic exploite une structure tarifaire à sept niveaux pour les consommateurs et les entreprises. Deux éléments volatiles sont documentés en mai 2026 : le statut d’inclusion de Claude Code dans Pro (anthropic.com/pricing le répertorie ; un journal des modifications indépendant indique qu’il a été retiré en avril 2026), et les plafonds de volume de messages par niveau (décrits comme « des limites d’utilisation s’appliquent » ou un « budget de conversation » sans chiffres spécifiques).
Comparaison des niveaux d’abonnement
Source : anthropic.com/pricing, consulté le 07/05/2026.
Voir aussi : Détails des tarifs Claude →
Tarifs de l’API pour les développeurs et les entreprises
Les tarifs de l’API pour les modèles de la génération actuelle sont mesurés par million de jetons avec des taux distincts pour l’entrée, l’écriture d’entrée en cache, la lecture d’entrée en cache et la sortie.
Source : anthropic.com/pricing, consulté le 07/05/2026.
Frais supplémentaires au niveau de l’API : Agents gérés à 0,08 $ par heure de session d’exécution active ; Recherche Web à 10 $ pour 1 000 recherches ; Exécution de code gratuite pour les 50 premières heures par jour et par organisation, puis 0,05 $ par heure et par conteneur ; inférence aux États-Unis uniquement à 1,1x le prix d’entrée et de sortie ; mise en cache des prompts avec une durée de vie (TTL) par défaut de 5 minutes (TTL étendue disponible). API Batch : 50 % de réduction sur tous les modèles, prenant en charge jusqu’à 10 000 requêtes pour un traitement asynchrone en moins de 24 heures.
Changements de tarifs récents (2025-2026)
L’événement tarifaire le plus important de l’histoire de l’API de Claude a été la réduction de 67 % du prix d’Opus lors du lancement d’Opus 4.6 (05/02/2026) : passant de 15 $/75 $ par million de jetons (Opus 4.1) à 5 $/25 $ par million de jetons (à partir d’Opus 4.6). La fenêtre de contexte de 1 million de jetons est également devenue standard sans supplément à partir d’Opus 4.6 et Sonnet 4.6. Claude Opus 4.7 a maintenu le nouveau tarif de 5 $/25 $. Claude Opus 4.1 a une date de fin de vie sur AWS Bedrock fixée au 31/05/2026, retirant l’ancien niveau Opus à 15 $/75 $ de la gamme de produits actifs.
Controverses et problèmes connus de Claude
Anthropic a été confronté à des controverses réglementaires et d’ingénierie plus fréquentes au début de 2026 que tout autre laboratoire d’IA, en raison d’engagements privilégiant la sécurité créant des conflits directs avec des clients de haut profil et de régressions de performance dans Claude Code devenant des points de focalisation pour la communauté.
Le refus du Pentagone et le procès du Département de la Guerre (février-mars 2026)
Le 26/02/2026, Anthropic a publiquement refusé une clause de contrat du Département de la Défense qui aurait permis « tout usage licite » de Claude, y compris le ciblage d’armes entièrement autonomes et la surveillance domestique des Américains sans contrôle judiciaire. Le PDG Dario Amodei a déclaré que l’entreprise « ne peut pas, en toute conscience, accepter ». Le Pentagone a désigné Anthropic comme un « risque pour la sécurité nationale dans la chaîne d’approvisionnement » — la première désignation de ce type jamais appliquée à une entreprise américaine. Le président Trump a émis un décret les 27 et 28/02/2026 interdisant l’utilisation de Claude par le gouvernement américain. Le Département de la Guerre a déployé Claude contre l’Iran moins de 24 heures après l’interdiction. Anthropic a déposé une plainte le 09/03/2026 alléguant des représailles gouvernementales. Le procès était actif à la date de la recherche.
La cause architecturale est significative : le cadre d’IA constitutionnelle de Claude de janvier 2026 contient des contraintes strictes explicites contre la facilitation de la surveillance de masse et du ciblage létal autonome sans supervision humaine. Il s’agit de contraintes au niveau du modèle, et non purement au niveau de la politique, ce qui signifie qu’elles ne peuvent pas être contournées via la configuration du prompt système.
Régression des performances de Claude Code (mars-avril 2026)
Un récit largement diffusé selon lequel « Claude est devenu plus bête » a émergé entre le 4 mars et le 13 avril 2026. Stella Laurenzo, directrice principale de l’IA chez AMD, a publié une analyse médico-légale de 6 852 sessions Claude Code (234 760 appels d’outils, 17 871 blocs de pensée) montrant un passage d’un comportement axé sur la recherche à un comportement axé sur l’édition, une augmentation des violations de stop-hook et une profondeur de raisonnement réduite. Anthropic a publié un post-mortem technique complet le 23/04/2026 confirmant trois causes distinctes : (1) l’effort de raisonnement par défaut est passé de high à medium le 04/03/2026 (rétabli le 07/04/2026) ; (2) un bug d’optimisation du cache effaçant l’historique de pensée à chaque tour pour les sessions périmées à partir du 26/03/2026 (corrigé le 10/04/2026) ; (3) une contrainte de verbosité du prompt système le 16/04/2026 causant une baisse d’évaluation de 3 % (rétablie le 20/04/2026).
L’accusation de « dégradation intentionnelle » n’était pas fondée. Les trois causes étaient des décisions d’ingénierie avec des justifications légitimes qui ont eu des interactions imprévues. Séparément, un benchmark viral de BridgeMind affirmant une baisse de performance de 15 points était basé sur n=6 tâches ; un nouveau test indépendant avec n=30 a montré un mouvement négligeable (87,6 % à 85,4 %). La véritable préoccupation en matière de gouvernance est le délai de plus de 6 semaines entre le premier changement et le post-mortem public.
Politique de données et refus d’entraînement (août 2025)
Le 28/08/2025, Anthropic a annulé sa politique précédente consistant à ne pas s’entraîner sur les conversations des consommateurs. Les conversations et les sessions de codage des utilisateurs des forfaits Gratuit, Pro et Max sont devenues des données d’entraînement par défaut. La conservation des données est passée de 30 jours à 5 ans, à moins que les utilisateurs ne s’y opposent manuellement avant le 28/09/2025 ; l’application complète a commencé en octobre 2025. Lawfare Media a noté que cela représente un passage du consentement explicite à l’intérêt légitime en vertu du RGPD, soulevant des questions de conformité pour les utilisateurs européens. Les forfaits Enterprise et Team incluent des dispositions contractuelles de non-entraînement des données sans refus par utilisateur.
IA constitutionnelle et schémas de refus
Anthropic a publié une nouvelle Constitution de Claude le 22/01/2026 (environ 84 pages, domaine public Creative Commons), remplaçant l’approche d’IA constitutionnelle de 2023. Le cadre passe de prescriptions basées sur des règles à un alignement basé sur la raison qui explique pourquoi certains comportements comptent, visant une généralisation à des situations inédites. Il établit une hiérarchie de priorités à 4 niveaux : sécurité > éthique > directives > utilité. Il reconnaît formellement la possibilité de la conscience et du statut moral de Claude — la première reconnaissance de ce type de la part d’un laboratoire d’IA majeur. Le blog Oxford AI Ethics a noté que cela représente « deux continuums évaluatifs » plutôt qu’un ensemble de règles fixes. Les contraintes strictes incluent le refus d’aider au ciblage létal autonome sans supervision humaine, à la surveillance de masse sans contrôle judiciaire, au développement d’armes CBRN et à tout contenu qui viserait à prendre un contrôle sociétal illégitime.
Voir aussi : Hallucination de ChatGPT par version →
Claude en entreprise — Adoption et intégrations
La pénétration de Claude en entreprise est la plus profonde de toutes les familles de modèles d’IA de pointe par nombre de déploiements, portée par l’architecture de sécurité Constitutional AI qui répond aux exigences d’approvisionnement des entreprises là où les concurrents axés uniquement sur la performance échouent.
Cas d’usage et déploiements en entreprise
70 % des entreprises du Fortune 100 sont clientes de Claude ; 8 du Fortune 10 ; plus de 500 clients dépensent plus de 1 M$ par an. Les clients entreprises (plus de 300 000 entreprises) représentent environ 80 % du chiffre d’affaires d’Anthropic. Le nombre de clients dépensant plus de 100 k$ par an a été multiplié par 7 l’année dernière. La part de Claude dans les dépenses LLM des entreprises a atteint environ 40 % en 2025, contre 12 % deux ans auparavant. Le chiffre d’affaires annualisé a été multiplié par environ 10 au cours de chacune des trois dernières années pour atteindre 14 Md$ au début de 2026.
Les déploiements notables incluent Deloitte (470 000 employés dans le monde sur Claude), Cognizant (350 000 collaborateurs sur Claude Code, et Claude plus largement dans toutes les fonctions), Thomson Reuters CoCounsel pour la recherche juridique et la rédaction de documents (plus de 1 M d’utilisateurs), Lyft (automatisation du support client réduisant le temps de traitement de plus de 87 % avec une précision décisionnelle améliorée de 30 %), TELUS (des dizaines de milliers d’utilisateurs, des milliards de jetons par mois) et Zapier (automatisation de flux de travail à grande échelle).
Intégrations de plateforme (Bedrock, Vertex, GitHub Copilot, Cursor)
L’écosystème de développeurs comprend plus de 6 000 applications avec une intégration native de Claude et plus de 75 connecteurs de flux de travail d’entreprise. Intégrations notables : Microsoft 365 (Excel, Word, Outlook), GitHub Copilot (Claude Sonnet 4 était le modèle sous-jacent au lancement), Cursor (partenariat CursorBench), Slack, Notion (Notion Skills pour Claude), Amazon Bedrock (tous les modèles actifs), Google Vertex AI (tous les modèles actifs) et Microsoft Azure AI Foundry (disponibilité générale pour certains modèles avec inférence en UE prévue pour 2026). Forte concentration sectorielle dans le juridique (Thomson Reuters CoCounsel), les services financiers (leader du benchmark Finance Agent), les services professionnels (Deloitte, Cognizant), l’ingénierie logicielle (GitHub Copilot, Cursor, intégrations IDE), les télécoms (TELUS) et le support client (réduction de temps de 87 % chez Lyft).
Intégrations matérielles et OS : application de bureau macOS (Cowork était exclusif à macOS lors du lancement en janvier 2026), application de bureau Windows, application iOS, application Android, GitHub Copilot, Cursor et un partenariat de calcul avec SpaceX divulgué à la mi-2025 (conditions non confirmées publiquement).
Voir aussi : Comparaison Claude vs ChatGPT →
Sources
Sources faisant autorité consultées pour la compilation de ce guide. Pour la maintenance, surveillez les URL indiquées dans la section JSON SSOT.
- Anthropic – anthropic.com (annonces, tarifs, pages professionnelles)
- Centre d’aide Anthropic – support.claude.com (documentation des fonctionnalités)
- Plateforme Anthropic – platform.claude.com (docs API, catalogue de modèles, dépréciations)
- Statut Anthropic – status.claude.com (incidents)
- Indice de divergence multi-modèle Suprmind – suprmind.ai/hub/multi-model-ai-divergence-index/ (données multi-modèles en production)
- Taux d’hallucinations IA et benchmarks Suprmind – suprmind.ai/hub/ai-hallucination-rates-and-benchmarks/ (données canoniques sur les hallucinations)
- Artificial Analysis – artificialanalysis.ai (Indice d’intelligence AA, AA-Omniscience)
- LMArena – arena.ai/leaderboard (classements des préférences utilisateurs)
- Vellum AI – vellum.ai/blog (benchmarks Claude Opus 4.7)
- DataCamp – datacamp.com (couverture Claude vs Gemini)
- Reuters – reuters.com (couverture du procès DoW)
- TechCrunch – techcrunch.com (rapport sur la série H, politique de données d’août 2025)
- The Register – theregister.com (couverture de la régression de Claude Code)
- Bloomberg – bloomberg.com (couverture de la série G à 30 Md$)
- AP News, CNBC – Couverture de l’investissement d’Amazon de 25 Md$ / 33 Md$
- Lawfare Media – lawfaremedia.org (critiques de la Constitutional AI)
- BISI, Oxford AI Ethics – Évaluations de la Constitution
Dernière vérification le 07/05/2026.
FAQ
Questions fréquemment posées
Qu’est-ce que Claude IA ?
Claude est une famille d’assistants IA développée par Anthropic, une entreprise américaine d’IA axée sur la sécurité, fondée en 2021 par d’anciens chercheurs d’OpenAI. Le fleuron actuel est Claude Opus 4.7, sorti le 16 avril 2026, avec une fenêtre de contexte de 1 M de jetons et un score SWE-bench Pro de 64,3 % — le record actuel de l’industrie pour le codage autonome. Claude est disponible via claude.ai, iOS, Android, les applications de bureau, l’API Anthropic, Amazon Bedrock et Google Vertex AI.
Qui a créé Claude ?
Anthropic a créé Claude. Anthropic a été cofondée en 2021 par Dario Amodei (PDG) et Daniela Amodei (Présidente) ainsi que sept autres anciens employés d’OpenAI. Au début de 2026, le chiffre d’affaires annualisé est d’environ 14 Md$ et un tour de table de série G de 30 Md$ a été clôturé en février 2026 avec une valorisation post-monétaire de 380 Md$.
Quelle est la dernière version de Claude ?
En mai 2026, le modèle phare disponible publiquement est Claude Opus 4.7 (sorti le 16/04/2026), doté d’une fenêtre de contexte d’entrée de 1 M de jetons, d’une sortie de 128 k jetons, du Raisonnement Adaptatif et d’une fonction « Computer Use » améliorée. Une version Claude Mythos Preview annoncée séparément (07/04/2026) se situe au-dessus d’Opus 4.7 mais reste accessible uniquement sur invitation via Project Glasswing.
Claude est-il gratuit ?
Oui, mais avec des limites. Le niveau gratuit donne accès à Claude Sonnet 4.6 (par défaut) et à un accès limité à Haiku avec des plafonds d’utilisation non spécifiés décrits comme un « budget de conversation ». Claude Code, le mode Recherche et l’accès complet à Opus nécessitent des abonnements payants.
Claude a-t-il des hallucinations ?
Oui, mais à des taux nettement inférieurs à ceux des modèles concurrents. Claude 4.1 Opus atteint un taux d’hallucination AA-Omniscience de 0 % en refusant de répondre en cas d’incertitude — le plus bas de tous les modèles testés. Claude Opus 4.7 maintient l’hallucination AA-Omniscience à 36 %, soit 50 points de moins que les 86 % de GPT-5.5 sur le même benchmark, avec un indice d’omniscience de 26 (le deuxième plus élevé au total).
Claude est-il meilleur que ChatGPT ?
Cela dépend de la tâche. Claude est en tête pour le codage autonome multi-fichiers (SWE-bench Pro 64,3 % contre 57,7 % pour GPT-5.4), le calibrage des hallucinations (AA-Omniscience 36 % contre 86 % pour GPT-5.5), l’analyse de contextes longs et la synthèse de documents professionnels. ChatGPT mène sur la génération d’images (Claude n’en propose pas), l’étendue de l’écosystème de plugins, le mode vocal et la vitesse brute sur les requêtes simples. Selon l’indice de divergence multi-modèle Suprmind (avril 2026, n=1 324), le taux de contradiction de confiance de Claude dans les scénarios à enjeux élevés est de 26,4 %, soit 9,8 points de moins que les 36,2 % de ChatGPT.
Pourquoi Claude refuse-t-il certaines requêtes ?
Le cadre de la Constitutional AI de Claude établit des contraintes strictes : aucune assistance pour le ciblage létal autonome sans supervision humaine, aucune surveillance de masse sans contrôle judiciaire, aucun développement d’armes CBRN, aucune assistance pour la prise de contrôle sociétale illégitime. Il s’agit de contraintes au niveau du modèle, et non de simples politiques. Les refus par défaut couvrent également le contenu sexuel explicite et les instructions détaillées pour des activités illégales ; les opérateurs peuvent configurer ces paramètres par défaut dans le cadre de la politique d’utilisation d’Anthropic.
Pourquoi Claude devient-il parfois moins performant en codage ?
Trois changements d’ingénierie distincts ont dégradé les performances de Claude Code entre début mars et mi-avril 2026, tous confirmés dans le post-mortem d’Anthropic du 23/04/2026 : l’effort de raisonnement par défaut réduit de high à medium (rétabli le 07/04/2026) ; un bug d’optimisation du cache effaçant l’historique de réflexion (corrigé le 10/04/2026) ; une contrainte de verbosité du prompt système causant une baisse d’évaluation de 3 % (rétablie le 20/04/2026). L’accusation de « dégradation intentionnelle » n’a pas été étayée.
Que signifie « modèle surchargé » dans Claude ?
Le code d’erreur 529 spécifique à Claude signifie que les serveurs d’Anthropic sont à pleine capacité, ce qui est distinct de l’erreur générique 503. Le plus gros incident documenté a été une panne de 14 heures les 2 et 3 mars 2026 affectant claude.ai et les applications mobiles ; l’API est restée largement fonctionnelle. La solution consiste à utiliser un délai d’attente exponentiel commençant à 1-2 secondes.
Claude a-t-il des poids ouverts ?
Non. Aucun modèle Claude n’a de poids ouverts. Anthropic ne publie pas les poids des modèles et n’autorise pas le déploiement auto-hébergé. L’API et les plateformes gérées (AWS Bedrock, Google Vertex AI, Microsoft Azure AI Foundry) sont les seules voies d’accès.
Arrêtez de deviner. Commencez à vérifier.
Suprmind exécute votre prompt simultanément sur ChatGPT, Claude, Gemini, Grok et Perplexity. Voyez où ils s’accordent, où ils divergent, et quelles idées un seul modèle a fait émerger — avant d’agir.