Anthropic a annoncé qu'à partir du 28 août 2025, les utilisateurs de Claude - en particulier ceux utilisant Claude Code - seront confrontés à de nouvelles limites d'utilisation hebdomadaires, mesurées en heures plutôt qu'en jetons.

Ces limites s'appliqueront aux abonnés Pro et Max et s'ajoutent au système existant de réinitialisation d'utilisation continue de 5 heures.

Ce que dit Anthropic

Anthropic a expliqué que le changement est conçu pour limiter l'utilisation excessive, comme les « utilisateurs exécutant Claude 24h/24 et 7j/7 » ou le partage d'accès d'une manière qui viole les conditions d'utilisation.

Ils soulignent que :

« Moins de 5 % des utilisateurs seront concernés par ces limites. »
- Porte-parole d'Anthropic, via TechCrunch

Ils ont également confirmé qu'une utilisation supplémentaire sera disponible à l'achat, si les utilisateurs ont besoin de plus de temps au-delà de leur plafond hebdomadaire.

Ce que cela signifie (en termes humains)

Si vous utilisez Claude comme le font la plupart des gens – en posant quelques questions, en demandant de l’aide pour écrire ou en faisant un brainstorming ici et là – vous n’atteindrez probablement jamais ces nouvelles limites.

Mais si vous utilisez Claude Code pour travailler toute la journée, en particulier s'il s'exécute silencieusement en arrière-plan pendant que vous créez, déboguez ou automatisez des tâches, ce changement sera important.

Anthropic ajoute des limites d'utilisation hebdomadaires à la limite de 5 heures déjà en vigueur, qui suspend votre accès après de longues sessions. Il y a donc désormais deux points à surveiller :

  1. La fenêtre glissante de 5 heures (toujours en place)

  2. Un nouveau plafond hebdomadaire de jetons, décrit en « heures par semaine » estimées

Ces nouvelles limites s'appliquent aux modèles les plus performants de Claude :

  • Claude Sonnet 4 - utilisé dans Claude Code pour le travail de développement général et l'écriture

  • Claude Opus 4 - utilisé pour le codage plus complexe, le raisonnement et les tâches plus importantes

Voici ce que dit Anthropic et ce à quoi cela ressemble en termes pratiques :

Plan

Utilisation estimée du Sonnet 4

Utilisation estimée de l'Opus 4

Pro (20 $/mois)

~40–80 heures/semaine

Non inclus

Max (100 $/mois)

~140–280 heures/semaine

~15–35 heures/semaine

Max (200 $/mois)

~240–480 heures/semaine

~24–40 heures/semaine

Relions les points

Si vous utilisez Claude, surtout sur Pro ou Max, cette mise à jour de la limite de débit peut paraître abrupte. Soudain, on parle de « plafonds hebdomadaires », d'« utilisation de jetons » et de limites qui se chevauchent, le tout lié aux pannes et aux comportements. Mettons de l'ordre dans cette confusion :

Nous allons passer en revue ce qui s'est passé, pourquoi cela se produit et comment cela vous affectera réellement, afin que vous sachiez si votre flux de travail habituel est en danger.

Ce qui s'est passé?

Lors du lancement de Claude Sonnet 4 et Claude Opus 4 le 22 mai 2025, Anthropic a apporté des améliorations majeures à sa plateforme Claude, notamment pour les développeurs utilisant Claude Code. Ces nouveaux modèles offraient un meilleur raisonnement, une réactivité accrue et des sessions de travail plus longues, conçues pour prendre en charge les workflows en temps réel comme le codage, le débogage et la planification des tâches. Mais ils comportaient des garde-fous.

Dès le premier jour, Claude Code a été lancé avec une limite d'utilisation mobile de 5 heures, appliquée par la consommation de jetons, et non par le temps réel. Ce système, conçu pour éviter les surcharges et les abus, était déjà en place au lancement ( https://techcrunch.com ).

Cependant, à mesure que l’adoption des nouveaux modèles s’est développée, des problèmes ont commencé à apparaître.

Entre le 23 et le 25 juillet, la page d'état d'Anthropic a enregistré plusieurs incidents de service majeurs, notamment des taux d'erreur élevés et des pannes complètes affectant Sonnet 4 et Opus 4, en particulier au sein de Claude Code ( https://status.anthropic.com ). Des outils de surveillance externes comme StatusGator ont enregistré plus de 11 heures d'interruption de service au cours de cette seule semaine ( https://statusgator.com/services/anthropic ).

La cause profonde ? Certains utilisateurs étaient :

  • Exécution de Claude Code presque 24h/24 et 7j/7

  • Utiliser Claude comme moteur de calcul backend

  • Partage ou revente de leurs comptes Max à grande échelle

Dans un cas, un seul utilisateur de Max aurait consommé des dizaines de milliers de dollars en utilisation de modèle, bien au-delà de ce qu'un niveau d'abonnement était censé gérer.

Et nous y voilà.

Que signifient réellement les « heures »

Anthropic continue de faire référence aux limites d’utilisation en termes d’« heures par semaine », mais cela peut être trompeur si vous le prenez au pied de la lettre.

En réalité, il n'y a pas de minuteur en cours d'exécution dans Claude.
Il n'y a pas de chronomètre pour suivre la durée d'utilisation du modèle.
Ce qui est mesuré, c'est votre consommation de jetons.

Anthropic utilise le terme « heures » pour vous aider à estimer la quantité d'utilisation que vous obtiendrez, en fonction de la taille moyenne de l'invite, du type de modèle et du style d'interaction.

Alors, quand vous voyez quelque chose comme :

  • « 15 à 35 heures par semaine » pour Claude Opus

  • « 140–280 heures » pour Claude Sonnet

Ce que cela signifie réellement, c'est :

Vous obtiendrez suffisamment de jetons pour prendre en charge environ autant d'heures d'utilisation typique.

Si vous écrivez de longues invites, générez des sorties de code volumineuses ou appelez Claude à plusieurs reprises avec des tâches très complexes, vous brûlerez ces « heures » plus rapidement, même si votre temps de session réel est court.

Bien que cela soit utile comme référence, cela ne constitue pas une réelle limite de temps.
Il s'agit d'une estimation approximative basée sur la vitesse à laquelle vos jetons s'additionnent.

Connaissons-nous les limites réelles des jetons ?

Anthropic n'a publié aucun chiffre officiel indiquant exactement combien de jetons vous obtenez par semaine ou par session.

Mais les rapports externes et les tests utilisateurs offrent quelques estimations utiles :

  • Selon une analyse tierce :

  • Sur la base de ces chiffres, les plafonds hebdomadaires (comme 40 à 80 heures pour Pro) reflètent probablement les budgets totaux de jetons conformes à ces estimations par session.

  • Anthropic a confirmé que c'est l'utilisation des jetons, et non le temps littéral, qui déclenche à la fois les limites continues et hebdomadaires - même s'ils décrivent l'accès en « heures » pour aider les utilisateurs à estimer.

Comparons… Ou pouvons-nous le faire ?

En ce qui concerne l’utilisation du LLM, les gens aiment demander :
« Lequel me donne le plus ? »
Mais la vérité est que…

Comparer Claude, ChatGPT et Gemini côte à côte ne revient pas à comparer des pommes et des oranges. C'est comparer des pommes à des salades de fruits ou à des smoothies mystères.

Décomposons-le.

🍏 Chacun compte différemment

  • OpenAI (ChatGPT) vous donne une limite de messages (80 toutes les 3 heures), mais n'affiche pas les jetons.

  • Anthropic (Claude) vous donne des « heures », qui sont en réalité basées sur des jetons, mais pas de manière transparente.

  • Google (Gemini) vous fournit des requêtes quotidiennes, mais pas d'informations sur les jetons, sauf si vous utilisez l'API.

Donc:

Même si vous vouliez suivre votre utilisation, vous parlez trois langues différentes.

🧮 Des jetons ? Bien sûr. Mais qu'est-ce qu'un jeton ?

Chaque modèle compte les jetons différemment en fonction de la façon dont il traite le langage.

  • Une phrase simple peut contenir 15 jetons dans un modèle… et 25 dans un autre.

  • Une longue réponse pourrait vous « coûter » plus cher de la part de Claude que de GPT-4o, même s’ils disaient la même chose.

Aucun fournisseur ne vous propose de calculateur de jetons universel, surtout pas dans les plans grand public.

💰 Et qu'en est-il du coût ?

Chaque entreprise a des dépenses différentes en coulisses :

  • Claude exécute de gros modèles sur des serveurs loués → plus coûteux à exploiter

  • Le GPT-4o est plus léger, plus rapide et moins cher à entretenir

  • Gemini utilise les propres puces de Google → ils contrôlent leur pile de coûts

Ainsi, les prix et les limites d’utilisation ne sont pas basés sur l’équité, mais sur des calculs de coût par utilisation que nous ne connaissons pas.

🛠️ De plus : ce n’est pas seulement une question de quantité

Même si vous pouviez comparer les jetons bruts :

  • Le modèle répond-il mieux ?

  • Est-ce plus rapide, plus utile ou plus facile à suivre ?

  • Est-ce que cela vous aide réellement à accomplir davantage de tâches ?

Une réponse intelligente peut valoir plus que 10 réponses faibles.

Alors… Qu’est-ce que tout cela signifie ?

Comparer l’utilisation des différents LLM semble simple, mais ce n’est pas le cas.
Chaque fournisseur utilise des formules, des infrastructures et des modèles commerciaux différents pour façonner votre expérience.

Ce que nous pouvons comparer est :

  • Transparence

  • À quelle fréquence atteignez-vous vos limites ?

  • Et si vous obtenez une réelle valeur avant de le faire.

En résumé

Date d'entrée en vigueur :
28 août 2025 – de nouvelles limites de taux basées sur des jetons seront appliquées.

Modèles impactés :

  • Claude 3 Sonnet

  • Claude 3 Opus
    Ces limites s'appliquent à la fois aux abonnés de l'équipe Claude et aux utilisateurs de l'API.

Ce qui change :

  • Nouveau système de limitation déclenché par une utilisation élevée et soutenue des jetons

  • Ces limites s'ajoutent au mécanisme existant de « temps de recharge de 5 heures »

  • Aucune visibilité des jetons en temps réel pour les utilisateurs (toujours une boîte noire)

Coût (inchangé) :

  • Claude Pro (Sonnet uniquement) : 20 $/mois

  • Claude Team (Sonnet + Opus) : 30 $/mois par siège

  • Tarifs de l'API Claude

Plus d'infos :

Point de vue de l'équipe Frozen Light

Lorsque nous examinons des mouvements stratégiques comme celui-ci, nous voyons deux choses : la différence entre les utilisateurs et l’adoption, et l’histoire de l’évolution de l’IA – et la façon dont ces deux éléments sont façonnés par l’infrastructure et le coût.

Nous lisons tous les jours des articles sur l’IA et sur la rapidité avec laquelle elle évolue, mais nous ne pensons pas aux jetons.
Les utilisateurs qui comprennent les jetons sont ceux qui peuvent pousser l'IA jusqu'à ses limites et en tirer le meilleur parti - alors que pour la plupart d'entre nous, ce n'est encore qu'un moment d'émerveillement.

Parce que derrière chaque moment wow se cache un coût réel - et les jetons sont le véritable jeu.

Si un utilisateur peut interrompre le service d’une entreprise, cela montre à quel point la différence est grande entre les utilisateurs légers et les utilisateurs intensifs.
Et si Anthropic affirme que cela n'aura d'impact que sur 5 % des utilisateurs, cela nous en dit long sur la situation actuelle de la plupart des utilisateurs.

Pour nous, c’est le véritable signal : la majorité ne pousse pas encore les outils à leurs limites.
Il reste encore un grand écart à combler.

Dans une perspective plus large, l’utilisation des jetons va façonner la tarification et l’évolution de l’IA.
Il existe déjà des signes indiquant que les prix vont changer à mesure que les fournisseurs acquièrent plus d’expérience sur ce qui est considéré comme une utilisation moyenne et prévoient de meilleurs coûts.

Vous pouvez déjà voir quels fournisseurs ont plus de flexibilité et de contrôle sur l’infrastructure qu’ils utilisent.
Cela jouera un rôle important dans le choix du LLM que nous choisirons d’utiliser – et pour quoi.

Nous pourrions nous tromper.
Mais nous devrons attendre et voir.

Share Article

Get stories direct to your inbox

We’ll never share your details. View our Privacy Policy for more info.