Claude Sonnet 5 : nouveautés, avantages et comparaison des prix

Anthropic vient de publier Claude Sonnet 5, la nouvelle génération de son modèle de milieu de gamme. C’est une mise à niveau directe de Sonnet 4.6, au même prix par token, avec des gains nets sur le codage et les tâches agentiques. Voici ce qui change vraiment, et ce que ça coûte une fois les détails pris en compte.

Le nouveau modèle en bref

Claude Sonnet 5 (identifiant API claude-sonnet-5) est positionné comme « la meilleure combinaison de vitesse et d’intelligence ». Ses caractéristiques principales :

Fenêtre de contexte d’un million de tokens par défaut, sans variante plus petite.
128k tokens de sortie au maximum.
Réflexion adaptative activée par défaut.
Le même ensemble d’outils et de fonctionnalités que Sonnet 4.6.

Anthropic présente Sonnet 5 comme une montée en capacité, avec les progrès les plus marqués sur le développement et les tâches automatisées (agents). C’est aussi une option pour les charges qui demandent plus que Sonnet 4.6 sans avoir à passer sur un modèle de classe Opus, plus cher.

Ce qui change concrètement

La réflexion adaptative par défaut

Sur Sonnet 4.6, une requête sans paramètre de réflexion s’exécutait sans réflexion. Sur Sonnet 5, la même requête déclenche désormais la réflexion adaptative, c’est-à-dire que le modèle ajuste seul l’effort de raisonnement selon la difficulté de la tâche. Pour la désactiver, il faut le préciser explicitement.

Point d’attention : comme la limite max_tokens couvre la réflexion plus la réponse, il faut revoir cette valeur sur les traitements qui tournaient sans réflexion auparavant, sous peine de voir la sortie tronquée.

Un nouveau tokenizer

C’est le changement le plus important pour votre budget. Sonnet 5 utilise un nouveau tokenizer : pour un même texte, il produit environ 30 % de tokens de plus que Sonnet 4.6.

Ce n’est pas un changement d’API, le code n’a pas à être modifié. Mais tout ce qui se mesure en tokens est touché : les compteurs d’usage, la quantité de texte que contient réellement la fenêtre de contexte, et surtout le coût d’une requête équivalente. J’y reviens plus bas, car c’est là que se cache le vrai prix.

Des protections cybersécurité en temps réel

Sonnet 5 est le premier modèle de niveau Sonnet doté de garde-fous cybersécurité en temps réel. Les requêtes portant sur des sujets interdits ou à haut risque peuvent être refusées. Le refus n’est pas une erreur technique : il revient sous la forme d’une réponse réussie avec un motif d’arrêt dédié, à gérer côté application.

La tarification de Sonnet 5

Le prix par token est inchangé par rapport à Sonnet 4.6. Mais Anthropic applique un tarif de lancement réduit jusqu’au 31 août 2026, avant un retour au tarif standard le 1er septembre 2026.

Période	Entrée (par million de tokens)	Sortie (par million de tokens)
Lancement (jusqu’au 31 août 2026)	2 $	10 $
Standard (à partir du 1er septembre 2026)	3 $	15 $

La mise en cache des prompts et l’API Batch suivent la même logique. Au tarif de lancement, une lecture de cache revient à 0,20 $ par million de tokens, et l’API Batch (traitement asynchrone, remise de 50 %) tombe à 1 $ en entrée et 5 $ en sortie.

Sonnet 5 face à Opus 4.8 et Haiku 4.5

C’est là que le choix se fait vraiment. Sonnet 5 se place au centre de la gamme, entre le modèle le plus rapide et le plus puissant.

Modèle	Entrée / Sortie (par M tokens)	Contexte	Sortie max	Positionnement
Opus 4.8	5 $ / 25 $	1M	128k	Raisonnement complexe, codage agentique
Sonnet 5	3 $ / 15 $ (2 $ / 10 $ au lancement)	1M	128k	Vitesse et intelligence équilibrées
Haiku 4.5	1 $ / 5 $	200k	64k	Le plus rapide, tâches simples

Comparaison des prix par million de tokens entre Opus 4.8, Sonnet 5 et Haiku 4.5, en entrée et en sortie. — Prix par million de tokens, en entrée et en sortie, aux tarifs standard. Sonnet 5 bénéficie d'un tarif de lancement de 2 $ / 10 $ jusqu'au 31 août 2026.

Concrètement : Sonnet 5 coûte près de deux fois moins cher qu’Opus 4.8 en sortie, tout en offrant la même fenêtre de contexte d’un million de tokens. Haiku 4.5 reste le choix économique pour les tâches simples et à fort volume, mais plafonne à 200k tokens de contexte.

Le vrai coût : ne pas oublier le tokenizer

Voici le piège à éviter. Le prix par token est identique à celui de Sonnet 4.6, mais le nouveau tokenizer génère environ 30 % de tokens de plus pour le même texte. Une requête identique peut donc coûter plus cher, même si la grille tarifaire n’a pas bougé.

Le tarif de lancement (2 $ / 10 $) compense largement cet effet jusqu’au 31 août 2026. Après cette date, au tarif standard (3 $ / 15 $), il faut intégrer la hausse du nombre de tokens dans ses estimations. Le bon réflexe : recompter ses prompts avec l’outil de comptage de tokens du modèle plutôt que de réutiliser des chiffres mesurés sur une version précédente.

Pour les développeurs : trois points de migration

Le passage de Sonnet 4.6 à Sonnet 5 est un remplacement direct (il suffit de changer l’identifiant du modèle), mais trois comportements ont changé :

La réflexion étendue manuelle est supprimée : elle renvoie désormais une erreur. On utilise la réflexion adaptative et le paramètre d’effort à la place.
Les paramètres d’échantillonnage (temperature, top_p, top_k) ne sont plus modifiables : toute valeur autre que celle par défaut renvoie une erreur. On guide le modèle par les instructions système.
Les budgets de tokens sont à revoir, à cause du nouveau tokenizer.

Quel modèle choisir

La règle reste simple : Haiku pour les tâches simples et volumineuses, Sonnet pour la majorité des charges de production, Opus pour le raisonnement le plus complexe. Sonnet 5 renforce cette position centrale en offrant plus de capacité au même prix, ce qui en fait un défaut raisonnable pour la plupart des intégrations.

Si vous envisagez d’intégrer un modèle Claude dans un produit ou un site, le choix du modèle et la maîtrise des coûts en tokens font partie des décisions qui pèsent sur le budget réel. Parlons-en : je vous aide à cadrer l’intégration et à dimensionner la dépense avant de vous lancer.