Ce que Sonnet 4.6 est vraiment (et pourquoi c'est le défaut)
Sonnet 4.6 est le modèle tier production d'Anthropic : pas aussi cher qu'Opus, pas aussi petit que Haiku, avec la surface de features complète Claude 4. Anthropic positionne Sonnet comme le bon choix pour « la plupart des workloads production » et les données le confirment — à travers les déploiements clients, Sonnet gère la majorité du trafic avec Opus réservé au sous-ensemble difficile et Haiku réservé au sous-ensemble économique.
Même architecture qu'Opus 4.7 (même base Claude 4), entraîné sur les mêmes données avec la même discipline RLHF, avec une taille de modèle plus petite qui sacrifie quelques points de pourcentage de qualité sur le raisonnement difficile pour une réduction de coût 5×. La surface de features est identique : utilisation d'outils, appels d'outils parallèles, extended thinking, cache de prompt, entrée vision, sorties structurées via schémas outils, l'API Batch.
La feature phare de Sonnet vs tous les autres modèles mid-tier : la fenêtre de contexte optionnelle 1M tokens. Opt-in via l'en-tête `anthropic-beta: context-1m-2025-08-07`. Anthropic double le prix d'entrée et ajoute 50% à la sortie pour la portion d'une requête dépassant 200K tokens — mais l'option long-contexte permet à Sonnet de rivaliser avec Gemini 2.5 Pro sur les workloads d'échelle document. Aucun autre tier Claude n'expose 1M.