Tarification : GPT-5 Mini est 7,5x moins cher en liste, mais le cache change la math
**Sonnet 4.6 est affiché à $3/1M input et $15/1M output. GPT-5 Mini est affiché à $0.40/1M input et $2.40/1M output.** GPT-5 Mini est 7,5x moins cher sur l'input et 6,25x moins cher sur l'output. Sur le tarif public seul, ce n'est pas un combat serré.
**Le cache ferme une part significative de l'écart.** La remise de lecture de cache de 90 % de Sonnet 4.6 ramène l'input en cache à $0.30/1M. La remise de prompt-cache hit de 50 % de GPT-5 Mini ramène l'input en cache à $0.20/1M. Sur l'input en cache, le ratio se rétrécit de 7,5x à 1,5x — Sonnet est toujours plus cher, mais l'écart rétrécit dramatiquement sur les charges de travail amies du cache.
**L'output est où l'écart reste.** Aucune remise de cache n's'applique aux tokens output chez l'un ou l'autre fournisseur. L'output de $15/1M de Sonnet vs le $2.40/1M de GPT-5 Mini est un delta de 6,25x sans atténuation de cache. Pour les charges de travail lourdes en output (génération de code, texte long, boucles d'agent), cela domine le coût total.
**Math sur un appel mid-tier typique** (3K input, 500 output, 70% cache hit sur un préfixe 2K) : GPT-5 Mini en cache = (0.7 × 2K × $0.20 + 1K × $0.40 + 500 × $2.40) / 1M = $0.0019. Sonnet 4.6 en cache = (0.7 × 2K × $0.30 + 1K × $3 + 500 × $15) / 1M = $0.0109. **Sonnet est 5,7x plus cher par appel sur cette forme typique.**
**La vraie question** n'est pas « Sonnet est-il 5,7x meilleur » (il ne l'est pas) — c'est « la marge de qualité par appel de Sonnet se traduit-elle en moins de tentatives, moins d'escalades, ou des résultats commerciaux meilleurs à un taux qui justifie 5,7x le coût. » Pour certaines charges de travail (support client, raisonnement complexe), la réponse est oui. Pour d'autres (classification, extraction, résumé simple), la réponse est non.
**Branchez vos vrais chiffres dans** : calculatrice de coût Claude API et calculatrice de coût OpenAI API — ceux-ci affichent le coût mensuel + annuel étant donné vos paramètres input/output/cache.