Qu'y a-t-il dans ce guide
C'est une page de référence. Parcourez le tableau dont vous avez besoin :
1. Comment fonctionne réellement la tarification par jeton (entrée vs sortie, pourquoi la sortie coûte plus cher).
2. Tarification OpenAI API — la famille complète gpt-5.5 et gpt-5.4 plus codex et modèles médias.
3. Tarification Anthropic / Claude API — Opus 4.8, Sonnet 4.6, Haiku 4.5, Fable 5.
4. Tarification Google Gemini API — niveaux Gemini 3.5, 3.1 et 2.5.
5. La table de comparaison tous modèles en un coup d'œil.
6. Caching des requêtes — comment les lectures en cache réduisent le coût d'entrée jusqu'à 90%.
7. Remises batch — 50% de réduction lorsque la latence n'a pas d'importance.
8. Tarification de la fenêtre de contexte — pourquoi le long contexte peut doubler silencieusement une facture.
9. Comment estimer votre coût mensuel réel.
10. Sources et lectures complémentaires.