Par l'équipe DDH · Digital Dashboard Hub

Calculateur de coûts GPT-5 (2026)

By The DDH Team at Digital Dashboard Hub·Updated June 19, 2026

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

GPT-5 n'est pas un seul modèle. C'est une famille à quatre niveaux — GPT-5.5, GPT-5.5 Pro, GPT-5.4 et GPT-5.4-mini — lancée au cours du cycle 2025-2026, chaque version optimisée pour un point différent de la courbe coût/capacité. En juin 2026, l'écart entre le modèle le moins et le plus cher est de 60x sur l'entrée et 120x sur la sortie, ce qui signifie que choisir le mauvais niveau est l'erreur la plus coûteuse que vous puissiez commettre avant d'écrire une seule ligne de prompt.

Chaque modèle GPT-5 facture de la même manière : un tarif par 1M de tokens en entrée (le prompt, le message système, les outils, l'historique rejoué) et un tarif séparé par 1M de tokens en sortie (la réponse, plus les tokens de raisonnement sur Pro). La sortie est 6x l'entrée sur les niveaux standard et exactement 6x sur Pro. Deux remises s'empilent par-dessus : l'entrée en cache facture environ 10% du tarif d'entrée standard (une remise de 90% sur la partie mise en cache) et l'API Batch applique 50% sur l'entrée et la sortie pour les tâches qui peuvent attendre jusqu'à 24 heures. Utilisées ensemble sur un prompt structuré, la même charge de travail s'exécute à 40-60% du prix standard.

Cette page est le détail spécifique à GPT-5. Pour la comparaison des prix OpenAI plus large entre les modèles hérités et les modèles de la série o, consultez notre calculateur de coûts OpenAI API. Pour les modèles de raisonnement de la série o qui coexistent avec GPT-5, consultez coût de raisonnement o1. Pour des prompts gratuits optimisés pour GPT-5 qui activent le cache et limitent la sortie par défaut, essayez le générateur de prompts ChatGPT.

Ci-dessous : le tableau complet des prix de juin 2026 pour la famille GPT-5, la formule canonique de coûts, quatre exemples pratiques (1k appels, 100k, 1M, et une boucle d'agent à 5 tours), conseils de sélection de niveau, notes de capacité spécifiques à GPT-5 (contexte 1M-token, vision native, mode temps réel), l'empilement des remises, et la FAQ qui couvre les questions que les équipes posent vraiment sur leur première facture GPT-5.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card. →

Prix de la famille GPT-5 par 1M de tokens — juin 2026

Feature	Entrée ($/1M)	Entrée en cache ($/1M)	Sortie ($/1M)
GPT-5.5 Pro	$30.00	$3.00	$180.00
GPT-5.5	$5.00	$0.50	$30.00
GPT-5.4	$2.50	$0.25	$15.00
GPT-5.4-mini	$0.50	$0.05	$1.50

Source, en juin 2026 : tarification OpenAI (https://developers.openai.com/api/docs/pricing). La tarification de l'entrée en cache s'applique uniquement aux accès au cache réussis — les accès au cache manqués facturent au tarif d'entrée standard. API Batch : 50% de réduction sur l'entrée et la sortie pour les tâches asynchrones avec une livraison jusqu'à 24 heures. Niveau prioritaire (routage plus rapide) facture environ 2x le tarif standard. La sortie de GPT-5.5 Pro inclut les tokens de raisonnement générés en interne même lorsqu'ils ne sont pas retournés à l'appelant.

La formule de coût GPT-5

Chaque appel GPT-5 utilise la même logique par token. Pas de frais de plateforme, pas de frais par appel, pas de facture minimale. Vous payez les tokens en entrée et en sortie, au tarif par 1M du modèle choisi :

``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```

Deux ajustements s'empilent par-dessus. Les accès au cache de prompt — portions de votre préfixe d'entrée qu'OpenAI a mises en cache parce que vous les avez envoyées récemment — facturent au tarif d'entrée en cache (10% du prix d'entrée standard sur chaque niveau GPT-5). Les prompts système stables longs et les schémas d'outils réutilisés sont les gagnants typiques. L'API Batch applique une réduction fixe de 50% sur l'entrée et la sortie pour les tâches asynchrones livrées dans les 24 heures. Les remises se composent : un appel GPT-5.5 en cache + batch paie $0.50/1M d'entrée en cache divisé par 2 = $0.25/1M sur la portion en cache, et $30/1M de sortie divisé par 2 = $15/1M sur la sortie.

Sur GPT-5.5 Pro, les tokens de raisonnement générés en interne avant la réponse visible facturent au tarif de sortie $180/1M, le même que le texte de réponse. Une requête qui déclenche 3 000 tokens de raisonnement pour produire une réponse de 500 tokens facture 3 500 tokens de sortie. Budgétisez un multiplicateur de raisonnement de 3-8x sur Pro si la tâche n'est pas triviale. Les modèles GPT-5.5 et GPT-5.4 standard ne mettent pas en surface la chaîne de pensée ; leur facturation de sortie correspond à la longueur de la réponse.

Exemple pratique 1 : un appel unique de 1 000 entrée / 500 sortie

Un appel représentatif — un prompt de 1 000 tokens retournant une réponse de 500 tokens, environ un résumé de 750 mots en entrée et une réponse de 375 mots en sortie. Aux tarifs standard pour la famille GPT-5 :

GPT-5.5 Pro : (1000 / 1,000,000) × $30.00 + (500 / 1,000,000) × $180.00 = $0.030 + $0.090 = **$0.120 par appel**.

GPT-5.5 : 0.001 × $5.00 + 0.0005 × $30.00 = $0.005 + $0.015 = **$0.020 par appel**.

GPT-5.4 : 0.001 × $2.50 + 0.0005 × $15.00 = $0.0025 + $0.0075 = **$0.010 par appel**.

GPT-5.4-mini : 0.001 × $0.50 + 0.0005 × $1.50 = $0.0005 + $0.00075 = **$0.00125 par appel**.

Un écart de 96x entre GPT-5.4-mini et GPT-5.5 Pro sur le même volume de tokens. Le bon modèle est rarement le plus cher de la famille — c'est le niveau GPT-5 le moins cher qui passe votre évaluation sur la tâche réelle. La plupart des équipes par défaut à GPT-5.5 par prudence ; dans notre expérience 60-70% de ce trafic survivrait à un passage à GPT-5.4 ou GPT-5.4-mini sans baisse de qualité perceptible.

Exemple pratique 2 : 100 000 appels par mois

Multipliez les chiffres par appel par 100 000 — une charge de travail réaliste de taille moyenne (classification quotidienne sur 3 000 records, exécutions hebdomadaires de résumé, un agent interne à faible volume) :

GPT-5.5 Pro : $12 000/mois. GPT-5.5 : $2 000. GPT-5.4 : $1 000. GPT-5.4-mini : $125.

Appliquez la remise de l'API Batch à GPT-5.4 pour toute portion qui n'a pas besoin de livraison synchrone (résumé nocturne, digests hebdomadaires, exécutions d'évaluation) : la ligne GPT-5.4 passe de $1 000 à $500 sur la portion batch. Ajoutez la mise en cache de prompts où 800 des 1 000 tokens d'entrée sont un préfixe système + outils stable touchant le cache 80% du temps : ces 640 tokens en cache passent de $2.50/1M à $0.25/1M — économisant environ 90% sur 64% du volume d'entrée, soit ~$144 de la facture d'entrée mensuelle.

Empilez les deux — la même charge de travail s'exécute autour de $400/mois sur GPT-5.4 à 100k appels, une réduction de 60% par rapport aux tarifs standard. La leçon se généralise : sur GPT-5, le choix du modèle fixe le plafond, mais la structure du cache et l'admissibilité au batch fixent ce que vous payez réellement. Les équipes qui choisissent GPT-5.5 et ignorent la mise en cache paient souvent plus que les équipes qui choisissent GPT-5.5 Pro et structurent les prompts pour les accès au cache.

Exemple pratique 3 : passage à l'échelle à 1 000 000 d'appels

Maintenant, passez à l'échelle à 1M appels par mois — échelle de production pour une application SaaS avec 30 000 utilisateurs actifs exécutant environ 33 appels GPT-5 chacun, ou une équipe d'un seul produit exécutant l'automatisation par record à haut volume :

GPT-5.5 Pro : **$120 000/mois**. GPT-5.5 : **$20 000**. GPT-5.4 : **$10 000**. GPT-5.4-mini : **$1 250**.

L'empilement Batch + cache sur GPT-5.5 ramène ces $20 000 à environ $8 300/mois — 58% de réduction — sur le même mélange entrée/sortie. Sur GPT-5.4-mini, le même empilement arrive à environ $500/mois, ce qui est $0.0005 par appel à l'échelle, un ordre de magnitude moins cher que ce que la plupart des entreprises budgétisent pour les fonctionnalités d'IA dans leur première ronde de planification.

L'ordre des leviers canoniques pour réduire les coûts sur GPT-5 : (1) exécutez une évaluation pour trouver le niveau le moins cher de la famille qui atteint la qualité, (2) groupez chaque charge de travail asynchrone pour 50% de réduction, (3) restructurez les prompts pour que le préfixe cacheable soit stable entre les appels, (4) limitez la longueur de sortie où vous contrôlez la forme de consommation. La plupart des équipes inversent l'ordre — elles ajustent la sortie en dernier alors que la sortie est 6x le prix d'entrée sur chaque niveau GPT-5.

Exemple pratique 4 : une boucle d'agent GPT-5.5 à 5 tours

Les boucles d'agent sont la forme de coût la pire sur GPT-5. Le modèle prend plusieurs tours par requête utilisateur, en rejoignant la retranscription complète à chaque tour. Une boucle typique à 5 tours avec un préfixe système + outils de 2 000 tokens et une croissance de contexte de 800 tokens par tour :

Tour 1 : 2 800 entrée / 200 sortie. Tour 2 : 3 000 entrée / 200 sortie. Tour 3 : 3 200 entrée / 200 sortie. Tour 4 : 3 400 entrée / 200 sortie. Tour 5 : 3 600 entrée / 200 sortie. Total : 16 000 entrée + 1 000 sortie. Sur GPT-5.5 : 0.016 × $5 + 0.001 × $30 = $0.080 + $0.030 = **$0.11 par requête utilisateur** — environ 5.5x un appel unique.

Appliquez maintenant la mise en cache. Le préfixe système + outils de 2 000 tokens est stable sur les 5 tours. Si le cache atteint environ 80% de ces 2 000 tokens × 5 tours = 8 000 tokens d'entrée en cache, ceux-ci passent de $5/1M à $0.50/1M : $0.040 → $0.004, économisant $0.036 par requête (33% de réduction de la facture). Pour 100k requêtes/mois : $11 000 → $7 400.

Sur GPT-5.5 Pro, la même boucle d'agent atteint **$0.66 par requête** aux tarifs standard — driven principalement par le tarif de sortie $180/1M par rapport à ~1 000 tokens de sortie visibles plus raisonnement. Déplacer la boucle à GPT-5.4 ($2.50 / $15) avec cache coupe le coût par requête à environ $0.035 — une amélioration 19x par rapport à Pro pour la plupart des charges de travail d'agent qui ne nécessitent pas la profondeur de raisonnement de Pro. Construisez gratuitement des prompts d'agent GPT-5 ancrés par cache avec notre constructeur de prompts de code.

GPT-5.5 vs GPT-5.5 Pro vs GPT-5.4 vs GPT-5.4-mini : comment choisir

**GPT-5.5 Pro ($30 / $180)** est pour les tâches où une mauvaise réponse coûte plus que 100 bonnes. Analyse financière multi-étapes, rédaction juridique, synthèse de code complexe avec des portes de correction strictes, raisonnement scientifique. Pro génère des chaînes de raisonnement interne étendues avant de produire sa réponse finale ; vous payez $180/1M pour ces tokens même s'ils n'apparaissent pas dans la réponse. Justifiez Pro uniquement quand le coût d'erreur en aval domine le coût par appel.

**GPT-5.5 ($5 / $30)** est le modèle par défaut pour le travail GPT-5 à usage général : flux de travail d'agent, génération de contenu qui est envoyé aux humains, chat complexe, tout ce que vous auriez utilisé pour GPT-4 ou les générations GPT-5 précoces. Capacité substantiellement supérieure à GPT-4 de l'ère 2024 à une fraction du prix. Si vous n'êtes pas sûr du niveau par lequel commencer, commencez ici et descendez après évaluation.

**GPT-5.4 ($2.50 / $15)** est le point doux pour les tâches structurées de haute qualité à l'échelle : résumé avec adhérence de format strict, extraction multi-étapes, classification complexe, synthèse RAG. La plupart des équipes de production exécutant entre 100k et 1M appels GPT-5 par mois vivent sur GPT-5.4 — moitié prix de GPT-5.5 avec des déltas de qualité très petits sur les tâches bien délimitées.

**GPT-5.4-mini ($0.50 / $1.50)** est pour les tâches intégrées à haut volume : classification simple, détection d'intention, routage, télémétrie interne, chat simple où l'utilisateur s'attend à quelque chose de rapide et léger. L'écart de prix 10x par rapport à GPT-5.5 le rend viable pour les cas d'usage qui ne survivraient pas à un coût de $0.02 par appel — suggestions d'autocomplétion, routage d'intention par frappe, modération en temps réel.

Capacités spécifiques à GPT-5 (et ce qu'elles coûtent)

GPT-5 expédie trois capacités qui le distinguent de la génération GPT-4. Chacune a une forme de coût réelle à comprendre avant de l'intégrer à un produit.

**Fenêtre de contexte de 1M tokens** sur GPT-5.5 et GPT-5.5 Pro. Cela déverrouille l'analyse en appel unique de gros documents (livres entiers, bases de code, transcriptions). Le coût : au tarif d'entrée $5/1M de GPT-5.5, remplir le contexte complet coûte $5 par appel avant d'obtenir un seul token de sortie. Un contrat juridique de 500 pages à environ 300k tokens coûte $1.50/appel uniquement sur l'entrée. Cela en vaut la peine quand l'alternative est un pipeline RAG de 20 appels ; brutal si vous n'avez vraiment pas besoin du contexte complet. La plupart des équipes devraient diviser + récupérer avant de recourir au contexte 1M.

**Vision native** sur chaque niveau GPT-5. Les images sont tokenisées à environ 85 tokens par mosaïque basse-détail et 170 par mosaïque haute-détail, avec un base de 85 tokens par image. Une image typique 1024x1024 en haute-détail coûte environ 1 275 tokens d'entrée — environ $0.006 sur GPT-5.5 ou $0.0006 sur GPT-5.4-mini. Les charges de travail riches en images (test d'UI, analyse de document, QA visuelle) facturent principalement sur l'entrée.

**Mode temps réel** pour la voix et vidéo en continu. Les appels API temps réel facturent à la fois les tokens d'entrée audio et les tokens de sortie audio à des tarifs distincts publiés sur la page de tarification en direct. Les économies se déplacent dramatiquement — la sortie audio domine la facture sur les cas d'usage conversationnels. Si vous construisez la voix temps réel sur GPT-5, modélisez 1 minute de conversation en tant qu'environ 2 000 tokens d'entrée audio + 2 000 tokens de sortie audio par minute, et cherchez les tarifs spécifiques à l'audio séparément.

**Sorties structurées** (garantie de schéma JSON) et **appel d'outils** sont inclus aux tarifs de tokens standard — il n'y a pas de surcharge par fonctionnalité. Les définitions d'outils facturent en tant que tokens d'entrée chaque fois qu'elles sont envoyées ; mettez-les en cache en tant que partie de votre préfixe système stable et elles chutent au tarif d'entrée en cache de 10%.

Économie GPT-5 par tâche (écriture, codage, raisonnement, agents)

Les différentes tâches ont des formes de coût différentes sur GPT-5. Connaître la forme change le modèle que vous devriez choisir.

**Écriture (articles de blog, contenu marketing, brouillons)** : entrée typique 500-1 500 tokens, sortie 1 500-3 000 tokens. Dominé par la sortie. Sur GPT-5.5 un brouillon de 1 000 entrée / 2 500 sortie coûte $0.005 + $0.075 = $0.080/appel. Sur GPT-5.4 le même brouillon coûte $0.0025 + $0.0375 = $0.040/appel. La limite de sortie compte le plus ici — l'exécution sans plafond `max_tokens` sur les tâches d'écriture brûle 30-50% supplémentaires sur les tokens que vous allez couper à la rédaction.

**Codage (refonte, génération, relecture)** : entrée typique 2 000-10 000 tokens (contenu de fichier, contexte), sortie 500-2 000 tokens. Dominé par l'entrée pour les refactorisations riches en contexte. Sur GPT-5.5 une tâche de code 5 000 entrée / 1 500 sortie coûte $0.025 + $0.045 = $0.070/appel. La mise en cache des en-têtes de fichier stable du projet et du prompt système coupe cela à environ $0.030/appel sur un cache chaud. GPT-5.5 Pro n'est justifié que quand la tâche nécessite du raisonnement architectural sur de nombreux fichiers.

**Raisonnement (mathématiques, analyse multi-étapes, planification complexe)** : c'est le domaine de GPT-5.5 Pro. Prompt typique 1 000 tokens avec réponse visible de 500 tokens mais 2 000-5 000 tokens de raisonnement caché en sortie. Sur GPT-5.5 Pro : $0.030 entrée + $180/1M × 5 500 = $0.030 + $0.99 = environ $1.02/appel. Pour comparaison, la même tâche sur GPT-5.5 pourrait coûter $0.020 et produire une pire réponse ; la question est si la différence de qualité de réponse vaut 50x le coût. Souvent c'est le cas pour le travail ponctuel à enjeux élevés, rarement pour l'inférence à l'échelle. Pour comparaison par rapport aux modèles de raisonnement de la série o qui facturent les tokens de raisonnement à des tarifs de sortie inférieurs, consultez coût de raisonnement o1.

**Boucles d'agent (utilisation d'outils multi-tours)** : examiné dans l'exemple pratique 4 ci-dessus. 4-8x un appel unique sur une boucle à 5 tours, descendant à 2-3x avec mise en cache agressive. Le plus grand gain est de garder le prompt système + définitions d'outils stable à travers la boucle pour que le cache tienne ; le deuxième plus grand gain est de résumer les tours passé le tour 5 en un récapitulatif compact plutôt que de rejoindre la retranscription complète.

API Batch sur GPT-5 : quand 50% de réduction est de l'argent gratuit

L'API Batch applique 50% de réduction sur l'entrée et la sortie GPT-5 pour les tâches livrées dans 24 heures. Elle accepte un fichier JSONL de requêtes, retourne un ID de tâche, et webhooks ou interroge pour achèvement. Aucune différence de qualité, aucune différence de comportement — mêmes modèles, mêmes sorties, moitié prix.

Les charges de travail qui sont des gains typiques de Batch sur GPT-5 : génération de contenu nocturne, résumé en masse (lettres d'information, digests hebdomadaires), classification d'hier's records, exécutions d'évaluation et de test de régression, précompute d'embedding (utiliser les points finaux d'embedding), génération de jeu d'entraînement, rédaction de rapport programmée. Toute sortie qui arrive dans un tableau de bord, e-mail ou CSV consommée asynchronement est un candidat Batch.

Les charges de travail qui ne peuvent pas utiliser Batch : chat synchrone (utilisateur en attente), boucles d'agent temps réel, n'importe quoi à l'intérieur d'un gestionnaire de requête qui retourne à l'utilisateur, n'importe quoi avec SLA sub-minute. Environ 30-60% du trafic GPT-5 de production typique peut passer à Batch sans changement UX.

L'effet composé : une facture GPT-5.5 de $20 000/mois avec 50% de la charge de travail éligible à Batch passe à $15 000/mois — $5 000/mois économisés sur un simple changement de configuration sans impact de qualité. Pour la plupart des équipes, c'est l'optimisation la plus EV unique qu'elles puissent faire sur leurs dépenses GPT-5.

Mise en cache de prompts sur GPT-5 : comment 90% de réduction fonctionne en pratique

L'entrée en cache sur GPT-5 facture exactement 10% du tarif d'entrée standard : $0.50/1M sur GPT-5.5 (vs $5), $0.25/1M sur GPT-5.4 (vs $2.50), $3.00/1M sur GPT-5.5 Pro (vs $30), $0.05/1M sur GPT-5.4-mini (vs $0.50). Le cache est opportuniste — OpenAI calcule une empreinte digitale de votre préfixe d'entrée et le met en cache côté serveur. Les appels ultérieurs avec le même préfixe lisent depuis le cache.

La règle dure : la mise en cache est une **correspondance de préfixe**, pas une correspondance de sous-chaîne. Tout ce que vous voulez mettez en cache doit venir au début de votre tableau de messages. Prompt système stable, définitions d'outils et exemples few-shot réutilisables viennent en premier. Le contenu spécifique à l'utilisateur et le contexte dynamique viennent en dernier. Un préfixe en cache de 1 500 tokens sur GPT-5.5 passe de $5/1M à $0.50/1M — économisant $0.0068 par appel. À 1M appels par mois, c'est $6 800 économisés avec un changement structural unique.

La plupart des SDKs LLM ne nécessitent pas de changements de code pour opter pour la mise en cache sur GPT-5 ; le cache s'active automatiquement une fois que vous structurez vos prompts préfixe-d'abord. La plus grande erreur que nous voyons dans les audits : les équipes interpolent des données dynamiques (date actuelle, ID utilisateur, état de session, chunks RAG récupérés) dans le prompt système, ce qui casse chaque accès au cache. Déplacez cela à un message utilisateur et le cache tient à travers les appels.

TTL cache sur GPT-5 est typiquement des minutes (pas des heures), donc les modèles de trafic importent. Une charge de travail avec des appels soutenus chaque peu de secondes met en cache de manière fiable ; une charge de travail avec un appel chaque 20 minutes plupart du temps cache-miss. Si votre trafic est en rafales, envisagez de réchauffer le cache avec un appel synthétique au début de chaque session — le marginal $0.005 pour réchauffer un préfixe de 1 500 tokens économise des multiples de cela à travers les 50 appels utilisateur suivants.

GPT-5 API vs abonnement ChatGPT : gardez-les séparés

OpenAI exécute deux pistes de facturation complètement séparées. L'**API GPT-5** (tarifée par token, accédée à platform.openai.com) est pour les développeurs construisant des applications. L'**abonnement ChatGPT grand public** (Gratuit, Plus $20/mo, Pro $200/mo, Team, Enterprise) donne aux utilisateurs finaux accès à GPT-5 dans l'UI ChatGPT. Mêmes modèles dessous, facturation distincte.

Un abonnement ChatGPT Plus $20/mois ne **n'inclut pas** de crédit d'API GPT-5. Si vous construisez sur l'API, configurez la facturation de l'API indépendamment à platform.openai.com et ajoutez une méthode de paiement à votre compte API. Les deux relations de facturation utilisent votre identité OpenAI mais suivent l'utilisation, les méthodes de paiement, les limites de facturation et les promotions de niveau indépendamment.

Un abonnement ChatGPT Pro $200/mois inclut GPT-5.5 Pro dans l'UI ChatGPT avec une utilisation effectivement illimitée, mais il vous donne zéro accès à l'API à GPT-5.5 Pro. Si votre équipe a besoin d'accès programmatique à GPT-5.5 Pro, vous payez $30/$180 par 1M de tokens sur l'API indépendamment de tout siège ChatGPT Pro que vous détenez.

Ce que cela signifie : budgétisez deux éléments de ligne distincts si votre équipe utilise les deux. Une équipe de 5 personnes avec des sièges ChatGPT Plus ($100/mois) plus une facture d'API GPT-5 ne double-paie pas — les sièges financent l'utilisation interactive et l'API finance le trafic de production. Consultez notre guide de coût ChatGPT pour la ventilation des niveaux de consommateur.

Erreurs courantes de coût GPT-5 (et la solution)

**Erreur 1 : utiliser GPT-5.5 par défaut pour chaque charge de travail.** La plupart du trafic de production est la classification, la résumé ou la génération de forme courte que GPT-5.4 ou GPT-5.4-mini gère à 1/5ème ou 1/40ème du prix avec une qualité indiscernable sur une évaluation réelle. La solution : construire une évaluation retenue de 50 exemples par tâche, exécuter les quatre niveaux GPT-5, choisir le niveau le moins cher qui passe. Cet exercice unique coupe généralement les factures GPT-5 de 40-70%.

**Erreur 2 : énormes prompts système qui ne sont jamais mis en cache.** Si votre prompt système interpole n'importe quoi qui change entre les appels (timestamps, noms d'utilisateur, résumés de contexte, chunks récupérés), le cache ne touche jamais et vous payez le tarif d'entrée complet chaque fois. La solution : réécrire pour que le prompt système soit statique entre les utilisateurs et les sessions ; déplacez tout le contenu dynamique aux messages utilisateur. Un prompt système statique de 2 000 tokens qui atteint le cache 90% du temps économise ~$8 par 1 000 appels sur GPT-5.5.

**Erreur 3 : pas de plafond `max_tokens`.** Une réponse de 300 tokens qui retourne 1 500 tokens parce que vous avez oublié un plafond coûte 5x en sortie. Sur GPT-5.5 Pro c'est $0.27 vs $0.054 par appel. La solution : plafonner la sortie partout où vous contrôlez la forme de consommation ; laissez-la sans plafond uniquement où vraiment nécessaire.

**Erreur 4 : rejoindre l'historique de chat complet à chaque tour.** Au-delà du tour 5, résumez la conversation antérieure en un récapitulatif compact de 200 tokens et rejoignez cela à la place de la retranscription complète. Économise 50-80% sur l'entrée à travers les sessions longues sans perte de qualité perceptible.

**Erreur 5 : utiliser GPT-5.5 Pro pour tout ce qui 'semble important'.** La prime 6x de Pro sur GPT-5.5 n'est justifiée que quand le coût d'erreur en aval dépasse la prime par appel. Pour la plupart du travail génératif, GPT-5.5 plus une passe de santé-chèque sur GPT-5.4 est moins cher et plus fiable que Pro seul. Construisez des évaluations ; laissez le coût suivre les données, pas les sensations.

**Erreur 6 : ignorer l'admissibilité au Batch.** 30-60% du trafic GPT-5 de production typique peut passer à Batch sans changement UX. Auditez votre trafic pour toute sortie qui arrive dans un tableau de bord, un e-mail ou un rapport consommé asynchronement — c'est un candidat Batch.

Sourçage et comment garder ces chiffres GPT-5 à jour

Chaque prix sur cette page provient de la page de tarification d'API en direct d'OpenAI à developers.openai.com/api/docs/pricing, récupérée 2026-06-20 et vérifiée par rapport à trois sources corroborantes indépendantes (commits d'intégration récents dans des projets open-source populaires, agrégateurs de tarification communautaires, le cookbook OpenAI public). Quand un nombre ne pouvait pas être vérifié par rapport à la page officielle, il a été omis — nous préférons livrer un guide manquant une ligne plutôt qu'un guide avec un nombre fabriqué.

OpenAI ne version pas sa page de tarification avec des entrées de changelog explicites. Ils poussent les changements silencieusement. Depuis le lancement de la famille GPT-5, nous avons vu deux mouvements de prix : une réduction de tarif d'entrée de 20% sur GPT-5.4-mini à la maturité de lancement, et un resserrement du ratio d'entrée en cache à un propre 10%. Attendez-vous au mouvement trimestriel sur au moins un niveau de la famille.

**Comment vérifier avant de budgétiser** : ouvrez developers.openai.com/api/docs/pricing dans une fenêtre incognito (aucune session connectée n'interfère avec le rendu), copiez les quatre lignes GPT-5 dans une feuille de calcul, comparez par rapport au tableau ci-dessus. S'ils correspondent, ce guide est à jour pour vos objectifs. S'ils ne le font pas, fiez-vous à la page en direct. Re-vérifiez trimestriellement si votre facture GPT-5 est au-dessus de $1 000/mois — à ce volume un seul mouvement de prix déplace le budget matériellement.

**Méthodologie reproductible** : chaque dollar du tableau et chaque exemple pratique trace les quatre prix publiés ci-dessus. Aucune ligne n'a été synthétisée à partir de tarifs 'plausibles'. Si vous trouvez un écart avec la page en direct, traitez la page en direct comme canonique et dites-nous — nous re-récupérons et mettons à jour. Détails de frère-sœur : coût API Claude pour comparaison côté Anthropic, coût DeepSeek pour des alternatives open-source à des prix fractionnaires GPT-5.

Comment estimer le coût de n'importe quel appel GPT-5 en 5 étapes

1
Estimez vos tokens d'entrée
Prenez le compte de caractères de votre prompt et divisez par 4, ou son compte de mots et divisez par 0,75. Règle empirique : 1 token ≈ 4 caractères ≈ 0,75 mots anglais. Un prompt système de 500 mots + un message utilisateur de 200 mots ≈ (500 + 200) ÷ 0,75 ≈ 933 tokens d'entrée. Pour les images, comptez ~85 tokens par mosaïque basse-détail, ~170 par mosaïque haute-détail, plus une base de 85 tokens.
→ Open the Générateur de prompts ChatGPT
2
Estimez vos tokens de sortie (et plafonez-les)
Estimez la sortie de la même manière — mots ÷ 0,75. La sortie pilote le coût parce que la sortie est 6x l'entrée sur chaque niveau GPT-5. Sur GPT-5.5 Pro, facteur dans 3-8x tokens de raisonnement qui facturent en sortie. Définissez un plafond `max_tokens` n'importe où vous pouvez prédire la forme de consommation.
3
Cherchez le tarif GPT-5 par 1M
Du tableau ci-dessus (vérifié juin 2026) : GPT-5.5 Pro $30 / $180, GPT-5.5 $5 / $30, GPT-5.4 $2.50 / $15, GPT-5.4-mini $0.50 / $1.50. Confirmez toujours la page en direct avant de vous engager pour budgétiser.
4
Appliquez la formule de coût GPT-5
cost = (input_tokens / 1,000,000) × input_price + (output_tokens / 1,000,000) × output_price. Un appel 1 000 entrée / 500 sortie sur GPT-5.4-mini = 0.001 × $0.50 + 0.0005 × $1.50 = $0.0005 + $0.00075 = $0.00125.
5
Empilez les remises GPT-5
L'entrée en cache facture 10% du tarif standard sur chaque niveau GPT-5. L'API Batch prend 50% de tous les deux flux pour les tâches livrées dans 24 heures. Ils se composent. Un appel GPT-5.5 en cache + batch paie $0.25/1M sur la portion d'entrée en cache et $15/1M en sortie — approximativement une réduction de facture totale de 60% à l'échelle.

Digital Dashboard Hub

The prompt patterns above work 10x better when they live in a library you actually own — tunable to your niche, exportable to GPT-5, Claude, Gemini, Perplexity, Midjourney, Llama. Stop pasting across 6 tools.

Try DDH's AI Prompt Builder — free 14 days, no card. →

Related calculators

OpenAI Pricing Calculator →GPT-5.5, 5.4, mini, nano — full per-call cost in one input.Claude Pricing Calculator →Opus 4.8, Sonnet 4.6, Haiku 4.5, Fable 5 — input + output combined.Context Window Comparison →Max input length and price per 1M for every current model.

Related prompt tools

Générateur de prompts ChatGPT (optimisé pour GPT-5)→Calculateur de coûts OpenAI API (famille complète)→Calculateur de coûts de raisonnement de la série o→Calculateur de coûts API Claude→

Frequently Asked Questions

Combien coûte GPT-5 par 1 million de tokens en 2026 ?

En juin 2026, GPT-5.5 facture $5.00 par 1M tokens d'entrée et $30.00 par 1M tokens de sortie. GPT-5.5 Pro est $30 / $180. GPT-5.4 est $2.50 / $15. GPT-5.4-mini est $0.50 / $1.50. Les tokens d'entrée en cache facturent exactement 10% du tarif d'entrée standard sur chaque niveau GPT-5. Source : page de tarification en direct d'OpenAI (developers.openai.com/api/docs/pricing).

Quelle est la différence entre la tarification de GPT-5.5 et GPT-5.5 Pro ?

GPT-5.5 est $5 entrée / $30 sortie par 1M tokens. GPT-5.5 Pro est $30 entrée / $180 sortie — exactement 6x plus cher sur les deux flux. Pro génère également des tokens de raisonnement interne étendus qui facturent au tarif de sortie même s'ils ne sont pas retournés à vous, donc le coût effectif de Pro sur les tâches riches en raisonnement est 8-20x GPT-5.5 standard. Justifiez Pro uniquement quand le coût d'erreur en aval dépasse le coût par appel.

Quel est le modèle GPT-5 le moins cher en 2026 ?

GPT-5.4-mini à $0.50 entrée / $1.50 sortie par 1M tokens. Un appel typique de 1 000 entrée / 500 sortie coûte $0.00125 sur GPT-5.4-mini — 96x moins cher que le même appel sur GPT-5.5 Pro. Meilleur pour les tâches intégrées à haut volume : classification, détection d'intention, routage, modération temps réel. Évitez pour le raisonnement multi-étapes ou la génération complexe.

GPT-5 a-t-il une couche gratuite ?

L'API GPT-5 n'a pas de couche gratuite permanente. Les nouveaux comptes OpenAI reçoivent généralement un petit crédit d'essai (historiquement $5, appliqué pendant 90 jours) qui peut être dépensé sur n'importe quel modèle incluant GPT-5. Le produit ChatGPT grand public offre GPT-5 dans sa couche gratuite avec limites d'utilisation, mais cela ne vous donne pas accès à l'API. Pour l'utilisation de production de l'API GPT-5, vous devez ajouter une méthode de paiement à platform.openai.com et payer par token aux tarifs ci-dessus.

Combien coûte l'API GPT-5 par appel ?

Pour un appel représentatif de 1 000 entrée / 500 sortie aux tarifs de juin 2026 : $0.00125 sur GPT-5.4-mini, $0.010 sur GPT-5.4, $0.020 sur GPT-5.5, et $0.120 sur GPT-5.5 Pro. Appliquez l'API Batch pour 50% de réduction si la charge de travail peut attendre 24 heures, et la mise en cache de prompts pour 90% de réduction sur la portion cacheable d'entrée. Un appel GPT-5.5 en cache + batch sur la même forme arrive autour de $0.010-0.014 par appel.

Quelle est la remise de l'API Batch GPT-5 ?

L'API Batch applique 50% de réduction sur les tarifs d'entrée et de sortie tokens sur chaque modèle GPT-5 pour les tâches asynchrones qui peuvent attendre jusqu'à 24 heures pour la livraison. Soumettez un fichier JSONL de requêtes, recevez un ID de tâche, interrogez ou webhook pour achèvement. Mêmes modèles, mêmes sorties, moitié prix. Meilleur pour la résumé nocturne, les digests hebdomadaires, la classification en masse, la génération de jeu d'entraînement, les exécutions d'évaluation — n'importe quoi non consommé synchronement.

Combien coûte l'entrée en cache GPT-5 ?

L'entrée en cache facture exactement 10% du tarif d'entrée standard sur chaque niveau GPT-5 : $0.50/1M sur GPT-5.5 (vs $5), $0.25/1M sur GPT-5.4 (vs $2.50), $3.00/1M sur GPT-5.5 Pro (vs $30), $0.05/1M sur GPT-5.4-mini (vs $0.50). Le cache est opportuniste et préfixe-uniquement : mettez les prompts système stables et les définitions d'outils au début, le contenu dynamique à la fin.

Puis-je empiler les remises GPT-5 Batch et d'entrée en cache ?

Oui. Les remises se composent multiplicativement. Un appel GPT-5.5 en cache + batch paie $0.50/1M (entrée en cache) ÷ 2 (batch) = $0.25/1M sur l'entrée en cache, et $30/1M ÷ 2 = $15/1M en sortie. Une charge de travail GPT-5.5 standard $20 000/mois arrive généralement autour de $7 000-9 000/mois avec les deux remises appliquées — une réduction de 55-65% sans changement de qualité.

Arrêtez de surpayer GPT-5. Écrivez des prompts construits pour le modèle que vous facturez.

Notre générateur de prompts AI écrit des prompts optimisés pour GPT-5 basés sur VOTRE entreprise + tâche — pré-chargé pour le cache, plafonné pour la sortie, dimensionné pour le niveau le moins cher qui fonctionne. Essai gratuit de 14 jours, pas de carte.

Browse all prompt tools →