Par l'équipe DDH · Digital Dashboard Hub

Calculateur de coûts d'IA : estimez les coûts en tokens sur tous les modèles (2026)

By DDH Research Team at Digital Dashboard Hub·Updated June 15, 2026

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

Pour estimer le coût d'un prompt d'IA, comptez les tokens en entrée et en sortie, puis multipliez chacun par le tarif par token du modèle : coût = (tokens d'entrée ÷ 1 000 000 × prix d'entrée) + (tokens de sortie ÷ 1 000 000 × prix de sortie). Une règle utile : 1 token représente environ 4 caractères ou 0,75 mots d'anglais, donc 1 000 mots correspondent à environ 1 333 tokens.

Les prix sont cotés par million de tokens et diffèrent pour l'entrée et la sortie, la sortie coûtant généralement plusieurs fois plus. Vous trouverez ci-dessous la formule, des exemples pratiques sur les tarifs actuels réels, un tableau complet multi-fournisseurs, et les remises cache et batch qui peuvent réduire sensiblement les factures. Les prix changent souvent — confirmez toujours auprès des pages tarifaires actuelles liées dans le tableau.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card. →

Tarifs API par 1M de tokens (entrée / sortie) — en juin 2026

Feature	Entrée ($/1M)	Sortie ($/1M)
OpenAI gpt-5.5	$5.00	$30.00
OpenAI gpt-5.5-pro	$30.00	$180.00
OpenAI gpt-5.4	$2.50	$15.00
OpenAI gpt-5.4-mini	$0.75	$4.50
OpenAI gpt-5.4-nano	$0.20	$1.25
Anthropic Claude Opus 4.8	$5.00	$25.00
Anthropic Claude Sonnet 4.6	$3.00	$15.00
Anthropic Claude Haiku 4.5	$1.00	$5.00
Anthropic Claude Fable 5	$10.00	$50.00
Google Gemini 3.5 Flash	$1.50	$9.00
Google Gemini 3.1 Pro (Aperçu, ≤200k)	$2.00	$12.00
Google Gemini 2.5 Pro	$1.25	$10.00
Google Gemini 2.5 Flash	$0.30	$2.50
Google Gemini 2.5 Flash-Lite	$0.10	$0.40

Sources, en juin 2026 : OpenAI (https://developers.openai.com/api/docs/pricing), Anthropic (https://claude.com/pricing et https://platform.claude.com/docs/en/about-claude/pricing), Google Gemini (https://ai.google.dev/gemini-api/docs/pricing). Les prix changent fréquemment — confirmez sur les pages actuelles avant de budgéter.

Comment le coût par token est-il calculé ?

Deux chiffres déterminent chaque estimation : le nombre de tokens que vous envoyez (entrée) et le nombre que le modèle retourne (sortie). Chacun a son propre tarif, coté par 1 000 000 de tokens.

La formule :

``` coût = (tokens_entrée / 1 000 000) * prix_entrée_par_M + (tokens_sortie / 1 000 000) * prix_sortie_par_M ```

Pour estimer le nombre de tokens avant d'avoir un compte exact avec un tokeniseur, utilisez la règle empirique selon laquelle 1 token équivaut à environ 4 caractères ou 0,75 mots en anglais (une estimation approximative selon la documentation OpenAI et Anthropic). Ainsi, un prompt de 500 mots représente environ 500 ÷ 0,75 ≈ 667 tokens d'entrée. C'est une approximation ; les espaces, la ponctuation, le code et le texte non-anglais modifient le ratio.

La sortie domine de nombreuses factures car les tarifs de sortie sont généralement plusieurs fois plus élevés que l'entrée, et les générations longues s'accumulent rapidement. Si une tâche peut retourner une réponse structurée courte au lieu de prose, cela seul réduit le coût.

Exemple pratique 1 : un appel unique question/réponse

Supposons que vous envoyez un prompt de 750 mots et recevez une réponse de 750 mots. À ~0,75 mots par token, cela représente environ 1 000 tokens d'entrée et 1 000 de sortie — 0,001 M chacun.

Sur gpt-5.4 ($2,50 entrée / $15,00 sortie par 1M) : entrée = 0,001 × $2,50 = $0,0025 ; sortie = 0,001 × $15,00 = $0,015 ; total ≈ $0,0175 par appel.

Sur Claude Sonnet 4.6 ($3,00 / $15,00) : entrée = 0,001 × $3,00 = $0,003 ; sortie = 0,001 × $15,00 = $0,015 ; total ≈ $0,018 par appel.

Sur Gemini 2.5 Flash ($0,30 / $2,50) : entrée = 0,001 × $0,30 = $0,0003 ; sortie = 0,001 × $2,50 = $0,0025 ; total ≈ $0,0028 par appel.

Même charge de travail, environ 6 fois moins cher sur Gemini 2.5 Flash que sur les modèles intermédiaires OpenAI ou Anthropic — ce qui est le tout l'intérêt d'adapter le niveau du modèle à la difficulté de la tâche.

Exemple pratique 2 : mise à l'échelle à 100 000 appels

Maintenant, exécutez ce même appel 1 000 entrée / 1 000 sortie 100 000 fois — par exemple un travail de classification ou de résumé par lot. Multipliez les totaux par appel ci-dessus par 100 000 :

gpt-5.4 : $0,0175 × 100 000 ≈ $1 750. Claude Sonnet 4.6 : $0,018 × 100 000 ≈ $1 800. Gemini 2.5 Flash : $0,0028 × 100 000 ≈ $280.

À cette échelle, les remises comptent. Si le travail n'est pas sensible à la latence, l'API Batch d'Anthropic offre 50 % de réduction sur l'entrée et la sortie, réduisant de moitié le chiffre Sonnet à environ $900. Le cache de prompt aide quand un grand préfixe identique (système de prompt, instructions, document de référence) se répète sur les appels. Consultez les méthodes ci-dessous.

Comment les remises cache et batch changent-elles les calculs ?

Deux mécanismes peuvent réduire considérablement le coût lorsque votre charge de travail les utilise.

Cache de prompt (Anthropic) : quand de nombreux appels partagent le même grand préfixe, vous le mettez en cache une fois et payez un tarif réduit sur la portion mise en cache des appels ultérieurs. Selon la tarification d'Anthropic, une lecture du cache (un hit) coûte 0,1x le tarif d'entrée de base — c'est-à-dire 10 % du tarif d'entrée normal pour les tokens mis en cache. L'écriture dans le cache coûte plus que l'entrée de base (1,25x pour un cache de 5 minutes, 2x pour un cache d'1 heure), donc le cache rentabilise quand le même préfixe est réutilisé assez de fois pour amortir cette écriture. Exemple : l'entrée Claude Opus 4.8 est $5/M, et sa lecture de cache est $0,50/M — une économie de 90 % sur la portion répétée.

API Batch (Anthropic) : 50 % de réduction sur l'entrée et la sortie pour les travaux asynchrones et non-sensibles au temps. Cela s'ajoute proprement aux grands travaux hors ligne comme l'exemple de 100 000 appels ci-dessus.

Adaptez la remise à la forme du travail : cache pour un grand préfixe répété avec queue variable, batch pour les gros travaux que vous pouvez attendre. Confirmez les tarifs et les mécanismes actuels sur les pages tarifaires liées, car ces conditions changent.

Comment estimer sans tokeniseur exact ?

Pour la planification, le nombre de caractères ou de mots vous rapproche. Prenez le nombre de caractères de votre prompt et divisez par 4, ou le nombre de mots et divisez par 0,75, pour estimer les tokens d'entrée. Estimez les tokens de sortie à partir de la longueur de réponse attendue.

Branchez ensuite les deux dans la formule et le tarif pour votre modèle choisi. Traitez le résultat comme une estimation d'ordre de grandeur, pas une garantie de facturation — le chiffre exact dépend du tokeniseur du modèle et de votre longueur de sortie réelle. Pour rédiger des prompts plus serrés (moins de tokens, instructions plus claires) pour le modèle que vous choisissez, notre générateur de prompt ChatGPT et constructeur de prompt de code vous aident à garder les entrées maigres.

Digital Dashboard Hub

The prompt patterns above work 10x better when they live in a library you actually own — tunable to your niche, exportable to GPT-5, Claude, Gemini, Perplexity, Midjourney, Llama. Stop pasting across 6 tools.

Try DDH's AI Prompt Builder — free 14 days, no card. →

Related calculators

OpenAI Pricing Calculator →GPT-5.5, 5.4, mini, nano — full per-call cost in one input.Claude Pricing Calculator →Opus 4.8, Sonnet 4.6, Haiku 4.5, Fable 5 — input + output combined.Context Window Comparison →Max input length and price per 1M for every current model.

Related prompt tools

Générateur de prompt ChatGPT→Constructeur de prompt de code→Générateur de plan d'article de blog→Générateur de description de produit→

Frequently Asked Questions

Combien de tokens pour 1 000 mots ?

Environ 1 333 tokens, en utilisant la règle empirique selon laquelle 1 token équivaut à environ 0,75 mots (ou environ 4 caractères) en anglais. C'est une approximation ; le code, la ponctuation et le texte non-anglais modifient le ratio.

Pourquoi la sortie est-elle plus chère que l'entrée ?

La génération de tokens est plus coûteuse en calcul que leur lecture, donc les fournisseurs facturent la sortie plus cher — souvent plusieurs fois le tarif d'entrée. Sur gpt-5.4, par exemple, la sortie ($15/1M) est six fois l'entrée ($2,50/1M), selon la tarification d'OpenAI.

Quel est le moyen le moins cher d'exécuter un grand travail par lot ?

Pour les travaux non-sensibles au temps, l'API Batch d'Anthropic offre 50 % de réduction sur l'entrée et la sortie. Combinez cela avec un niveau de modèle à bas coût où la qualité le permet. Confirmez les conditions actuelles à la tarification d'Anthropic.

Combien le cache de prompt économise-t-il ?

Sur Anthropic, une lecture de cache (hit) coûte 0,1x le tarif d'entrée de base — 90 % de réduction sur la portion mise en cache — bien que l'écriture dans le cache coûte plus que l'entrée de base, donc cela rentabilise quand un grand préfixe est réutilisé assez de fois. Consultez le détail tarifaire d'Anthropic.

Puis-je faire confiance aux estimations basées sur le nombre de caractères pour budgéter ?

Comme estimation d'ordre de grandeur, oui — divisez les caractères par 4 (ou les mots par 0,75) pour les tokens d'entrée. Pour une facturation exacte, vous avez besoin du tokeniseur du modèle et de votre longueur de sortie réelle, donc traitez le résultat de la formule comme un plan, pas une garantie.

Quel modèle actuel est le moins cher pour les tâches simples ?

Parmi les niveaux du tableau, Gemini 2.5 Flash-Lite ($0,10 entrée / $0,40 sortie par 1M) et gpt-5.4-nano ($0,20 / $1,25) sont les options les moins coûteuses en juin 2026. Adaptez le niveau le moins cher qui répond encore à votre barre de qualité.

Tous les fournisseurs facturent-ils séparément l'entrée et la sortie ?

Oui — OpenAI, Anthropic et Google tous quotent des tarifs distincts pour l'entrée et la sortie par million de tokens. La formule de cet article s'applique aux trois ; seuls les chiffres par token diffèrent. Consultez la page tarifaire liée de chaque fournisseur pour les chiffres actuels.

Rédigez des prompts plus serrés

Moins de tokens d'entrée et des instructions plus claires signifient des factures réduites. Commencez par nos générateurs de prompt.

Browse all prompt tools →