Par l'équipe DDH · Digital Dashboard Hub

Calculateur de coût Grok 4 API (2026)

By The DDH Team at Digital Dashboard Hub·Updated June 19, 2026

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

xAI facture par token sur l'API Grok. Chaque appel a deux flux tarifés : tokens d'entrée (le prompt, le message système, les tours antérieurs rejouées, les définitions outils, tous les résultats de recherche X que vous intégrez en contexte) et tokens de sortie (tout ce que le modèle écrit en retour, incluant les arguments d'appels outils). L'entrée et la sortie sont facturées à des taux différents par 1M. Dans la famille Grok-4, la sortie coûte 2x à 3x le prix d'entrée — un écart bien plus serré que le ratio 5-6x d'OpenAI ou le ratio 5x d'Anthropic, ce qui change comment vous optimisez.

En juin 2026, les prix Grok couvrent une gamme de 30x : Grok-4 Fast à $0.20 entrée / $0.50 sortie par 1M tokens jusqu'à Grok-4.20 à $2.00 / $6.00. Deux leviers de coût importent vraiment : les cache-hits Grok-4.20 se facturent 90% de remise ($0.20/1M entrée), et le programme partage données xAI retourne jusqu'à **$150/mois en crédits gratuits** en échange de laisser xAI entraîner sur vos prompts et complétions. Aucun autre grand fournisseur LLM n'offre un programme crédit gratuit à cette échelle.

Les deux propositions uniques de Grok : (1) **accès X-data en temps réel** — le seul LLM avec intégration Twitter/X native et en direct pour les événements actuels, le sentiment et les nouvelles de dernière minute ; et (2) **fenêtres contexte 1-2M tokens** dans la famille, doublant ce qu'OpenAI et Anthropic offrent à des prix comparables. Le compromis est la maturité écosystème : les outils, SDKs et intégrations tiers traînent les plus grands joueurs.

Ci-dessous : la table prix complète juin-2026 vérifiée contre la documentation live xAI, la formule coût canonique, quatre exemples concrets (1k, 100k, 1M et une boucle agent 5-turn), l'échange partage données $150/mois expliqué en anglais clair, quand l'accès X temps réel importe vraiment, et la FAQ qui couvre tout ce qui bloque les équipes. Ajoutez aux signets — et rédigez rapidement des prompts qui ne gaspillent pas la fenêtre contexte massive de Grok avec notre générateur prompt ChatGPT gratuit. Calculateurs connexes : Coût OpenAI API · Coût GPT-5 · Coût DeepSeek.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card. →

Prix API Grok par 1M tokens — juin 2026

Feature	Entrée ($/1M)	Sortie ($/1M)	Fenêtre contexte
Grok-4.20	$2.00	$6.00	2M tokens
Grok-4.3	$1.25	$2.50	1M tokens
Grok-4 Fast	$0.20	$0.50	2M tokens

Source, en juin 2026 : documentation modèle xAI (https://docs.x.ai/docs/models) et x.ai/api. Prix cache-hit Grok-4.20 : 90% de remise sur l'entrée standard ($0.20/1M sur la portion cachée). Grok-4.3 et Grok-4 Fast n'exposent pas actuellement les prix cache-hit sur la page documentation live. Programme partage données : jusqu'à $150/mois en crédits API gratuits en échange du consentement de votre trafic au dataset d'entraînement (https://x.ai/api). X Premium+ est un abonnement chat consommateur $40/mois sur x.com — relation de facturation séparée, n'inclut pas le crédit API. La recherche X-data en temps réel est incluse dans la facture token standard sur les trois modèles.

La formule coût (mémorisez celle-ci)

Chaque appel API Grok suit les mêmes calculs. Il n'y a pas de frais par appel, pas de frais plateforme, pas de dépense minimale. Vous payez ce que vous envoyez et ce que vous récupérez, au taux par 1M tokens du modèle :

``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```

Deux ajustements s'ajoutent, mais uniquement sur Grok-4.20. D'abord, **le tarification cache-hit** réduit la portion entrée cachée à $0.20/1M — une remise 90% versus le taux standard $2.00. Le cache est opportuniste et basé préfixe : mettez votre prompt système stable, définitions outils et tous les exemples few-shot réutilisables au début du tableau message ; mettez le contenu user-spécifique en dernier. Deuxièmement, le **programme partage données** retourne jusqu'à $150/mois en crédits gratuits si vous acceptez votre trafic au dataset d'entraînement xAI (voir la section dédiée ci-dessous). Ces deux s'accumulent : une charge de travail éligible partage données exécutant des préfixes Grok-4.20 cachés peut résulter zéro coût marginal pour les premiers ~75M tokens entrée cachée par mois.

Les résultats recherche X temps réel que le modèle récupère sont facturés comme tokens entrée une fois qu'ils entrent en contexte — il n'y a pas de frais recherche séparé comme Perplexity facture. C'est l'une des plus nettes victoires tarifaires de Grok : l'ancrage web/X temps réel est intégré au taux token standard.

Exemple concret 1 : un appel unique 1 000-in / 500-out

Prenez un appel représentatif — un prompt 1 000 tokens qui retourne une réponse 500 tokens, environ 750 mots de brief en entrée et 375 mots de réponse en sortie. Aux taux standard, le coût par appel s'établit comme :

Grok-4.20 : (1000 / 1,000,000) × $2.00 + (500 / 1,000,000) × $6.00 = $0.002 + $0.003 = **$0.005 par appel**.

Grok-4.3 : 0.001 × $1.25 + 0.0005 × $2.50 = $0.00125 + $0.00125 = **$0.0025 par appel**.

Grok-4 Fast : 0.001 × $0.20 + 0.0005 × $0.50 = $0.0002 + $0.00025 = **$0.00045 par appel**.

Remarquez l'écart 11x entre Grok-4 Fast ($0.00045) et Grok-4.20 ($0.005) sur les mêmes volumes tokens — un écart plus serré que la gamme 145x sur la famille GPT-5 d'OpenAI. Les niveaux tarifaires sont plus proches en prix parce que les écarts capacité sont plus petits ; choisissez le niveau le moins cher qui atteint votre barre qualité.

Exemple concret 2 : 100 000 appels par mois

Multipliez les nombres par-appel par 100 000. C'est une charge travail realiste taille moyenne — classification quotidienne sur 3 000+ enregistrements, exécutions résumé hebdomadaire, une boucle agent volume modéré :

Grok-4.20 : **$500/mois**. Grok-4.3 : **$250/mois**. Grok-4 Fast : **$45/mois**.

Maintenant appliquez les cache-hits à la ligne Grok-4.20. Si 800 sur chaque 1 000 tokens entrée sont un préfixe système stable qui hit cache 80% du temps, ces 640 tokens cachés baissent de $2.00/1M à $0.20/1M — économisant 90% sur 64% de l'entrée. Cela réduit la facture entrée de $200 → $85, prenant le total de $500 → $385 (environ 23% de remise).

Maintenant appliquez partage données. Si votre trafic est admissible (pas de PII, pas de contenu régulé), le crédit $150/mois absorbe complètement $385 → $235 net. Sur Grok-4 Fast, la même charge travail $45/mois est entièrement couverte par le crédit partage données — vous payez $0. C'est le niveau production le moins cher de l'industrie une fois partage données en jeu. Construisez des prompts ancrés cache gratuitement avec notre générateur prompt code.

Exemple concret 3 : mise à l'échelle 1 000 000 appels

Maintenant mettez à l'échelle 1M appels — une charge travail production complète (ex., analyse par-user sur une app SaaS avec 30 000 utilisateurs actifs exécutant 33 appels/mois chacun) :

Grok-4.20 : **$5 000/mois**. Grok-4.3 : **$2 500/mois**. Grok-4 Fast : **$450/mois**.

Sur Grok-4.20, en appliquant le même pattern cache-hit 80% de l'exemple 2 réduit la facture à environ $3 850 — une économie $1 150. Le crédit partage données frappe $150 supplémentaires, atterrissant à $3 700.

Sur Grok-4 Fast à $450/mois, le crédit partage données $150 couvre 33% de la facture — payant $300 net pour 1M appels est approximativement $0.0003 par appel. C'est compétitif avec DeepSeek-V3 ($0.14/$0.28) une fois que vous prenez en compte le manque de programme crédit gratuit de DeepSeek. L'ordre levier canonique pour réduire le coût Grok à l'échelle : (1) choisissez Grok-4 Fast pour tout ce qui ne demande pas le raisonnement flagship, (2) structurez les prompts préfixe-en-premier pour capturer les cache-hits sur Grok-4.20, (3) acceptez partage données si votre trafic remplit les conditions, (4) cappez la longueur sortie — la sortie est 2.5-3x prix entrée dans la famille.

Exemple concret 4 : une réelle boucle agent production sur Grok-4.20

Une boucle agent est la pire forme coût — le modèle prend plusieurs turns par requête user, rejouant la transcription complète chaque turn. Prenez une boucle typique 5-turn avec un prompt système 2 000 tokens + outils, contexte croissant 800 tokens par turn (parce que le contexte 2M de Grok permet bien plus d'état intermédiaire épais que les modèles contexte plus petit) :

Turn 1 : 2 800 in / 200 out. Turn 2 : 3 000 in / 200 out. Turn 3 : 3 200 in / 200 out. Turn 4 : 3 400 in / 200 out. Turn 5 : 3 600 in / 200 out. Total : 16 000 entrée + 1 000 sortie. Sur Grok-4.20 : 0.016 × $2.00 + 0.001 × $6.00 = $0.032 + $0.006 = **$0.038 par requête** — environ 7.6x un appel unique.

Maintenant appliquez caching. Le préfixe système 2 000 tokens + outils est stable sur tous les 5 turns. Avec cache-hits 80% sur ces 2 000 tokens × 5 turns = 8 000 tokens entrée cachée baissant de $2.00/1M à $0.20/1M : $0.016 → $0.0016, économisant $0.0144 par requête (38% de la facture). Pour 100k requêtes/mois : de $3 800 → $2 360. La même charge travail sur Grok-4 Fast (pas cache exposé mais baseline moins cher) exécute $0.0076 par requête → $760/mois au même volume. Pour les charges travail agent, Grok-4 Fast est généralement la bonne réponse sauf si vous avez besoin de la profondeur raisonnement de 4.20.

Le mouvement haut-levier sur Grok est le même que sur chaque autre LLM : la structure cache surpasse le choix modèle. Un prompt ancré cache sur Grok-4.20 peut atterrir plus proche coût à Grok-4 Fast qu'au Grok-4.20 taux standard.

Le programme crédit libre partage données — comment obtenir $150/mois de Grok gratuitement

xAI exécute un programme développeur qui retourne jusqu'à **$150 par mois en crédits API gratuits** en échange d'accepter votre trafic API au corpus entraînement. Aucun autre grand fournisseur LLM n'offre un programme crédit gratuit à cette échelle — le niveau gratuit OpenAI s'est plafonné des années avant, Anthropic n'en a pas, les crédits Gemini Google sont liés aux promotions onboarding GCP, pas aux rebates développeur continu.

**L'échange en anglais clair** : quand vous acceptez, xAI est autorisé à utiliser vos prompts et complétions pour entraîner des futures versions Grok. Les données sont dé-identifiées à l'ingestion, mais quiconque a des charges travail sensibilité-confidentialité (PII client, contenu régulé, IP interne, tout sous NDA, santé, documents légaux, conseil financier avec parties identifiables personnellement) ne devrait pas accepter. Le crédit n'est pas la peine du risque fuite données.

**Qui devrait accepter** : développeurs indépendants, hobbyistes, charges travail contenu-public (résumer l'actualité, analyser posts X publics, générer copie marketing, construire démos), prototypes early-stage où vous validez toujours le produit. Quiconque dont les prompts ne vous dérangeraient pas d'apparaître verbatim dans une future réponse Grok est adapté.

**Qui ne devrait pas accepter** : entreprises SaaS dont les données client circulent via les prompts, industries régulées (santé/finance/légal), outils B2B manipulant l'information client propriétaire confidentielle, tout où le contenu prompt a une valeur commerciale comme IP confidentiel. Les $150/mois ne valent pas l'exposition contractuelle ou régulatoire.

**Comment s'inscrire** : acceptez via la console xAI à x.ai/api sous les paramètres développeur. Le crédit s'applique automatiquement à votre utilisation facturable ; vous n'obtenez pas d'argent, vous obtenez jusqu'à $150 d'utilisation API absorbée chaque mois. Le crédit non utilisé ne s'accumule pas. Les conditions exactes (admissibilité, manipulation données, opt-out) sont documentées à x.ai/api — vérifiez-les avant d'inscrire.

Quand l'accès X temps réel de Grok importe (et quand c'est irrelevant)

Grok est le seul grand LLM avec accès X (Twitter) firehose native et en temps réel. Chaque autre fournisseur offrant « recherche web » — OpenAI, Anthropic via outils web, Gemini, Perplexity — utilise des APIs recherche tiers qui indexent les pages publiques X avec lag significatif (minutes à heures, parfois plus). Grok requête l'index interne X directement, avec fraîcheur sub-minute sur le contenu tendance.

**Cas utilisation où cela vaut vraiment payer la prime Grok sur un modèle moins cher** : analyse sentiment live sur l'actualité breaking (la réaction Tesla earnings dans les 10 minutes après l'appel qui se termine), surveillance réputation marque lors d'une crise, analyse événement politique temps réel, agrégation commentaire sports/divertissement, surveiller sentiment développeur sur un lancement produit, suivre comment une meme se répand. N'importe quoi où « que dit X sur Y *en ce moment* » est la question.

**Cas utilisation où c'est irrelevant** : génération code, résumé document, extraction structurée, classification, support client, autocomplete encastré, flux travail agent exécutant des données internes, RAG sur votre propre corpus. Pour ces cas, l'accès X temps réel est overhead que vous payez zéro supplémentaire mais ne tirez aucune valeur — et Grok-4 Fast à $0.20/$0.50 est compétitif sur prix seul, bonus X temps réel ou pas.

**L'honnête compromis** : les données X temps réel sont vraiment uniques à Grok, mais c'est un moat étroit. Si votre produit la nécessite, aucun autre modèle ne substitue. Si votre produit ne la nécessite, vous choisissez Grok sur prix/fenêtre-contexte, pas l'intégration X. Soyez honnête sur quel seau vous êtes avant d'architecturer autour.

**Coût résultats recherche** : quand Grok récupère contenu X en contexte, ces tokens se facturent au taux entrée standard. Une requête recherche qui tire 20 posts X moyennes 500 tokens chacun = 10 000 tokens entrée ajoutés au prompt. Sur Grok-4.20 c'est $0.02 par appel augmenté recherche au-dessus votre prompt base. Planifiez cela dans votre budget token — les appels Grok augmentés recherche sont 5-10x le volume entrée d'un appel vanilla.

Grok-4 Fast vs GPT-5.4-mini vs DeepSeek-V3 : l'affrontement modèles bon marché

Grok-4 Fast s'assoit entre OpenAI et DeepSeek sur la courbe niveau bon marché. Côte à côte aux taux standard (juin 2026) :

**Grok-4 Fast** : $0.20 entrée / $0.50 sortie, 2M contexte, accès X temps réel, crédit $150/mois disponible. **GPT-5.4-mini** : $0.50 entrée / $1.50 sortie, 200K contexte, écosystème mature, remises batch + cache. **DeepSeek-V3** : $0.14 entrée / $0.28 sortie, 64K contexte, baseline moins cher, pas crédits gratuits, infra basée Chine. Voir les décompositions complètes à Coût GPT-5 et Coût DeepSeek.

**Sur un appel 1 000-in / 500-out** : Grok-4 Fast $0.00045, GPT-5.4-mini $0.00125, DeepSeek-V3 $0.00028. Par appel, DeepSeek-V3 est moins cher. Mais : factoriez le crédit partage données sur Grok et Grok-4 Fast devient effectivement libre pour les premiers ~330k appels/mois, battant DeepSeek pour n'importe quelle charge travail sous ce seuil.

**Où chacun gagne** : DeepSeek-V3 pour le prix pur-par-token à l'échelle où vous ne remplacez pas pour les crédits Grok. GPT-5.4-mini pour la maturité écosystème, outillage, API batch, et inférence basée US (confort régulateur). Grok-4 Fast pour les fenêtres contexte 2M, accès X temps réel, ou n'importe quelle charge travail admissible pour le crédit partage données $150/mois. Les trois sont grossièrement remplaçables sur capacité pour la plupart des tâches production classification/résumé/extraction — choisissez sur confiance infra, fenêtre contexte, ou besoins données uniques.

Grok l'API vs X Premium+ l'abonnement consommateur : ne les confondez pas

xAI exécute deux relations de facturation complètement séparées, et elles se confondent constamment. L'**API Grok** (tarifiée par-token dans la table ci-dessus, accédée via x.ai/api et docs.x.ai) est pour les développeurs construisant des applications. L'**abonnement consommateur X Premium+** ($40/mois sur x.com/premium) est pour les utilisateurs finaux chattant avec Grok dans l'UI x.com et inclut également X sans pub, limites post plus longues et autres fonctionnalités consommateur. Même modèle dessous ; facturation entièrement distincte.

**Ce que cela veut dire pour les constructeurs** : un abonnement $40/mois X Premium+ **n'inclut pas** le crédit API. Si vous construisez sur Grok-4.20, configurez la facturation API indépendamment à x.ai/api. S'inscrire à X Premium+ ne fait rien pour vos limites taux API, quota, ou facture.

**Ce que cela veut dire pour les utilisateurs finaux** : une clé API ne vous donne pas les fonctionnalités Premium+ sur x.com. Si vous voulez l'UI chat consommateur, le flux sans pub, et les posts plus longs, c'est un abonnement séparé $40/mois. Les deux relations utilisent la même identité xAI/X mais suivent l'utilisation, méthodes paiement et limites facturation indépendamment.

**Pourquoi cette confusion est plus commune avec Grok qu'autres fournisseurs** : parce que xAI et X partagent la marque (même société mère), les utilisateurs assument un abonnement achète les deux. Il ne le fait pas. La même séparation architecturale qu'OpenAI a entre les abonnements ChatGPT et l'API s'applique ici — même logo, produits différents, factures différentes.

Erreurs fréquentes qui gonflent la facture Grok

**Erreur 1 : par défaut Grok-4.20 pour tout.** La plupart du trafic production est classification, extraction, résumé — Grok-4 Fast manipule ceux-ci au 1/10e du prix et le contexte 2M est le même. Testez avant d'assumer le flagship est nécessaire.

**Erreur 2 : énormes prompts système jamais cachés sur Grok-4.20.** Si votre prompt système interpole n'importe quoi qui change entre les appels (timestamps, IDs user, état session), le cache ne hit jamais. Restructurez pour que le prompt système soit statique et le contexte dynamique vive dans les messages user.

**Erreur 3 : ne pas capper la sortie.** La sortie est 2.5-3x prix entrée dans la famille Grok. Une réponse 200 tokens qui retourne 1 200 tokens parce que vous avez oublié de mettre max_tokens coûte 6x. Sur Grok-4.20, c'est $0.0072 par appel vs $0.0012. Cappez la longueur sortie n'importe où vous contrôlez la forme consommation.

**Erreur 4 : utiliser recherche X temps réel quand vous ne la nécessitez.** Chaque appel augmenté recherche ajoute 5 000-15 000 tokens entrée. Si votre tâche ne nécessite vraiment pas les données X live, désactivez l'outil — vous couperez le volume entrée par 5-10x sur ces appels.

**Erreur 5 : bourrer la fenêtre contexte 2M parce que vous pouvez.** Le contexte géant Grok est une fonctionnalité, pas une ressource libre. 1M tokens entrée sur Grok-4.20 coûte $2.00 par appel. Utilisez la fenêtre contexte pour ce qu'elle a été conçue (documents longs, état agent épais) — pas comme un substitut à la récupération ou au résumé.

**Erreur 6 : ne pas s'inscrire à partage données quand votre charge travail est admissible.** Si votre trafic remplit vraiment les conditions (pas PII, pas contenu client propriétaire), vous laissez jusqu'à $1 800/an sur la table en ne acceptant pas.

Méthodologie sourçage et comment garder ces nombres courants

Chaque prix dans ce guide vient de la documentation modèle live xAI à docs.x.ai/docs/models et la page tarifaire développeur à x.ai/api, extraits le 2026-06-20 et vérifiés contre trois sources corroborantes indépendantes (agrégateurs tarifaires communauté, commits intégration récents dans les projets open-source populaires référençant xai-sdk, et changelog développeur xAI). Quand un nombre ne pouvait pas être vérifié contre la page officielle, il a été omis — nous préférons livrer un guide manquant une ligne qu'un guide avec un nombre fabriqué.

xAI met à jour la tarification plus agressivement que les fournisseurs plus anciens — Grok-4.20 a vu une réduction prix 30% en Q4 2025 et Grok-4 Fast a lancé à un prix 60% sous le lancement Grok-4 initial. Attendez-vous 4-6 mouvements tarifaires par an, presque tous vers le bas en tant que la famille mûrit. Le plus grand risque pratique : assumer un prix que vous avez sourcé en Q1 tient toujours en Q3.

**Comment vérifier avant de budgéter** : ouvrez docs.x.ai/docs/models dans une fenêtre incognito, copiez les nombres pour vos modèles cible dans une feuille calcul, et comparez contre ce guide. S'ils correspondent, ce guide est actuel pour vos buts. S'ils ne correspondent, fiez-vous à la page live. Vérifiez de nouveau trimestriellement si votre facture Grok mensuelle est plus de $500 — à ce volume, un mouvement prix unique décale matériellement le budget.

**Pourquoi nous avons omis certaines lignes** : le tarification cache-hit pour Grok-4.3 et Grok-4 Fast n'est pas exposé actuellement sur la page documentation live vérifiée, même si les posts forum communauté citent parfois des taux cache spécifiques. Plutôt que de propager possiblement nombres obsolètes, nous les omettons ici. Nous avons aussi omis les niveaux entreprise/remise-volume qui sont négociés cas-par-cas et pas listés publiquement.

**Méthodologie reproductible** : chaque ligne dans la table ci-dessus a une citation ; chaque exemple concret utilise ces lignes ; chaque réponse FAQ les reflète. Si vous trouvez un désaccord avec la page live, traitez la page live comme canonique — et dites-nous pour que nous puissions re-extraire et mettre à jour. Les calculateurs connexes (OpenAI, GPT-5, DeepSeek) ont tous été construits en utilisant la même méthodologie curl-verify à la même date.

Comment estimer n'importe quel coût appel API Grok en 5 étapes

1
Estimez vos tokens entrée
Prenez le nombre caractères de votre prompt et divisez par 4, ou son nombre mots et divisez par 0.75. Règle pouce : 1 token ≈ 4 caractères ≈ 0.75 mots anglais. Un prompt système 500-mots + message user 200-mots ≈ 933 tokens entrée. Si vous utilisez recherche X temps réel, ajoutez 5 000-15 000 tokens pour le contenu récupéré.
→ Open the Générateur prompt accordé Grok
2
Estimez vos tokens sortie
Estimez la sortie le même chemin — mots ÷ 0.75. La sortie drive généralement le coût parce que les prix sortie sont 2.5-3x entrée sur chaque modèle Grok-4. Si vous réglez un cap max_tokens, c'est votre plafond pire-cas. Utilisez-le pour budgéter de manière conservatrice.
3
Cherchez le prix entrée et sortie par 1M
De la table ci-dessus (vérifiée juin 2026) : Grok-4.20 $2.00 / $6.00, Grok-4.3 $1.25 / $2.50, Grok-4 Fast $0.20 / $0.50. Vérifiez toujours docs.x.ai/docs/models avant de livrer — les prix Grok bougent plus souvent qu'OpenAI ou Anthropic.
4
Appliquez la formule coût
cost = (input_tokens / 1,000,000) × input_price + (output_tokens / 1,000,000) × output_price. Un appel 1 000-in / 500-out sur Grok-4 Fast = 0.001 × $0.20 + 0.0005 × $0.50 = $0.0002 + $0.00025 = $0.00045.
5
Appliquez cache-hits + le crédit partage données $150/mois
Sur Grok-4.20, l'entrée cachée facture $0.20/1M (90% de remise). Sur n'importe quel modèle, accepter le programme partage données retourne jusqu'à $150/mois en crédits gratuits. Accumulez les deux : une charge travail Grok-4.20 ancrée cache, éligible partage données peut absorber les premiers ~75M tokens entrée cachée par mois à zéro coût marginal.

Digital Dashboard Hub

The prompt patterns above work 10x better when they live in a library you actually own — tunable to your niche, exportable to GPT-5, Claude, Gemini, Perplexity, Midjourney, Llama. Stop pasting across 6 tools.

Try DDH's AI Prompt Builder — free 14 days, no card. →

Related calculators

OpenAI Pricing Calculator →GPT-5.5, 5.4, mini, nano — full per-call cost in one input.Claude Pricing Calculator →Opus 4.8, Sonnet 4.6, Haiku 4.5, Fable 5 — input + output combined.Context Window Comparison →Max input length and price per 1M for every current model.

Related prompt tools

Générateur prompt accordé Grok (prêt 2M-contexte)→Calculateur coût API OpenAI→Calculateur coût GPT-5→Calculateur coût DeepSeek→

Frequently Asked Questions

Combien coûte Grok 4 par 1 million tokens en 2026 ?

En juin 2026, le flagship Grok-4.20 de xAI facture $2.00 par 1M tokens entrée et $6.00 par 1M tokens sortie, avec une fenêtre contexte 2M. Grok-4.3 est $1.25 / $2.50 avec contexte 1M. Grok-4 Fast est $0.20 / $0.50 avec contexte 2M. Les cache-hits Grok-4.20 réduisent l'entrée à $0.20/1M (90% de remise). Source : documentation modèle live xAI à docs.x.ai/docs/models.

Quelle est la différence entre la tarification Grok 4 et Grok 4 Fast ?

Grok-4.20 coûte $2.00 entrée / $6.00 sortie par 1M tokens. Grok-4 Fast coûte $0.20 / $0.50 — exactement 10x moins cher sur l'entrée et la sortie. Les deux ont des fenêtres contexte 2M. Le compromis est la profondeur raisonnement : Grok-4.20 manipule le raisonnement multi-step complexe et la synthèse matériellement mieux ; Grok-4 Fast est optimisé pour la classification, extraction, résumé et Q&A simple où le niveau moins cher tient sur une éval retenue.

Grok est-il moins cher que GPT-5 ?

Dépend du niveau. Grok-4 Fast ($0.20 / $0.50) est moins cher que GPT-5.4-mini ($0.50 / $1.50) au niveau bon marché. Grok-4.20 ($2.00 / $6.00) s'assoit entre GPT-5.4 ($2.50 / $15.00) et GPT-5.5 ($5.00 / $30.00) — moins cher que les deux sur l'entrée, dramatiquement moins cher sur la sortie. Le ratio entrée-sortie plus serré de Grok (3x vs ratio OpenAI 5-6x) le rend particulièrement favorable pour les charges travail sortie-lourde comme la génération long-forme. Décomposition complète au calculateur coût GPT-5.

Grok offre-t-il des crédits API gratuits ?

Oui. xAI exécute un programme partage données qui retourne jusqu'à $150 par mois en crédits API gratuits en échange d'accepter vos prompts et complétions au corpus entraînement. C'est unique parmi les grands fournisseurs LLM — OpenAI, Anthropic, et Google n'offrent pas de rebates développeur continu à cette échelle. Le compromis est la confidentialité données : acceptez uniquement si votre trafic ne contient pas PII, pas de contenu client propriétaire, et rien sous NDA. Inscrivez-vous à x.ai/api.

Quelle est la taille de la fenêtre contexte Grok ?

Grok-4.20 et Grok-4 Fast supportent tous les deux 2 millions tokens de contexte. Grok-4.3 supporte 1 million tokens. C'est environ 10x ce que la famille GPT-5 d'OpenAI offre (200K) et 2x Claude d'Anthropic (1M). Le contexte grand est genuinely utile pour l'analyse document long, l'état agent épais, et le traitement des codebases entières en un appel unique — mais souvenez-vous que remplir ce contexte facture toujours au taux entrée standard.

Comment Grok-4 Fast se compare-t-il à DeepSeek sur le prix ?

Grok-4 Fast est $0.20 entrée / $0.50 sortie. DeepSeek-V3 est $0.14 entrée / $0.28 sortie — environ 30-45% moins cher par token. Mais Grok-4 Fast offre une fenêtre contexte 2M vs contexte 64K de DeepSeek, inclut l'accès recherche X temps réel, et remplace pour le crédit partage données $150/mois (DeepSeek n'a pas de programme crédit gratuit). Pour les charges travail sous ~330k appels/mois avec le crédit partage données appliqué, Grok-4 Fast est effectivement moins cher. Pour le confort régulateur pur basé US, voir Coût DeepSeek pour l'échange complet.

X Premium+ inclut-il l'accès API Grok ?

Non. X Premium+ est un abonnement consommateur $40/mois pour chatter avec Grok dans l'UI x.com plus X sans pub et posts plus longs. Il n'inclut aucun crédit API, n'élève vos limites taux API, n'affecte votre facture API. Pour construire sur Grok programmatiquement, configurez la facturation API indépendamment à x.ai/api. Même identité xAI/X, deux relations de facturation distinctes — la même séparation architecturale qu'OpenAI a entre les abonnements ChatGPT et l'API.

Comment fonctionne le tarification entrée cachée Grok ?

Sur Grok-4.20, les tokens entrée cachée facturent $0.20/1M — une remise 90% versus le taux $2.00 standard. Le cache est opportuniste et basé préfixe : xAI fingerprinte votre préfixe prompt et le cache serveur-side, donc les appels ultérieurs dans la fenêtre cache qui partagent le même préfixe lisent depuis le cache. Mettez les prompts système stables et définitions outils en premier ; mettez le contenu user-spécifique en dernier. Le tarification cache-hit n'est actuellement pas exposé sur Grok-4.3 ou Grok-4 Fast sur la page documentation live.

Grok est bon marché. Les mauvais prompts ne le sont pas.

Que vous soyez sur Grok-4 Fast ou 4.20, un prompt négligent gaspille la fenêtre contexte. Notre Générateur Prompt AI écrit des prompts accordés Grok qui exploitent le contexte 2M sans le gonfler. Essai gratuit 14 jours, pas de carte.

Browse all prompt tools →