La formule coût (mémorisez celle-ci)
Chaque appel API Grok suit les mêmes calculs. Il n'y a pas de frais par appel, pas de frais plateforme, pas de dépense minimale. Vous payez ce que vous envoyez et ce que vous récupérez, au taux par 1M tokens du modèle :
``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```
Deux ajustements s'ajoutent, mais uniquement sur Grok-4.20. D'abord, **le tarification cache-hit** réduit la portion entrée cachée à $0.20/1M — une remise 90% versus le taux standard $2.00. Le cache est opportuniste et basé préfixe : mettez votre prompt système stable, définitions outils et tous les exemples few-shot réutilisables au début du tableau message ; mettez le contenu user-spécifique en dernier. Deuxièmement, le **programme partage données** retourne jusqu'à $150/mois en crédits gratuits si vous acceptez votre trafic au dataset d'entraînement xAI (voir la section dédiée ci-dessous). Ces deux s'accumulent : une charge de travail éligible partage données exécutant des préfixes Grok-4.20 cachés peut résulter zéro coût marginal pour les premiers ~75M tokens entrée cachée par mois.
Les résultats recherche X temps réel que le modèle récupère sont facturés comme tokens entrée une fois qu'ils entrent en contexte — il n'y a pas de frais recherche séparé comme Perplexity facture. C'est l'une des plus nettes victoires tarifaires de Grok : l'ancrage web/X temps réel est intégré au taux token standard.