Die Kostenformel (merken Sie sich diese eine)
Jeder Grok-API-Aufruf folgt der gleichen Mathematik. Es gibt keine Pro-Aufruf-Gebühr, keine Plattformgebühr, keinen Mindestausgaben. Sie bezahlen für das, was Sie senden, und was Sie zurückbekommen, zum Pro-1M-Token-Satz des Modells:
``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```
Zwei Anpassungen stapeln sich oben drauf, aber nur auf Grok-4.20. Zuerst, **Cache-Hit-Preisgestaltung** senkt den zwischengespeicherten Input-Anteil auf $0.20/1M — ein 90% Rabatt gegenüber dem $2.00 Standard-Satz. Der Cache ist opportunistisch und präfix-basiert: Legen Sie Ihren stabilen System-Prompt, Tool-Definitionen und alle wiederverwendbaren Few-Shot-Beispiele am Anfang des Message-Arrays ab; legen Sie benutzer-spezifischen Inhalt zuletzt ab. Zweitens, das **Datenschutz-Programm** gibt bis zu $150/Monat in kostenlosen Gutschriften zurück, wenn Sie Ihren Traffic in xAI's Trainingssatz aufnehmen (siehe den dedizierten Abschnitt unten). Diese zwei stapeln sich: eine datenschutz-fähige Workload auf zwischengespeicherten Grok-4.20-Präfixen kann für die ersten ~75M zwischengespeicherten Input-Token pro Monat zu null Grenzkosten netto führen.
Echtzeit-X-Such-Ergebnisse, die das Modell abruft, werden als Input-Token berechnet, sobald sie in den Kontext eingehen — es gibt keine separate Such-Gebühr wie Perplexity berechnet. Dies ist einer von Grok's saubersten Pricing-Siegen: Live-Web/X-Erdung ist in den Standard-Token-Satz integriert.