Skip to contentNew: Does ChatGPT recommend your brand? Free 60-second AI visibility check →
Von dem DDH Team · Digital Dashboard Hub

Grok 4 API-Kostenrechner (2026)

By The DDH Team at Digital Dashboard HubUpdated

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

14 days, no card. Cancel in 2 clicks.

xAI berechnet Token pro Aufruf auf der Grok-API. Jeder Aufruf hat zwei abgerechnete Ströme: Input-Token (der Prompt, die Systemnachricht, frühere Turns, Tool-Definitionen, alle X-Suchergebnisse, die Sie in den Kontext ziehen) und Output-Token (alles, was das Modell zurückschreibt, einschließlich Tool-Call-Argumente). Ein- und Ausgabe werden mit unterschiedlichen Pro-1M-Raten abgerechnet. In der Grok-4-Familie läuft die Ausgabe 2x bis 3x über dem Input-Preis — ein viel engerer Spread als OpenAI's 5-6x oder Anthropic's 5x Verhältnis, was ändert, wie Sie optimieren.

Ab Juni 2026 erstrecken sich Grok's Preise über eine 30x Spanne: Grok-4 Fast bei $0.20 Input / $0.50 Output pro 1M Token bis zu Grok-4.20 bei $2.00 / $6.00. Zwei Kostenhebel sind wirklich wichtig: Grok-4.20 Cache-Hits werden mit 90% Rabatt berechnet ($0.20/1M Input), und xAI's Datenschutz-Programm gibt bis zu **$150/Monat in kostenlosen Gutschriften** zurück im Austausch dafür, dass xAI auf Ihren Prompts und Completions trainiert. Kein anderer großer LLM-Anbieter bietet ein kostenloses Gutschrift-Programm in diesem Maßstab.

Grok's zwei einzigartige Verkaufsargumente: (1) **Echtzeit-X-Datenzugang** — das einzige LLM mit Live-, nativem Twitter/X-Integration für aktuelle Ereignisse, Stimmung und Brechendes; und (2) **1-2M Token Kontextfenster** über die Familie hinweg, das doppelte von OpenAI und Anthropic bei vergleichbaren Preispunkten. Der Handel ist Ökosystem-Reife: Tooling, SDKs und Third-Party-Integrationen liegen hinter den größeren Spielern zurück.

Unten: die vollständige Juni-2026-Preistabelle überprüft gegen xAI's Live-Dokumentation, die kanonische Kostenformel, vier Rechenbeispiele (1k, 100k, 1M und eine 5-turn Agent-Loop), die $150/Monat Datenschutz-Lösung in einfachem Englisch erklärt, wann Echtzeit-X-Zugang wirklich wichtig ist, und die FAQ, die alles erfasst, worüber Teams stolpern. Speichern Sie dies als Lesezeichen — und entwerfen Sie schnell Prompts, die Grok's massives Kontextfenster nicht verschwenden mit unserem kostenlosen ChatGPT-Prompt-Generator. Verwandte Rechner: OpenAI API-Kosten · GPT-5-Kosten · DeepSeek-Kosten.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card.

Grok API-Preis pro 1M Token — Juni 2026

Feature
Input ($/1M)
Output ($/1M)
Kontextfenster
Grok-4.20$2.00$6.002M Token
Grok-4.3$1.25$2.501M Token
Grok-4 Fast$0.20$0.502M Token

Quelle, ab Juni 2026: xAI-Modell-Dokumentation (https://docs.x.ai/docs/models) und x.ai/api. Grok-4.20 Cache-Hit-Preisgestaltung: 90% Rabatt auf Standard-Input ($0.20/1M auf zwischengespeichertem Teil). Grok-4.3 und Grok-4 Fast geben derzeit keine Cache-Hit-Preisgestaltung auf der Live-Dokumentationsseite frei. Datenschutz-Programm: bis zu $150/Monat in kostenlosen API-Gutschriften im Austausch dafür, dass Sie Ihren Traffic in den Trainingssatz aufnehmen (https://x.ai/api). X Premium+ ist ein $40/Monat Consumer-Chat-Abonnement auf x.com — separate Abrechnungsbeziehung, umfasst keine API-Gutschrift. Echtzeit-X-Datensuche ist in der Standard-Token-Rechnung auf allen drei Modellen enthalten.

Die Kostenformel (merken Sie sich diese eine)

Jeder Grok-API-Aufruf folgt der gleichen Mathematik. Es gibt keine Pro-Aufruf-Gebühr, keine Plattformgebühr, keinen Mindestausgaben. Sie bezahlen für das, was Sie senden, und was Sie zurückbekommen, zum Pro-1M-Token-Satz des Modells:

``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```

Zwei Anpassungen stapeln sich oben drauf, aber nur auf Grok-4.20. Zuerst, **Cache-Hit-Preisgestaltung** senkt den zwischengespeicherten Input-Anteil auf $0.20/1M — ein 90% Rabatt gegenüber dem $2.00 Standard-Satz. Der Cache ist opportunistisch und präfix-basiert: Legen Sie Ihren stabilen System-Prompt, Tool-Definitionen und alle wiederverwendbaren Few-Shot-Beispiele am Anfang des Message-Arrays ab; legen Sie benutzer-spezifischen Inhalt zuletzt ab. Zweitens, das **Datenschutz-Programm** gibt bis zu $150/Monat in kostenlosen Gutschriften zurück, wenn Sie Ihren Traffic in xAI's Trainingssatz aufnehmen (siehe den dedizierten Abschnitt unten). Diese zwei stapeln sich: eine datenschutz-fähige Workload auf zwischengespeicherten Grok-4.20-Präfixen kann für die ersten ~75M zwischengespeicherten Input-Token pro Monat zu null Grenzkosten netto führen.

Echtzeit-X-Such-Ergebnisse, die das Modell abruft, werden als Input-Token berechnet, sobald sie in den Kontext eingehen — es gibt keine separate Such-Gebühr wie Perplexity berechnet. Dies ist einer von Grok's saubersten Pricing-Siegen: Live-Web/X-Erdung ist in den Standard-Token-Satz integriert.


Rechenbeispiel 1: ein einzelner 1.000-in / 500-out Aufruf

Nehmen Sie einen repräsentativen Aufruf — einen 1.000-Token-Prompt, der eine 500-Token-Antwort zurückgibt, ungefähr eine 750-Wort-Zusammenfassung rein und eine 375-Wort-Antwort raus. Zu Standard-Raten, landet die Pro-Aufruf-Kosten als:

Grok-4.20: (1000 / 1,000,000) × $2.00 + (500 / 1,000,000) × $6.00 = $0.002 + $0.003 = **$0.005 pro Aufruf**.

Grok-4.3: 0.001 × $1.25 + 0.0005 × $2.50 = $0.00125 + $0.00125 = **$0.0025 pro Aufruf**.

Grok-4 Fast: 0.001 × $0.20 + 0.0005 × $0.50 = $0.0002 + $0.00025 = **$0.00045 pro Aufruf**.

Beachten Sie die 11x Spanne zwischen Grok-4 Fast ($0.00045) und Grok-4.20 ($0.005) auf identischen Token-Volumina — eine engere Spanne als die 145x Spanne über OpenAI's GPT-5-Familie. Die Preisstufen sind näher beieinander, weil die Fähigkeitslücken kleiner sind; wählen Sie die billigste Stufe, die Ihre Qualitätsstandards erfüllt.


Rechenbeispiel 2: 100.000 Aufrufe pro Monat

Multiplizieren Sie die Pro-Aufruf-Zahlen mit 100.000. Dies ist eine realistische Mid-Size-Workload — tägliche Klassifizierung auf 3.000+ Datensätzen, wöchentliche Summarisierungs-Läufe, eine moderate Agent-Loop:

Grok-4.20: **$500/Monat**. Grok-4.3: **$250/Monat**. Grok-4 Fast: **$45/Monat**.

Nun wenden Sie Cache-Hits auf die Grok-4.20-Reihe an. Wenn 800 von jedem 1.000 Input-Token ein stabiles System-Präfix sind, das 80% der Zeit Cache-Hit hat, fallen diese 640 zwischengespeicherten Token von $2.00/1M auf $0.20/1M — sparen 90% auf 64% des Input. Das reduziert die Input-Rechnung von $200 → $85, nimmt den Gesamtwert von $500 → $385 (etwa 23% Rabatt).

Nun wenden Sie Datenschutz an. Wenn Ihr Traffic berechtigt ist (keine PII, kein regulierter Inhalt), absorbiert die $150/Monat Gutschrift vollständig $385 → $235 netto. Auf Grok-4 Fast ist die gleiche $45/Monat Workload vollständig durch die Datenschutz-Gutschrift abgedeckt — Sie bezahlen $0. Dies ist die billigste Production-Stufe in der Industrie, sobald Datenschutz am Spiel ist. Erstellen Sie Cache-verankerte Prompts kostenlos mit unserem Code-Prompt-Builder.


Rechenbeispiel 3: Skalierung auf 1.000.000 Aufrufe

Skalieren Sie nun auf 1M Aufrufe — eine vollständige Production-Workload (z.B. Pro-Benutzer-Analyse über eine SaaS-App mit 30.000 aktiven Benutzern, die jeweils 33 Aufrufe/Monat durchführen):

Grok-4.20: **$5.000/Monat**. Grok-4.3: **$2.500/Monat**. Grok-4 Fast: **$450/Monat**.

Auf Grok-4.20 senkt das gleiche 80%-Cache-Hit-Muster aus Beispiel 2 die Rechnung auf ungefähr $3.850 — eine $1.150 Einsparung. Die Datenschutz-Gutschrift zieht weitere $150 ab und landet bei $3.700.

Auf Grok-4 Fast bei $450/Monat deckt die $150 Datenschutz-Gutschrift 33% der Rechnung — $300 netto bezahlen für 1M Aufrufe ist ungefähr $0.0003 pro Aufruf. Das ist wettbewerbsfähig mit DeepSeek-V3 ($0.14/$0.28), wenn Sie DeepSeek's Mangel an einem kostenlosen Gutschrift-Programm berücksichtigen. Die kanonische Hebel-Reihenfolge zum Senken von Grok-Kosten: (1) wählen Sie Grok-4 Fast für alles, das keine Flagship-Reasoning braucht, (2) strukturieren Sie Prompts Präfix-zuerst, um Cache-Hits auf Grok-4.20 zu erfassen, (3) entscheiden Sie sich für Datenschutz, wenn Ihr Traffic berechtigt ist, (4) begrenzen Sie die Output-Länge — Output ist 2.5-3x Input-Preis über die Familie.


Rechenbeispiel 4: eine echte Production Agent-Loop auf Grok-4.20

Eine Agent-Loop ist die Worst-Case-Kostenform — das Modell nimmt mehrere Turns pro Benutzer-Query, spielt das volle Transcript jede Turn ab. Nehmen Sie eine typische 5-Turn-Loop mit einem 2.000-Token System-Prompt + Tools, wachsender Kontext 800 Token pro Turn (weil Grok's 2M Kontext viel fettere Zwischenzustände als kleinere Kontext-Modelle erlaubt):

Turn 1: 2.800 in / 200 out. Turn 2: 3.000 in / 200 out. Turn 3: 3.200 in / 200 out. Turn 4: 3.400 in / 200 out. Turn 5: 3.600 in / 200 out. Gesamt: 16.000 Input + 1.000 Output. Auf Grok-4.20: 0.016 × $2.00 + 0.001 × $6.00 = $0.032 + $0.006 = **$0.038 pro Query** — etwa 7.6x ein einzelner Aufruf.

Nun wenden Sie Caching an. Das 2.000-Token System + Tools-Präfix ist über alle 5 Turns stabil. Mit 80% Cache-Hits auf diesen 2.000 Token × 5 Turns = 8.000 zwischengespeicherte Input-Token, die von $2.00/1M auf $0.20/1M fallen: $0.016 → $0.0016, sparen $0.0144 pro Query (38% von der Rechnung). Für 100k Queries/Monat: von $3.800 → $2.360. Die gleiche Workload auf Grok-4 Fast (kein Cache freigelegt, aber billigere Baseline) läuft $0.0076 pro Query → $760/Monat beim gleichen Volumen. Für Agent-Workloads ist Grok-4 Fast normalerweise die richtige Antwort, außer Sie brauchen die Reasoning-Tiefe von 4.20.

Der hochgradig wirksame Schritt auf Grok ist der gleiche wie auf jedem anderen LLM: Cache-Struktur schlägt Modellwahl. Ein Cache-verankerter Prompt auf Grok-4.20 kann näher an den Kosten zu Grok-4 Fast als zu Standard-Rate Grok-4.20 landen.


Das Datenschutz-Gratisprogramm — wie Sie $150/Monat Grok kostenlos bekommen

xAI führt ein Entwickler-Programm aus, das bis zu **$150 pro Monat in kostenlosen API-Gutschriften** im Austausch für die Entscheidung, Ihren API-Traffic in das Trainings-Corpus aufzunehmen, zurückgibt. Kein anderer großer LLM-Anbieter bietet ein kostenloses Gutschrift-Programm in diesem Maßstab — OpenAI's kostenloses Tier ist vor Jahren begrenzt worden, Anthropic hat keines, Google's Gemini-Gutschriften sind an GCP-Onboarding-Promotionen gebunden, nicht an laufende Entwickler-Rückerstattungen.

**Der Handel in einfachem Englisch**: Wenn Sie sich entscheiden, darf xAI Ihre Prompts und Completions verwenden, um zukünftige Versionen von Grok zu trainieren. Die Daten werden bei der Aufnahme de-identifiziert, aber jeder mit datenschutz-empfindlichen Workloads (Kunden-PII, regulierter Inhalt, interne IP, alles unter NDA, Gesundheitswesen, juristische Dokumente, finanzielle Beratung mit persönlich identifizierbaren Parteien) sollte sich nicht anmelden. Die Gutschrift ist das Daten-Leckage-Risiko nicht wert.

**Wer sollte sich anmelden**: Indie-Entwickler, Hobby-Betreiber, öffentliche Inhalts-Workloads (Zusammenfassung von Nachrichten, Analyse öffentlicher X-Posts, Erzeugung von Marketing-Copy, Demo-Erstellung), Early-Stage-Prototypen, wo Sie immer noch das Produkt validieren. Jeder, dessen Prompts sich nicht stören würde, wenn sie Wort für Wort in einer zukünftigen Grok-Antwort auftauchen würden, ist ein guter Kandidat.

**Wer sollte sich nicht anmelden**: SaaS-Unternehmen, deren Kundendaten durch Prompts fließen, regulierte Branchen (Gesundheitswesen/Finanzen/Jura), B2B-Tools, die propritetäre Kundeninformationen handhaben, alles, wo der Prompt-Inhalt als vertrauliche IP kommerziellen Wert hat. Die $150/Monat ist das vertragliche oder regulatorische Expositions-Risiko nicht wert.

**Wie Sie sich anmelden**: Entscheiden Sie sich durch die xAI-Konsole bei x.ai/api unter Entwickler-Einstellungen an. Die Gutschrift wird automatisch auf Ihre abrechenbare Nutzung angewendet; Sie bekommen kein Bargeld, Sie bekommen bis zu $150 API-Nutzung, die jeden Monat absorbiert wird. Ungenutzte Gutschrift wird nicht übertragen. Die genauen Bedingungen (Berechtigung, Datenbehandlung, Opt-out) sind bei x.ai/api dokumentiert — überprüfen Sie diese vor der Anmeldung.


Wenn Grok's Echtzeit-X-Zugang wichtig ist (und wenn er irrelevant ist)

Grok ist das einzige große LLM mit nativem, Echtzeit-Zugang zum X (Twitter) Firehose. Jeder andere Anbieter, der "Web-Suche" anbietet — OpenAI, Anthropic über Web-Tools, Gemini, Perplexity — verwendet Drittanbieter-Such-APIs, die X's öffentliche Seiten mit erheblicher Verzögerung indizieren (Minuten zu Stunden, manchmal mehr). Grok fragt X's internen Index direkt ab, mit Sub-Minuten-Frische bei Trending-Inhalten.

**Use Cases, wo dies wirklich wert ist, Grok's Premium über ein billigeres Modell zu bezahlen**: Live-Stimmungs-Analyse bei Breaking News (Tesla-Verdienste-Reaktion innerhalb von 10 Minuten nach dem Ende des Anrufs), Marken-Reputation-Überwachung während einer Krise, Echtzeit-Politik-Ereignis-Analyse, Sport-/Unterhaltungs-Kommentar-Aggregation, Überwachung von Entwickler-Stimmung auf einen Produkt-Launch, Verfolgung, wie sich ein Meme ausbreitet. Alles, wo "Was sagt X über Y *gerade jetzt*" die Frage ist.

**Use Cases, wo es irrelevant ist**: Code-Erzeugung, Dokumenten-Zusammenfassung, strukturierte Extraktion, Klassifikation, Kundenunterstützung, eingebettete Autocomplete, Agent-Workflows, die auf internen Daten arbeiten, RAG über Ihrem eigenen Corpus. Für diese ist Echtzeit-X-Zugang Overhead, den Sie nichts extra bezahlen, aber keinen Wert von bekommen — und Grok-4 Fast bei $0.20/$0.50 ist allein auf Preis wettbewerbsfähig, Echtzeit-Bonus oder nicht.

**Der ehrliche Trade-off**: Echtzeit-X-Daten sind genuinely einzigartig zu Grok, aber es ist ein schmaler Burggraben. Wenn Ihr Produkt es braucht, kein anderes Modell kann ersetzen. Wenn Ihr Produkt es nicht braucht, wählen Sie Grok auf Preis/Kontextfenster, nicht die X-Integration. Seien Sie ehrlich, in welchen Bucket Sie fallen, bevor Sie um ihn architekturieren.

**Kosten von Such-Ergebnissen**: Wenn Grok X-Inhalt in den Kontext abruft, werden diese Token zur Standard-Input-Rate berechnet. Eine Such-Query, die 20 X-Posts durchschnittlich 500 Token ziehen = 10.000 Input-Token zum Prompt hinzugefügt. Auf Grok-4.20 das sind $0.02 pro Such-verstärkter Aufruf oben auf Ihrem Base-Prompt. Planen Sie dies in Ihrem Token-Budget — Such-verstärkte Grok-Aufrufe sind 5-10x das Input-Volumen eines Vanilla-Aufrufs.


Grok-4 Fast vs GPT-5.4-mini vs DeepSeek-V3: der Billig-Modell-Showdown

Grok-4 Fast sitzt zwischen OpenAI und DeepSeek auf der Billig-Tier-Kurve. Seite-an-Seite auf Standard-Raten (Juni 2026):

**Grok-4 Fast**: $0.20 Input / $0.50 Output, 2M Kontext, Echtzeit-X-Zugang, $150/Monat Gutschrift verfügbar. **GPT-5.4-mini**: $0.50 Input / $1.50 Output, 200K Kontext, reifes Ökosystem, Batch + Cache-Rabatte. **DeepSeek-V3**: $0.14 Input / $0.28 Output, 64K Kontext, billigste Baseline, keine kostenlosen Gutschriften, China-basierte Infrastruktur. Siehe vollständige Aufschlüsselungen bei GPT-5-Kosten und DeepSeek-Kosten.

**Auf einem 1.000-in / 500-out Aufruf**: Grok-4 Fast $0.00045, GPT-5.4-mini $0.00125, DeepSeek-V3 $0.00028. Pro Aufruf ist DeepSeek-V3 am billigsten. Aber: Rechnen Sie die Datenschutz-Gutschrift auf Grok ein und Grok-4 Fast wird effektiv kostenlos für die ersten ~330k Aufrufe/Monat, Schlag DeepSeek für jede Workload unter diesem Schwellenwert.

**Wo jede gewinnt**: DeepSeek-V3 für reinen Preis-pro-Token bei Skalierung, wo Sie nicht für Grok-Gutschriften berechtigt sind. GPT-5.4-mini für Ökosystem-Reife, Tooling, Batch-API und US-basierte Inferenz (regulatorischer Komfort). Grok-4 Fast für 2M Kontext-Fenster, Echtzeit-X-Zugang oder jede Workload, die für die $150/Monat Datenschutz-Gutschrift berechtigt ist. Die drei sind ungefähr auf Fähigkeit für die meisten Production-Klassifikations-/Zusammenfassungs-/Extraktions-Tasks substituierbar — wählen Sie auf Infrastruktur-Vertrauen, Kontextfenster oder einzigartige Datenbedarf.


Grok die API vs X Premium+ das Consumer-Abonnement: verwechseln Sie sie nicht

xAI führt zwei völlig separate Abrechnungsbeziehungen, und sie werden ständig verwechselt. Die **Grok-API** (berechnet pro-Token in der Tabelle oben, zugegriffen über x.ai/api und docs.x.ai) ist für Entwickler, die Anwendungen bauen. Das **X Premium+ Consumer-Abonnement** ($40/Monat auf x.com/premium) ist für End-Benutzer, die mit Grok in der X.com-UI chatten, und umfasst auch werbefreies X, längere Post-Grenzen und andere Consumer-Features. Das gleiche Modell untendrunter; vollständig unterschiedliche Abrechnung.

**Was dies für Builder bedeutet**: ein $40/Monat X Premium+ Abonnement umfasst **nicht** API-Gutschrift. Wenn Sie auf Grok-4.20 bauen, richten Sie API-Abrechnung separat bei x.ai/api ein. Das Abonnement von X Premium+ tut nichts für Ihre API-Rate-Grenzen, Kontingent oder Rechnung.

**Was es für End-Benutzer bedeutet**: ein API-Schlüssel gibt Ihnen nicht Premium+-Features auf x.com. Wenn Sie die Consumer-Chat-UI, werbefreies Feed und längere Posts wünschen, das ist ein separates $40/Monat Abonnement. Die zwei Beziehungen verwenden die gleiche xAI/X-Identität, aber verfolgen Nutzung, Zahlungsmethoden und Abrechnungs-Grenzen unabhängig.

**Warum diese Verwirrung mit Grok häufiger ist als bei anderen Anbietern**: Weil xAI und X Branding teilen (gleiche Muttergesellschaft), Benutzer nehmen an, ein Abonnement kauft beide. Das tut es nicht. Die gleiche architektonische Trennung, die OpenAI zwischen ChatGPT-Abonnements und der API hat, wird hier angewendet — das gleiche Logo, verschiedene Produkte, verschiedene Rechnungen.


Häufige Fehler, die die Grok-Rechnung aufblähen

**Fehler 1: Standard-Grok-4.20 für alles verwenden.** Die meisten Production-Traffic ist Klassifikation, Extraktion, Zusammenfassung — Grok-4 Fast handhabt diese bei 1/10 des Preises und das 2M Kontext ist das gleiche. Testen Sie, bevor Sie annehmen, dass der Flagship notwendig ist.

**Fehler 2: riesige System-Prompts, die nie Cache auf Grok-4.20 treffen.** Wenn Ihr System-Prompt alles interpoliert, das zwischen Aufrufen ändert (Zeitstempel, Benutzer-IDs, Session-State), der Cache trifft nie. Strukturieren Sie um, so dass der System-Prompt statisch ist und der dynamische Kontext in Benutzer-Nachrichten lebt.

**Fehler 3: nicht begrenzen der Ausgabe.** Output ist 2.5-3x Input-Preis über die Grok-Familie. Eine 200-Token-Antwort, die 1.200 Token zurückgibt, weil Sie vergessen haben, max_tokens zu setzen, kostet 6x. Auf Grok-4.20, das sind $0.0072 pro Aufruf vs $0.0012. Begrenzen Sie die Output-Länge überall, wo Sie die Verbrauchs-Form kontrollieren.

**Fehler 4: Echtzeit-X-Suche verwenden, wenn Sie sie nicht brauchen.** Jeder Such-verstärkter Aufruf fügt 5.000-15.000 Input-Token hinzu. Wenn Ihre Task die Live-X-Daten nicht wirklich braucht, deaktivieren Sie das Tool — Sie werden das Input-Volumen um 5-10x auf diesen Aufrufen schneiden.

**Fehler 5: das 2M-Kontext-Fenster füllen, weil Sie können.** Grok's riesiger Kontext ist ein Feature, keine kostenlose Ressource. 1M Input-Token auf Grok-4.20 kostet $2.00 pro Aufruf. Verwenden Sie das Kontext-Fenster für das, wozu es entworfen wurde (lange Dokumente, fetter Agent-State) — nicht als Ersatz für Retrieval oder Zusammenfassung.

**Fehler 6: nicht anmelden zum Datenschutz, wenn Ihre Workload berechtigt ist.** Wenn Ihr Traffic genuinely berechtigt ist (keine PII, kein propritetärer Kundeninhalt), lassen Sie bis zu $1.800/Jahr auf dem Tisch, indem Sie sich nicht anmelden.


Sourcing-Methodologie und wie Sie diese Zahlen aktuell halten

Jeder Preis in diesem Leitfaden kommt von xAI's Live-Modell-Dokumentation bei docs.x.ai/docs/models und der Entwickler-Preisseite bei x.ai/api, abgerufen am 2026-06-20 und verifiziert gegen drei unabhängig bestätigende Quellen (Community-Preis-Aggregatoren, aktuelle Integrations-Commits in populären Open-Source-Projekten, die xai-sdk referenzieren, und xAI's Entwickler-Changelog). Wenn eine Zahl nicht gegen die offizielle Seite verifiziert werden konnte, wurde sie ausgelassen — wir würden lieber einen Leitfaden mit fehlenden Reihen versenden als einen Leitfaden mit einer fabrizierten Zahl.

xAI aktualisiert die Preisgestaltung aggressiver als die älteren Anbieter — Grok-4.20 sah eine 30% Preisreduzierung in Q4 2025 und Grok-4 Fast startete bei einem Preis 60% unter dem initialen Grok-4-Release. Erwarten Sie 4-6 Preisbewegungen pro Jahr, fast alle abwärts, während die Familie reift. Die größte praktische Gefahr: annehmen, dass ein Preis, den Sie in Q1 sourced haben, immer noch in Q3 hält.

**Wie überprüfen Sie, bevor Sie budgetieren**: öffnen Sie docs.x.ai/docs/models in einem Incognito-Fenster, kopieren Sie die Zahlen für Ihre Zielmodelle in eine Kalkulationstabelle und vergleichen Sie gegen diesen Leitfaden. Wenn sie übereinstimmen, ist dieser Leitfaden für Ihre Zwecke aktuell. Wenn nicht, vertrauen Sie der Live-Seite. Re-verifizieren Sie vierteljährlich, wenn Ihre monatliche Grok-Rechnung über $500 liegt — bei diesem Volumen verschiebt eine einzelne Preisbewegung das Budget wesentlich.

**Warum wir einige Reihen ausgelassen haben**: Cache-Hit-Preisgestaltung für Grok-4.3 und Grok-4 Fast ist derzeit nicht auf der verifizierten Live-Dokumentseite freigelegt, obwohl Community-Forum-Posts manchmal spezifische Cache-Raten zitieren. Eher als möglicherweise-veraltete Zahlen zu verbreiten, lassen wir sie hier aus. Wir haben auch Enterprise/Volumen-Rabatt-Tiers ausgelassen, die Fall-für-Fall verhandelt werden und nicht öffentlich aufgelistet sind.

**Reproduzierbare Methodologie**: jede Reihe in der Tabelle oben hat eine Zitation; jedes Rechenbeispiel nutzt diese Reihen; jede FAQ-Antwort reflektiert sie. Wenn Sie einen Diskrepanz mit der Live-Seite finden, behandeln Sie die Live-Seite als kanonisch — und sagen Sie uns, so dass wir neu-abrufen und aktualisieren können. Die Begleit-Rechner (OpenAI, GPT-5, DeepSeek) wurden alle mit der gleichen curl-Verifizierungs-Methodologie am gleichen Datum gebaut.

Wie Sie beliebige Grok-API-Anrufs-Kosten in 5 Schritten schätzen

  1. 1

    Schätzen Sie Ihre Input-Token

    Nehmen Sie die Zeichenanzahl Ihres Prompts und teilen Sie durch 4, oder die Wortanzahl und teilen Sie durch 0.75. Faustregel: 1 Token ≈ 4 Zeichen ≈ 0.75 englische Worte. Ein 500-Wort System-Prompt + 200-Wort Benutzer-Nachricht ≈ 933 Input-Token. Wenn Sie Echtzeit-X-Suche verwenden, addieren Sie 5.000-15.000 Token für den abgerufenen Inhalt.

    → Open the Grok-optimierter Prompt-Generator
  2. 2

    Schätzen Sie Ihre Output-Token

    Schätzen Sie die Ausgabe auf die gleiche Weise — Worte ÷ 0.75. Output treibt normalerweise Kosten an, da Output-Preise 2.5-3x Input auf jedem Grok-4-Modell sind. Wenn Sie ein max_tokens-Limit setzen, das ist Ihre Worst-Case-Decke. Verwenden Sie es, um konservativ zu budgetieren.

  3. 3

    Schlagen Sie den Input- und Output-Preis pro 1M nach

    Aus der Tabelle oben (verifiziert Juni 2026): Grok-4.20 $2.00 / $6.00, Grok-4.3 $1.25 / $2.50, Grok-4 Fast $0.20 / $0.50. Überprüfen Sie immer docs.x.ai/docs/models, bevor Sie versenden — Grok's Preise bewegen sich häufiger als OpenAI's oder Anthropic's.

  4. 4

    Wenden Sie die Kostenformel an

    cost = (input_tokens / 1,000,000) × input_price + (output_tokens / 1,000,000) × output_price. Ein 1.000-in / 500-out Aufruf auf Grok-4 Fast = 0.001 × $0.20 + 0.0005 × $0.50 = $0.0002 + $0.00025 = $0.00045.

  5. 5

    Wenden Sie Cache-Hits + die $150/Monat Datenschutz-Gutschrift an

    Auf Grok-4.20, zwischengespeicherter Input wird bei $0.20/1M berechnet (90% Rabatt). Auf jedem Modell, entscheiden Sie sich für das Datenschutz-Programm gibt bis zu $150/Monat in kostenlosen Gutschriften zurück. Stapeln Sie beide: eine Cache-verankerte, Datenschutz-fähige Grok-4.20-Workload kann die ersten ~75M zwischengespeicherten Input-Token pro Monat zu null Grenzkosten absorbieren.

Frequently Asked Questions

Wie viel kostet Grok 4 pro 1 Million Token im Jahr 2026?

Ab Juni 2026 berechnet xAI's Flagship Grok-4.20 $2.00 pro 1M Input-Token und $6.00 pro 1M Output-Token, mit einem 2M-Token-Kontextfenster. Grok-4.3 ist $1.25 / $2.50 mit 1M Kontext. Grok-4 Fast ist $0.20 / $0.50 mit 2M Kontext. Grok-4.20 Cache-Hits senken Input auf $0.20/1M (90% Rabatt). Quelle: xAI's Live-Modell-Dokumentation bei docs.x.ai/docs/models.

Was ist der Unterschied zwischen Grok 4 und Grok 4 Fast Preisgestaltung?

Grok-4.20 kostet $2.00 Input / $6.00 Output pro 1M Token. Grok-4 Fast kostet $0.20 / $0.50 — genau 10x billiger auf beiden Input und Output. Beide haben 2M Kontextfenster. Der Trade-off ist Reasoning-Tiefe: Grok-4.20 handhabt komplexe Multi-Schritt-Reasoning und Synthese wesentlich besser; Grok-4 Fast ist für Klassifikation, Extraktion, Zusammenfassung und einfache Q&A optimiert, wo die billigere Stufe auf einer gehaltenen Eval durchhält.

Ist Grok billiger als GPT-5?

Kommt auf die Stufe an. Grok-4 Fast ($0.20 / $0.50) ist billiger als GPT-5.4-mini ($0.50 / $1.50) am billigen Ende. Grok-4.20 ($2.00 / $6.00) sitzt zwischen GPT-5.4 ($2.50 / $15.00) und GPT-5.5 ($5.00 / $30.00) — billiger auf Input, dramatisch billiger auf Output. Grok's engeres Input-zu-Output-Verhältnis (3x vs OpenAI's 5-6x) macht es besonders günstig für Output-schwere Workloads wie Langform-Erzeugung. Vollständige Aufschlüsselung bei GPT-5-Kosten-Rechner.

Bietet Grok kostenlose API-Gutschriften?

Ja. xAI führt ein Datenschutz-Programm aus, das bis zu $150 pro Monat in kostenlosen API-Gutschriften im Austausch für die Entscheidung, Ihre Prompts und Completions in das Trainings-Corpus aufzunehmen, zurückgibt. Dies ist einzigartig unter großen LLM-Anbietern — OpenAI, Anthropic und Google bieten keine laufenden Entwickler-Rückerstattungen in diesem Maßstab. Der Trade ist Datenschutz: entscheiden Sie sich nur an, wenn Ihr Traffic keine PII, keinen propritetären Kundeninhalt und nichts unter NDA enthält. Melden Sie sich bei x.ai/api an.

Wie groß ist Grok's Kontextfenster?

Grok-4.20 und Grok-4 Fast unterstützen beide 2 Millionen Token Kontext. Grok-4.3 unterstützt 1 Million Token. Dies ist ungefähr 10x das, was OpenAI's GPT-5-Familie anbietet (200K) und 2x Anthropic's Claude (1M). Der große Kontext ist genuinely nützlich für lange Dokument-Analyse, fetter Agent-State und Verarbeitung ganzer Codebases in einem einzelnen Anruf — aber denken Sie daran, dass das Füllen dieses Kontexts immer noch zur Standard-Input-Rate berechnet wird.

Wie vergleicht sich Grok-4 Fast mit DeepSeek auf Preis?

Grok-4 Fast ist $0.20 Input / $0.50 Output. DeepSeek-V3 ist $0.14 Input / $0.28 Output — etwa 30-45% billiger pro Token. Aber Grok-4 Fast bietet ein 2M-Kontextfenster vs DeepSeek's 64K, umfasst Echtzeit-X-Such-Zugang und qualifiziert sich für die $150/Monat Datenschutz-Gutschrift (DeepSeek hat kein Gratiskreditprogramm). Für Workloads unter ~330k Aufrufen/Monat mit der angewendeten Datenschutz-Gutschrift ist Grok-4 Fast effektiv billiger. Für reinen regulatorischen US-basierten Komfort, siehe DeepSeek-Kosten für den vollständigen Trade-off.

Umfasst X Premium+ Grok-API-Zugang?

Nein. X Premium+ ist ein $40/Monat Consumer-Abonnement zum Chatten mit Grok in der x.com-UI plus werbefreies X und längere Posts. Es umfasst keine API-Gutschrift, erhöht Ihre API-Rate-Grenzen oder beeinflusst Ihre API-Rechnung. Um programmisch auf Grok zu bauen, richten Sie API-Abrechnung separat bei x.ai/api ein. Gleiche xAI/X-Identität, zwei unterschiedliche Abrechnungsbeziehungen — gleiche architektonische Trennung, die OpenAI zwischen ChatGPT-Abonnements und der API hat.

Wie funktioniert Grok cached-input Preisgestaltung?

Auf Grok-4.20 werden zwischengespeicherte Input-Token bei $0.20/1M berechnet — ein 90% Rabatt gegenüber dem $2.00 Standard-Satz. Der Cache ist opportunistisch und präfix-basiert: xAI fingerabdruck Ihren Prompt-Präfix und zwischenspeichert ihn Server-seitig, so dass nachfolgende Aufrufe in dem Cache-Fenster, die den gleichen Präfix teilen, aus dem Cache lesen. Legen Sie stabile System-Prompts und Tool-Definitionen zuerst; legen Sie benutzer-spezifischen Inhalt zuletzt. Cache-Hit-Preisgestaltung ist derzeit nicht auf Grok-4.3 oder Grok-4 Fast auf der Live-Dokumentseite freigelegt.

Grok ist billig. Schlechte Prompts nicht.

Egal ob Sie auf Grok-4 Fast oder 4.20 sind, ein schlampiger Prompt verschwendet das Kontextfenster. Unser AI Prompt Generator schreibt Grok-optimierte Prompts, die das 2M-Kontext-Fenster ausnutzen, ohne es aufzublähen. 14-Tage kostenlose Testphase, keine Karte.

Browse all prompt tools →

Kostenlose Prompt-Bibliothek — 100+ Copy-Paste-Prompts

Wöchentlich handverlesene Prompts für ChatGPT, Claude, Midjourney und DALL·E. Kein Spam. Jederzeit abmeldbar.

Kein Spam. Eine E-Mail pro Woche. Bereits ~12.000 Prompt-Autoren angemeldet.