Skip to contentNew: Does ChatGPT recommend your brand? Free 60-second AI visibility check →
Von The DDH Team · Digital Dashboard Hub

KI-Prompt-Kostenrechner: Schätzen Sie Token-Kosten über Modelle hinweg (2026)

By DDH Research Team at Digital Dashboard HubUpdated

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

14 days, no card. Cancel in 2 clicks.

Um die Kosten eines KI-Prompts zu schätzen, zählen Sie die Tokens ein und aus und multiplizieren Sie jeweils mit dem Preis des Modells pro Token: Kosten = (Input-Tokens ÷ 1.000.000 × Input-Preis) + (Output-Tokens ÷ 1.000.000 × Output-Preis). Eine nützliche Faustregel ist, dass 1 Token ungefähr 4 Zeichen oder etwa 0,75 Wörter Englisch entspricht, sodass 1.000 Wörter etwa 1.333 Tokens sind.

Preise werden pro Million Tokens angegeben und unterscheiden sich bei Ein- und Ausgabe, wobei Ausgabe üblicherweise mehrfach mehr kostet. Unten finden Sie die Formel, Arbeitsbeispiele zu echten aktuellen Preisen, eine vollständige anbietübergreifende Tabelle sowie die Caching- und Batch-Rabatte, die Rechnungen erheblich senken können. Preise ändern sich häufig — bestätigen Sie diese immer auf den in der Tabelle verlinkten Live-Preisseiten.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card.

API-Preise pro 1M Tokens (Input / Output) — Stand Juni 2026

Feature
Input ($/1M)
Output ($/1M)
OpenAI gpt-5.5$5.00$30.00
OpenAI gpt-5.5-pro$30.00$180.00
OpenAI gpt-5.4$2.50$15.00
OpenAI gpt-5.4-mini$0.75$4.50
OpenAI gpt-5.4-nano$0.20$1.25
Anthropic Claude Opus 4.8$5.00$25.00
Anthropic Claude Sonnet 4.6$3.00$15.00
Anthropic Claude Haiku 4.5$1.00$5.00
Anthropic Claude Fable 5$10.00$50.00
Google Gemini 3.5 Flash$1.50$9.00
Google Gemini 3.1 Pro (Preview, ≤200k)$2.00$12.00
Google Gemini 2.5 Pro$1.25$10.00
Google Gemini 2.5 Flash$0.30$2.50
Google Gemini 2.5 Flash-Lite$0.10$0.40

Quellen, Stand Juni 2026: OpenAI (https://developers.openai.com/api/docs/pricing), Anthropic (https://claude.com/pricing und https://platform.claude.com/docs/en/about-claude/pricing), Google Gemini (https://ai.google.dev/gemini-api/docs/pricing). Preise ändern sich häufig — bestätigen Sie diese auf den Live-Seiten, bevor Sie budgetieren.

Wie werden Token-Kosten berechnet?

Zwei Zahlen treiben jede Schätzung an: wie viele Tokens Sie senden (Input) und wie viele das Modell zurückgibt (Output). Jede hat seinen eigenen Preis, angegeben pro 1.000.000 Tokens.

Die Formel:

``` cost = (input_tokens / 1,000,000) * input_price_per_M + (output_tokens / 1,000,000) * output_price_per_M ```

Um Token-Zahlen vor einer genauen Tokenizer-Zählung zu schätzen, verwenden Sie die Faustregel, dass 1 Token ungefähr 4 Zeichen oder etwa 0,75 Wörter Englisch entspricht (eine grobe Schätzung nach OpenAI- und Anthropic-Dokumentation). Ein Prompt mit 500 Wörtern sind also ungefähr 500 ÷ 0,75 ≈ 667 Input-Tokens. Dies ist eine Näherung; Leerzeichen, Satzzeichen, Code und nicht-englischer Text verschieben das Verhältnis.

Output dominiert viele Rechnungen, da Output-Preise typischerweise mehrfach höher als Input-Preise sind und lange Generationen sich schnell summieren. Wenn eine Aufgabe statt Prosa eine kurze strukturierte Antwort liefern kann, spart das allein Kosten.


Arbeitsbeispiel 1: ein einzelner Q&A-Aufruf

Angenommen, Sie senden einen 750-Wörter-Prompt und erhalten eine 750-Wörter-Antwort zurück. Bei ~0,75 Wörtern pro Token sind das etwa 1.000 Input-Tokens und 1.000 Output-Tokens — je 0,001 M.

Bei gpt-5.4 ($2,50 Input / $15,00 Output pro 1M): Input = 0,001 × $2,50 = $0,0025; Output = 0,001 × $15,00 = $0,015; insgesamt ≈ $0,0175 pro Aufruf.

Bei Claude Sonnet 4.6 ($3,00 / $15,00): Input = 0,001 × $3,00 = $0,003; Output = 0,001 × $15,00 = $0,015; insgesamt ≈ $0,018 pro Aufruf.

Bei Gemini 2.5 Flash ($0,30 / $2,50): Input = 0,001 × $0,30 = $0,0003; Output = 0,001 × $2,50 = $0,0025; insgesamt ≈ $0,0028 pro Aufruf.

Gleiche Arbeitslast, etwa 6x günstiger auf Gemini 2.5 Flash als auf den mittleren OpenAI- oder Anthropic-Modellen — genau darum geht es beim Abgleichen von Modell-Tier mit Aufgaben-Schwierigkeit.


Arbeitsbeispiel 2: Skalierung auf 100.000 Aufrufe

Führen Sie nun denselben 1.000-ein / 1.000-aus-Aufruf 100.000-mal aus — etwa eine Batch-Klassifizierung oder Zusammenfassung. Multiplizieren Sie die oben angegebenen Pro-Aufruf-Summen mit 100.000:

gpt-5.4: $0,0175 × 100.000 ≈ $1.750. Claude Sonnet 4.6: $0,018 × 100.000 ≈ $1.800. Gemini 2.5 Flash: $0,0028 × 100.000 ≈ $280.

Bei dieser Größenordnung spielen Rabatte eine Rolle. Wenn der Job nicht latenzempfindlich ist, gibt Anthropics Batch API 50% Rabatt auf Ein- und Ausgabe und halbiert die Sonnet-Summe auf etwa $900. Prompt-Caching hilft, wenn ein großes, identisches Präfix (System-Prompt, Anweisungen, Referenzdokument) über Aufrufe wiederholt wird. Siehe die Methoden unten.


Wie verändern Caching und Batch-Rabatte die Rechnung?

Zwei Mechanismen können die Kosten deutlich senken, wenn Ihre Arbeitslast zu ihnen passt.

Prompt-Caching (Anthropic): Wenn viele Aufrufe das gleiche große Präfix teilen, cachen Sie es einmal und zahlen eine reduzierte Rate auf den gecachten Teil späterer Aufrufe. Nach Anthropics Preisgestaltung kostet ein Cache-Treffer (Lesezugriff) 0,1x den Basis-Input-Preis — das heißt, 10% des normalen Input-Satzes für die gecachten Tokens. Das Schreiben in den Cache kostet mehr als Basis-Input (1,25x für einen 5-Minuten-Cache, 2x für einen 1-Stunden-Cache), daher rentiert sich Caching, wenn das gleiche Präfix genug Male wiederverwendet wird, um das Schreiben zu amortisieren. Beispiel: Claude Opus 4.8 Input ist $5/M und sein Cache-Lesezugriff ist $0,50/M — eine 90%-Einsparung auf dem wiederholten Teil.

Batch API (Anthropic): 50% Rabatt auf Ein- und Ausgabe für asynchrone, nicht-zeitsensitive Jobs. Dies kombiniert sich sauber mit großen Offline-Arbeitslasten wie dem 100.000-Aufrufe-Beispiel oben.

Gleichen Sie den Rabatt auf die Form der Arbeit ab: Caching für ein großes wiederholtes Präfix mit variierendem Schwanz, Batch für große Jobs, auf die Sie warten können. Bestätigen Sie aktuelle Sätze und Mechaniken auf den verlinkten Preisseiten, da sich diese Bedingungen ändern.


Wie schätze ich ohne genauen Tokenizer?

Zur Planung bringen Sie Zeichen- oder Wortanzahlen Sie nah heran. Nehmen Sie die Zeichenanzahl Ihres Prompts und dividieren Sie durch 4, oder teilen Sie die Wortanzahl durch 0,75, um Input-Tokens zu schätzen. Schätzen Sie Output-Tokens aus der Länge der erwarteten Antwort.

Setzen Sie dann beide in die Formel und den Preis für Ihr gewähltes Modell ein. Behandeln Sie das Ergebnis als Größenordnungsschätzung, nicht als Rechnungsgarantie — die genaue Zahl hängt von der Tokenizer des Modells und Ihrer tatsächlichen Ausgabelänge ab. Um prägnantere Prompts (weniger Tokens, klarere Anweisungen) für welches Modell Sie auch wählen, zu verfassen, helfen Ihnen unser ChatGPT-Prompt-Generator und Code-Prompt-Builder, Inputs schlank zu halten.

Frequently Asked Questions

Wie viele Tokens sind 1.000 Wörter?

Etwa 1.333 Tokens, using der Faustregel, dass 1 Token etwa 0,75 Wörter (oder etwa 4 Zeichen) im Englischen ist. Dies ist eine Näherung; Code, Satzzeichen und nicht-englischer Text verändern das Verhältnis.

Warum ist Output teurer als Input?

Das Erzeugen von Tokens ist rechnerisch kostspieliger als das Lesen, daher preisen Anbieter Output höher — oft mehrfach des Input-Satzes. Bei gpt-5.4 ist zum Beispiel Output ($15/1M) sechsmal Input ($2,50/1M), gemäß OpenAIs Preisgestaltung.

Was ist der günstigste Weg, um einen großen Batch-Job auszuführen?

Für nicht-zeitsensitive Jobs gibt Anthropics Batch API 50% Rabatt auf Ein- und Ausgabe. Kombinieren Sie das mit einem Low-Cost-Modell-Tier, wo Qualität erlaubt ist. Bestätigen Sie aktuelle Bedingungen unter Anthropics Preisgestaltung.

Wie viel spart Prompt-Caching?

Bei Anthropic kostet ein Cache-Treffer (Lesezugriff) 0,1x den Basis-Input-Preis — 90% Rabatt auf den gecachten Teil — obwohl das Schreiben in den Cache mehr als Basis-Input kostet, daher rentiert es sich, wenn ein großes Präfix genug Male wiederverwendet wird. Siehe Anthropics Preisdetail.

Kann ich auf Zeichenanzahl-Schätzungen zur Budgetierung vertrauen?

Als Größenordnungsschätzung ja — teilen Sie Zeichen durch 4 (oder Wörter durch 0,75) für Input-Tokens. Zur genauen Abrechnung benötigen Sie die Tokenizer des Modells und Ihre echte Ausgabelänge, daher behandeln Sie das Formel-Ergebnis als Plan, nicht als Garantie.

Welches aktuelle Modell ist am günstigsten für einfache Aufgaben?

Unter den Tiers in der Tabelle sind Gemini 2.5 Flash-Lite ($0,10 Input / $0,40 Output pro 1M) und gpt-5.4-nano ($0,20 / $1,25) die günstigsten Optionen seit Juni 2026. Wählen Sie das günstigste Tier, das immer noch Ihren Qualitätsstandard erfüllt.

Berechnen alle Anbieter Ein- und Ausgabe separat?

Ja — OpenAI, Anthropic und Google geben alle unterschiedliche Input- und Output-Preise pro Million Tokens an. Die Formel in diesem Artikel gilt für alle drei; nur die Pro-Token-Zahlen unterscheiden sich. Siehe jede der verlinkten Preisseiten des Anbieters für aktuelle Zahlen.

Schreiben Sie prägnantere Prompts

Weniger Input-Tokens und klarere Anweisungen bedeuten niedrigere Rechnungen. Beginnen Sie mit unseren Prompt-Generatoren.

Browse all prompt tools →

Kostenlose Prompt-Bibliothek — 100+ Copy-Paste-Prompts

Wöchentlich handverlesene Prompts für ChatGPT, Claude, Midjourney und DALL·E. Kein Spam. Jederzeit abmeldbar.

Kein Spam. Eine E-Mail pro Woche. Bereits ~12.000 Prompt-Autoren angemeldet.