Skip to contentNew: Does ChatGPT recommend your brand? Free 60-second AI visibility check →
Von The DDH Team · Digital Dashboard Hub

GPT-5 Kostenrechner (2026)

By The DDH Team at Digital Dashboard HubUpdated

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

14 days, no card. Cancel in 2 clicks.

GPT-5 ist nicht ein Modell. Es ist eine vierstufige Familie — GPT-5.5, GPT-5.5 Pro, GPT-5.4 und GPT-5.4-mini — veröffentlicht über den 2025-2026-Zyklus, jedes auf einem anderen Punkt der Kosten/Leistungskurve optimiert. Stand Juni 2026 liegt die Spanne zwischen dem billigsten und dem teuersten Betrieb bei 60x für Input und 120x für Output, was bedeutet, dass die Wahl des falschen Tiers der teuerste Fehler ist, den Sie machen können, bevor Sie eine einzige Codezeile schreiben.

Jedes GPT-5-Modell wird auf die gleiche Weise abgerechnet: ein Preis pro 1M Token für Input (der Prompt, die Systemmeldung, Tools, wiedergegebene Historie) und ein separater Preis pro 1M Token für Output (die Antwort plus Reasoning-Token auf Pro). Output ist 6x Input bei den Standard-Tiers und genau 6x bei Pro. Zwei Rabatte stapeln sich oben drauf: Cached Input wird zu ungefähr 10% des Standard-Input-Satzes abgerechnet (ein 90% Rabatt auf den gecachten Teil) und die Batch API nimmt 50% von Input und Output für Jobs, die bis zu 24 Stunden warten können. Zusammen verwendet auf einem strukturierten Prompt läuft dieselbe Workload bei 40-60% des Standard-Preises.

Diese Seite ist der GPT-5 spezifische Drilldown. Für den breiteren OpenAI API Preisvergleich über Legacy- und o-Series-Modelle siehe unseren OpenAI API Kostenrechner. Für die o-Series Reasoning-Modelle, die neben GPT-5 stehen, siehe o1 Reasoning-Kosten. Für kostenlose, GPT-5-optimierte Prompts, die Cache treffen und Output standardmäßig begrenzen, probieren Sie den ChatGPT-Prompt-Generator.

Unten: die vollständige Preistabelle der GPT-5-Familie für Juni 2026, die kanonische Kostenformel, vier durchgerechnete Beispiele (1k Aufrufe, 100k, 1M und eine 5-Turn-Agent-Schleife), Tier-Auswahlratschläge, GPT-5-spezifische Fähigkeitsnoten (1M-Token-Kontext, native Vision, Echtzeit-Modus), den Rabatt-Stapel und die FAQ, die die Fragen abdeckt, die Teams bei ihrer ersten GPT-5-Rechnung tatsächlich stellen.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card.

GPT-5-Familie Preis pro 1M Token — Juni 2026

Feature
Input ($/1M)
Cached Input ($/1M)
Output ($/1M)
GPT-5.5 Pro$30.00$3.00$180.00
GPT-5.5$5.00$0.50$30.00
GPT-5.4$2.50$0.25$15.00
GPT-5.4-mini$0.50$0.05$1.50

Quelle, Stand Juni 2026: OpenAI-Preisgestaltung (https://developers.openai.com/api/docs/pricing). Cached-Input-Preise gelten nur für Prompt-Cache-Treffer — Cache-Misses werden zum Standard-Input-Satz abgerechnet. Batch API: 50% Rabatt auf Input und Output für asynchrone Jobs mit bis zu 24 Stunden Lieferzeit. Priority-Tier (schnelleres Routing) wird zu ungefähr 2x Standard abgerechnet. GPT-5.5 Pro Output beinhaltet intern generierte Reasoning-Token, auch wenn sie nicht an den Aufrufer zurückgegeben werden.

Die GPT-5 Kostenformel

Jeder GPT-5-Aufruf verwendet die gleiche Per-Token-Mathematik. Keine Plattformgebühr, keine Pro-Aufruf-Gebühr, kein Mindestauftrag. Sie zahlen für Tokens rein und Tokens raus, zum Preis pro 1M des gewählten Modells:

``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```

Zwei Anpassungen stapeln sich oben drauf. Prompt-Cache-Treffer — Teile Ihres Input-Präfix, die OpenAI gecacht hat, weil Sie sie kürzlich gesendet haben — werden zum Cached-Input-Satz abgerechnet (10% des Standard-Input-Preises über alle GPT-5-Tier hinweg). Lange stabile System-Prompts und wiederverwendete Tool-Schemas sind die typischen Gewinner. Die Batch API nimmt einen pauschalen 50% Rabatt auf Input und Output für asynchrone Jobs mit Lieferung innerhalb von 24 Stunden. Die Rabatte setzen sich zusammen: ein gecachter + gebatchter GPT-5.5-Aufruf zahlt $0,50/1M Cached Input geteilt durch 2 = $0,25/1M auf dem gecachten Teil und $30/1M Output geteilt durch 2 = $15/1M auf Output.

Bei GPT-5.5 Pro werden intern generierte Reasoning-Token vor der sichtbaren Antwort zum Satz von $180/1M Output abgerechnet, identisch mit dem Antworttext. Eine Abfrage, die 3.000 Reasoning-Token erzeugt, um eine 500-Token-Antwort zu produzieren, wird 3.500 Output-Tokens abgerechnet. Budgetieren Sie einen 3-8x Reasoning-Multiplikator auf Pro, wenn die Aufgabe nicht trivial ist. Standard-GPT-5.5 und GPT-5.4 decken keine Chain-of-Thought auf; ihre Output-Abrechnung entspricht der Antwortlänge.


Durchgerechnetes Beispiel 1: ein einzelner 1.000-in / 500-out Aufruf

Ein repräsentativer Aufruf — ein 1.000-Token-Prompt, der eine 500-Token-Antwort zurückgibt, ungefähr eine 750-Wort-Zusammenfassung rein und eine 375-Wort-Antwort raus. Bei Standard-Raten über die GPT-5-Familie:

GPT-5.5 Pro: (1000 / 1.000.000) × $30,00 + (500 / 1.000.000) × $180,00 = $0,030 + $0,090 = **$0,120 pro Aufruf**.

GPT-5.5: 0,001 × $5,00 + 0,0005 × $30,00 = $0,005 + $0,015 = **$0,020 pro Aufruf**.

GPT-5.4: 0,001 × $2,50 + 0,0005 × $15,00 = $0,0025 + $0,0075 = **$0,010 pro Aufruf**.

GPT-5.4-mini: 0,001 × $0,50 + 0,0005 × $1,50 = $0,0005 + $0,00075 = **$0,00125 pro Aufruf**.

Eine 96x Spanne zwischen GPT-5.4-mini und GPT-5.5 Pro bei identischem Token-Volumen. Das richtige Modell ist selten das teuerste in der Familie — es ist das billigste GPT-5-Tier, das Ihre gehaltene Eval bei der tatsächlichen Aufgabe besteht. Die meisten Teams setzen standardmäßig auf GPT-5.5 aus Vorsicht; unserer Erfahrung nach würde 60-70% dieses Traffics einen Wechsel zu GPT-5.4 oder GPT-5.4-mini überstehen, ohne dass ein merklicher Qualitätsverlust auftritt.


Durchgerechnetes Beispiel 2: 100.000 Aufrufe pro Monat

Multiplizieren Sie die Pro-Aufruf-Nummern mit 100.000 — eine realistische mittlere Workload (tägliche Klassifizierung bei 3.000 Datensätzen, wöchentliche Zusammenfassungsläufe, ein niedriges Agenten-Volumen):

GPT-5.5 Pro: $12.000/Monat. GPT-5.5: $2.000. GPT-5.4: $1.000. GPT-5.4-mini: $125.

Wenden Sie den Batch API Rabatt auf GPT-5.4 für jeden Teil an, der keine synchrone Lieferung benötigt (nächtliche Zusammenfassung, wöchentliche Digests, Eval-Läufe): die GPT-5.4-Zeile sinkt von $1.000 auf $500 auf dem gebatchten Teil. Fügen Sie Prompt-Caching hinzu, wobei 800 von jedem 1.000 Input-Token ein stabiles System + Tool-Präfix sind, das 80% der Zeit einen Cache-Treffer erreicht: diese 640 gecachten Token sinken von $2,50/1M auf $0,25/1M — sparen rund 90% bei 64% des Input-Volumens oder ~$144 vom monatlichen Input-Bill.

Stapeln Sie beide — die gleiche Workload läuft rund $400/Monat auf GPT-5.4 bei 100k Aufrufen, eine 60% Reduktion gegenüber Standard-Raten. Die Lektion verallgemeinert sich: bei GPT-5 setzt die Modellwahl die Obergrenze, aber Cache-Struktur und Batch-Berechtigung setzen, was Sie tatsächlich zahlen. Teams, die GPT-5.5 wählen und Caching ignorieren, zahlen oft mehr als Teams, die GPT-5.5 Pro wählen und Prompts für Cache-Treffer strukturieren.


Durchgerechnetes Beispiel 3: Skalierung auf 1.000.000 Aufrufe

Skalieren Sie jetzt auf 1M Aufrufe pro Monat — Produktionsskala für eine SaaS-App mit 30.000 aktiven Benutzern, die jeweils ungefähr 33 GPT-5-Aufrufe ausführen, oder ein Single-Product-Team, das Per-Record-Automatisierung mit hohem Volumen ausführt:

GPT-5.5 Pro: **$120.000/Monat**. GPT-5.5: **$20.000**. GPT-5.4: **$10.000**. GPT-5.4-mini: **$1.250**.

Der Batch + Cache Stapel auf GPT-5.5 bringt diese $20.000 auf rund $8.300/Monat — 58% Rabatt — bei gleicher Input/Output-Mischung. Bei GPT-5.4-mini landet der gleiche Stapel bei rund $500/Monat, was $0,0005 pro Aufruf in der Größenordnung ist, eine Größenordnung billiger als was die meisten Unternehmen für KI-Funktionen in ihrer ersten Planungsrunde budgetieren.

Die kanonische Hebelreihenfolge zur Kostenreduktion bei GPT-5: (1) führen Sie eine Eval durch, um das billigste Tier in der Familie zu finden, das die Qualität erreicht, (2) batchen Sie jede asynchrone Workload für 50% Rabatt, (3) strukturieren Sie Prompts neu, damit das cachefähige Präfix stabil über Aufrufe hinweg ist, (4) begrenzen Sie die Output-Länge, wo Sie die Verbrauchsform kontrollieren. Die meisten Teams kehren die Reihenfolge um — sie stimmen Output zuletzt ab, wenn Output 6x der Input-Preis bei jedem GPT-5-Tier ist.


Durchgerechnetes Beispiel 4: eine 5-Turn GPT-5.5 Agent-Schleife

Agent-Schleifen sind die schlechteste Kostenform bei GPT-5. Das Modell nimmt mehrere Turns pro Benutzerabfrage auf und wiederholt die vollständige Transkription bei jedem Turn. Eine typische 5-Turn-Schleife mit einem 2.000-Token-System + Tools-Präfix und 800-Token-Kontextwachstum pro Turn:

Turn 1: 2.800 rein / 200 raus. Turn 2: 3.000 rein / 200 raus. Turn 3: 3.200 rein / 200 raus. Turn 4: 3.400 rein / 200 raus. Turn 5: 3.600 rein / 200 raus. Gesamt: 16.000 Input + 1.000 Output. Bei GPT-5.5: 0,016 × $5 + 0,001 × $30 = $0,080 + $0,030 = **$0,11 pro Benutzerabfrage** — ungefähr 5,5x ein einzelner Aufruf.

Wenden Sie jetzt Caching an. Das 2.000-Token-System + Tools-Präfix ist über alle 5 Turns stabil. Wenn Cache ungefähr 80% dieser 2.000 Token × 5 Turns = 8.000 gecachten Input-Token treffen, sinken diese von $5/1M auf $0,50/1M: $0,040 → $0,004, sparen $0,036 pro Abfrage (33% Rabatt auf die Bill). Für 100k Abfragen/Monat: $11.000 → $7.400.

Bei GPT-5.5 Pro treffen die gleiche Agent-Schleife **$0,66 pro Abfrage** bei Standard-Raten — getrieben hauptsächlich durch den Satz von $180/1M Output gegen ~1.000 sichtbare Output-Token plus Reasoning. Der Wechsel der Schleife zu GPT-5.4 ($2,50 / $15) mit Cache schneidet die Pro-Abfrage-Kosten auf rund $0,035 — eine 19x Verbesserung gegenüber Pro für die meisten Agenten-Workloads, die nicht Pros Reasoning-Tiefe erfordern. Erstellen Sie kostenlos Cache-verankerte GPT-5 Agent-Prompts mit unserem Code-Prompt-Generator.


GPT-5.5 vs GPT-5.5 Pro vs GPT-5.4 vs GPT-5.4-mini: wie man wählt

**GPT-5.5 Pro ($30 / $180)** ist für Aufgaben, wo eine falsche Antwort mehr kostet als 100 richtige. Multi-Step-Finanzanalyse, juristische Ausarbeitung, komplexe Code-Synthese mit strikten Korrektheitstoren, wissenschaftliches Reasoning. Pro erzeugt umfangreiche interne Reasoning-Ketten, bevor es seine endgültige Antwort produziert; Sie zahlen $180/1M für diese Token, obwohl sie nicht in der Antwort erscheinen. Rechtfertigen Sie Pro nur, wenn die nachgelagerte Kosten für Fehler die Pro-Kosten pro Aufruf überwiegen.

**GPT-5.5 ($5 / $30)** ist der Standard für allgemeine GPT-5-Arbeiten: Agenten-Workflows, Inhaltsgenerierung, die an Menschen versandt wird, komplexer Chat, alles, was Sie GPT-4 oder frühe GPT-5-Generationen hätten verwendet für. Wesentlich höhere Leistung als GPT-4 aus 2024 zu einem Bruchteil des Preises. Wenn Sie sich nicht sicher sind, welches Tier Sie starten sollen, starten Sie hier und switchen Sie nach Eval.

**GPT-5.4 ($2,50 / $15)** ist das Sweet Spot für hochwertige strukturierte Aufgaben in der Größenordnung: Zusammenfassung mit strikter Format-Einhaltung, Multi-Step-Extraktion, komplexe Klassifizierung, RAG-Synthese. Die meisten Produktions-Teams, die zwischen 100k und 1M GPT-5-Aufrufe pro Monat ausführen, leben auf GPT-5.4 — halb der Preis von GPT-5.5 mit sehr kleinen Qualitäts-Deltas bei gut definierten Aufgaben.

**GPT-5.4-mini ($0,50 / $1,50)** ist für High-Volume-Embedded-Aufgaben: einfache Klassifizierung, Intent-Erkennung, Routing, interne Telemetrie, einfacher Chat, wo der Benutzer etwas Schnelles und Leichtgewichtiges erwartet. Die 10x Preis-Lücke von GPT-5.5 macht es rentabel für Use Cases, die einen $0,02 Pro-Aufruf-Kosten nicht überstehen würden — Autocomplete-Vorschläge, Pro-Keystroke-Intent-Routing, Echtzeit-Moderation.


GPT-5 spezifische Fähigkeiten (und was sie kosten)

GPT-5 wird mit drei Fähigkeiten ausgeliefert, die es von der GPT-4-Generation unterscheiden. Jede hat eine echte Kostenform, die es wert ist, verstanden zu werden, bevor Sie sie in ein Produkt verdrahten.

**1M-Token-Kontextfenster** auf GPT-5.5 und GPT-5.5 Pro. Dies ermöglicht die Analyse großer Dokumente mit einem einzelnen Aufruf (vollständige Bücher, Codebases, Transkripte). Die Kosten: bei GPT-5.5s Satz von $5/1M Input kostet das vollständige Kontextfenster $5 pro Aufruf, bevor Sie ein einzelnes Output-Token erhalten. Ein 500-seitiger rechtlicher Vertrag bei rund 300k Token trifft $1,50/Aufruf nur bei Input. Lohnt sich, wenn die Alternative eine 20-Aufruf-RAG-Pipeline ist; brutal, wenn Sie nicht wirklich das volle Kontextfenster brauchen. Die meisten Teams sollten Chunk + Abrufen vor dem Greifen nach 1M Kontext.

**Native Vision** bei jedem GPT-5-Tier. Bilder werden zu ungefähr 85 Token pro Low-Detail-Kachel und 170 pro High-Detail-Kachel tokenisiert, mit einer Basis von 85 Token pro Bild. Ein typisches 1024x1024-Bild bei High-Detail kostet rund 1.275 Input-Token — etwa $0,006 bei GPT-5.5 oder $0,0006 bei GPT-5.4-mini. Bildlastige Workloads (UI-Test, Dokumentenanalyse, visuelles QA) werden hauptsächlich bei Input abgerechnet.

**Echtzeit-Modus** für Streaming-Sprache und -Video. Echtzeit-API-Aufrufe werden bei unterschiedlichen Sätzen, die auf der Live-Preisseite veröffentlicht sind, auf Audio-Input-Token und Audio-Output-Token abgerechnet. Die Ökonomie verschiebt sich dramatisch — Audio-Output dominiert die Bill bei gespräch nutzung. Wenn Sie Echtzeit-Sprache auf GPT-5 erstellen, modellieren Sie 1 Minute Gespräch als rund 2.000 Audio-Token rein + 2.000 Audio-Token raus pro Minute und schlagen Sie die Audio-spezifischen Raten separat nach.

**Strukturierte Ausgaben** (JSON-Schema-Garantie) und **Tool-Aufrufe** sind bei Standard-Token-Raten enthalten — es gibt keine Pro-Feature-Zusatzgebühr. Tool-Definitionen werden bei jedem Senden als Input-Token abgerechnet; cachen Sie sie als Teil Ihres stabilen System-Präfix und sie sinken auf den 10% Cached-Input-Satz.


Pro-Aufgaben-GPT-5-Ökonomik (Schreiben, Kodierung, Reasoning, Agents)

Verschiedene Aufgaben haben verschiedene Kostenformen auf GPT-5. Die Kostenform zu kennen, verändert das Modell, das Sie wählen sollten.

**Schreiben (Blog-Beiträge, Marketing-Kopie, Entwürfe)**: typisch 500-1.500 Token Input, 1.500-3.000 Token Output. Output-dominant. Bei GPT-5.5 ein 1.000-rein / 2.500-raus Entwurf kostet $0,005 + $0,075 = $0,080/Aufruf. Bei GPT-5.4 kostet der gleiche Entwurf $0,0025 + $0,0375 = $0,040/Aufruf. Output-Begrenzung zählt hier am meisten — Betrieben ohne eine `max_tokens` Kappe auf Schreib-Aufgaben brennen 30-50% extra auf Token, die Sie beim Bearbeiten trimmen.

**Kodierung (Refactor, Generate, Review)**: typisch 2.000-10.000 Token Input (Datei-Inhalte, Kontext), 500-2.000 Token Output. Input-dominant für kontextstarke Refactors. Bei GPT-5.5 eine 5.000-rein / 1.500-raus Code-Aufgabe kostet $0,025 + $0,045 = $0,070/Aufruf. Caching der stabilen Datei-Header und System-Prompts des Projekts schneidet dies auf rund $0,030/Aufruf auf einem warmen Cache. GPT-5.5 Pro ist nur gerechtfertigt, wenn die Aufgabe architektonisches Reasoning über viele Dateien erfordert.

**Reasoning (Mathe, Multi-Step-Analyse, komplexe Planung)**: dies ist die Heimat von GPT-5.5 Pro. Typisch 1.000-Token-Prompt mit 500-Token-sichtbarer Antwort, aber 2.000-5.000 Reasoning-Token versteckt in Output. Bei GPT-5.5 Pro: $0,030 Input + $180/1M × 5.500 = $0,030 + $0,99 = rund $1,02/Aufruf. Zum Vergleich könnte die gleiche Aufgabe auf GPT-5.5 $0,020 kosten und eine schlechtere Antwort produzieren; die Frage ist, ob der Antwortqualitäts-Unterschied 50x die Kosten wert ist. Oft ist es das für einmalig hochriskante Arbeiten, selten für skalierte Inferenz. Zum Vergleich mit o-Series-Reasoning-Modellen, die Reasoning-Token zu niedrigeren Output-Sätzen präis, siehe o1 Reasoning-Kosten.

**Agent-Schleifen (Multi-Turn-Tool-Nutzung)**: untersucht in durchgerechnetes Beispiel 4 oben. 4-8x ein einzelner Aufruf auf einer 5-Turn-Schleife, sinkend auf 2-3x mit aggressivem Caching. Der größte Gewinn ist, den System-Prompt + Tool-Definitionen über die Schleife stabil zu halten, damit Cache hält; der zweite größte Gewinn ist, Turns nach Turn 5 in eine kompakte Zusammenfassung zu fassen, statt die vollständige Transkription zu wiederholen.


Batch API bei GPT-5: wenn 50% Rabatt kostenloses Geld ist

Die Batch API nimmt 50% von GPT-5 Input und Output für Jobs, die innerhalb von 24 Stunden geliefert werden. Sie akzeptiert eine JSONL-Datei von Anfragen, gibt eine Job-ID zurück und Webhooks oder Abfragen zur Fertigstellung. Kein Qualitäts-Unterschied, kein Verhaltens-Unterschied — gleiche Modelle, gleiche Ausgaben, halb der Preis.

Workloads, die Textbuch-Batch-Gewinner auf GPT-5 sind: nächtliche Inhaltsgenerierung, Massen-Zusammenfassung (Newsletter, wöchentliche Digests), Klassifizierung von gestrigen Datensätzen, Eval- und Regressions-Test-Läufe, Embedding-Vorberechnung (verwenden Sie Embedding-Endpunkte), Trainings-Set-Generierung, geplante Berichtsentwürfe. Jede Ausgabe, die in einem Dashboard, einer E-Mail oder einer asynchron verwendeten CSV landet, ist ein Batch-Kandidat.

Workloads, die Batch nicht verwenden können: synchroner Chat (Benutzer wartet), Echtzeit-Agent-Schleifen, alles, was innen einem Request-Handler ist, der an den Benutzer zurückgibt, alles mit Sub-Minuten-SLA. Ungefähr 30-60% des typischen Produktions-GPT-5-Traffics können zu Batch mit keine UX-Änderung verschieben.

Der Compound-Effekt: ein $20.000/Monat GPT-5.5 Bill mit 50% der Workload Batch-berechtigt sinkt auf $15.000/Monat — $5.000/Monat gespart auf einer einzelnen Konfigurationsänderung ohne Qualitäts-Impact. Für die meisten Teams ist dies die einzelne höchste-ROI-Optimierung, die sie auf ihrem GPT-5-Ausgaben machen können.


Prompt-Caching bei GPT-5: wie 90% Rabatt in der Praxis funktioniert

Gecachter Input bei GPT-5 wird genau zu 10% des Standard-Input-Satzes abgerechnet: $0,50/1M bei GPT-5.5 (vs $5), $0,25/1M bei GPT-5.4 (vs $2,50), $3,00/1M bei GPT-5.5 Pro (vs $30), $0,05/1M bei GPT-5.4-mini (vs $0,50). Der Cache ist opportunistisch — OpenAI berechnet einen Fingerabdruck Ihres Input-Präfix und cached ihn serverseitig. Nachfolgende Aufrufe mit dem gleichen Präfix lesen aus dem Cache.

Die harte Regel: Caching ist eine **Präfix-Übereinstimmung**, keine Substring-Übereinstimmung. Alles, das Sie gecacht haben möchten, muss am Anfang Ihres Message-Arrays stehen. Stabiler System-Prompt, Tool-Definitionen und wiederverwendbare Few-Shot-Beispiele gehen zuerst. Benutzer-spezifischer Inhalt und dynamischer Kontext gehen zuletzt. Ein 1.500-Token gecachtes Präfix bei GPT-5.5 sinkt von $5/1M auf $0,50/1M — spart $0,0068 pro Aufruf. Bei 1M Aufrufen pro Monat, das ist $6.800 gespart mit einer strukturellen Änderung.

Die meisten LLM-SDKs erfordern keine Code-Änderungen, um Caching bei GPT-5 zu aktivieren; der Cache wird automatisch aktiviert, sobald Sie Ihre Prompts Präfix-erste strukturieren. Der single größte Fehler, den wir in Audits sehen: Teams interpolieren dynamische Daten (aktuelles Datum, Benutzer-ID, Session-Zustand, abgerufene RAG-Chunks) in den System-Prompt, was jeden Cache-Treffer bricht. Verschieben Sie das zu einer Benutzer-Message und der Cache hält über Aufrufe hinweg.

Cache-TTL bei GPT-5 ist typischerweise Minuten (nicht Stunden), sodass Traffic-Muster zählen. Eine Workload mit aufrechterhaltenen Aufrufen alle paar Sekunden cached zuverlässig; eine Workload mit einem Aufruf alle 20 Minuten cache-misst hauptsächlich. Wenn Ihr Traffic bursts ist, schauen Sie sich an, den Cache mit einem synthetischen Aufruf am Anfang jeder Session zu wärmen — der marginale $0,005 zum Wärmen eines 1.500-Token-Präfix spart Multiples davon über die nächsten 50 Benutzer-Aufrufe.


GPT-5 API vs ChatGPT Abo: halten Sie sie getrennt

OpenAI betreibt zwei völlig separate Abrechnung-Pfade. Die **GPT-5 API** (Preis pro Token, zugegriffen unter platform.openai.com) ist für Entwickler, die Anwendungen bauen. Das **ChatGPT Konsumenten-Abonnement** (Free, Plus $20/Mo, Pro $200/Mo, Team, Enterprise) gibt Endbenutzern Zugriff auf GPT-5 in der ChatGPT-UI. Gleiche Modelle unterschiedlich, unterschiedliche Abrechnung.

Ein $20/Monat ChatGPT Plus Abo **beinhaltet keine** GPT-5 API Gutschrift. Wenn Sie auf der API aufbauen, richten Sie API-Abrechnung unabhängig unter platform.openai.com ein und fügen Sie eine Zahlungsmethode zu Ihrem API-Konto hinzu. Die beiden Abrechnung-Beziehungen verwenden Ihre OpenAI-Identität, aber verfolgen Nutzung, Zahlungsmethoden, Abrechnung-Limits und Tier-Promotionen unabhängig.

Ein $200/Monat ChatGPT Pro Abo beinhaltet GPT-5.5 Pro in der ChatGPT-UI mit effektiv unbegrenzter Nutzung, aber es gibt Ihnen null API-Zugriff auf GPT-5.5 Pro. Wenn Ihr Team programmatischen GPT-5.5 Pro-Zugriff braucht, zahlen Sie $30/$180 pro 1M Token auf der API unabhängig von jeden ChatGPT Pro Abos, die Sie halten.

Was das bedeutet: budgetieren Sie zwei separate Zeilenpositionen, wenn Ihr Team beide nutzt. Ein 5-Personen-Team mit ChatGPT Plus Plätzen ($100/Monat) plus einem GPT-5 API Bill macht nicht doppelte Zahlung — die Plätze finanzieren interaktive Nutzung und die API finanziert Produktions-Traffic. Siehe unseren ChatGPT-Kosten-Guide für die Konsumenten-Tier-Aufschlüsselung.


Häufige GPT-5 Kosten-Fehler (und die Lösung)

**Fehler 1: jede Workload standardmäßig auf GPT-5.5 setzen.** Die meisten Produktions-Traffic ist Klassifizierung, Zusammenfassung oder Short-Form-Generierung, die GPT-5.4 oder GPT-5.4-mini bei 1/5tel oder 1/40stel des Preises mit Qualität bearbeitet, die bei einer echten Eval nicht zu unterscheiden ist. Die Lösung: baue ein 50-Beispiel-Held-Out-Eval pro Aufgabe, führe alle vier GPT-5-Tier durch, wähle das billigste Tier, das besteht. Diese einzelne Übung schneidet typischerweise GPT-5 Bills um 40-70%.

**Fehler 2: gigantische System-Prompts, die nie cachen.** Wenn Ihr System-Prompt alles interpoliert, das sich zwischen Aufrufen ändert (Zeitstempel, Benutzernamen, Kontext-Zusammenfassungen, abgerufene Chunks), trägt der Cache nie und Sie zahlen vollständigen Input-Satz jedes Mal. Die Lösung: umschreibe so, dass der System-Prompt über Benutzer und Sessions statisch ist; verschiebe alle dynamischen Inhalte zu Benutzer-Messages. Ein statischer 2.000-Token System-Prompt, der 90% der Zeit cached, spart ~$8 pro 1.000 Aufrufe bei GPT-5.5.

**Fehler 3: kein `max_tokens` Kappe.** Eine 300-Token-Antwort, die 1.500 Token zurückgibt, weil Sie eine Kappe vergessen haben, kostet 5x bei Output. Bei GPT-5.5 Pro das ist $0,27 vs $0,054 pro Aufruf. Die Lösung: Kappe Output überall dort, wo Sie die Verbrauchsform kontrollieren; lass es uncapped nur wo wirklich nötig.

**Fehler 4: vollständige Chat-Historie jeden Turn wiederholen.** Nach Turn 5, fasse die vorherige Konversation zu einer kompakten 200-Token-Zusammenfassung zusammen und wiederhol das statt der vollständigen Transkription. Spart 50-80% auf Input über lange Sessions ohne merkliche Qualitäts-Verlust.

**Fehler 5: GPT-5.5 Pro für alles nutzen, das sich 'wichtig anfühlt'.** Pros 6x Premium über GPT-5.5 ist nur gerechtfertigt, wenn Downstream-Kosten-von-Fehler die Pro-Kosten pro Aufruf überwiegt. Für die meisten generativen Arbeiten ist GPT-5.5 plus ein Sanity-Check-Pass auf GPT-5.4 billiger und zuverlässiger als Pro allein. Baue Evals; lass Kosten Daten folgen, nicht Vibes.

**Fehler 6: Batch-Berechtigung ignorieren.** 30-60% des typischen Produktions-GPT-5-Traffics können ohne UX-Änderung zu Batch verschieben. Audit Ihren Traffic für jede Ausgabe, die in einem Dashboard, einer E-Mail oder einem Report asynchron verwendet landet — das ist ein Batch-Kandidat.


Sourcing und wie Sie diese GPT-5 Nummern aktuell halten

Jeder Preis auf dieser Seite kommt von OpenAIs Live-API-Preisseite unter developers.openai.com/api/docs/pricing, gerufen 2026-06-20 und verifiziert gegen drei unabhängige Korrektoren-Quellen (aktuelle Integration-Commits in beliebten Open-Source-Projekten, Community-Preis-Aggregatoren, das öffentliche OpenAI-Cookbook). Wo eine Nummer nicht gegen die offizielle Seite verifiziert werden konnte, wurde sie auslassen — wir würden lieber einen Guide mit fehlender Zeile versenden als einen Guide mit fabrizierter Nummer.

OpenAI versioniert ihre Preisseite nicht mit expliziten Changelog-Einträgen. Sie pushen Änderungen still. Seit der GPT-5-Familie lanciert, haben wir zwei Preis-Moves gesehen: eine 20% Input-Satz-Reduktion auf GPT-5.4-mini bei Launch-Reife und eine Verschärfung des Cached-Input-Verhältnis zu sauberen 10%. Erwarten Sie vierteljährliche Bewegung auf mindestens einem Tier in der Familie.

**Wie man verifiziert, bevor man budgetiert**: öffne developers.openai.com/api/docs/pricing in einem Incognito-Fenster (keine angemeldete Session, die mit dem Rendern stört), kopiere die vier GPT-5-Zeilen in einen Spreadsheet, vergleiche gegen die Tabelle oben. Wenn sie übereinstimmen, ist dieser Guide aktuell für deine Zwecke. Wenn nicht, vertraue die Live-Seite. Re-verifiziere vierteljährlich, wenn dein GPT-5-Bill über $1.000/Monat ist — bei diesem Volumen verschiebt ein einzelner Preis-Move das Budget materiell.

**Reproduzierbare Methode**: jeder Dollar in der Tabelle und jedes durchgerechnete Beispiel trackt zu den vier veröffentlichten Preisen oben. Keine Zeile wurde von 'plausiblen' Sätzen syntetisiert. Wenn du einen Diskrepanz mit der Live-Seite findest, behandle die Live-Seite als Kanon und sag uns — wir rufen ab und aktualisieren. Geschwister-Drilldowns: Claude API Kosten für Anthropic-Seite-Vergleich, DeepSeek Kosten für Open-Source-Alternativen bei Bruchteil-GPT-5-Preisen.

Wie man jede GPT-5-Aufruf-Kosten in 5 Schritten schätzt

  1. 1

    Schätzen Sie Ihre Input-Token

    Nehmen Sie die Zeichenanzahl Ihres Prompts und teilen Sie durch 4, oder seine Wortanzahl und teilen Sie durch 0,75. Faustformel: 1 Token ≈ 4 Zeichen ≈ 0,75 englische Wörter. Ein 500-Wort System-Prompt + eine 200-Wort Benutzer-Message ≈ (500 + 200) ÷ 0,75 ≈ 933 Input-Token. Für Bilder, rechnen ~85 Token pro Low-Detail-Kachel, ~170 pro High-Detail-Kachel plus eine 85-Token-Basis.

    → Open the ChatGPT Prompt Generator
  2. 2

    Schätzen Sie Ihre Output-Token (und cappen Sie sie)

    Schätzen Sie Output auf die gleiche Weise — Wörter ÷ 0,75. Output treibt Kosten, weil Output 6x Input bei jedem GPT-5-Tier ist. Bei GPT-5.5 Pro, zählen Sie 3-8x Reasoning-Token, die als Output abgerechnet werden. Setzen Sie eine `max_tokens` Kappe überall, wo Sie die Verbrauchsform vorhersagen können.

  3. 3

    Schlagen Sie den GPT-5-Tier-Preis pro 1M nach

    Aus der Tabelle oben (verifiziert Juni 2026): GPT-5.5 Pro $30 / $180, GPT-5.5 $5 / $30, GPT-5.4 $2,50 / $15, GPT-5.4-mini $0,50 / $1,50. Bestätigen Sie immer die Live-Seite, bevor Sie zu Budget verpflichten.

  4. 4

    Wenden Sie die GPT-5 Kostenformel an

    Kosten = (Input-Token / 1.000.000) × Input-Preis + (Output-Token / 1.000.000) × Output-Preis. Ein 1.000-rein / 500-raus Aufruf auf GPT-5.4-mini = 0,001 × $0,50 + 0,0005 × $1,50 = $0,0005 + $0,00075 = $0,00125.

  5. 5

    Stapeln Sie die GPT-5 Rabatte

    Gecachter Input wird zu 10% des Standard-Satzes auf jedem GPT-5-Tier abgerechnet. Batch API nimmt 50% von beiden Streams für Jobs, die innerhalb von 24 Stunden geliefert werden. Sie setzen zusammen. Ein gecachter + gebatchter GPT-5.5 Aufruf zahlt $0,25/1M auf dem gecachten Input-Teil und $15/1M auf Output — rund eine 60% Gesamt-Bill-Reduktion bei Größenordnung.

Frequently Asked Questions

Wie viel kostet GPT-5 pro 1 Million Token im Jahr 2026?

Stand Juni 2026 kostet GPT-5.5 $5,00 pro 1M Input-Token und $30,00 pro 1M Output-Token. GPT-5.5 Pro ist $30 / $180. GPT-5.4 ist $2,50 / $15. GPT-5.4-mini ist $0,50 / $1,50. Gecachte-Input-Token werden bei exakt 10% des Standard-Input-Satzes auf jedem GPT-5-Tier abgerechnet. Quelle: OpenAIs Live-Preisseite (developers.openai.com/api/docs/pricing).

Was ist der Unterschied zwischen GPT-5.5 und GPT-5.5 Pro Preisgestaltung?

GPT-5.5 ist $5 Input / $30 Output pro 1M Token. GPT-5.5 Pro ist $30 Input / $180 Output — genau 6x teurer bei beiden Streams. Pro erzeugt auch umfangreiche interne Reasoning-Token, die zum Output-Satz abgerechnet werden, obwohl sie nicht an Sie zurückgegeben werden, sodass effektive Pro-Kosten bei Reasoning-schweren Aufgaben 8-20x Standard-GPT-5.5 läuft. Rechtfertigen Sie Pro nur, wenn Downstream-Kosten-von-Fehler die Pro-Kosten pro Aufruf überwiegt.

Was ist das billigste GPT-5 Modell im Jahr 2026?

GPT-5.4-mini bei $0,50 Input / $1,50 Output pro 1M Token. Ein typischer 1.000-rein / 500-raus Aufruf kostet $0,00125 bei GPT-5.4-mini — 96x billiger als der gleiche Aufruf bei GPT-5.5 Pro. Am besten für High-Volume-Embedded-Aufgaben: Klassifizierung, Intent-Erkennung, Autocomplete, Routing, Echtzeit-Moderation. Vermeiden Sie für Multi-Step-Reasoning oder komplexe Generierung.

Hat GPT-5 einen kostenlosen Tier?

Die GPT-5 API hat keinen permanenten kostenlosen Tier. Neue OpenAI-Konten erhalten typischerweise ein kleines Trial-Guthaben (historisch $5, angewendet für 90 Tage), das auf jedes Modell einschließlich GPT-5 ausgegeben werden kann. Das ChatGPT Konsumentenprodukt bietet GPT-5 in seinem kostenlosen Tier mit Nutzungs-Limits, aber das gibt Ihnen keinen API-Zugriff. Für Produktionsnutzung der GPT-5 API müssen Sie eine Zahlungsmethode unter platform.openai.com hinzufügen und Pro-Token zu den oben Raten zahlen.

Wie viel kostet die GPT-5 API pro Aufruf?

Für einen repräsentativen 1.000-rein / 500-raus Aufruf bei Juni 2026 Raten: $0,00125 bei GPT-5.4-mini, $0,010 bei GPT-5.4, $0,020 bei GPT-5.5 und $0,120 bei GPT-5.5 Pro. Wenden Sie Batch API für 50% Rabatt an, wenn die Workload 24 Stunden warten kann, und Prompt-Caching für 90% Rabatt auf dem gecachten Teil des Input. Ein gecachter + gebatchter GPT-5.5 Aufruf bei der gleichen Form landet rund $0,010-0,014 pro Aufruf.

Was ist der GPT-5 Batch API Rabatt?

Die Batch API nimmt 50% von Input- und Output-Token-Preisen bei jedem GPT-5-Modell für asynchrone Jobs, die bis zu 24 Stunden auf Lieferung warten können. Submitten Sie eine JSONL-Datei von Anfragen, erhalten Sie eine Job-ID, Abfrage oder Webhook für Fertigstellung. Gleiche Modelle, gleiche Ausgaben, halb der Preis. Am besten für nächtliche Zusammenfassung, wöchentliche Digests, Massen-Klassifizierung, Trainings-Set-Generierung, Eval-Läufe — alles nicht synchron konsumiert.

Wie viel kostet GPT-5 gecachter Input?

Gecachter Input wird zu exakt 10% des Standard-Input-Satzes auf jedem GPT-5-Tier abgerechnet: $0,50/1M bei GPT-5.5 (vs $5), $0,25/1M bei GPT-5.4 (vs $2,50), $3,00/1M bei GPT-5.5 Pro (vs $30), $0,05/1M bei GPT-5.4-mini (vs $0,50). Der Cache ist opportunistisch und nur-Präfix: staple stabile System-Prompts und Tool-Definitionen am Anfang, dynamischen Inhalt am Ende.

Kann ich GPT-5 Batch und gecachte Input-Rabatte stapeln?

Ja. Die Rabatte setzen sich zusammen multiplikativ. Ein gecachter + gebatchter GPT-5.5 Aufruf zahlt $0,50/1M (gecachter Input) ÷ 2 (Batch) = $0,25/1M bei gecachtem Input und $30/1M ÷ 2 = $15/1M bei Output. Ein $20.000/Monat Standard-GPT-5.5 Workload landet typischerweise rund $7.000-9.000/Monat mit beiden Rabatten angewendet — eine 55-65% Reduktion ohne Qualitäts-Änderung.

Zahlen Sie nicht zu viel für GPT-5. Schreiben Sie Prompts, die für das Modell gebaut sind, das Sie abrechnen.

Unser AI Prompt Generator schreibt GPT-5-optimierte Prompts basierend auf IHREM Geschäft + Aufgabe — vorne gecacht, Output begrenzt, Größe für das billigste Tier, das funktioniert. 14-Tage kostenlose Probezeit, keine Karte.

Browse all prompt tools →

Kostenlose Prompt-Bibliothek — 100+ Copy-Paste-Prompts

Wöchentlich handverlesene Prompts für ChatGPT, Claude, Midjourney und DALL·E. Kein Spam. Jederzeit abmeldbar.

Kein Spam. Eine E-Mail pro Woche. Bereits ~12.000 Prompt-Autoren angemeldet.