Die GPT-5 Kostenformel
Jeder GPT-5-Aufruf verwendet die gleiche Per-Token-Mathematik. Keine Plattformgebühr, keine Pro-Aufruf-Gebühr, kein Mindestauftrag. Sie zahlen für Tokens rein und Tokens raus, zum Preis pro 1M des gewählten Modells:
``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```
Zwei Anpassungen stapeln sich oben drauf. Prompt-Cache-Treffer — Teile Ihres Input-Präfix, die OpenAI gecacht hat, weil Sie sie kürzlich gesendet haben — werden zum Cached-Input-Satz abgerechnet (10% des Standard-Input-Preises über alle GPT-5-Tier hinweg). Lange stabile System-Prompts und wiederverwendete Tool-Schemas sind die typischen Gewinner. Die Batch API nimmt einen pauschalen 50% Rabatt auf Input und Output für asynchrone Jobs mit Lieferung innerhalb von 24 Stunden. Die Rabatte setzen sich zusammen: ein gecachter + gebatchter GPT-5.5-Aufruf zahlt $0,50/1M Cached Input geteilt durch 2 = $0,25/1M auf dem gecachten Teil und $30/1M Output geteilt durch 2 = $15/1M auf Output.
Bei GPT-5.5 Pro werden intern generierte Reasoning-Token vor der sichtbaren Antwort zum Satz von $180/1M Output abgerechnet, identisch mit dem Antworttext. Eine Abfrage, die 3.000 Reasoning-Token erzeugt, um eine 500-Token-Antwort zu produzieren, wird 3.500 Output-Tokens abgerechnet. Budgetieren Sie einen 3-8x Reasoning-Multiplikator auf Pro, wenn die Aufgabe nicht trivial ist. Standard-GPT-5.5 und GPT-5.4 decken keine Chain-of-Thought auf; ihre Output-Abrechnung entspricht der Antwortlänge.