Die Reasoning-Token Kostenformel (die, die niemand warnt)
Bei Chat-Modellen wie GPT-5.5 ist die Kostenformel unkompliziert — Sie bezahlen für die Input-Tokens, die Sie gesendet haben, und die Output-Tokens, die das Modell zurückschrieb. Bei der o-Serie gibt es einen dritten Term, der in keinem Response-Feld angezeigt wird, aber definitiv auf Ihrer Rechnung.
``` cost = (input_tokens / 1,000,000) × input_price + (reasoning_tokens / 1,000,000) × output_price ← unsichtbar für Aufrufer + (visible_output / 1,000,000) × output_price ```
Die reasoning_tokens Anzahl wird in der API-Response unter `usage.completion_tokens_details.reasoning_tokens` gemeldet. Lesen Sie sie. Loggen Sie sie. Wenn Sie dieses Feld überspringen, haben Sie keine Ahnung, was Sie pro Aufruf tatsächlich zahlen — das `content` Feld zeigt Ihnen die 200-Token-Antwort, aber das `reasoning_tokens` Feld ist, wo die 4.000-Token-Rechnung sich versteckt.
Praktische Reasoning-Token Form, die wir in produktiven Deployments sehen: einfache Mathematik / Klassifikation mit Reasoning aktiviert = 200-800 Reasoning-Tokens; mehrstufige Code-Generierung = 1.500-5.000 Reasoning-Tokens; komplexe Planung / Beweis-ähnliche Tasks = 5.000-25.000 Reasoning-Tokens; agentic Schleifen mit Selbst-Verifikation = 20.000-80.000 Reasoning-Tokens pro Query. Budgetieren Sie die vollständige Einschätzung, nicht die sichtbare Antwort.