Preisgestaltung: GPT-5 Mini ist 7,5x günstiger beim Listenpreis, aber Caching ändert die Mathematik
**Sonnet 4.6 kostet $3/1M Input und $15/1M Output. GPT-5 Mini kostet $0.40/1M Input und $2.40/1M Output.** GPT-5 Mini ist 7,5x günstiger bei Input und 6,25x günstiger bei Output. Beim Listenpreis alleine ist das nicht knapp.
**Caching schließt einen bedeutsamen Anteil der Lücke.** Sonnet 4.6s 90% Cache-Read-Rabatt senkt gecachete Input auf $0.30/1M. GPT-5 Minis 50% Prompt-Cache Hit-Rabatt senkt gecachete Input auf $0.20/1M. Bei gecachete Input verengt sich das Verhältnis von 7,5x auf 1,5x — Sonnet ist immer noch teurer, aber die Lücke schrumpft dramatisch bei Cache-freundlichen Workloads.
**Output ist, wo die Lücke bleibt.** Kein Cache-Rabatt gilt für Output-Token bei einem der beiden Anbieter. Sonnets $15/1M Output vs GPT-5 Minis $2.40/1M Output ist ein 6,25x Delta ohne Cache-Mitigation. Bei Output-schweren Workloads (Code-Generierung, lang-form Text, Agent-Loops) dominiert dies die Gesamtkosten.
**Mathematik auf einem typischen Mid-Tier-Call** (3K Input, 500 Output, 70% Cache-Hit auf einem 2K Präfix): GPT-5 Mini gecacht = (0.7 × 2K × $0.20 + 1K × $0.40 + 500 × $2.40) / 1M = $0.0019. Sonnet 4.6 gecacht = (0.7 × 2K × $0.30 + 1K × $3 + 500 × $15) / 1M = $0.0109. **Sonnet ist 5,7x teurer pro Call bei dieser typischen Form.**
**Die richtige Frage** ist nicht "ist Sonnet 5,7x besser" (das ist es nicht) — es ist "übersetzt sich Sonnets Pro-Call-Qualitätsvorteil in weniger Wiederholungen, weniger Eskalationen oder bessere Geschäftsergebnisse mit einer Rate, die 5,7x Kosten rechtfertigt." Für einige Workloads (Customer Support, komplexes Reasoning) ist die Antwort ja. Für andere (Klassifikation, Extraktion, einfache Zusammenfassung) ist die Antwort nein.
**Geben Sie Ihre echten Zahlen ein**: Claude API-Kostenrechner und OpenAI API-Kostenrechner — diese zeigen monatliche + jährliche Kosten mit Ihren Input/Output/Cache-Parametern.