Preise: Gemini 2.5 Pro ist billiger, aber nur in der 200K-Context-Klammer
**GPT-4o kostet $2,50/1M Input und $10/1M Output.** Das ist derselbe Input-Preis wie GPT-5.4 und 40% von GPT-5.5s Input-Preis – GPT-4o ist solide Mid-Tier in der 2026-OpenAI-Linie.
**Gemini 2.5 Pro kostet $1,25/1M Input und $10/1M Output** für Prompts unter 200K Tokens. Das ist die Hälfte von GPT-4os Input-Preis zum gleichen Output-Preis – ein klarer Kosten-Vorteil für jeden Workload, der in 200K Context passt.
**Über 200K Context verdoppelt sich Geminis Pricing auf Input ($2,50/1M) und geht 1,5x bei Output ($15/1M).** Das ist wichtig: Das Headline-Feature des 2M-Kontextfensters ist echte Capability, aber nicht kostenlos – es nutzen kostet mehr pro Token als ein kürzerer Prompt. Planen Sie Ihre Context-Window-Nutzung mit diesem Gedanken.
**Cache-Rabatt auf Gemini 2.5 Pro ist 75% auf Cache-Read** – bringt gecachten Input auf $0,31/1M (Short Context) oder $0,625/1M (Long Context). Aggressiv, und nur knapp hinter Anthropics 90%-Cache-Read-Rabatt auf Claude.
**OpenAIs 50% Prompt-Cache-Hit-Rabatt auf GPT-4o** bringt gecachten Input auf $1,25/1M – bringe es Geminis unkachiertem Preis nahe. Caching hilft beiden, aber Geminis Rabatt ist strukturell größer.
**Bei einem typischen 5K-Input, 1K-Output-Call**: GPT-4o unkachiert kostet $0,0225. Gemini 2.5 Pro unkachiert (Short Context) kostet $0,01625 – 28% billiger. Cachiert, beide verengen sich auf wenige Hundertstel Cent pro Call. Bei 100K Calls/Tag ist das ein $7–8K/Jahr-Unterschied unkachiert, fallend auf Rauschen cachiert. **Kosten sind selten der entscheidende Faktor** bei der Skala, auf der die meisten Teams arbeiten; Capability-Unterschiede zählen mehr.