Die Kostenformel (identisch mit jedem anderen Anbieter)
Jeder DeepSeek API-Aufruf folgt der gleichen Mathematik wie OpenAI, Anthropic oder jeder andere Token-abgerechnete Anbieter. Es gibt keine Plattformgebühr, keine Pro-Call-Gebühr, kein Mindestausgaben. Sie zahlen für das, was Sie senden und was Sie zurückbekommen, mit der pro-1M-Token-Rate des Modells:
``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```
Die DeepSeek-spezifische Anpassung, die wichtig ist: Cache-Hit-Input. Teile Ihres Prompt-Präfixes, die DeepSeek in einem kürzlichen vorherigen Aufruf innerhalb des Cache-Fensters gesehen hat, werden mit der Cache-Hit-Rate abgerechnet. Bei V3 und R1 liegt dies genau bei 10% des Standard-Input (90% Rabatt). Bei V4-Flash und V4-Pro fällt es auf 2% bzw. 0,83% — nahezu kostenlos. Lange stabile System-Prompts, feste Tool-Schemas und wiederverwendete Few-Shot-Blöcke sind die typischen Gewinner. Die Cache-Aktivierung ist automatisch — Sie müssen kein Flag übergeben; DeepSeeks Server-seitiger Cache passt Ihr Prompt-Präfix an und wendet den Rabatt in der Abrechnung an.
Reasoning-Token bei DeepSeek-R1 und DeepSeek-V4-Pro werden mit der Output-Rate abgerechnet, obwohl sie nicht an den Aufrufer zurückgegeben werden — die gleiche Form wie bei OpenAIs o-Serie. Ein Modell, das 6.000 Token denkt, bevor es eine 400-Token-Antwort produziert, rechnet 6.400 Output-Token ab. Planen Sie ein 5-15x Output-Budget bei Reasoning-intensiven Aufgaben gegenüber reinen Chat-Aufgaben. R1 wurde insbesondere mit 3.000-10.000 Reasoning-Token bei komplexen Problemen gemessen — berechnen Sie das in Ihre Pro-Call-Schätzungen ein, sonst werden Sie von der Rechnung überrascht.