Wie werden Token-Kosten berechnet?
Zwei Zahlen treiben jede Schätzung an: wie viele Tokens Sie senden (Input) und wie viele das Modell zurückgibt (Output). Jede hat seinen eigenen Preis, angegeben pro 1.000.000 Tokens.
Die Formel:
``` cost = (input_tokens / 1,000,000) * input_price_per_M + (output_tokens / 1,000,000) * output_price_per_M ```
Um Token-Zahlen vor einer genauen Tokenizer-Zählung zu schätzen, verwenden Sie die Faustregel, dass 1 Token ungefähr 4 Zeichen oder etwa 0,75 Wörter Englisch entspricht (eine grobe Schätzung nach OpenAI- und Anthropic-Dokumentation). Ein Prompt mit 500 Wörtern sind also ungefähr 500 ÷ 0,75 ≈ 667 Input-Tokens. Dies ist eine Näherung; Leerzeichen, Satzzeichen, Code und nicht-englischer Text verschieben das Verhältnis.
Output dominiert viele Rechnungen, da Output-Preise typischerweise mehrfach höher als Input-Preise sind und lange Generationen sich schnell summieren. Wenn eine Aufgabe statt Prosa eine kurze strukturierte Antwort liefern kann, spart das allein Kosten.