Comment le coût par token est-il calculé ?
Deux chiffres déterminent chaque estimation : le nombre de tokens que vous envoyez (entrée) et le nombre que le modèle retourne (sortie). Chacun a son propre tarif, coté par 1 000 000 de tokens.
La formule :
``` coût = (tokens_entrée / 1 000 000) * prix_entrée_par_M + (tokens_sortie / 1 000 000) * prix_sortie_par_M ```
Pour estimer le nombre de tokens avant d'avoir un compte exact avec un tokeniseur, utilisez la règle empirique selon laquelle 1 token équivaut à environ 4 caractères ou 0,75 mots en anglais (une estimation approximative selon la documentation OpenAI et Anthropic). Ainsi, un prompt de 500 mots représente environ 500 ÷ 0,75 ≈ 667 tokens d'entrée. C'est une approximation ; les espaces, la ponctuation, le code et le texte non-anglais modifient le ratio.
La sortie domine de nombreuses factures car les tarifs de sortie sont généralement plusieurs fois plus élevés que l'entrée, et les générations longues s'accumulent rapidement. Si une tâche peut retourner une réponse structurée courte au lieu de prose, cela seul réduit le coût.