¿Cómo se calcula el costo de tokens?
Dos números impulsan cada estimación: cuántos tokens envías (entrada) y cuántos devuelve el modelo (salida). Cada uno tiene su propio precio, cotizado por 1.000.000 de tokens.
La fórmula:
``` cost = (input_tokens / 1,000,000) * input_price_per_M + (output_tokens / 1,000,000) * output_price_per_M ```
Para estimar conteos de tokens antes de tener un conteo exacto del tokenizador, usa la regla práctica de que 1 token es aproximadamente 4 caracteres o alrededor de 0,75 palabras en inglés (una estimación aproximada según la documentación de OpenAI y Anthropic). Entonces un prompt de 500 palabras es aproximadamente 500 ÷ 0,75 ≈ 667 tokens de entrada. Esta es una aproximación; espacios en blanco, puntuación, código y texto en otros idiomas cambian la proporción.
La salida domina muchas facturas porque los precios de salida son típicamente varias veces el precio de entrada, y las generaciones largas se suman rápidamente. Si una tarea puede devolver una respuesta estructurada corta en lugar de prosa, eso por sí solo reduce el costo.