La fórmula de costo de tokens de razonamiento (la que nadie te advierte)
En modelos de chat como GPT-5.5, la fórmula de costo es directa — pagas por los tokens de entrada que enviaste y los tokens de salida que el modelo escribió. En la serie o, hay un tercer término que no aparece en ningún campo de respuesta pero absolutamente aparece en tu factura:
``` cost = (input_tokens / 1,000,000) × input_price + (reasoning_tokens / 1,000,000) × output_price ← invisible al llamador + (visible_output / 1,000,000) × output_price ```
El recuento de reasoning_tokens se reporta en la respuesta de la API bajo `usage.completion_tokens_details.reasoning_tokens`. Léelo. Regístralo. Si omites este campo no tienes idea de lo que realmente estás pagando por llamada — el campo `content` te muestra la respuesta de 200 tokens, pero el campo `reasoning_tokens` es donde se oculta la factura de 4,000 tokens.
La forma práctica de tokens de razonamiento que vemos en implementaciones de producción: matemática simple / clasificación con razonamiento habilitado = 200-800 tokens de razonamiento; generación de código de múltiples pasos = 1,500-5,000 tokens de razonamiento; tareas complejas de planificación / estilo de prueba = 5,000-25,000 tokens de razonamiento; bucles agentes con auto-verificación = 20,000-80,000 tokens de razonamiento por consulta. Presupuesta la envolvente completa, no la respuesta visible.