La fórmula de costo GPT-5
Cada llamada GPT-5 utiliza las mismas matemáticas por token. Sin tarifa de plataforma, sin tarifa por llamada, sin factura mínima. Pagas por tokens dentro y tokens fuera, a la tarifa por 1M del modelo elegido:
``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```
Dos ajustes se superponen. Los aciertos de caché de prompts — porciones de tu prefijo de entrada que OpenAI almacenó en caché porque los enviaste recientemente — facturan a la tarifa de entrada en caché (10% del precio de entrada estándar en todos los niveles GPT-5). Los prompts de sistema estables largos y los esquemas de herramientas reutilizados son los ganadores típicos. La API Batch aplica un descuento fijo del 50% tanto en entrada como en salida para trabajos asincronos entregados dentro de 24 horas. Los descuentos se componen: una llamada GPT-5.5 en caché + por lotes paga $0.50/1M entrada en caché dividido entre 2 = $0.25/1M en la porción en caché, y $30/1M salida dividido entre 2 = $15/1M en salida.
En GPT-5.5 Pro, los tokens de razonamiento generados internamente antes de la respuesta visible facturan a la tarifa de $180/1M salida, igual que el texto de respuesta. Una consulta que desencadena 3,000 tokens de razonamiento para producir una respuesta de 500 tokens factura 3,500 tokens de salida. Presupuesta un multiplicador de razonamiento de 3-8x en Pro si la tarea no es trivial. GPT-5.5 estándar y GPT-5.4 no exponen cadena de pensamiento; su factura de salida coincide con la longitud de respuesta.