Skip to contentNew: Does ChatGPT recommend your brand? Free 60-second AI visibility check →
Por el Equipo de DDH · Digital Dashboard Hub

Calculadora de Costes GPT-5 (2026)

By The DDH Team at Digital Dashboard HubUpdated

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

14 days, no card. Cancel in 2 clicks.

GPT-5 no es un único modelo. Es una familia de cuatro niveles — GPT-5.5, GPT-5.5 Pro, GPT-5.4 y GPT-5.4-mini — lanzados a lo largo del ciclo 2025-2026, cada uno optimizado para un punto diferente en la curva de coste / capacidad. Desde junio de 2026, la diferencia entre el más barato y el más caro es de 60x en entrada y 120x en salida, lo que significa que elegir el nivel incorrecto es el error más costoso que puedes cometer antes de escribir una sola línea de prompt.

Cada modelo GPT-5 factura de la misma manera: un precio por 1M tokens en entrada (el prompt, mensaje de sistema, herramientas, historial reproducido) y un precio por 1M tokens separado en salida (la respuesta, más tokens de razonamiento en Pro). La salida es 6x la entrada en los niveles estándar y exactamente 6x en Pro. Dos descuentos se superponen: la entrada en caché factura aproximadamente al 10% de la tarifa de entrada estándar (un descuento del 90% en la porción en caché) y la API Batch aplica un 50% de descuento tanto en entrada como en salida para trabajos que pueden esperar hasta 24 horas. Utilizados conjuntamente en un prompt estructurado, la misma carga de trabajo se ejecuta al 40-60% del precio estándar.

Esta página es la profundización específica para GPT-5. Para la comparación de precios de API de OpenAI más amplia entre modelos heredados y de la serie o, consulta nuestra calculadora de costes de API de OpenAI. Para los modelos de razonamiento de la serie o que están junto a GPT-5, consulta costo de razonamiento o1. Para prompts gratuitos optimizados para GPT-5 que activan caché y limitan salida por defecto, prueba el generador de prompts de ChatGPT.

A continuación: la tabla de precios completa de junio de 2026 para la familia GPT-5, la fórmula de costo canónica, cuatro ejemplos trabajados (1k llamadas, 100k, 1M, y un bucle de agente de 5 turnos), orientación sobre selección de niveles, notas de capacidad específicas de GPT-5 (contexto de 1M tokens, visión nativa, modo en tiempo real), la pila de descuentos, y las preguntas frecuentes que cubren las preguntas que los equipos realmente hacen en su primera factura de GPT-5.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card.

Precio de la familia GPT-5 por 1M tokens — junio de 2026

Feature
Entrada ($/1M)
Entrada en caché ($/1M)
Salida ($/1M)
GPT-5.5 Pro$30.00$3.00$180.00
GPT-5.5$5.00$0.50$30.00
GPT-5.4$2.50$0.25$15.00
GPT-5.4-mini$0.50$0.05$1.50

Fuente, a junio de 2026: precios de OpenAI (https://developers.openai.com/api/docs/pricing). El precio de entrada en caché se aplica solo a aciertos de caché de prompts — los fallos de caché facturan a la tarifa de entrada estándar. API Batch: 50% de descuento tanto en entrada como en salida para trabajos asincronos con entrega de hasta 24 horas. Nivel de prioridad (enrutamiento más rápido) factura aproximadamente a 2x estándar. La salida de GPT-5.5 Pro incluye tokens de razonamiento generados internamente incluso cuando no se devuelven al llamador.

La fórmula de costo GPT-5

Cada llamada GPT-5 utiliza las mismas matemáticas por token. Sin tarifa de plataforma, sin tarifa por llamada, sin factura mínima. Pagas por tokens dentro y tokens fuera, a la tarifa por 1M del modelo elegido:

``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```

Dos ajustes se superponen. Los aciertos de caché de prompts — porciones de tu prefijo de entrada que OpenAI almacenó en caché porque los enviaste recientemente — facturan a la tarifa de entrada en caché (10% del precio de entrada estándar en todos los niveles GPT-5). Los prompts de sistema estables largos y los esquemas de herramientas reutilizados son los ganadores típicos. La API Batch aplica un descuento fijo del 50% tanto en entrada como en salida para trabajos asincronos entregados dentro de 24 horas. Los descuentos se componen: una llamada GPT-5.5 en caché + por lotes paga $0.50/1M entrada en caché dividido entre 2 = $0.25/1M en la porción en caché, y $30/1M salida dividido entre 2 = $15/1M en salida.

En GPT-5.5 Pro, los tokens de razonamiento generados internamente antes de la respuesta visible facturan a la tarifa de $180/1M salida, igual que el texto de respuesta. Una consulta que desencadena 3,000 tokens de razonamiento para producir una respuesta de 500 tokens factura 3,500 tokens de salida. Presupuesta un multiplicador de razonamiento de 3-8x en Pro si la tarea no es trivial. GPT-5.5 estándar y GPT-5.4 no exponen cadena de pensamiento; su factura de salida coincide con la longitud de respuesta.


Ejemplo trabajado 1: una única llamada de 1.000 entrada / 500 salida

Una llamada representativa — un prompt de 1.000 tokens devolviendo una respuesta de 500 tokens, aproximadamente un resumen de 750 palabras dentro y una respuesta de 375 palabras fuera. A tarifas estándar en toda la familia GPT-5:

GPT-5.5 Pro: (1000 / 1,000,000) × $30.00 + (500 / 1,000,000) × $180.00 = $0.030 + $0.090 = **$0.120 por llamada**.

GPT-5.5: 0.001 × $5.00 + 0.0005 × $30.00 = $0.005 + $0.015 = **$0.020 por llamada**.

GPT-5.4: 0.001 × $2.50 + 0.0005 × $15.00 = $0.0025 + $0.0075 = **$0.010 por llamada**.

GPT-5.4-mini: 0.001 × $0.50 + 0.0005 × $1.50 = $0.0005 + $0.00075 = **$0.00125 por llamada**.

Una diferencia de 96x entre GPT-5.4-mini y GPT-5.5 Pro en el mismo volumen de tokens. El modelo correcto rara vez es el más caro de la familia — es el nivel GPT-5 más barato que pasa tu evaluación retenida en la tarea real. La mayoría de los equipos por defecto a GPT-5.5 por precaución; en nuestra experiencia el 60-70% de ese tráfico sobreviviría a un cambio a GPT-5.4 o GPT-5.4-mini sin caída de calidad perceptible.


Ejemplo trabajado 2: 100.000 llamadas por mes

Multiplica los números por llamada por 100.000 — una carga de trabajo realista de tamaño medio (clasificación diaria en 3.000 registros, ejecuciones de resumen semanal, un agente interno de bajo volumen):

GPT-5.5 Pro: $12.000/mes. GPT-5.5: $2.000. GPT-5.4: $1.000. GPT-5.4-mini: $125.

Aplica el descuento de la API Batch a GPT-5.4 para cualquier porción que no necesite entrega sincrónica (resumen nocturno, resúmenes semanales, ejecuciones de evaluación): la fila de GPT-5.4 cae de $1.000 a $500 en la porción por lotes. Añade almacenamiento en caché de prompts donde 800 de cada 1.000 tokens de entrada son un prefijo estable de sistema + herramientas que acierta en caché el 80% de las veces: esos 640 tokens en caché caen de $2.50/1M a $0.25/1M — ahorrando aproximadamente 90% en 64% del volumen de entrada, o ~$144 de la factura mensual de entrada.

Apila ambos — la misma carga de trabajo se ejecuta alrededor de $400/mes en GPT-5.4 a 100k llamadas, una reducción del 60% frente a tarifas estándar. La lección se generaliza: en GPT-5, la elección del modelo establece el techo, pero la estructura de caché y la elegibilidad de lotes establecen lo que realmente pagas. Los equipos que eligen GPT-5.5 e ignoran el almacenamiento en caché a menudo pagan más que los equipos que eligen GPT-5.5 Pro y estructuran prompts para aciertos de caché.


Ejemplo trabajado 3: escala a 1.000.000 de llamadas

Ahora escala a 1M de llamadas por mes — escala de producción para una aplicación SaaS con 30.000 usuarios activos ejecutando aproximadamente 33 llamadas GPT-5 cada una, o un equipo de producto único ejecutando automatización por registro a alto volumen:

GPT-5.5 Pro: **$120.000/mes**. GPT-5.5: **$20.000**. GPT-5.4: **$10.000**. GPT-5.4-mini: **$1.250**.

La pila de Batch + caché en GPT-5.5 lleva esos $20.000 a aproximadamente $8.300/mes — 58% descuento — en la misma mezcla entrada/salida. En GPT-5.4-mini, la misma pila aterriza alrededor de $500/mes, que es $0.0005 por llamada a escala, un orden de magnitud más barato que lo que la mayoría de las empresas presupuestan para características de IA en su primera ronda de planificación.

El orden canónico de palancas para reducir costos en GPT-5: (1) ejecuta una evaluación para encontrar el nivel más barato de la familia que alcance calidad, (2) por lotes cada carga de trabajo asincrónica para 50% descuento, (3) reestructura prompts para que el prefijo almacenable en caché sea estable entre llamadas, (4) limita la longitud de salida donde controlas la forma de consumo. La mayoría de los equipos revierten el orden — ajustan salida al final cuando la salida es 6x el precio de entrada en todos los niveles GPT-5.


Ejemplo trabajado 4: un bucle de agente GPT-5.5 de 5 turnos

Los bucles de agente son la forma de costo peor caso en GPT-5. El modelo toma múltiples turnos por consulta del usuario, reproduciendo la transcripción completa cada turno. Un bucle típico de 5 turnos con un prefijo de sistema + herramientas de 2.000 tokens y crecimiento de contexto de 800 tokens por turno:

Turno 1: 2.800 entrada / 200 salida. Turno 2: 3.000 entrada / 200 salida. Turno 3: 3.200 entrada / 200 salida. Turno 4: 3.400 entrada / 200 salida. Turno 5: 3.600 entrada / 200 salida. Total: 16.000 entrada + 1.000 salida. En GPT-5.5: 0.016 × $5 + 0.001 × $30 = $0.080 + $0.030 = **$0.11 por consulta del usuario** — alrededor de 5.5x una llamada única.

Ahora aplica almacenamiento en caché. El prefijo de sistema + herramientas de 2.000 tokens es estable en los 5 turnos. Si el caché acierta aproximadamente el 80% de esos 2.000 tokens × 5 turnos = 8.000 tokens de entrada en caché, esos caen de $5/1M a $0.50/1M: $0.040 → $0.004, ahorrando $0.036 por consulta (33% descuento en la factura). Para 100k consultas/mes: $11.000 → $7.400.

En GPT-5.5 Pro, el mismo bucle de agente alcanza **$0.66 por consulta** a tarifas estándar — impulsado principalmente por la tarifa de $180/1M salida contra ~1.000 tokens de salida visible más razonamiento. Mover el bucle a GPT-5.4 ($2.50 / $15) con caché reduce el costo por consulta a aproximadamente $0.035 — una mejora de 19x sobre Pro para la mayoría de cargas de trabajo agentes que no requieren la profundidad de razonamiento de Pro. Para comparación contra modelos de razonamiento de la serie o que precian tokens de razonamiento a tasas de salida más bajas, consulta costo de razonamiento o1.


GPT-5.5 vs GPT-5.5 Pro vs GPT-5.4 vs GPT-5.4-mini: cómo elegir

**GPT-5.5 Pro ($30 / $180)** es para tareas donde una respuesta incorrecta cuesta más que 100 correctas. Análisis financiero multitaso, redacción legal, síntesis de código complejo con puertas de corrección estricta, razonamiento científico. Pro genera extensas cadenas de razonamiento interno antes de producir su respuesta final; pagas $180/1M para esos tokens aunque no aparezcan en la respuesta. Justifica Pro solo cuando el costo downstream del error domina el costo por llamada.

**GPT-5.5 ($5 / $30)** es el estándar para el trabajo general de propósito GPT-5: flujos de trabajo agentes, generación de contenido que se envía a humanos, chat complejo, cualquier cosa para la que habrías usado GPT-4 o primeras generaciones de GPT-5. Capacidad sustancialmente más alta que GPT-4 de la era 2024 a una fracción del precio. Si no estás seguro de qué nivel comenzar, comienza aquí y disminuye después de evaluar.

**GPT-5.4 ($2.50 / $15)** es el punto dulce para tareas estructuradas de alta calidad a escala: resumen con adherencia estricta de formato, extracción multitarea, clasificación compleja, síntesis RAG. La mayoría de los equipos de producción que ejecutan entre 100k y 1M llamadas GPT-5 por mes viven en GPT-5.4 — la mitad del precio de GPT-5.5 con deltas de calidad muy pequeños en tareas bien delimitadas.

**GPT-5.4-mini ($0.50 / $1.50)** es para tareas incrustadas de alto volumen: clasificación simple, detección de intención, enrutamiento, telemetría interna, chat simple donde el usuario espera algo rápido y ligero. La brecha de precio 10x desde GPT-5.5 lo hace viable para casos de uso que no sobrevivirían a un costo de $0.02 por llamada — sugerencias de autocompletado, enrutamiento de intención por pulsación de tecla, moderación en tiempo real.


Capacidades específicas de GPT-5 (y lo que cuestan)

GPT-5 envía tres capacidades que la distinguen de la generación GPT-4. Cada una tiene una forma de costo real que vale la pena entender antes de conectarla en un producto.

**Ventana de contexto de 1M tokens** en GPT-5.5 y GPT-5.5 Pro. Esto desbloquea análisis de una sola llamada de documentos grandes (libros completos, bases de código, transcripciones). El costo: a la tarifa de entrada de $5/1M de GPT-5.5, llenar el contexto completo cuesta $5 por llamada antes de obtener un solo token de salida. Un contrato legal de 500 páginas aproximadamente 300k tokens golpea $1.50/llamada solo en entrada. Vale la pena cuando la alternativa es un conducto RAG de 20 llamadas; brutal si realmente no necesitas el contexto completo. La mayoría de los equipos deberían fragmentar + recuperar antes de llegar al contexto de 1M.

**Visión nativa** en cada nivel GPT-5. Las imágenes se tokenizaban aproximadamente 85 tokens por mosaico de bajo detalle y 170 por mosaico de alto detalle, con una base de 85 tokens por imagen. Una imagen típica de 1024x1024 a alto detalle cuesta alrededor de 1.275 tokens de entrada — aproximadamente $0.006 en GPT-5.5 o $0.0006 en GPT-5.4-mini. Cargas de trabajo con muchas imágenes (prueba de UI, análisis de documentos, QA visual) facturan principalmente en entrada.

**Modo en tiempo real** para voz y video en streaming. Las llamadas a la API en tiempo real facturan tanto tokens de audio de entrada como tokens de audio de salida a tasas distintas publicadas en la página de precios en vivo. La economía cambia drásticamente — la salida de audio domina la factura en casos de uso conversacionales. Si estás construyendo voz en tiempo real en GPT-5, modela 1 minuto de conversación como aproximadamente 2.000 tokens de audio dentro + 2.000 tokens de audio salida por minuto, y busca las tasas específicas de audio por separado.

**Salidas estructuradas** (garantía de esquema JSON) y **llamadas de herramienta** se incluyen a tasas de token estándar — no hay costo adicional por característica. Las definiciones de herramientas facturan como tokens de entrada cada vez que se envían; almacénalas en caché como parte de tu prefijo de sistema estable y caen a la tarifa de entrada en caché del 10%.


Economía de GPT-5 por tarea (escritura, codificación, razonamiento, agentes)

Las diferentes tareas tienen diferentes formas de costo en GPT-5. Conocer la forma cambia el modelo que deberías elegir.

**Escritura (posts de blog, copy de marketing, borradores)**: entrada típica de 500-1.500 tokens, salida de 1.500-3.000 tokens. Dominado por salida. En GPT-5.5 un borrador de 1.000 entrada / 2.500 salida cuesta $0.005 + $0.075 = $0.080/llamada. En GPT-5.4 el mismo borrador cuesta $0.0025 + $0.0375 = $0.040/llamada. Límite de salida importa más aquí — ejecutar sin un techo de `max_tokens` en tareas de escritura quema 30-50% adicional en tokens que recortarás en edición.

**Codificación (refactorizar, generar, revisar)**: entrada típica de 2.000-10.000 tokens (contenidos de archivo, contexto), salida de 500-2.000 tokens. Dominada por entrada para refactores con mucho contexto. En GPT-5.5 una tarea de código de 5.000 entrada / 1.500 salida cuesta $0.025 + $0.045 = $0.070/llamada. El almacenamiento en caché de encabezados de archivo estables del proyecto y el prompt del sistema reduce eso a aproximadamente $0.030/llamada en un caché cálido. GPT-5.5 Pro solo está justificado cuando la tarea requiere razonamiento arquitectónico en muchos archivos.

**Razonamiento (matemáticas, análisis multitarea, planificación compleja)**: este es el hogar de GPT-5.5 Pro. Prompt típico de 1.000 tokens con respuesta visible de 500 tokens pero 2.000-5.000 tokens de razonamiento ocultos en salida. En GPT-5.5 Pro: $0.030 entrada + $180/1M × 5.500 = $0.030 + $0.99 = aproximadamente $1.02/llamada. Para comparación, la misma tarea en GPT-5.5 podría costar $0.020 y producir una respuesta peor; la pregunta es si la diferencia de calidad de respuesta vale 50x el costo. A menudo lo es para trabajo único de alto riesgo, raramente para inferencia escalada. Para comparación contra modelos de razonamiento de la serie o que precian tokens de razonamiento a tasas de salida más bajas, consulta costo de razonamiento o1.

**Bucles de agente (uso de herramientas multiturn)**: examinado en ejemplo trabajado 4 arriba. 4-8x una llamada única en un bucle de 5 turnos, cayendo a 2-3x con almacenamiento en caché agresivo. La mayor ganancia es mantener el prompt del sistema + definiciones de herramientas estables en el bucle para que el caché se mantenga; la segunda ganancia más grande es resumir turnos después del turno 5 en un recapitulativo compacto en lugar de reproducir la transcripción completa.


API Batch en GPT-5: cuando 50% descuento es dinero gratis

La API Batch aplica 50% descuento en entrada y salida GPT-5 para trabajos entregados dentro de 24 horas. Acepta un archivo JSONL de solicitudes, devuelve un ID de trabajo, y webhooks o encuestas para completar. Sin diferencia de calidad, sin diferencia de comportamiento — mismos modelos, mismos resultados, mitad del precio.

Las cargas de trabajo que son triunfos típicos de Batch en GPT-5: generación de contenido nocturno, resumen en lotes (boletines, resúmenes semanales), clasificación de registros de ayer, ejecuciones de evaluación y prueba de regresión, precompute de embedding (usar puntos finales de embedding), generación de conjunto de entrenamiento, redacción de informe programada. Cualquier salida que aterriza en un panel, correo electrónico o CSV consumido asincrónicamente es un candidato de Batch.

Las cargas de trabajo que no pueden usar Batch: chat sincrónico (usuario esperando), bucles de agente en tiempo real, cualquier cosa dentro de un manejador de solicitud que devuelve al usuario, cualquier cosa con SLA de sub-minuto. Alrededor del 30-60% del tráfico típico de producción GPT-5 puede moverse a Batch sin cambio de UX.

El efecto compuesto: una factura de $20.000/mes de GPT-5.5 con 50% de la carga de trabajo Batch-elegible cae a $15.000/mes — $5.000/mes ahorrados en un único cambio de configuración sin impacto de calidad. Para la mayoría de los equipos esta es la optimización única más alta en EV que pueden hacer en su gasto GPT-5.


Almacenamiento en caché de prompts en GPT-5: cómo funcionan 90% descuento en la práctica

La entrada en caché en GPT-5 factura exactamente al 10% de la tarifa de entrada estándar: $0.50/1M en GPT-5.5 (vs $5), $0.25/1M en GPT-5.4 (vs $2.50), $3.00/1M en GPT-5.5 Pro (vs $30), $0.05/1M en GPT-5.4-mini (vs $0.50). El caché es oportunista — OpenAI computa una huella digital de tu prefijo de entrada y lo almacena en caché del lado del servidor. Las llamadas posteriores con el mismo prefijo leen desde el caché.

La regla difícil: el almacenamiento en caché es una **coincidencia de prefijo**, no una coincidencia de subcadena. Cualquier cosa que quieras en caché debe venir al inicio de tu matriz de mensajes. Prompt de sistema estable, definiciones de herramientas, y ejemplos de pocos disparos van primero. Contenido específico del usuario y contexto dinámico van al final. Un prefijo en caché de 1.500 tokens en GPT-5.5 cae de $5/1M a $0.50/1M — ahorrando $0.0068 por llamada. A 1M de llamadas por mes, eso es $6.800 ahorrados con un cambio estructural.

La mayoría de los SDK LLM no requieren cambios de código para optar por almacenamiento en caché en GPT-5; el caché se activa automáticamente una vez que estructuras tus prompts primero de prefijo. El error más grande que vemos en auditorías: los equipos interpolan datos dinámicos (fecha actual, ID de usuario, estado de sesión, fragmentos RAG recuperados) en el prompt del sistema, lo que rompe cada acierto de caché. Mueve eso a un mensaje de usuario y el caché se mantiene entre llamadas.

El TTL de caché en GPT-5 es típicamente minutos (no horas), así que los patrones de tráfico importan. Una carga de trabajo con llamadas sostenidas cada pocos segundos almacena en caché confiablemente; una carga de trabajo con una llamada cada 20 minutos mayormente cache-misses. Si tu tráfico es bursátil, mira calentar el caché con una llamada sintética al inicio de cada sesión — el $0.005 marginal para calentar un prefijo de 1.500 tokens ahorra múltiples de eso en las siguientes 50 llamadas de usuario.


API de GPT-5 vs suscripción de ChatGPT: mantenerlos separados

OpenAI ejecuta dos pistas de facturación completamente separadas. La **API de GPT-5** (preciso por token, accedida en platform.openai.com) es para desarrolladores que construyen aplicaciones. La **suscripción de consumidor de ChatGPT** (Gratis, Plus $20/mes, Pro $200/mes, Team, Enterprise) da a los usuarios finales acceso a GPT-5 en la UI de ChatGPT. Mismos modelos debajo, facturación distinta.

Una suscripción de $20/mes ChatGPT Plus **no** incluye ningún crédito de API GPT-5. Si estás construyendo en la API, configura facturación API independientemente en platform.openai.com y agrega un método de pago a tu cuenta API. Las dos relaciones de facturación usan tu identidad de OpenAI pero rastrean uso, métodos de pago, límites de facturación, y promociones de nivel independientemente.

Una suscripción de $200/mes ChatGPT Pro incluye GPT-5.5 Pro en la UI de ChatGPT con uso efectivamente ilimitado, pero te da cero acceso API a GPT-5.5 Pro. Si tu equipo necesita acceso programático a GPT-5.5 Pro, pagas $30/$180 por 1M tokens en la API independientemente de cualquier suscripción Pro de ChatGPT que sostengas.

Lo que esto significa: presupuesta dos líneas de artículos separadas si tu equipo usa ambos. Un equipo de 5 personas con asientos de ChatGPT Plus ($100/mes) más una factura de API GPT-5 no está pagando el doble — los asientos financian uso interactivo y la API financia tráfico de producción. Consulta nuestra guía de costo de ChatGPT para el desglose de nivel de consumidor.


Errores comunes de costo GPT-5 (y la solución)

**Error 1: predeterminar cada carga de trabajo a GPT-5.5.** La mayoría del tráfico de producción es clasificación, resumen, o generación de forma corta que GPT-5.4 o GPT-5.4-mini maneja a 1/5 o 1/40 del precio con calidad indistinguible en una evaluación real. La solución: construye una evaluación retenida de 50 ejemplos por tarea, ejecuta los cuatro niveles GPT-5, elige el nivel más barato que pase. Este ejercicio único típicamente reduce facturas GPT-5 por 40-70%.

**Error 2: prompts de sistema enormes que nunca almacenan en caché.** Si tu prompt de sistema interpola cualquier cosa que cambie entre llamadas (marcas de tiempo, nombres de usuarios, resúmenes de contexto, fragmentos recuperados), el caché nunca acierta y pagas la tarifa de entrada completa cada vez. La solución: reescribe para que el prompt del sistema sea estático entre usuarios y sesiones; mueve todo contenido dinámico a mensajes de usuario. Un prompt de sistema estático de 2.000 tokens que acierta caché 90% del tiempo ahorra ~$8 por 1.000 llamadas en GPT-5.5.

**Error 3: sin límite de `max_tokens`.** Una respuesta de 300 tokens que devuelve 1.500 tokens porque olvidaste un techo cuesta 5x en salida. En GPT-5.5 Pro eso es $0.27 vs $0.054 por llamada. La solución: limita salida en todas partes donde controlas la forma de consumo; déjalo sin techo solo donde es genuinamente necesario.

**Error 4: reproducir historial de chat completo cada turno.** Pasado turno 5, resume la conversación anterior en un recapitulativo compacto de 200 tokens y reproduce ese en su lugar de la transcripción completa. Ahorra 50-80% en entrada en sesiones largas sin pérdida de calidad perceptible.

**Error 5: usar GPT-5.5 Pro para todo lo que 'se siente importante'.** La prima 6x de Pro sobre GPT-5.5 solo está justificada cuando el costo downstream del error excede la prima por llamada. Para la mayoría del trabajo generativo, GPT-5.5 más una pasada de verificación de cordura en GPT-5.4 es más barato y más confiable que Pro solo. Construye evaluaciones; deja que el costo siga datos, no vibraciones.

**Error 6: ignorar elegibilidad de Batch.** 30-60% del tráfico típico de producción GPT-5 puede moverse a Batch sin cambio de UX para 50% descuento. Audita tu tráfico para cualquier salida que aterrice en un panel, correo electrónico o informe consumido asincrónicamente — eso es un candidato de Batch.


Abastecimiento y cómo mantener estos números GPT-5 actuales

Cada precio en esta página proviene de la página de precios de API en vivo de OpenAI en developers.openai.com/api/docs/pricing, recuperada 2026-06-20 y verificada contra tres fuentes corroborantes independientes (commits de integración recientes en proyectos de código abierto populares, agregadores de precios de comunidad, el libro de cocina público de OpenAI). Donde un número no podía ser verificado contra la página oficial fue omitido — preferiríamos enviar una guía faltando una fila que enviar una guía con un número fabricado.

OpenAI no versiona su página de precios con entradas de registro de cambios explícitas. Empacan cambios silenciosamente. Desde que la familia GPT-5 se lanzó, hemos visto dos movimientos de precio: una reducción de tarifa de entrada del 20% en GPT-5.4-mini a la madurez del lanzamiento, y un ajuste de la proporción de entrada en caché a un 10% limpio. Espera movimiento trimestral en al menos un nivel de la familia.

**Cómo verificar antes de presupuestar**: abre developers.openai.com/api/docs/pricing en una ventana incógnita (sin sesión conectada interfiriendo en renderizado), copia las cuatro filas de GPT-5 en una hoja de cálculo, compara contra la tabla arriba. Si coinciden, esta guía es actual para tus propósitos. Si no, confía en la página en vivo. Re-verifica trimestralmente si tu factura GPT-5 es más de $1.000/mes — a ese volumen un movimiento de precio único cambia el presupuesto materialmente.

**Metodología reproducible**: cada dólar en la tabla y cada ejemplo trabajado rastrea a los cuatro precios publicados arriba. Ninguna fila fue sintetizada de tasas 'plausibles'. Si encuentras una discrepancia con la página en vivo, trata la página en vivo como canónica y cuéntanos — re-recuperamos y actualizamos. Exploraciones hermanas: costo de Claude API para comparación Anthropic, costo de DeepSeek para alternativas de código abierto a precios fraccionarios de GPT-5.

Cómo estimar cualquier costo de llamada GPT-5 en 5 pasos

  1. 1

    Estima tus tokens de entrada

    Toma el recuento de caracteres de tu prompt y divide por 4, o su recuento de palabras y divide por 0.75. Regla de oro: 1 token ≈ 4 caracteres ≈ 0.75 palabras inglesas. Un prompt de sistema de 500 palabras + un mensaje de usuario de 200 palabras ≈ (500 + 200) ÷ 0.75 ≈ 933 tokens de entrada. Para imágenes, cuenta ~85 tokens por mosaico de bajo detalle, ~170 por mosaico de alto detalle, más una base de 85 tokens.

    → Open the Generador de prompts de ChatGPT
  2. 2

    Estima tus tokens de salida (y límítalos)

    Estima salida de la misma manera — palabras ÷ 0.75. La salida impulsa el costo porque la salida es 6x entrada en todos los niveles GPT-5. En GPT-5.5 Pro, factoriza 3-8x tokens de razonamiento que facturan como salida. Establece un límite de `max_tokens` en cualquier lugar donde puedas predecir la forma de consumo.

  3. 3

    Busca el precio del nivel GPT-5 por 1M

    De la tabla arriba (verificada junio de 2026): GPT-5.5 Pro $30 / $180, GPT-5.5 $5 / $30, GPT-5.4 $2.50 / $15, GPT-5.4-mini $0.50 / $1.50. Siempre confirma la página en vivo antes de comprometerte con presupuesto.

  4. 4

    Aplica la fórmula de costo GPT-5

    cost = (input_tokens / 1,000,000) × input_price + (output_tokens / 1,000,000) × output_price. Una llamada de 1.000 entrada / 500 salida en GPT-5.4-mini = 0.001 × $0.50 + 0.0005 × $1.50 = $0.0005 + $0.00075 = $0.00125.

  5. 5

    Apila los descuentos de GPT-5

    La entrada en caché factura al 10% del estándar en todos los niveles GPT-5. La API Batch aplica 50% descuento en ambas corrientes para trabajos entregados dentro de 24 horas. Se componen. Una llamada GPT-5.5 en caché + por lotes paga $0.25/1M en la porción de entrada en caché y $15/1M en salida — aproximadamente una reducción de factura total del 60% a escala.

Frequently Asked Questions

¿Cuánto cuesta GPT-5 por 1 millón de tokens en 2026?

A partir de junio de 2026, GPT-5.5 cobra $5.00 por 1M tokens de entrada y $30.00 por 1M tokens de salida. GPT-5.5 Pro es $30 / $180. GPT-5.4 es $2.50 / $15. GPT-5.4-mini es $0.50 / $1.50. Los tokens de entrada en caché facturan exactamente al 10% de la tarifa de entrada estándar en todos los niveles GPT-5. Fuente: página de precios en vivo de OpenAI (developers.openai.com/api/docs/pricing).

¿Cuál es la diferencia entre precios de GPT-5.5 y GPT-5.5 Pro?

GPT-5.5 es $5 entrada / $30 salida por 1M tokens. GPT-5.5 Pro es $30 entrada / $180 salida — exactamente 6x más caro en ambas corrientes. Pro también genera extensos tokens de razonamiento interno que facturan a la tarifa de salida incluso aunque no se devuelvan a ti, así que el costo efectivo de Pro en tareas con mucho razonamiento ejecuta 8-20x GPT-5.5 estándar. Justifica Pro solo cuando el costo downstream del error domina el costo por llamada.

¿Cuál es el modelo GPT-5 más barato en 2026?

GPT-5.4-mini a $0.50 entrada / $1.50 salida por 1M tokens. Una llamada típica de 1.000 entrada / 500 salida cuesta $0.00125 en GPT-5.4-mini — 96x más barato que la misma llamada en GPT-5.5 Pro. Mejor para tareas incrustadas de alto volumen: clasificación, detección de intención, autocompletado, enrutamiento, moderación en tiempo real. Evitar para razonamiento multitarea o generación compleja.

¿Tiene GPT-5 un nivel gratuito?

La API GPT-5 no tiene un nivel gratuito permanente. Las nuevas cuentas de OpenAI típicamente reciben un pequeño crédito de prueba (históricamente $5, aplicado por 90 días) que se puede gastar en cualquier modelo incluyendo GPT-5. El producto de consumidor ChatGPT ofrece GPT-5 en su nivel gratuito con límites de uso, pero eso no te da acceso a la API. Para uso de producción de la API GPT-5, debes agregar un método de pago en platform.openai.com y pagar por token a las tasas arriba.

¿Cuánto cuesta la API GPT-5 por llamada?

Para una llamada representativa de 1.000 entrada / 500 salida a tarifas de junio de 2026: $0.00125 en GPT-5.4-mini, $0.010 en GPT-5.4, $0.020 en GPT-5.5, y $0.120 en GPT-5.5 Pro. Aplica API Batch para 50% descuento si la carga de trabajo puede esperar 24 horas, y almacenamiento en caché de prompts para 90% descuento en la porción almacenable en caché de entrada. Una llamada GPT-5.5 en caché + por lotes en la misma forma aterriza alrededor de $0.010-0.014 por llamada.

¿Cuál es el descuento de la API Batch de GPT-5?

La API Batch aplica 50% descuento tanto en precios de tokens de entrada como de salida en cada modelo GPT-5 para trabajos asincronos que pueden esperar hasta 24 horas para entrega. Envía un archivo JSONL de solicitudes, recibe un ID de trabajo, encuesta o webhook para completar. Mismos modelos, mismos resultados, mitad del precio. Mejor para resumen nocturno, resúmenes semanales, clasificación en lotes, generación de conjunto de entrenamiento, ejecuciones de evaluación — cualquier cosa no consumida sincrónicamente.

¿Cuánto cuesta la entrada en caché de GPT-5?

La entrada en caché factura exactamente al 10% de la tarifa de entrada estándar en todos los niveles GPT-5: $0.50/1M en GPT-5.5 (vs $5), $0.25/1M en GPT-5.4 (vs $2.50), $3.00/1M en GPT-5.5 Pro (vs $30), $0.05/1M en GPT-5.4-mini (vs $0.50). El caché es oportunista y solo de prefijo: pon prompts de sistema estables y definiciones de herramientas al inicio, contenido dinámico al final.

¿Puedo apilar descuentos de Batch y entrada en caché de GPT-5?

Sí. Los descuentos se componen multiplicativamente. Una llamada GPT-5.5 en caché + por lotes paga $0.50/1M (entrada en caché) ÷ 2 (batch) = $0.25/1M en entrada en caché, y $30/1M ÷ 2 = $15/1M en salida. Una carga de trabajo estándar de GPT-5.5 de $20.000/mes típicamente aterriza alrededor de $7.000-9.000/mes con ambos descuentos aplicados — una reducción del 55-65% sin cambio de calidad.

Deja de pagar de más por GPT-5. Escribe prompts construidos para el modelo por el que factura.

Nuestro Generador de Prompts de IA escribe prompts optimizados para GPT-5 basado en TU negocio + tarea — prepagado para caché, limitado para salida, dimensionado para el nivel más barato que funciona. Prueba gratuita de 14 días, sin tarjeta.

Browse all prompt tools →

Biblioteca gratuita de prompts — más de 100 prompts listos para copiar

Prompts seleccionados cada semana para ChatGPT, Claude, Midjourney y DALL·E. Sin spam. Cancela cuando quieras.

Sin spam. Un correo por semana. Más de ~12.000 usuarios de prompts ya suscritos.