Tarjeta de modelo · Verificado contra docs de OpenAI · 2026-06-20

GPT-5: Ficha técnica completa (junio 2026)

By The DDH Team at Digital Dashboard Hub·Updated June 19, 2026

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

GPT-5 es el modelo de propósito general estrella de OpenAI, lanzado en agosto de 2025. Sustituyó a GPT-4o y la línea preview GPT-4.5, consolidando razonamiento, entrada multimodal y uso de herramientas en un único endpoint. A partir de junio de 2026 es el modelo predeterminado de ChatGPT Plus, Pro, Team y Enterprise, y la opción recomendada en la API para cualquier tarea que superara el umbral donde GPT-4o dejó de ser suficiente.

Los números destacados: $1.25 por cada 1M tokens de entrada, $10 por 1M de salida, $0.125 por 1M para entrada en caché (descuento del 90% en el prefijo en caché). La ventana de contexto es de 400.000 tokens — entrada + salida combinadas — con un límite máximo de 128.000 tokens de salida por respuesta. El corte de conocimiento es el 30 de septiembre de 2024. Las modalidades son entrada de texto e imagen; salida solo de texto. Llamadas a funciones, llamadas paralelas a herramientas, salidas estructuradas (JSON Schema), la API Responses, almacenamiento en caché de prompts y la API Batch (50% descuento) están todas soportadas.

A continuación, la tabla de especificaciones completa, la solicitud mínima de cURL + Python, cuándo GPT-5 es la opción correcta frente a gpt-5-mini o gpt-5-nano, una comparativa lado a lado contra Claude Opus 4.7 y Gemini 2.5 Pro, y las preguntas frecuentes que cubren cada matiz que la documentación omite. Páginas relacionadas: Ficha técnica de GPT-5 mini · Ficha técnica de Claude Opus 4.7 · Ficha técnica de Gemini 2.5 Pro. Escribe un prompt optimizado para GPT-5 gratis con nuestro generador de prompts ChatGPT.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card. →

GPT-5 — Ficha técnica completa (junio 2026)

Feature	Especificación GPT-5
Proveedor	OpenAI
ID del modelo (API)	gpt-5
Lanzado	Agosto 2025
Precio entrada (por 1M)	$1.25
Precio entrada en caché (por 1M)	$0.125 (90% descuento)
Precio salida (por 1M)	$10.00
Descuento API Batch	50% descuento entrada + salida
Ventana de contexto (entrada + salida)	400.000 tokens
Tokens máximos de salida	128.000 tokens
Modalidades (entrada)	Texto, imagen
Modalidades (salida)	Texto
Llamadas a funciones
Llamadas paralelas a herramientas
Salidas estructuradas (JSON Schema)
Streaming
Almacenamiento en caché de prompts (automático)
Visión (comprensión de imágenes)
Control de esfuerzo de razonamiento	mínimo / bajo / medio / alto
Corte de conocimiento	30 de septiembre de 2024
Endpoint	/v1/responses, /v1/chat/completions

Fuentes verificadas 2026-06-20: página de modelos de OpenAI (https://platform.openai.com/docs/models/gpt-5), página de precios de OpenAI (https://openai.com/api/pricing), referencia de la API Responses de OpenAI (https://platform.openai.com/docs/api-reference/responses). Los precios y límites cambian sin previo aviso — vuelve a verificar las páginas activas antes de presupuestar.

Qué es realmente GPT-5 (y qué cambió de GPT-4o)

GPT-5 es el primer modelo de OpenAI que lanza razonamiento, entrada multimodal y uso de herramientas como una superficie unificada y única, en lugar de tres endpoints separados. Donde GPT-4o, o1 y o3-mini eran tres superficies API distintas en 2024-2025, GPT-5 las colapsa: un único ID de modelo `gpt-5` con un parámetro `reasoning_effort` (`minimal`, `low`, `medium`, `high`) que escala cuántos tokens de razonamiento interno quema el modelo antes de responder.

En la práctica, esto significa que ya no eliges entre un 'modelo de chat' frente a un 'modelo de razonamiento'. Eliges GPT-5 y ajustas el esfuerzo de razonamiento para que coincida con la tarea. Una llamada de clasificación usa `reasoning_effort: minimal` y se factura como GPT-4o. Una llamada de síntesis de código o prueba matemática usa `reasoning_effort: high` y quema varios miles de tokens de razonamiento — facturados al precio de salida aunque no se devuelvan en la respuesta.

La visión está integrada: pasa una URL de imagen o una imagen codificada en base64 en cualquier mensaje de usuario y GPT-5 la analizará. Las llamadas a funciones, las llamadas paralelas a herramientas, las salidas estructuradas (fuerza al modelo a devolver JSON conforme a un JSON Schema) y el almacenamiento en caché de prompts están todos activados por defecto. La API Responses (`/v1/responses`) es el endpoint recomendado de OpenAI para código nuevo; chat completions sigue funcionando para todo lo que GPT-5 hace y sigue siendo el camino de menor fricción para migrar desde modelos GPT anteriores.

Matemáticas de precios: lo que GPT-5 realmente cuesta por llamada

La fórmula de precios es el modelo estándar por token: `coste = (tokens_entrada / 1M) × $1.25 + (tokens_salida / 1M) × $10`. Una llamada representativa de 1.000 tokens entrada / 500 tokens salida: `0.001 × $1.25 + 0.0005 × $10 = $0.00125 + $0.005 = $0.00625`. Aproximadamente 0.6¢ por llamada.

Aplica almacenamiento en caché de prompts: un prompt del sistema de 2.000 tokens con el 80% en caché en múltiples llamadas reduce 1.600 tokens de entrada de $1.25/M a $0.125/M — ahorrando $0.0018 por llamada. En 100.000 llamadas/mes, eso equivale a $180 menos en la factura sin coste de calidad.

Aplica la API Batch: una carga JSONL de 1.000 solicitudes con entrega de hasta 24 horas se ejecuta a $0.625/M entrada y $5/M salida — 50% descuento en ambas corrientes. La carga de trabajo de 1.000 entrada / 500 salida se reduce a $0.003125 por llamada.

Los tokens de razonamiento son el elemento de línea oculto. Con `reasoning_effort: high`, GPT-5 puede quemar 4.000-10.000 tokens de razonamiento antes de producir una respuesta visible de 500 tokens. Esos tokens de razonamiento se facturan al precio de salida ($10/M) pero no se devuelven. Una llamada con razonamiento alto que produce una respuesta de 500 tokens con 5.000 tokens de razonamiento factura 5.500 tokens de salida = $0.055 — 8.8× una llamada sin razonamiento. Presupuesta en consecuencia. Para un recorrido de costes completo en la familia GPT-5, consulta nuestra calculadora de costes de la API de OpenAI.

Ventana de contexto: 400K total, límite de salida de 128K

La ventana de contexto de 400.000 tokens de GPT-5 es entrada + salida combinadas — no 400K de cada una. El límite máximo de salida es de 128.000 tokens por respuesta, así que una respuesta de máxima longitud deja 272.000 tokens para entrada. En la práctica, la mayoría de cargas de trabajo de producción se ejecutan con entrada en el rango de 5K-50K y salida limitada bien por debajo de 4K mediante `max_output_tokens`, que es la configuración que alcanza el punto óptimo de precio-rendimiento.

400K es suficiente para encajar aproximadamente un documento de 300.000 palabras (≈600 páginas de texto a espacio simple) o un fragmento de base de código completo de 1.500 líneas con metadatos. Es menos que la ventana de 1M de Gemini 2.5 Pro pero más que la de 200K de Claude Opus 4.7. Para flujos de trabajo potenciados por recuperación, la ventana de GPT-5 es cómoda. Para resumen de documentos largos donde toda la entrada debe caber en una sola solicitud, Gemini 2.5 Pro es el único modelo frontera con una ventana más grande.

Siempre limita la longitud de salida. El `max_output_tokens` predeterminado es el máximo del modelo (128K), y un modelo que decide divagar puede dispararse en coste. Establecer `max_output_tokens: 2000` para una solicitud de preguntas y respuestas normal, `max_output_tokens: 8000` para generación de código, y solo elevar ese límite cuando la tarea genuinamente lo necesita (informe de forma larga, revisión completa de base de código) es la disciplina que separa facturas predecibles de facturas sorpresa.

Modalidades: texto adentro, texto + imagen adentro, texto afuera

GPT-5 acepta texto e imágenes como entrada. No hay entrada o salida de audio en el endpoint estándar `gpt-5` (la API Realtime de OpenAI usa un modelo separado para conversación de voz a voz). La entrada de imagen se envía como una URL que OpenAI puede obtener o como una URL de datos codificada en base64 dentro del array `content` de un mensaje. Cada imagen se factura a un coste de token fijo dependiendo del detalle de resolución (`low` es ~85 tokens, `high` es hasta ~1.100 tokens por imagen para el tamaño de mosaico estándar).

La salida es solo texto — sin generación de imágenes nativa. Para generar imágenes, llama a `gpt-image-1` (el sucesor de DALL·E 3) o envía una llamada a herramienta desde GPT-5 a tu pipeline de generación de imágenes. Para audio, integra la API Realtime por separado o usa Whisper para transcripción antes de pasar texto a GPT-5.

La calidad de visión en GPT-5 es notablemente más fuerte que GPT-4o en gráficos, diagramas, texto manuscrito y razonamiento multi-imagen. Aún tiene dificultades con texto muy pequeño (placas de matrícula, capturas de pantalla densas a baja resolución), y como con cada modelo de visión, el OCR se maneja mejor con una herramienta OCR dedicada cuando el volumen lo justifica.

Llamadas a funciones, herramientas y salidas estructuradas

GPT-5 soporta la superficie completa de la API de llamadas a funciones: define herramientas como JSON Schema, GPT-5 elige una (o varias, en paralelo) y devuelve los argumentos para llamar. Las llamadas paralelas a herramientas permiten que GPT-5 invoque múltiples herramientas en una sola respuesta cuando aceleraría la tarea — por ejemplo, obtener dos endpoints de API simultáneamente. Esto está activado por defecto; pasa `parallel_tool_calls: false` para desactivar.

Las salidas estructuradas (introducidas en 2024 para GPT-4o, refinadas en GPT-5) te permiten pasar un parámetro `response_format: { type: 'json_schema', json_schema: {...} }` y OpenAI garantiza que la salida del modelo valida contra ese esquema. No más analizar JSON libre y reintentar en errores de validación. Soporta objetos anidados, arrays, enums, oneOf — el subconjunto de JSON Schema que creció durante 2025.

La nueva API Responses (`/v1/responses`) es el endpoint recomendado de OpenAI para nuevas integraciones a partir de mediados de 2025. Soporta conversaciones con estado (almacenamiento de mensajes del lado del servidor), herramientas integradas (búsqueda de archivos, búsqueda web, intérprete de código, uso de computadora) y un protocolo de streaming más limpio. Chat completions (`/v1/chat/completions`) aún funciona para todo lo que GPT-5 hace y sigue siendo el camino de menor fricción para migrar desde modelos GPT anteriores.

Esfuerzo de razonamiento: el parámetro más importante de GPT-5

GPT-5 expone un parámetro `reasoning_effort` con cuatro niveles: `minimal`, `low`, `medium` (predeterminado) y `high`. Este es el control que convierte GPT-5 de un modelo de chat rápido en un modelo de razonamiento lento sobre una base por llamada — sin necesidad de ID de modelo separado.

`minimal`: tokens de razonamiento casi nulos, respuesta más rápida, facturado esencialmente como entrada + salida visible. Usa para clasificación, extracción, preguntas y respuestas simples, conversiones de formato — cualquier cosa donde la respuesta es mecánica.

`low`: unos pocos cientos de tokens de razonamiento. El punto dulce para chat de propósito general, generación de contenido y tareas de código rutinarias. Añade <$0.005 por llamada frente a minimal en la mayoría de cargas de trabajo.

`medium` (predeterminado): típicamente 1.000-3.000 tokens de razonamiento. Usa para análisis, planificación multi-paso, síntesis de código donde la corrección importa.

`high`: 4.000-10.000+ tokens de razonamiento. Usa para pruebas matemáticas, síntesis de código complejo con estrictos requisitos de corrección, análisis legal/financiero. Factura 5-10× una llamada sin razonamiento. La mayoría de equipos sobre-usan `high` e infra-usan `low`; perfila tu tráfico y dimensiona correctamente el nivel de esfuerzo de cada prompt.

Cuándo elegir GPT-5 frente a gpt-5-mini frente a gpt-5-nano

**Elige GPT-5** cuando la calidad de salida es el cuello de botella — síntesis de código, razonamiento complejo, planificación multi-paso, tareas de visión con requisitos altos de precisión, cualquier cosa que se envíe a humanos donde 'suficientemente bueno' no fue suficiente en gpt-4o. La prima de 8× sobre gpt-5-mini se justifica cuando el coste de error descendente domina el coste por llamada.

**Elige gpt-5-mini** ($0.25 / $2 por 1M) cuando necesites el seguimiento de instrucciones de GPT-5 y salidas estructuradas pero la tarea subyacente es mecánica: clasificación, extracción, resumen, transformación de datos estructurados, chat simple. La mayoría de cargas de trabajo de producción con >100K llamadas/mes viven en gpt-5-mini.

**Elige gpt-5-nano** ($0.05 / $0.40 por 1M, donde esté disponible) para casos de uso integrados — enrutamiento de intención, moderación de contenido, sugerencias de estilo autocompletar, clasificación de telemetría interna. Evita para cualquier cosa que requiera razonamiento multi-paso.

Entre proveedores: elige **Claude Opus 4.7** para escritura de forma larga donde la voz y la calibración de rechazo de Anthropic importan más que el cociente intelectual puro; elige **Gemini 2.5 Pro** cuando necesites una ventana de contexto de 1M en una sola llamada o comprensión nativa de vídeo. Consulta GPT-5 frente a Claude Opus 4.7 para la comparativa lado a lado.

Fuentes verificadas y cómo volver a comprobar los números

Cada número en esta página fue verificado contra la documentación activa de OpenAI el 2026-06-20. Las fuentes canónicas: platform.openai.com/docs/models/gpt-5 para ventana de contexto, modalidades y soporte de parámetros; openai.com/api/pricing para precios de entrada/salida/en caché; platform.openai.com/docs/api-reference/responses para el contrato de la API Responses.

OpenAI no versionea sus páginas de precios o modelos con entradas de changelog explícitas. Los precios se han movido 3-5 veces por año en promedio desde que se lanzó GPT-4 en 2023, casi siempre hacia abajo a medida que un modelo madura. Vuelve a verificar trimestralmente si tu factura mensual supera $1.000 — un único movimiento de precio cambia el presupuesto materialmente a escala.

Metodología: cuando un número no podía ser confirmado de forma cruzada contra la página oficial de OpenAI en la fecha de verificación, fue omitido de esta tarjeta en lugar de ser adivinado. Si encuentras una discrepancia contra la página activa de OpenAI, trata la página activa como canónica.

Realiza tu primera llamada a la API de GPT-5 en 5 pasos

1
Obtén una clave de API de OpenAI
Inicia sesión en platform.openai.com → dashboard → Claves de API → Crear nueva clave secreta. Cópiala a un archivo `.env` como `OPENAI_API_KEY=...`. Nunca hagas commit de las claves a git.
2
Instala el SDK
Python: `pip install openai`. Node: `npm install openai`. El SDK soporta GPT-5, la API Responses, salidas estructuradas, entrada de visión y almacenamiento en caché de prompts sin necesidad de fijar versiones más allá de la última versión estable.
3
Envía una llamada mínima
Python: `from openai import OpenAI; client = OpenAI(); r = client.responses.create(model='gpt-5', input='Explica los prefijos de almacenamiento en caché en una frase.'); print(r.output_text)`. Ese es el viaje completo — ID de modelo, entrada, respuesta.
4
Añade esfuerzo de razonamiento + límite de salida máximo
Para coste predecible: `client.responses.create(model='gpt-5', input=prompt, reasoning={'effort': 'low'}, max_output_tokens=2000)`. El esfuerzo de razonamiento `low` es la opción predeterminada correcta para la mayoría de cargas de trabajo de estilo chat; limita la salida para mantener la factura acotada.
→ Open the Generador de prompts ChatGPT
5
Añade salidas estructuradas para producción
Fuerza una respuesta tipada: pasa `text={'format': {'type': 'json_schema', 'json_schema': {...}}}` en la API Responses o `response_format` en chat completions. Se garantiza que el modelo devolverá JSON que valida — sin bucles de análisis y reintento.

Digital Dashboard Hub

The prompt patterns above work 10x better when they live in a library you actually own — tunable to your niche, exportable to GPT-5, Claude, Gemini, Perplexity, Midjourney, Llama. Stop pasting across 6 tools.

Try DDH's AI Prompt Builder — free 14 days, no card. →

Related calculators

OpenAI Pricing Calculator →GPT-5.5, 5.4, mini, nano — full per-call cost in one input.Claude Pricing Calculator →Opus 4.8, Sonnet 4.6, Haiku 4.5, Fable 5 — input + output combined.Context Window Comparison →Max input length and price per 1M for every current model.

Related prompt tools

Generador de prompts ChatGPT (optimizado para GPT-5)→Constructor de prompts de código (anclado en caché)→Ficha técnica de GPT-5 mini→Ficha técnica de Claude Opus 4.7→Calculadora de costes de API de OpenAI→

Frequently Asked Questions

¿Cuánto cuesta GPT-5 en 2026?

$1.25 por 1M tokens de entrada, $10 por 1M tokens de salida, $0.125 por 1M para entrada en caché (90% descuento). La API Batch toma otro 50% descuento en ambas corrientes para trabajos asincrónica con entrega de hasta 24 horas. Una llamada representativa de 1.000 entrada / 500 salida cuesta ~$0.00625. Fuente: openai.com/api/pricing, verificado 2026-06-20.

¿Cuál es la ventana de contexto de GPT-5?

400.000 tokens — entrada + salida combinadas. La salida máxima por respuesta está limitada a 128.000 tokens, así que una respuesta de máxima longitud deja 272.000 tokens para entrada. Más grande que Claude Opus 4.7 (200K), más pequeña que Gemini 2.5 Pro (1M).

¿Cuál es el corte de conocimiento de GPT-5?

30 de septiembre de 2024 según la tarjeta de modelo de OpenAI. Para cualquier cosa después de esa fecha — eventos, lanzamientos, cambios de API — GPT-5 no tiene conocimiento a menos que lo proporciones mediante contexto o una llamada a herramienta de búsqueda web.

¿Cuál es la diferencia entre GPT-5 y GPT-5 mini?

La misma ventana de contexto (400K), las mismas modalidades (entrada de texto + imagen), el mismo conjunto de características (llamadas a funciones, salidas estructuradas, almacenamiento en caché de prompts). La diferencia es calidad y precio: GPT-5 es $1.25/$10 por 1M, mini es $0.25/$2 — aproximadamente 5× más barato. GPT-5 tiene razonamiento más fuerte, síntesis de código y planificación multi-paso; mini es la opción correcta para tareas mecánicas de alto volumen. Consulta nuestra ficha técnica de GPT-5 mini para la comparativa lado a lado.

¿GPT-5 soporta visión?

Sí. Pasa imágenes como URLs o URLs de datos codificadas en base64 dentro del array `content` de un mensaje de usuario. La visión de GPT-5 es notablemente más fuerte que GPT-4o en gráficos, diagramas, texto manuscrito y razonamiento multi-imagen. La salida es solo texto — sin generación de imágenes nativa; usa `gpt-image-1` para eso.

¿Qué es reasoning_effort y cómo lo uso?

GPT-5 expone un parámetro `reasoning_effort` con cuatro niveles: `minimal`, `low`, `medium` (predeterminado), `high`. Controla cuántos tokens de razonamiento interno quema GPT-5 antes de producir la respuesta visible. Los tokens de razonamiento se facturan al precio de salida. Usa `minimal` para clasificación/extracción, `low` para chat, `medium` para análisis, `high` solo cuando la corrección domina el coste (pruebas, síntesis de código complejo).

¿GPT-5 está disponible en la API o solo en ChatGPT?

Ambos. El ID de modelo `gpt-5` está disponible en platform.openai.com a través de la API Responses (`/v1/responses`, recomendado para código nuevo) y chat completions (`/v1/chat/completions`, retrocompatible). También es el modelo predeterminado de ChatGPT Plus, Pro, Team y Enterprise. La facturación de la API y la facturación de suscripción de ChatGPT son separadas — una suscripción de ChatGPT Plus no incluye crédito de API.

¿Puedo hacer fine-tuning en GPT-5?

OpenAI no ha abierto el fine-tuning público en GPT-5 a partir de junio de 2026 — el fine-tuning está disponible en gpt-4.1, gpt-4o y gpt-4o-mini. Para la mayoría de casos de uso, GPT-5 + salidas estructuradas + un prompt bien engineerizado cierran la brecha de calidad que el fine-tuning abordaría. Consulta platform.openai.com/docs/guides/fine-tuning para la disponibilidad actual de modelos.

Deja de pagar de más en GPT-5. Escribe prompts creados para el modelo.

Nuestro generador de prompts IA escribe prompts optimizados para GPT-5 (sistema+desarrollador+usuario divididos, listos para salida estructurada, anclados en caché) basados en TU negocio + tarea. 14 días gratis de DDH Pro, sin tarjeta.

Browse all prompt tools →