Skip to contentNew: Does ChatGPT recommend your brand? Free 60-second AI visibility check →
Tarjeta de modelo · Verificado contra documentación OpenAI · 2026-06-20

GPT-5 mini: Especificaciones completas (junio 2026)

By The DDH Team at Digital Dashboard HubUpdated

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

14 days, no card. Cancel in 2 clicks.

gpt-5-mini es el hermano de nivel medio de GPT-5, lanzado junto al modelo insignia en agosto de 2025. Mismo ventana de contexto, mismas modalidades (entrada de texto + imagen), mismo conjunto de características (llamadas de función, salidas estructuradas, llamadas de herramientas en paralelo, caché de prompts, API de Respuestas), mismo parámetro effort-reasoning. La única diferencia significativa es el tamaño del modelo subyacente — y el precio que conlleva.

Números destacados: $0,25 por 1M tokens de entrada, $2 por 1M salida, $0,025 por 1M para entrada en caché (90% de descuento). Es 5× más barato que GPT-5 en entrada y salida. La ventana de contexto es de 400.000 tokens combinados; la salida máxima es de 128.000 tokens. El corte de conocimiento es el 31 de mayo de 2024. El mismo endpoint de API de Respuestas lo sirve.

La mayoría de equipos de producción que ejecutan más de 100.000 llamadas/mes funcionan con gpt-5-mini. Es la opción predeterminada correcta para clasificación, extracción, resumen, transformación de datos estructurados, chat rutinario, andamiaje de contenido — cualquier cosa donde GPT-5 estaría pagando de más por capacidad que no usas. A continuación: tabla de especificaciones completa, cuándo elegirlo sobre GPT-5 o Claude Sonnet 4.6, solicitud API mínima, 8 preguntas frecuentes. Páginas hermanas: especificaciones de GPT-5 · especificaciones de Claude Sonnet 4.6 · especificaciones de Gemini 2.5 Flash. Escribe un prompt ajustado a gpt-5-mini gratis con nuestro generador de prompts de ChatGPT.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card.

gpt-5-mini — Ficha técnica completa (junio 2026)

Feature
especificaciones de gpt-5-mini
ProveedorOpenAI
ID del modelo (API)gpt-5-mini
LanzadoAgosto 2025
Precio de entrada (por 1M)$0,25
Precio de entrada en caché (por 1M)$0,025 (90% de descuento)
Precio de salida (por 1M)$2,00
Descuento de API por lotes50% de descuento entrada + salida
Ventana de contexto (entrada + salida)400.000 tokens
Tokens de salida máxima128.000 tokens
Modalidades (entrada)Texto, imagen
Modalidades (salida)Texto
Llamadas de función
Llamadas de herramientas en paralelo
Salidas estructuradas (JSON Schema)
Streaming
Caché de prompts (automático)
Visión (comprensión de imágenes)
Control de effort-reasoningminimal / low / medium / high
Corte de conocimiento31 de mayo de 2024
Endpoint/v1/responses, /v1/chat/completions

Fuentes verificadas 2026-06-20: página de modelos de OpenAI (https://platform.openai.com/docs/models/gpt-5-mini), página de precios de OpenAI (https://openai.com/api/pricing). Los precios cambian sin aviso — reverifica antes de presupuestar.

Qué es realmente gpt-5-mini (vs GPT-5)

gpt-5-mini es una variante más pequeña, rápida y barata de GPT-5 construida sobre la misma arquitectura y canalización de entrenamiento. OpenAI no publica conteos de parámetros para ninguno de los dos modelos, pero en la práctica gpt-5-mini es aproximadamente el equivalente de gpt-4o-mini en la familia de GPT-5 — la misma disciplina de seguimiento de instrucciones, más débil en razonamiento complejo, dramáticamente más barato.

Lo crucial es que la superficie de características es idéntica: gpt-5-mini soporta las mismas llamadas de función, llamadas de herramientas en paralelo, salidas estructuradas (validadas por JSON Schema), caché de prompts, endpoint de API de Respuestas, entrada de visión y control de effort-reasoning. Cualquier cosa que escribas para GPT-5 se ejecuta en gpt-5-mini con un simple cambio de ID de modelo. La diferencia se ve en tareas que requieren razonamiento de múltiples pasos, síntesis de código complejo o precisión factual estricta.

Posicionamiento de OpenAI: gpt-5-mini es el nivel 'predeterminado para producción'. La mayoría de asistentes de chat, extractores de datos estructurados, canalizaciones de clasificación, andamios de contenido y agentes de enrutamiento deberían estar aquí. Reserva GPT-5 para la pequeña fracción de tráfico donde el costo del error realmente domina el costo por llamada.


Matemáticas de precios: qué cuesta realmente gpt-5-mini por llamada

Tasas estándar: `costo = (tokens_entrada / 1M) × $0,25 + (tokens_salida / 1M) × $2`. La llamada representativa 1.000-entrada / 500-salida: `0,001 × $0,25 + 0,0005 × $2 = $0,00025 + $0,001 = $0,00125`. Alrededor de 0,125¢ por llamada — una quinta parte del costo de GPT-5 en tokens idénticos.

A 1.000.000 de llamadas/mes con ese perfil, la tarifa estándar ejecuta $1.250 vs $6.250 de GPT-5. Aplica un 80% de coincidencia de caché de prompts en un prefijo del sistema de 1.500 tokens y la entrada por llamada cae más; aplica API por lotes para cargas de trabajo asincrónicas (resumen, clasificación, evaluación) y otro 50% de descuento en ambos flujos.

Ejemplo del mundo real: una canalización de clasificación de soporte al cliente con 2M llamadas/mes con promedios de 800-entrada / 100-salida en gpt-5-mini ejecuta `0,0008 × $0,25 + 0,0001 × $2 = $0,0004 por llamada = $800/mes`. Con caché de prompts activando en el prefijo del sistema estable, ~$500/mes. En GPT-5, la misma carga de trabajo es $4.000/mes. La elección del modelo es el mayor apalancamiento de costo en la familia GPT-5 por un amplio margen. Trabajado $ a escala: calculadora de costos de API de OpenAI.


Ventana de contexto y límite de salida — misma forma que GPT-5

gpt-5-mini viene con la misma ventana de contexto de 400.000 tokens que GPT-5 y el mismo límite de salida máxima de 128.000 tokens. No hay variante con contexto más pequeño; OpenAI estandarizó la ventana en la familia GPT-5 para que el trabajo de ingeniería de prompts sea portátil entre niveles.

Implicación práctica: los prompts que funcionan en GPT-5 caben en gpt-5-mini sin reescrituras relacionadas con el contexto. La brecha de precio es puramente una brecha de calidad, no una brecha de contexto. Si estás moviendo tráfico desde GPT-5 a gpt-5-mini por razones de costo, la migración es un cambio de ID de modelo más un pase de evaluación — no una reescritura de prompts.

Como siempre, limita la salida. Establece `max_output_tokens` al límite realista para tu tarea (1.500 para chat, 4.000 para código, 8.000 para formato largo). El límite predeterminado (128K) es una guardia defensiva, no un objetivo.


Dónde gpt-5-mini gana y dónde pierde frente a GPT-5

**Gana (usa gpt-5-mini)**: clasificación, extracción de entidades nombradas, resumen de entrada estructurada, conversiones de formato (JSON ↔ YAML ↔ Markdown), asistencia de chat simple, agentes de enrutamiento/despacho, andamiaje de contenido (esquemas, primeros borradores), canalizaciones de salida estructurada, clasificación de telemetría interna, etiquetado de documentos, análisis de sentimiento. La calidad en estos es indistinguible de GPT-5 en una evaluación retenida para la mayoría de equipos.

**Pierde (usa GPT-5)**: síntesis de código complejo con contexto de múltiples archivos, pruebas matemáticas, planificación de múltiples pasos que requiere retroceso, análisis legal/financiero donde la corrección es innegociable, razonamiento de visión de grano fino (contar objetos en escenas densas, leer texto pequeño), tareas a nivel de punto de referencia de codificación competitiva. La prima de precio de 5× para GPT-5 se justifica cuando estos son el cuello de botella.

Ejecuta una evaluación antes de comprometerte. Toma 200 entradas representativas de tu tráfico de producción, ejecuta ambos modelos, puntúa a ciegas los resultados. La mayoría de equipos descubren que gpt-5-mini cubre el 70-90% del tráfico sin caída de calidad medible y reservan GPT-5 para el resto — típicamente enrutados vía un clasificador de complejidad simple.


Comparado con: Claude Sonnet 4.6 y Gemini 2.5 Flash

gpt-5-mini a $0,25 / $2 se sitúa entre Claude Sonnet 4.6 ($3 / $15 — nivel medio de Anthropic, calidad ligeramente superior, precio mucho más alto) y Gemini 2.5 Flash ($0,30 / $2,50 — nivel medio de Google, precio comparable, contexto de 1M).

vs **Claude Sonnet 4.6**: 12× más barato en entrada, 7,5× más barato en salida. Sonnet gana en voz de formato largo, disciplina de seguimiento de instrucciones en prompts complejos y ahorros de caché de prompts (90% de descuento en lecturas en caché vía Anthropic). gpt-5-mini gana en rendimiento bruto y precio. Ver Claude Sonnet vs GPT-5 mini para la comparación lado a lado.

vs **Gemini 2.5 Flash**: precio comparable ($0,25 vs $0,30 entrada), salida comparable ($2 vs $2,50), pero Flash tiene una ventana de contexto de 1M vs 400K de gpt-5-mini. Flash también soporta entrada de audio nativa. gpt-5-mini gana en salidas estructuradas (la ejecución de JSON Schema de OpenAI es más madura) y el ecosistema de herramientas de OpenAI más amplio.

Entre niveles: gpt-5-mini a 5× más barato que GPT-5 cubre el mismo conjunto de características; la mayoría de equipos deberían ser predeterminados aquí y escalar solo si hay necesidad demostrada.


Effort-reasoning en gpt-5-mini

gpt-5-mini expone el mismo parámetro `reasoning_effort` que GPT-5 (`minimal`, `low`, `medium`, `high`). Las mismas reglas aplican: los tokens de razonamiento se facturan a la tasa de salida, no se te devuelven, y pueden inflar drásticamente el costo si se dejan en `high` por defecto.

En gpt-5-mini específicamente, `minimal` es el predeterminado correcto para tareas mecánicas de alto volumen (clasificación, extracción). El costo por llamada se mantiene por debajo de $0,001 para entradas típicas. `low` es el predeterminado correcto para chat y generación de contenido. `medium` y `high` generalmente se desperdician en gpt-5-mini — si la tarea necesita razonamiento serio, el mejor movimiento es escalar a GPT-5 con `medium`, no ejecutar gpt-5-mini en `high`.

Error común: dejar `reasoning_effort` en el predeterminado (`medium`) en una carga de trabajo de clasificación a 1M+ llamadas/mes. Los tokens de razonamiento silenciosamente 2-3× la factura. Siempre establece explícitamente el nivel de esfuerzo en prompts de producción.


Fuentes verificadas y cómo reverificar los números

Cada número en esta página fue verificado contra la documentación en vivo de OpenAI el 2026-06-20. Fuentes: platform.openai.com/docs/models/gpt-5-mini, openai.com/api/pricing, platform.openai.com/docs/api-reference/responses.

Los precios en la familia GPT-5 se han movido una vez desde el lanzamiento (un ajuste a la baja en entrada en caché a finales de 2025). OpenAI no versiona su página de precios con entradas de changelog. Reverifica la página en vivo trimestralmente si tu factura mensual excede $500.

Si encuentras una discrepancia con la página en vivo, trata la página en vivo como canónica. Volvemos a obtener y actualizamos esta tarjeta mensualmente.

Cambia de GPT-5 a gpt-5-mini en 5 pasos

  1. 1

    Elige una porción representativa del tráfico de producción

    Muestrea 200-500 entradas reales de la última semana de tu tráfico de GPT-5. Estratifica entre tipos de tarea (clasificación, extracción, chat, código) para que la evaluación cubra tu carga de trabajo real, no solo los casos fáciles.

  2. 2

    Ejecuta ambos modelos en las mismas entradas

    Prompt idéntico, parámetros idénticos, solo el ID de modelo cambia (`gpt-5` → `gpt-5-mini`). Registra ambas salidas. Seguimiento de costos: gpt-5-mini a 5× más barato, entonces el delta de costo es el límite inferior de ahorros.

  3. 3

    Puntúa a ciegas las salidas

    Haz que un humano o un juez de LLM puntúe salidas sin saber cuál modelo produjo cuál. En la mayoría de tareas de producción (clasificación, extracción, resumen, chat rutinario), gpt-5-mini puntúa dentro del 2-5% de GPT-5. Ese delta generalmente está dentro del ruido de la evaluación.

  4. 4

    Establece reasoning_effort explícito + max_output_tokens

    En llamadas de gpt-5-mini de producción: `reasoning_effort='minimal'` para clasificación/extracción, `'low'` para chat. Limita `max_output_tokens` al límite realista para la tarea. Ambos previenen arrastre de costo silencioso.

    → Open the Generador de prompts de ChatGPT
  5. 5

    Migra el ID del modelo, monitorea por 7 días

    Cambia `model='gpt-5'` a `model='gpt-5-mini'` en producción. Monitorea tus métricas de calidad (tasa de aceptación, tasa de revisión manual, tasa de error posterior) durante 7 días. Si la calidad se mantiene, la migración está hecha. Si cae en un subconjunto de tráfico, enruta ese subconjunto de vuelta a GPT-5 vía un clasificador de complejidad.

Frequently Asked Questions

¿Cuánto cuesta gpt-5-mini en 2026?

$0,25 por 1M tokens de entrada, $2 por 1M tokens de salida, $0,025 por 1M para entrada en caché (90% de descuento). La API por lotes quita otro 50% de ambos flujos. Una llamada representativa de 1.000-entrada / 500-salida cuesta ~$0,00125 — aproximadamente 5× más barato que GPT-5 en tokens idénticos. Fuente: openai.com/api/pricing, verificado 2026-06-20.

¿Cuál es la diferencia entre GPT-5 y gpt-5-mini?

Misma ventana de contexto (400K), mismas modalidades (entrada de texto + imagen), mismo conjunto de características (llamadas de función, salidas estructuradas, llamadas de herramientas en paralelo, caché de prompts, reasoning_effort). La diferencia es tamaño del modelo, calidad de salida y precio. gpt-5-mini es 5× más barato en entrada y salida. Usa gpt-5-mini como predeterminado; escala a GPT-5 para síntesis de código complejo, planificación de múltiples pasos o tareas críticas de corrección.

¿Cuál es la ventana de contexto de gpt-5-mini?

400.000 tokens combinados entrada + salida, con un límite de salida máxima de 128.000 tokens. Idéntico a GPT-5 — OpenAI estandarizó la ventana en la familia GPT-5 para que los prompts sean portátiles entre niveles.

¿Soporta gpt-5-mini llamadas de función y salidas estructuradas?

Sí — paridad completa con GPT-5. Llamadas de función, llamadas de herramientas en paralelo, salidas estructuradas (validación de JSON Schema garantizada por la API), API de Respuestas, streaming y caché de prompts están todos soportados.

¿Cuál es el corte de conocimiento de gpt-5-mini?

31 de mayo de 2024 según la tarjeta de modelo de OpenAI. Ligeramente anterior al corte de GPT-5 (30 de septiembre de 2024). Para cualquier cosa después de mayo de 2024, proporciona contexto en el prompt o usa una llamada de herramienta de búsqueda web.

¿Está disponible gpt-5-mini en ChatGPT o solo en la API?

Principalmente la API. Los usuarios de ChatGPT en niveles Free y Plus ven una mezcla de GPT-5 y gpt-5-mini dependiendo de carga y límites de tasa, pero la UI de selección de modelo en ChatGPT no expone gpt-5-mini como opción explícita. Para uso determinista de gpt-5-mini, llama la API.

¿Debería usar gpt-5-mini o gpt-4o-mini?

gpt-5-mini en casi todos los casos. Mismo nivel de precio que gpt-4o-mini ($0,15/$0,60 vs $0,25/$2 de gpt-5-mini), pero con el conjunto completo de características de GPT-5, contexto más grande (400K vs 128K), ejecución de salida estructurada más fuerte y el parámetro unified reasoning_effort. gpt-4o-mini permanece disponible para compatibilidad retroactiva en fine-tunes heredados.

¿Puedo hacer fine-tune en gpt-5-mini?

OpenAI no ha abierto fine-tuning público en gpt-5-mini a junio de 2026. El fine-tuning permanece disponible en gpt-4.1, gpt-4o y gpt-4o-mini. Para la mayoría de casos de uso, gpt-5-mini + salidas estructuradas + un prompt bien diseñado cierra la brecha de calidad que el fine-tuning abordaría. Verifica platform.openai.com/docs/guides/fine-tuning para disponibilidad actual de modelos.

Ahorra 5× en tráfico de GPT-5. Escribe prompts ajustados a mini.

Nuestro Generador de Prompts IA escribe prompts ajustados a gpt-5-mini (contexto compacto, salidas estructuradas, anclado en caché, reasoning_effort explícito) basado en TU negocio + tarea. 14 días gratis de DDH Pro, sin tarjeta.

Browse all prompt tools →

Biblioteca gratuita de prompts — más de 100 prompts listos para copiar

Prompts seleccionados cada semana para ChatGPT, Claude, Midjourney y DALL·E. Sin spam. Cancela cuando quieras.

Sin spam. Un correo por semana. Más de ~12.000 usuarios de prompts ya suscritos.