Fiche modèle · Vérifié selon la documentation OpenAI · 2026-06-20

GPT-5 mini : fiche technique complète (juin 2026)

By The DDH Team at Digital Dashboard Hub·Updated June 19, 2026

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

gpt-5-mini est la variante de niveau intermédiaire de GPT-5 d'OpenAI, lancée aux côtés du modèle phare en août 2025. Même fenêtre de contexte, mêmes modalités (entrée texte + image), même ensemble de fonctionnalités (appels de fonction, sorties structurées, appels d'outils parallèles, cache de prompts, l'API Responses), même paramètre d'effort de raisonnement. La seule différence significative est la taille du modèle sous-jacent — et la tarification qui en découle.

Chiffres clés : 0,25 $ par 1M tokens d'entrée, 2 $ par 1M tokens de sortie, 0,025 $ par 1M pour l'entrée en cache (90% de réduction). C'est 5× moins cher que GPT-5 en entrée et sortie. La fenêtre de contexte est de 400 000 tokens combinés ; la sortie maximale est de 128 000 tokens. La date limite des connaissances est le 31 mai 2024. Le même endpoint API Responses le sert.

La plupart des équipes de production exécutant plus de 100 000 appels/mois vivent avec gpt-5-mini. C'est le bon défaut pour la classification, l'extraction, le résumé, la transformation de données structurées, la conversation courante, l'échafaudage de contenu — tout ce pour quoi GPT-5 serait un surpaiement pour une capacité que vous n'utilisez pas. Ci-dessous : tableau de spécifications complet, quand le choisir par rapport à GPT-5 ou Claude Sonnet 4.6, requête API minimale, 8 FAQ. Pages associées : fiche GPT-5 · fiche Claude Sonnet 4.6 · fiche Gemini 2.5 Flash. Écrivez un prompt optimisé pour gpt-5-mini gratuitement avec notre générateur de prompts ChatGPT.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card. →

gpt-5-mini — Fiche technique complète (juin 2026)

Feature	Spécifications gpt-5-mini
Fournisseur	OpenAI
ID du modèle (API)	gpt-5-mini
Date de sortie	Août 2025
Prix d'entrée (par 1M)	$0.25
Prix d'entrée en cache (par 1M)	$0.025 (90% de réduction)
Prix de sortie (par 1M)	$2.00
Réduction API Batch	50% de réduction entrée + sortie
Fenêtre de contexte (entrée + sortie)	400 000 tokens
Tokens de sortie maximums	128 000 tokens
Modalités (entrée)	Texte, image
Modalités (sortie)	Texte
Appels de fonction
Appels d'outils parallèles
Sorties structurées (JSON Schema)
Streaming
Cache de prompts (automatique)
Vision (compréhension d'images)
Contrôle d'effort de raisonnement	minimal / low / medium / high
Date limite des connaissances	31 mai 2024
Endpoint	/v1/responses, /v1/chat/completions

Sources vérifiées le 2026-06-20 : page modèle OpenAI (https://platform.openai.com/docs/models/gpt-5-mini), page de tarification OpenAI (https://openai.com/api/pricing). Les prix changent sans préavis — reverifiez avant de budgétiser.

Ce qu'est réellement gpt-5-mini (par rapport à gpt-5)

gpt-5-mini est une variante plus petite, plus rapide et moins chère de GPT-5 construite sur la même architecture et le même pipeline d'entraînement. OpenAI ne publie pas les comptages de paramètres pour l'un ou l'autre modèle, mais en pratique gpt-5-mini est à peu près l'équivalent de gpt-4o-mini dans la famille GPT-4 — même discipline de suivi des instructions, plus faible sur le raisonnement difficile, dramatiquement moins cher.

Surtout, la surface des fonctionnalités est identique : gpt-5-mini prend en charge les mêmes appels de fonction, appels d'outils parallèles, sorties structurées (validées par JSON Schema), cache de prompts, endpoint API Responses, entrée vision et contrôle d'effort de raisonnement. Tout ce que vous écrivez pour GPT-5 s'exécute sur gpt-5-mini en changeant simplement l'ID du modèle. La différence apparaît sur les tâches qui nécessitent un raisonnement multi-étapes, une synthèse de code complexe ou une précision factuelle stricte.

Positionnement d'OpenAI : gpt-5-mini est le niveau 'par défaut pour la production'. La plupart des assistants de chat, extracteurs de données structurées, pipelines de classification, échafaudages de contenu et agents de routage devraient vivre ici. Réservez GPT-5 pour la petite fraction de trafic où le coût de l'erreur domine réellement le coût par appel.

Mathématiques de tarification : ce que gpt-5-mini coûte réellement par appel

Tarifs standard : `coût = (tokens_entrée / 1M) × 0,25 $ + (tokens_sortie / 1M) × 2 $`. L'appel représentatif 1 000 entrée / 500 sortie : `0,001 × 0,25 $ + 0,0005 × 2 $ = 0,00025 $ + 0,001 $ = 0,00125 $`. Environ 0,125¢ par appel — un cinquième du coût GPT-5 sur les tokens identiques.

À 1 000 000 appels/mois avec ce profil, le tarif standard s'élève à 1 250 $ contre 6 250 $ pour GPT-5. Appliquez un taux de cache de prompts de 80% sur un préfixe système de 1 500 tokens et l'entrée par appel baisse davantage ; appliquez l'API Batch pour les flux de travail asynchrones (résumé, classification, évaluation) et une autre réduction de 50% sur les deux flux.

Exemple réel : un pipeline de classification du support client à 2M appels/mois avec des moyennes 800 entrée / 100 sortie sur gpt-5-mini s'exécute `0,0008 × 0,25 $ + 0,0001 × 2 $ = 0,0004 $ par appel = 800 $/mois`. Avec l'activation du cache de prompts sur le préfixe système stable, environ 500 $/mois. Sur GPT-5, le même flux de travail coûte 4 000 $/mois. Le choix du modèle est le plus grand levier de coût dans la famille GPT-5 de loin. Calcul en dollars à l'échelle : calculatrice de coûts API OpenAI.

Fenêtre de contexte et limite de sortie — même structure que GPT-5

gpt-5-mini est livré avec la même fenêtre de contexte de 400 000 tokens que GPT-5 et le même plafond de sortie maximal de 128 000 tokens. Il n'y a pas de variante à contexte plus petit ; OpenAI a standardisé la fenêtre dans la famille GPT-5 afin que le travail d'ingénierie de prompts soit portable entre les niveaux.

Implication pratique : les prompts qui fonctionnent sur GPT-5 s'ajustent sur gpt-5-mini sans réécriture liée au contexte. L'écart de prix est purement un écart de qualité, pas un écart de contexte. Si vous déplacez du trafic de GPT-5 vers gpt-5-mini pour des raisons de coût, la migration est un simple changement d'ID de modèle plus une passe d'évaluation — pas une réécriture de prompt.

Comme toujours, limitez la sortie. Définissez `max_output_tokens` au plafond réaliste pour votre tâche (1 500 pour le chat, 4 000 pour le code, 8 000 pour la forme longue). Le plafond par défaut (128K) est une garde défensive, pas une cible.

Où gpt-5-mini gagne et où il perd face à GPT-5

**Gagne (utilisez gpt-5-mini)** : classification, extraction d'entités nommées, résumé d'entrée structurée, conversions de format (JSON ↔ YAML ↔ Markdown), assistance de chat simple, agents de routage/dispatch, échafaudage de contenu (outlines, premiers brouillons), pipelines de sorties structurées, classification de télémétrie interne, marquage de documents, analyse de sentiment. La qualité sur ces tâches est indistinguible de celle de GPT-5 sur une évaluation détenue pour la plupart des équipes.

**Perd (utilisez GPT-5)** : synthèse de code complexe avec contexte multi-fichier, preuves mathématiques, planification multi-étapes nécessitant du retour en arrière, analyse juridique/financière où la correction est non-négociable, raisonnement vision fine (compter les objets dans des scènes denses, lire du petit texte), tâches de niveau benchmark de codage compétitif. La prime de prix 5× pour GPT-5 est justifiée quand ce sont les goulots d'étranglement.

Exécutez une évaluation avant de vous engager. Prenez 200 entrées représentatives de votre trafic de production, exécutez les deux modèles, évaluez les sorties en aveugle. La plupart des équipes découvrent que gpt-5-mini couvre 70-90% du trafic sans chute de qualité mesurable et réservent GPT-5 pour le reste — généralement routé via un simple classificateur de complexité.

Comparaison : Claude Sonnet 4.6 et Gemini 2.5 Flash

gpt-5-mini à 0,25 $ / 2 $ se situe entre Claude Sonnet 4.6 (3 $ / 15 $ — le niveau intermédiaire d'Anthropic, qualité légèrement supérieure, prix beaucoup plus élevé) et Gemini 2.5 Flash (0,30 $ / 2,50 $ — le niveau intermédiaire de Google, prix comparable, contexte 1M).

vs **Claude Sonnet 4.6** : 12× moins cher en entrée, 7,5× moins cher en sortie. Sonnet gagne sur la voix de la forme longue, la discipline de suivi des instructions sur les prompts complexes et les économies de cache de prompts (90% de réduction sur les lectures en cache via Anthropic). gpt-5-mini gagne sur le débit brut et le prix. Voir Claude Sonnet vs GPT-5 mini pour la comparaison côte à côte.

vs **Gemini 2.5 Flash** : prix comparable (0,25 $ vs 0,30 $ entrée), sortie comparable (2 $ vs 2,50 $), mais Flash a une fenêtre de contexte 1M vs le contexte 400K de gpt-5-mini. Flash prend également en charge l'entrée audio native. gpt-5-mini gagne sur les sorties structurées (l'application JSON Schema d'OpenAI est plus mature) et l'écosystème des outils OpenAI plus large.

Entre niveaux : gpt-5-mini à 5× moins cher que GPT-5 couvre le même ensemble de fonctionnalités ; la plupart des équipes devraient utiliser ceci par défaut et escalader uniquement sur besoin démontré.

Effort de raisonnement sur gpt-5-mini

gpt-5-mini expose le même paramètre `reasoning_effort` que GPT-5 (`minimal`, `low`, `medium`, `high`). Les mêmes règles s'appliquent : les tokens de raisonnement se facturent au tarif de sortie, ne vous sont pas retournés et peuvent dramatiquement gonfler le coût s'ils sont définis à `high`.

Sur gpt-5-mini spécifiquement, `minimal` est le bon défaut pour les tâches mécaniques à haut volume (classification, extraction). Le coût par appel reste sous 0,001 $ pour les entrées typiques. `low` est le bon défaut pour le chat et la génération de contenu. `medium` et `high` sont généralement gaspillés sur gpt-5-mini — si la tâche a besoin de raisonnement sérieux, le meilleur mouvement est d'escalader vers GPT-5 avec `medium`, pas d'exécuter gpt-5-mini à `high`.

Erreur commune : laisser `reasoning_effort` au défaut (`medium`) sur une tâche de classification à 1M+ appels/mois. Les tokens de raisonnement gonflent silencieusement la facture 2-3×. Définissez toujours explicitement le niveau d'effort sur les prompts de production.

Sources vérifiées et comment reverifier les chiffres

Chaque nombre sur cette page a été vérifié par rapport à la documentation en direct d'OpenAI le 2026-06-20. Sources : platform.openai.com/docs/models/gpt-5-mini, openai.com/api/pricing, platform.openai.com/docs/api-reference/responses.

Les prix de la famille GPT-5 ont changé une fois depuis le lancement (un ajustement à la baisse sur l'entrée en cache en fin 2025). OpenAI ne versionne pas sa page de tarification avec des entrées de changelog. Reverifiez la page en direct trimestriellement si votre facture mensuelle dépasse 500 $.

Si vous trouvez une divergence avec la page en direct, traitez la page en direct comme canonique. Nous récupérons et mettons à jour cette fiche mensuellement.

Passer de GPT-5 à gpt-5-mini en 5 étapes

1
Sélectionnez une tranche représentative du trafic de production
Échantillonnez 200-500 entrées réelles de la semaine dernière de votre trafic GPT-5. Stratifiez entre les types de tâches (classification, extraction, chat, code) afin que l'évaluation couvre votre charge de travail réelle, pas seulement les cas faciles.
2
Exécutez les deux modèles sur les mêmes entrées
Prompt identique, paramètres identiques, seul l'ID du modèle change (`gpt-5` → `gpt-5-mini`). Enregistrez les deux sorties. Suivi des coûts : gpt-5-mini à 5× moins cher, donc la différence de coût est la limite inférieure des économies.
3
Évaluez les sorties en aveugle
Faites évaluer les sorties par un humain ou un juge LLM sans savoir quel modèle les a produites. Sur la plupart des tâches de production (classification, extraction, résumé, chat courant), gpt-5-mini évalue à 2-5% de gpt-5. Cet écart est généralement dans le bruit de l'évaluation.
4
Définissez explicitement reasoning_effort + max_output_tokens
Sur les appels de production gpt-5-mini : `reasoning_effort='minimal'` pour la classification/extraction, `'low'` pour le chat. Limitez `max_output_tokens` au plafond réaliste pour la tâche. Les deux empêchent la dérive de coûts silencieuse.
→ Open the Générateur de prompts ChatGPT
5
Migrez l'ID du modèle, surveillez pendant 7 jours
Changez `model='gpt-5'` en `model='gpt-5-mini'` en production. Surveillez vos métriques de qualité (taux d'acceptation, taux d'examen manuel, taux d'erreur en aval) pendant 7 jours. Si la qualité se maintient, la migration est terminée. Si elle glisse sur un sous-ensemble de trafic, routez ce sous-ensemble vers GPT-5 via un classificateur de complexité.

Digital Dashboard Hub

The prompt patterns above work 10x better when they live in a library you actually own — tunable to your niche, exportable to GPT-5, Claude, Gemini, Perplexity, Midjourney, Llama. Stop pasting across 6 tools.

Try DDH's AI Prompt Builder — free 14 days, no card. →

Related calculators

OpenAI Pricing Calculator →GPT-5.5, 5.4, mini, nano — full per-call cost in one input.Claude Pricing Calculator →Opus 4.8, Sonnet 4.6, Haiku 4.5, Fable 5 — input + output combined.Context Window Comparison →Max input length and price per 1M for every current model.

Related prompt tools

Générateur de prompts ChatGPT (optimisé pour mini)→Fiche technique GPT-5→Fiche technique Claude Sonnet 4.6→Fiche technique Gemini 2.5 Flash→Calculatrice de coûts API OpenAI→

Frequently Asked Questions

Combien coûte gpt-5-mini en 2026 ?

0,25 $ par 1M tokens d'entrée, 2 $ par 1M tokens de sortie, 0,025 $ par 1M pour l'entrée en cache (90% de réduction). L'API Batch réduit une autre 50% sur les deux flux. Un appel représentatif 1 000 entrée / 500 sortie coûte environ 0,00125 $ — environ 5× moins cher que GPT-5 sur les tokens identiques. Source : openai.com/api/pricing, vérifié le 2026-06-20.

Quelle est la différence entre gpt-5 et gpt-5-mini ?

Même fenêtre de contexte (400K), mêmes modalités (entrée texte + image), même ensemble de fonctionnalités (appels de fonction, sorties structurées, appels d'outils parallèles, cache de prompts, reasoning_effort). La différence est la taille du modèle, la qualité de sortie et le prix. gpt-5-mini est 5× moins cher en entrée et sortie. Utilisez gpt-5-mini par défaut ; escaladez vers gpt-5 pour la synthèse de code complexe, la planification multi-étapes ou les tâches critiques pour la correction.

Quelle est la fenêtre de contexte de gpt-5-mini ?

400 000 tokens combinés entrée + sortie, avec un plafond de sortie maximal de 128 000 tokens. Identique à gpt-5 — OpenAI a standardisé la fenêtre dans la famille GPT-5 afin que les prompts soient portables entre les niveaux.

gpt-5-mini prend-il en charge les appels de fonction et les sorties structurées ?

Oui — parité complète avec gpt-5. Les appels de fonction, appels d'outils parallèles, sorties structurées (validation JSON Schema garantie par l'API), l'API Responses, le streaming et le cache de prompts sont tous pris en charge.

Quelle est la date limite des connaissances de gpt-5-mini ?

Le 31 mai 2024 selon la fiche technique d'OpenAI. Légèrement antérieure à la date limite de gpt-5 (30 septembre 2024). Pour tout ce qui est après mai 2024, fournissez le contexte dans le prompt ou utilisez un appel d'outil de recherche web.

gpt-5-mini est-il disponible dans ChatGPT ou uniquement l'API ?

Principalement l'API. Les utilisateurs ChatGPT aux niveaux Gratuit et Plus voient un mélange de gpt-5 et gpt-5-mini selon la charge et les limites de débit, mais l'interface de sélection de modèle dans ChatGPT n'expose pas gpt-5-mini comme choix explicite. Pour une utilisation déterministe de gpt-5-mini, appelez l'API.

Devrais-je utiliser gpt-5-mini ou gpt-4o-mini ?

gpt-5-mini dans presque tous les cas. Même niveau de prix que gpt-4o-mini (0,15 $ / 0,60 $ vs 0,25 $ / 2 $ de gpt-5-mini), mais avec l'ensemble complet des fonctionnalités GPT-5, un contexte plus large (400K vs 128K), une application de sorties structurées meilleure et le paramètre reasoning_effort unifié. gpt-4o-mini reste disponible pour la compatibilité arrière sur les ajustements fins hérités.

Puis-je affiner gpt-5-mini ?

OpenAI n'a pas ouvert l'ajustement fin public sur gpt-5-mini en juin 2026. L'ajustement fin reste disponible sur gpt-4.1, gpt-4o et gpt-4o-mini. Pour la plupart des cas d'usage, gpt-5-mini + sorties structurées + un prompt bien conçu comble l'écart de qualité que l'ajustement fin traiterait. Vérifiez platform.openai.com/docs/guides/fine-tuning pour la disponibilité actuelle du modèle.

Économisez 5× sur le trafic GPT-5. Écrivez des prompts optimisés pour mini.

Notre générateur de prompts IA écrit des prompts optimisés pour gpt-5-mini (contexte serré, sorties structurées, ancrées au cache, reasoning_effort explicite) basés sur VOTRE entreprise + tâche. Essai gratuit 14 jours de DDH Pro, pas de carte.

Browse all prompt tools →