Ce qu'est réellement GPT-5 (et ce qui a changé depuis GPT-4o)
GPT-5 est le premier modèle OpenAI à embarquer le raisonnement, l'entrée multimodale et l'utilisation d'outils en tant que surface unifiée et unique, plutôt que trois endpoints distincts. Là où GPT-4o, o1 et o3-mini étaient trois surfaces API distinctes en 2024-2025, GPT-5 les fusionne : un seul ID modèle `gpt-5` avec un paramètre `reasoning_effort` (`minimal`, `low`, `medium`, `high`) qui ajuste le nombre de tokens de raisonnement internes que le modèle consomme avant de répondre.
En pratique, vous ne choisissez plus entre un 'modèle chat' et un 'modèle de raisonnement'. Vous choisissez GPT-5 et ajustez le niveau de raisonnement selon la tâche. Un appel de classification utilise `reasoning_effort: minimal` et se facture comme GPT-4o. Un appel de synthèse de code ou de preuve mathématique utilise `reasoning_effort: high` et consomme plusieurs milliers de tokens de raisonnement — facturés au tarif de sortie même s'ils ne sont pas retournés dans la réponse.
La vision est intégrée : passez une URL d'image ou une image encodée en base64 dans n'importe quel message utilisateur et GPT-5 l'analysera. L'appel de fonctions, les appels d'outils parallèles, les structured outputs (forcer le modèle à retourner du JSON conforme à un JSON Schema) et le prompt caching sont tous activés par défaut. L'API Responses (`/v1/responses`) est l'endpoint recommandé par OpenAI pour le nouveau code ; chat completions fonctionne toujours pour tout ce que GPT-5 fait et reste le chemin le moins contraignant pour migrer depuis les modèles GPT antérieurs.