Qué es realmente GPT-5 (y qué cambió de GPT-4o)
GPT-5 es el primer modelo de OpenAI que lanza razonamiento, entrada multimodal y uso de herramientas como una superficie unificada y única, en lugar de tres endpoints separados. Donde GPT-4o, o1 y o3-mini eran tres superficies API distintas en 2024-2025, GPT-5 las colapsa: un único ID de modelo `gpt-5` con un parámetro `reasoning_effort` (`minimal`, `low`, `medium`, `high`) que escala cuántos tokens de razonamiento interno quema el modelo antes de responder.
En la práctica, esto significa que ya no eliges entre un 'modelo de chat' frente a un 'modelo de razonamiento'. Eliges GPT-5 y ajustas el esfuerzo de razonamiento para que coincida con la tarea. Una llamada de clasificación usa `reasoning_effort: minimal` y se factura como GPT-4o. Una llamada de síntesis de código o prueba matemática usa `reasoning_effort: high` y quema varios miles de tokens de razonamiento — facturados al precio de salida aunque no se devuelvan en la respuesta.
La visión está integrada: pasa una URL de imagen o una imagen codificada en base64 en cualquier mensaje de usuario y GPT-5 la analizará. Las llamadas a funciones, las llamadas paralelas a herramientas, las salidas estructuradas (fuerza al modelo a devolver JSON conforme a un JSON Schema) y el almacenamiento en caché de prompts están todos activados por defecto. La API Responses (`/v1/responses`) es el endpoint recomendado de OpenAI para código nuevo; chat completions sigue funcionando para todo lo que GPT-5 hace y sigue siendo el camino de menor fricción para migrar desde modelos GPT anteriores.