Was GPT-5 wirklich ist (und was sich von GPT-4o geändert hat)
GPT-5 ist OpenAIs erstes Modell, das Reasoning, multimodale Eingabe und Tool-Nutzung als einheitliche, Single-Model-Oberfläche statt drei separater Endpunkte bereitstellt. Wo GPT-4o, o1 und o3-mini 2024-2025 drei unterschiedliche API-Oberflächen waren, vereint GPT-5 sie: eine einzelne `gpt-5` Modell-ID mit einem `reasoning_effort` Parameter (`minimal`, `low`, `medium`, `high`), der skaliert, wie viele interne Reasoning-Token das Modell verbraucht, bevor es antwortet.
Praktisch bedeutet dies, dass Sie nicht mehr zwischen einem 'Chat-Modell' und einem 'Reasoning-Modell' wählen. Sie wählen GPT-5 und stellen den Reasoning-Aufwand der Aufgabe entsprechend ein. Ein Klassifizierungsaufruf verwendet `reasoning_effort: minimal` und wird wie GPT-4o abgerechnet. Ein Code-Synthese- oder Mathematikbeweis-Aufruf verwendet `reasoning_effort: high` und verbraucht mehrere tausend Reasoning-Token — abgerechnet zum Ausgabesatz, obwohl sie nicht in der Antwort zurückgegeben werden.
Vision ist integriert: Übergeben Sie eine Bild-URL oder ein base64-codiertes Bild in jeder Benutzer-Nachricht und GPT-5 wird es analysieren. Funktionsaufrufe, parallele Tool-Aufrufe, strukturierte Ausgaben (erzwingen Sie, dass das Modell JSON zurückgibt, das einem JSON Schema entspricht), und Prompt Caching sind alle standardmäßig aktiviert. Die Responses API (`/v1/responses`) ist OpenAIs empfohlener Endpunkt für neuen Code; Chat Completions funktioniert immer noch für alles, was GPT-5 kann, und bleibt der reibungsloseste Weg für die Migration von früheren GPT-Modellen.