Modellkarte · Verifiziert gegen OpenAI-Dokumentation · 2026-06-20

GPT-5 mini: Vollständiges Datenblatt (Juni 2026)

By The DDH Team at Digital Dashboard Hub·Updated June 19, 2026

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

gpt-5-mini ist OpenAIs Mid-Tier-Modell neben GPT-5, das zusammen mit dem Flaggschiff im August 2025 veröffentlicht wurde. Gleiches Kontextfenster, gleiche Modalitäten (Text- und Bildeingabe), gleicher Funktionsumfang (Funktionsaufrufe, strukturierte Ausgaben, parallele Werkzeugaufrufe, Prompt-Caching, die Responses API), gleicher reasoning-effort-Parameter. Der einzige wesentliche Unterschied ist die zugrundeliegende Modellgröße — und die daraus resultierende Preisgestaltung.

Kennzahlen: $0.25 pro 1M Eingabe-Token, $2 pro 1M Ausgabe-Token, $0.025 pro 1M für gecachte Eingabe (90% Rabatt). Das ist 5× günstiger als GPT-5 bei Ein- und Ausgabe. Das Kontextfenster beträgt 400.000 Token kombiniert; die maximale Ausgabe liegt bei 128.000 Token. Der Knowledge Cutoff ist der 31. Mai 2024. Der gleiche Responses API-Endpoint bedient es.

Die meisten Produktionsteams mit über 100.000 Aufrufen/Monat arbeiten mit gpt-5-mini. Es ist die richtige Standardwahl für Klassifizierung, Extraktion, Zusammenfassung, strukturierte Datentransformation, routinemäßige Chats, Content-Gerüstbau — alles, bei dem das GPT-5-Flaggschiff für Funktionen überzahlen würde, die Sie nicht nutzen. Unten: vollständige Spezifikationstabelle, wann Sie es gegenüber GPT-5 oder Claude Sonnet 4.6 wählen sollten, minimale API-Anfrage, 8 FAQs. Verwandte Seiten: GPT-5 Datenblatt · Claude Sonnet 4.6 Datenblatt · Gemini 2.5 Flash Datenblatt. Schreiben Sie gpt-5-mini-optimierte Prompts kostenlos mit unserem ChatGPT-Prompt-Generator.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card. →

gpt-5-mini — Vollständiges Datenblatt (Juni 2026)

Feature	gpt-5-mini Spezifikation
Anbieter	OpenAI
Modell-ID (API)	gpt-5-mini
Veröffentlicht	August 2025
Eingabepreis (pro 1M)	$0.25
Gecachter Eingabepreis (pro 1M)	$0.025 (90% Rabatt)
Ausgabepreis (pro 1M)	$2.00
Batch API-Rabatt	50% Rabatt auf Ein- und Ausgabe
Kontextfenster (Eingabe + Ausgabe)	400.000 Token
Maximale Ausgabe-Token	128.000 Token
Modalitäten (Eingabe)	Text, Bild
Modalitäten (Ausgabe)	Text
Funktionsaufrufe
Parallele Werkzeugaufrufe
Strukturierte Ausgaben (JSON Schema)
Streaming
Prompt-Caching (automatisch)
Vision (Bildverständnis)
Kontrollierte Reasoning-Tiefe	minimal / low / medium / high
Knowledge Cutoff	31. Mai 2024
Endpoint	/v1/responses, /v1/chat/completions

Quellen verifiziert 2026-06-20: OpenAI-Modellseite (https://platform.openai.com/docs/models/gpt-5-mini), OpenAI-Preisseite (https://openai.com/api/pricing). Preise ändern sich ohne Ankündigung — vor der Budgetplanung erneut verifizieren.

Was gpt-5-mini wirklich ist (gegenüber gpt-5)

gpt-5-mini ist eine kleinere, schnellere und günstigere Variante von GPT-5, die auf der gleichen Architektur und dem gleichen Trainings-Pipeline basiert. OpenAI veröffentlicht Parameterzahlen für keines der Modelle, aber in der Praxis ist gpt-5-mini etwa das Äquivalent von gpt-4o-mini in der GPT-4-Familie — gleiche Befehlsfolge-Disziplin, schwächer bei schwierigen Reasoning-Aufgaben, dramatisch günstiger.

Entscheidend: Die Feature-Oberfläche ist identisch: gpt-5-mini unterstützt die gleichen Funktionsaufrufe, parallele Werkzeugaufrufe, strukturierte Ausgaben (JSON-Schema-validiert), Prompt-Caching, den Responses API-Endpoint, Vision-Eingabe und Reasoning-Effort-Kontrolle. Alles, was Sie für GPT-5 schreiben, läuft auf gpt-5-mini mit nur einer Modell-ID-Änderung. Der Unterschied zeigt sich bei Aufgaben, die mehrstufiges Reasoning, komplexe Code-Synthese oder strikte faktische Genauigkeit erfordern.

Positionierung von OpenAI: gpt-5-mini ist der Standard-Tier für Produktionsumgebungen. Die meisten Chat-Assistenten, strukturierte Datenextraktoren, Klassifizierungs-Pipelines, Content-Gerüstbauer und Routing-Agenten sollten hier laufen. Reservieren Sie GPT-5 für den kleinen Teil des Traffics, bei dem die Fehlerkosten wirklich höher sind als die Pro-Call-Kosten.

Preisrechnung: Was gpt-5-mini pro Aufruf wirklich kostet

Standardtarife: `Kosten = (Eingabe-Token / 1M) × $0.25 + (Ausgabe-Token / 1M) × $2`. Der repräsentative Aufruf mit 1.000 Eingabe- und 500 Ausgabe-Token: `0.001 × $0.25 + 0.0005 × $2 = $0.00025 + $0.001 = $0.00125`. Etwa 0,125¢ pro Aufruf — ein Fünftel der GPT-5-Kosten bei identischen Token.

Bei 1.000.000 Aufrufen/Monat mit diesem Profil liegen die Standardtarife bei $1.250 im Vergleich zu $6.250 für GPT-5. Wenden Sie einen 80%igen Prompt-Cache-Hit auf ein stabiles System-Präfix von 1.500 Token an und die Eingabekosten pro Aufruf sinken weiter; nutzen Sie die Batch API für asynchrone Workloads (Zusammenfassung, Klassifizierung, Bewertung) und erhalten Sie weitere 50% Rabatt auf beide Streams.

Praktisches Beispiel: Eine Kundenservice-Klassifizierungs-Pipeline bei 2M Aufrufen/Monat mit durchschnittlich 800 Eingabe- und 100 Ausgabe-Token auf gpt-5-mini läuft `0.0008 × $0.25 + 0.0001 × $2 = $0.0004 pro Aufruf = $800/Monat`. Mit aktiviertem Prompt-Caching auf dem stabilen System-Präfix etwa $500/Monat. Auf GPT-5 kostet die gleiche Workload $4.000/Monat. Die Modellwahl ist die größte Kostenhebelwirkung in der GPT-5-Familie mit großem Abstand. Ausführliche Kostenberechnung: OpenAI API-Kostenrechner.

Kontextfenster und Ausgabegrenze — gleiche Struktur wie GPT-5

gpt-5-mini wird mit dem gleichen 400.000-Token-Kontextfenster wie GPT-5 und der gleichen 128.000-Token-Ausgabegrenze ausgeliefert. Es gibt keine kleinere Kontext-Variante; OpenAI hat das Fenster über die GPT-5-Familie standardisiert, sodass Prompt-Engineering-Arbeit zwischen Tiers portierbar ist.

Praktische Auswirkung: Prompts, die auf GPT-5 funktionieren, passen auch auf gpt-5-mini, ohne dass Kontextrevisionen notwendig sind. Die Preisspanne ist rein eine Qualitätsspanne, keine Kontextspanne. Wenn Sie Traffic aus Kostengründen von GPT-5 zu gpt-5-mini verlagern, ist die Migration eine Modell-ID-Änderung plus eine Evaluierungsphase — keine Prompt-Umschreibung.

Wie immer: Ausgabe begrenzen. Setzen Sie `max_output_tokens` auf die realistische Obergrenze für Ihre Aufgabe (1.500 für Chat, 4.000 für Code, 8.000 für längere Texte). Die Standardgrenze (128K) ist ein defensiver Guard, kein Ziel.

Wo gpt-5-mini gegenüber GPT-5 gewinnt und wo verliert

**Gewinnt (verwenden Sie gpt-5-mini)**: Klassifizierung, Named-Entity-Extraktion, Zusammenfassung strukturierter Eingaben, Formatkonversionen (JSON ↔ YAML ↔ Markdown), einfache Chat-Assistenz, Routing-/Versand-Agenten, Content-Gerüstbau (Gliederungen, erste Entwürfe), strukturierte Ausgabe-Pipelines, interne Telemetrie-Klassifizierung, Dokumenten-Tagging, Sentiment-Analyse. Die Qualität bei diesen Aufgaben ist für die meisten Teams ununterscheidbar von GPT-5 bei einer gehaltenen Evaluierung.

**Verliert (verwenden Sie GPT-5)**: Komplexe Code-Synthese mit Multi-File-Kontext, mathematische Beweise, mehrstufige Planung, die Backtracking erfordert, Rechts-/Finanzanalyse, bei der Korrektheit nicht verhandelbar ist, differenziertes Vision-Reasoning (Objekte in dichten Szenen zählen, kleine Texte lesen), wettbewerbsfähige Coding-Benchmark-Level-Aufgaben. Die 5× Preisanpassung für GPT-5 ist gerechtfertigt, wenn diese der Engpass sind.

Führen Sie eine Evaluierung durch, bevor Sie sich festlegen. Nehmen Sie 200 repräsentative Eingaben aus Ihrem Produktionstraffic, führen Sie beide Modelle aus, blind-bewerten Sie die Ausgaben. Die meisten Teams stellen fest, dass gpt-5-mini 70-90% des Traffics mit keinem messbaren Qualitätsverlust abdeckt und reservieren GPT-5 für den Rest — typischerweise weitergeleitet über einen einfachen Komplexitäts-Klassifizierer.

Verglichen mit: Claude Sonnet 4.6 und Gemini 2.5 Flash

gpt-5-mini bei $0.25 / $2 sitzt zwischen Claude Sonnet 4.6 ($3 / $15 — Anthropics Mid-Tier, etwas höhere Qualität, viel höherer Preis) und Gemini 2.5 Flash ($0.30 / $2.50 — Googles Mid-Tier, vergleichbarer Preis, 1M Kontext).

gegen **Claude Sonnet 4.6**: 12× günstiger bei Eingabe, 7,5× günstiger bei Ausgabe. Sonnet gewinnt bei längeren Schreibstimmen, Befehlsfolge-Disziplin bei komplexen Prompts und Prompt-Caching-Einsparungen (90% Rabatt auf gecachte Lesezugriffe über Anthropic). gpt-5-mini gewinnt bei rohem Durchsatz und Preis. Siehe Claude Sonnet vs GPT-5 mini für den direkten Vergleich.

gegen **Gemini 2.5 Flash**: vergleichbarer Preis ($0.25 vs $0.30 Eingabe), vergleichbare Ausgabe ($2 vs $2.50), aber Flash hat ein 1M-Kontextfenster gegenüber gpt-5-minis 400K. Flash unterstützt auch native Audio-Eingabe. gpt-5-mini gewinnt bei strukturierten Ausgaben (OpenAIs JSON-Schema-Durchsetzung ist reifer) und dem breiteren OpenAI-Tooling-Ökosystem.

Tier-übergreifend: gpt-5-mini bei 5× günstiger als GPT-5 mit gleichem Funktionsumfang; die meisten Teams sollten standardmäßig hier anfangen und nur bei nachgewiesener Notwendigkeit eskalieren.

Reasoning-Tiefe auf gpt-5-mini

gpt-5-mini stellt den gleichen `reasoning_effort`-Parameter wie GPT-5 bereit (`minimal`, `low`, `medium`, `high`). Die gleichen Regeln gelten: Reasoning-Token werden zum Ausgabetarif berechnet, werden nicht an Sie zurückgegeben und können die Kosten dramatisch erhöhen, wenn sie auf `high` belassen werden.

Bei gpt-5-mini speziell ist `minimal` die richtige Standardeinstellung für hochvolumige mechanische Aufgaben (Klassifizierung, Extraktion). Die Kosten pro Aufruf bleiben unter $0.001 für typische Eingaben. `low` ist die richtige Standardeinstellung für Chat und Content-Generierung. `medium` und `high` sind normalerweise verschwendet auf gpt-5-mini — wenn die Aufgabe ernsthaftes Reasoning benötigt, ist der bessere Schachzug, zu GPT-5 mit `medium` zu eskalieren, nicht gpt-5-mini auf `high` zu setzen.

Häufiger Fehler: `reasoning_effort` bei der Standardeinstellung (`medium`) bei einer Klassifizierungs-Workload bei 1M+ Aufrufen/Monat belassen. Die Reasoning-Token verdreifachen die Rechnung stumm. Setzen Sie immer explizit die Effort-Stufe bei Produktions-Prompts.

Verifizierte Quellen und wie Sie die Zahlen erneut überprüfen

Jede Zahl auf dieser Seite wurde gegen OpenAIs Live-Dokumentation am 2026-06-20 verifiziert. Quellen: platform.openai.com/docs/models/gpt-5-mini, openai.com/api/pricing, platform.openai.com/docs/api-reference/responses.

Die Preise in der GPT-5-Familie sind seit dem Launch einmal angepasst worden (eine Preissenkung bei gecachter Eingabe in späten 2025). OpenAI versieht ihre Preisseite nicht mit Changelog-Einträgen. Verifizieren Sie die Live-Seite vierteljährlich erneut, wenn Ihre monatliche Rechnung $500 übersteigt.

Wenn Sie eine Diskrepanz mit der Live-Seite finden, behandeln Sie die Live-Seite als maßgeblich. Wir rufen dieses Datenblatt monatlich ab und aktualisieren es.

Wechsel von GPT-5 zu gpt-5-mini in 5 Schritten

1
Wählen Sie ein repräsentatives Segment des Produktionstraffics
Samplen Sie 200-500 echte Eingaben aus der letzten Woche Ihres gpt-5-Traffics. Stratifizieren Sie über Task-Typen (Klassifizierung, Extraktion, Chat, Code), damit die Evaluierung Ihre tatsächliche Workload abdeckt, nicht nur die einfachen Fälle.
2
Führen Sie beide Modelle mit identischen Eingaben aus
Identischer Prompt, identische Parameter, nur die Modell-ID ändert sich (`gpt-5` → `gpt-5-mini`). Protokollieren Sie beide Ausgaben. Kostentracking: gpt-5-mini bei 5× günstiger, also ist der Kostenunterschied die untere Grenze der Einsparungen.
3
Blind-bewerten Sie die Ausgaben
Lassen Sie einen Menschen oder einen LLM-Richter Ausgaben bewerten, ohne zu wissen, welches Modell welche produziert hat. Bei den meisten Produktionsaufgaben (Klassifizierung, Extraktion, Zusammenfassung, routinemäßiger Chat) liegt gpt-5-mini innerhalb von 2-5% von gpt-5. Dieser Unterschied liegt normalerweise im Rauschen der Evaluierung.
4
Setzen Sie explizite reasoning_effort + max_output_tokens
Bei Produktions-gpt-5-mini-Aufrufen: `reasoning_effort='minimal'` für Klassifizierung/Extraktion, `'low'` für Chat. Begrenzen Sie `max_output_tokens` auf die realistische Obergrenze für die Aufgabe. Beide verhindern stille Kostenausweitung.
→ Open the ChatGPT-Prompt-Generator
5
Migrieren Sie die Modell-ID, überwachen Sie 7 Tage
Ändern Sie `model='gpt-5'` zu `model='gpt-5-mini'` in der Produktion. Überwachen Sie Ihre Qualitätsmetriken (Akzeptanzrate, Manueller-Überprüfungs-Rate, Fehlerrate downstream) für 7 Tage. Wenn die Qualität stabil bleibt, ist die Migration abgeschlossen. Wenn sie auf einer Teilmenge des Traffics abfällt, leiten Sie diese Teilmenge über einen Komplexitäts-Klassifizierer zurück zu GPT-5.

Digital Dashboard Hub

The prompt patterns above work 10x better when they live in a library you actually own — tunable to your niche, exportable to GPT-5, Claude, Gemini, Perplexity, Midjourney, Llama. Stop pasting across 6 tools.

Try DDH's AI Prompt Builder — free 14 days, no card. →

Related calculators

OpenAI Pricing Calculator →GPT-5.5, 5.4, mini, nano — full per-call cost in one input.Claude Pricing Calculator →Opus 4.8, Sonnet 4.6, Haiku 4.5, Fable 5 — input + output combined.Context Window Comparison →Max input length and price per 1M for every current model.

Related prompt tools

ChatGPT-Prompt-Generator (mini-optimiert)→GPT-5 Datenblatt→Claude Sonnet 4.6 Datenblatt→Gemini 2.5 Flash Datenblatt→OpenAI API-Kostenrechner→

Frequently Asked Questions

Wie viel kostet gpt-5-mini im Jahr 2026?

$0.25 pro 1M Eingabe-Token, $2 pro 1M Ausgabe-Token, $0.025 pro 1M für gecachte Eingabe (90% Rabatt). Die Batch API nimmt weitere 50% von beiden Streams ab. Ein repräsentativer Aufruf mit 1.000 Eingabe- und 500 Ausgabe-Token kostet etwa $0.00125 — etwa 5× günstiger als GPT-5 bei identischen Token. Quelle: openai.com/api/pricing, verifiziert 2026-06-20.

Was ist der Unterschied zwischen gpt-5 und gpt-5-mini?

Gleiches Kontextfenster (400K), gleiche Modalitäten (Text- und Bildeingabe), gleicher Funktionsumfang (Funktionsaufrufe, strukturierte Ausgaben, parallele Werkzeugaufrufe, Prompt-Caching, reasoning_effort). Der Unterschied ist Modellgröße, Ausgabequalität und Preis. gpt-5-mini ist 5× günstiger bei Ein- und Ausgabe. Verwenden Sie gpt-5-mini als Standard; eskalieren Sie zu GPT-5 für komplexe Code-Synthese, mehrstufige Planung oder korrektheitskritische Aufgaben.

Welches Kontextfenster hat gpt-5-mini?

400.000 Token kombinierte Ein- und Ausgabe, mit einer Ausgabegrenze von 128.000 Token. Identisch mit gpt-5 — OpenAI hat das Fenster über die GPT-5-Familie standardisiert, sodass Prompts tier-portierbar sind.

Unterstützt gpt-5-mini Funktionsaufrufe und strukturierte Ausgaben?

Ja — vollständige Parität mit gpt-5. Funktionsaufrufe, parallele Werkzeugaufrufe, strukturierte Ausgaben (JSON-Schema-Validierung durch die API garantiert), die Responses API, Streaming und Prompt-Caching werden alle unterstützt.

Was ist der Knowledge Cutoff von gpt-5-mini?

31. Mai 2024 gemäß OpenAIs Modellkarte. Etwas früher als gpt-5s Cutoff (30. September 2024). Für alles nach Mai 2024 stellen Sie Kontext im Prompt bereit oder verwenden Sie einen Web-Such-Funktionsaufruf.

Ist gpt-5-mini in ChatGPT verfügbar oder nur über API?

Hauptsächlich die API. ChatGPT-Nutzer auf kostenlosen und Plus-Tiers sehen je nach Last und Ratenbegrenzungen eine Mischung aus gpt-5 und gpt-5-mini, aber die Modellauswahl-UI in ChatGPT zeigt gpt-5-mini nicht als explizite Wahl. Für deterministischen gpt-5-mini-Einsatz rufen Sie die API auf.

Sollte ich gpt-5-mini oder gpt-4o-mini verwenden?

gpt-5-mini in fast jedem Fall. Gleiches Preissegment wie gpt-4o-mini ($0.15/$0.60 vs gpt-5-minis $0.25/$2), aber mit dem vollständigen GPT-5-Funktionsumfang, größerem Kontext (400K vs 128K), besserer Durchsetzung strukturierter Ausgaben und dem vereinheitlichten reasoning_effort-Parameter. gpt-4o-mini bleibt für Rückwärtskompatibilität bei Legacy-Fine-Tunes verfügbar.

Kann ich gpt-5-mini fine-tunen?

OpenAI hat das öffentliche Fine-Tuning auf gpt-5-mini bis Juni 2026 nicht eröffnet. Fine-Tuning bleibt auf gpt-4.1, gpt-4o und gpt-4o-mini verfügbar. Für die meisten Anwendungsfälle schließt gpt-5-mini + strukturierte Ausgaben + ein gut entwickelter Prompt die Qualitätslücke, die Fine-Tuning ansprechen würde. Überprüfen Sie platform.openai.com/docs/guides/fine-tuning auf aktuelle Modellverfügbarkeit.

Sparen Sie 5× bei GPT-5-Traffic. Schreiben Sie mini-optimierte Prompts.

Unser AI Prompt Generator schreibt gpt-5-mini-optimierte Prompts (kompakter Kontext, strukturierte Ausgaben, Cache-verankert, explizite reasoning_effort) basierend auf IHREM Geschäft + Task. 14-Tage kostenlos, DDH Pro, keine Kartenzahlung erforderlich.

Browse all prompt tools →