Model Card · Verifiziert gegen Anthropic-Dokumentation · 2026-06-20

Claude Sonnet 4.6: Vollständiges Spec Sheet (Juni 2026)

By The DDH Team at Digital Dashboard Hub·Updated June 19, 2026

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

Claude Sonnet 4.6 ist Anthropics Mid-Tier-Modell und das Production-Workhorse der Claude-4-Familie. Im September 2025 als Nachfolger von Sonnet 4 und Sonnet 3.7 veröffentlicht, positioniert es sich zwischen Opus (Flagship, $15/$75 pro 1M) und Haiku (Cost-Volume-Tier, ~$1/$5). Sonnet ist seit Claude 3 im Jahr 2024 Anthropics am häufigsten eingesetztes Modell, weil es den Großteil der Opus-Qualität bei etwa 20% der Opus-Kosten bietet.

Kernzahlen: $3 pro 1M Input-Token, $15 pro 1M Output-Token, $0,30 pro 1M für gecachte Input-Lesevorgänge (90% Rabatt), $3,75 pro 1M für Cache-Schreibvorgänge (5-Min.-TTL). Das Context-Fenster ist standardmäßig 200.000 Token, mit optional verfügbarem 1.000.000-Token-(1M-)Fenster über den Beta-Header `context-1m-2025-08-07`. Max Output ist 64.000 Token. Modalitäten sind Text- + Vision-Input; nur Text-Output. Tool Use, parallele Tool-Aufrufe, Prompt Caching, Extended Thinking und die Batch-API (50% Rabatt) werden alle unterstützt.

Nachfolgend: vollständige Spec-Tabelle, wann Sonnet vs. Opus oder GPT-5 Mini die richtige Wahl ist, direkter Vergleich mit anderen Mid-Tier-Modellen, minimale API-Request und 8 FAQs. Verwandte Seiten: Claude Opus 4.7 Spec Sheet · GPT-5 Mini Spec Sheet · Gemini 2.5 Flash Spec Sheet. Schreiben Sie einen Sonnet-optimierten Prompt kostenlos mit unserem ChatGPT Prompt Generator (Claude-Modus).

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card. →

Claude Sonnet 4.6 — Vollständiges Spec Sheet (Juni 2026)

Feature	Sonnet 4.6 Spezifikation
Provider	Anthropic
Modell-ID (API)	claude-sonnet-4-6
Veröffentlicht	September 2025
Input-Preis (pro 1M)	$3.00
Gecachter Input-Lese (pro 1M)	$0.30 (90% Rabatt)
Cache-Schreib (pro 1M, 5-Min.-TTL)	$3.75 (25% Aufschlag)
Cache-Schreib (pro 1M, 1-Std.-TTL)	$6.00 (2× Aufschlag)
Output-Preis (pro 1M)	$15.00
Batch-API-Rabatt	50% Rabatt auf Input + Output
Context-Fenster (Standard)	200.000 Token
Context-Fenster (1M Beta)	1.000.000 Token
1M-Beta-Input-Preis (>200K Input)	$6.00 (2× Tier)
1M-Beta-Output-Preis (>200K Input)	$22.50 (1,5× Tier)
Max Output-Token	64.000 Token
Modalitäten (Input)	Text, Bild
Modalitäten (Output)	Text
Tool Use
Parallele Tool-Nutzung
Strukturierte Outputs (über Tool-Schemas)
Streaming
Prompt Caching
Extended Thinking (Reasoning)
Vision (Bildverständnis)
Wissensstichtag	März 2025
Endpunkt	/v1/messages

Quellen verifiziert am 2026-06-20: Anthropic Models Documentation (https://docs.anthropic.com/en/docs/about-claude/models), Anthropic Pricing Page (https://www.anthropic.com/pricing), Anthropic Prompt Caching Docs (https://docs.anthropic.com/en/docs/build-with-claude/prompt-caching). Die 1M-Context-Beta erfordert den Header `anthropic-beta: context-1m-2025-08-07` und wird mit 2× Input / 1,5× Output-Tier für Input >200K Token abgerechnet. Überprüfen Sie die Live-Seiten vor der Budgetierung erneut.

Was Sonnet 4.6 wirklich ist (und warum es die Standard-Wahl ist)

Sonnet 4.6 ist Anthropics Production-Tier-Modell: nicht so teuer wie Opus, nicht so klein wie Haiku, mit der vollständigen Claude-4-Feature-Oberfläche. Anthropic positioniert Sonnet als die richtige Wahl für "die meisten Production-Workloads" und die Daten belegen das — in allen Kundenimplementierungen bewältigt Sonnet den Großteil des Traffics, während Opus für die schweren Fälle reserviert ist und Haiku für die kostengünstigen Fälle.

Gleiche Architektur wie Opus 4.7 (gleiche Claude-4-Basis), trainiert auf den gleichen Daten mit der gleichen RLHF-Disziplin, mit geringerer Modellgröße, die einige wenige Prozentpunkte bei hartem Reasoning gegen eine 5× Preisreduktion tauscht. Die Feature-Oberfläche ist identisch: Tool Use, parallele Tool-Aufrufe, Extended Thinking, Prompt Caching, Vision-Input, strukturierte Outputs über Tool-Schemas, die Batch-API.

Sonnets Standout-Feature vs. allen anderen Mid-Tier-Modellen: das optionale 1M-Token-Context-Fenster. Opt-in über den Header `anthropic-beta: context-1m-2025-08-07`. Anthropic verdoppelt den Input-Preis und addiert 50% zum Output für den Teil einer Request, der 200K Token überschreitet — aber die Long-Context-Option lässt Sonnet mit Gemini 2.5 Pro bei dokumentumfassenden Workloads konkurrieren. Keine andere Claude-Tier bietet 1M an.

Preis-Mathematik: Was Sonnet 4.6 pro Call wirklich kostet

Standard-Tarife: `cost = (input_tokens / 1M) × $3 + (output_tokens / 1M) × $15`. Der repräsentative 1.000-Input / 500-Output Call: `0.001 × $3 + 0.0005 × $15 = $0.003 + $0.0075 = $0.0105`. Etwa 1¢ pro Call — 5× günstiger als Opus bei gleicher Token-Menge, aber 8× teurer als gpt-5-mini.

Prompt Caching ist der größte Preis-Hebel. Markieren Sie stabile Blöcke mit `cache_control: {type: 'ephemeral'}` und Anthropic cached diese Präfix für 5 Minuten (oder 1 Stunde mit `ttl: '1h'`). Gecachte Lesevorgänge sinken von $3/M auf $0,30/M — 90% Rabatt. First-Write-Prämien: 25% bei 5-Min.-TTL, 100% bei 1-Std.-TTL.

Beispiel: eine Customer-Support-Pipeline mit 3.000-Token gecachtem System-Prompt, 100K Calls/Monat, 600 dynamischem Input + 200 Output. Ohne Caching: `(0.0036 × $3 + 0.0002 × $15) × 100K = $4.080/Monat`. Mit Caching (90% Hit-Rate): System-Präfix wird zu $0,30/M abgerechnet, Gesamtkosten sinken auf ~$1.250/Monat. ~70% Rabatt — komplett durch Prompt-Struktur, keine Modell-Änderung.

Batch-API obendrauf: 50% Rabatt auf beide Streams für asynchrone Workloads. Der Stack aus Caching + Batching macht Sonnet auch gegenüber gpt-5-mini zu einer preiswettbewerbsfähigen Option für die richtige Workload-Form. Kosten-Stack über die Claude-Familie: Claude API Cost Calculator.

Die 1M-Context-Beta — wann sich der 2× Input-Aufschlag lohnt

Opt-in zu 1M Context durch Hinzufügung von `anthropic-beta: context-1m-2025-08-07` zu Ihren API-Request-Headern. Sonnet akzeptiert dann bis zu 1.000.000 Input-Token in einem einzigen Call. Die Preisgestaltung ändert sich, wenn Input 200K überschreitet: Input-Preis-Tier wechselt zu $6/M (2×), Output zu $22,50/M (1,5×).

Der Aufschlag lohnt sich, wenn: Sie ein ganzes langes Dokument (ein komplettes Buch, einen großen Codebase-Chunk, eine Monats-lange Gesprächshistorie) in einem Call für Cross-Section-Reasoning unterbringen müssen. Das 1M-Context ermöglicht Sonnet Dinge, die kein 200K-Modell kann — Fragen beantworten, die erfordern, vom 2. und von der 600. Seite des gleichen Dokuments zu ziehen.

Der Aufschlag lohnt sich nicht, wenn: Retrieval-Augmented Generation (RAG) über chunked Dokumente ausreichend ist. RAG auf Sonnet bei standardmäßig 200K ist dramatisch günstiger als 1M-Context-Sonnet, und bei den meisten Knowledge-Q&A-Workloads trifft gut abgestimmtes RAG die gleiche Antwort-Qualität.

Vergleich: Gemini 2.5 Pro bietet auch 1M Context bei einer anderen Preisstruktur ($2,50 Input >200K vs. Sonnets $6). Für reine 1M-Context-Kosten ist Gemini 2.5 Pro billiger. Für Anthropic-Qualitäts-Voice + Disziplin bei 1M ist Sonnet 4.6 1M Beta die einzige Option.

Extended Thinking auf Sonnet 4.6

Sonnet 4.6 unterstützt die gleiche Extended-Thinking-Funktion wie Opus 4.7. Konfigurieren Sie über `thinking: {type: 'enabled', budget_tokens: 3000}` im API-Call. Sonnet wird bis zu 3.000 interne Reasoning-Token verbrauchen, bevor die sichtbare Antwort produziert wird.

Die Kosten-Dynamik ist auf Sonnet anders als auf Opus, weil Sonnets Output-Rate 5× günstiger ist. Ein 3.000-Token-Thinking-Budget auf Sonnet addiert `0.003 × $15 = $0,045` zum Call. Das gleiche Budget auf Opus addiert `0.003 × $75 = $0,225`. Extended Thinking ist auf Sonnet ökonomisch defensibler — Sie können es auf eine breitere Klasse von Tasks anwenden.

Typische Sonnet-Thinking-Budgets: 1.000-2.000 Token für Routine-Analyse-Tasks, 3.000-5.000 für Code-Synthese mit nicht-trivialer Logik, 5.000+ für Math/Proof-Tasks. Wie bei Opus sollten Sie Thinking nicht zu Klassifizierung oder Extraktion hinzufügen — es addiert Kosten ohne Qualitätsverbesserung.

Wann Sonnet 4.6 vs. Opus 4.7 vs. gpt-5-mini wählen

**Wählen Sie Sonnet 4.6** als Production-Standard in jedem Workflow, der von Anthropics Voice, Disziplin oder Tooling profitiert: kundengerichteter Chat, Content-Generierung, strukturierte-Daten-Pipelines, Zusammenfassung mit Qualitätsanforderungen, Code-Review und Erklärung, agentic Workflows, die keine Opus-Tier-Planung benötigen. Die meisten Teams, die auf Claude standardisieren, führen >80% des Traffics auf Sonnet aus.

**Wählen Sie Opus 4.7**, wenn Sonnets Qualität bei einer spezifischen schwierigen Teilmenge nicht ausreicht — komplexe Agentic Loops, Multi-File Code-Synthese mit strikter Korrektheit, Legal/Financial-Analyse, wo eine falsche Antwort teuer ist, tiefe Research-Synthese. Zahlen Sie 5× für den Opus-Boost nur bei den Tasks, die ihn benötigen.

**Wählen Sie gpt-5-mini** ($0,25 / $2 pro 1M) gegenüber Sonnet, wenn: Kosten die dominierende Einschränkung sind, die Task mechanisch ist (Klassifizierung, Extraktion), Sie bereits im OpenAI-Ökosystem sind, oder Sie das größere 400K-Context ohne die 1M-Beta-Komplexität benötigen. gpt-5-mini ist 12× günstiger als Sonnet beim Input. Sonnet schlägt es bei Voice, Long-Form-Schreiben und Instruction-Following-Disziplin.

Cross-Tier Head-to-Head: Claude Sonnet vs. GPT-5 Mini.

Tool Use, strukturierte Outputs und die XML-Tag-Konvention

Sonnet 4.6 wird mit Anthropics vollständiger Tool-Use-API ausgeliefert: definieren Sie Tools als JSON Schema im `tools`-Parameter, Sonnet wählt einen (oder mehrere, parallel) und gibt die Argumente in einem `tool_use`-Content-Block zurück. Paralleles Tool Use ist standardmäßig aktiviert; deaktivieren Sie mit `disable_parallel_tool_use: true`.

Strukturierte Outputs folgen dem gleichen Tool-Use-Muster wie Opus: definieren Sie einen Tool, dessen Input-Schema Ihr gewünschtes Output-Schema ist, erzwingen Sie den Call mit `tool_choice: {type: 'tool', name: 'extract_data'}`. Die JSON-Schema-Erzwingung ist zuverlässig; ungültige Outputs sind äußerst selten bei gut geformten Schemas.

XML-Tag-Prompts funktionieren gut: `<task>...</task>`, `<context>...</context>`, `<example>...</example>`, `<output_format>...</output_format>`. Sonnet, wie Opus, ist trainiert, um diese zuverlässig zu beachten, und Anthropics Advanced-Pattern-Docs verwenden sie konsistent. Markdown-überschriebene oder Plain-Paragraph-Prompts funktionieren auch, aber unterscheiden sich typischerweise gegenüber XML-getaggten Äquivalenten bei komplexen Multi-Section-Anweisungen.

Verifizierte Quellen und wie Sie die Zahlen erneut überprüfen

Jede Zahl auf dieser Seite wurde gegen Anthropics Live-Dokumentation am 2026-06-20 verifiziert. Quellen: docs.anthropic.com/en/docs/about-claude/models für Context-Fenster, Modalitäten und Feature-Support; anthropic.com/pricing für Input/Output/gecachte Preise und 1M-Beta-Tier; docs.anthropic.com/en/docs/build-with-claude/prompt-caching für Cache-Write/Read-Mechaniken.

Die 1M-Context-Beta erfordert den expliziten Header `anthropic-beta: context-1m-2025-08-07`. Anthropic versions Beta-Funktionen nach ID — wenn die Beta zu General Availability wechselt, ändert sich der Header. Beobachten Sie docs.anthropic.com/en/release-notes auf die GA-Ankündigung.

Methodik: wenn eine Zahl nicht gegen eine offizielle Anthropic-Seite auf dem Verifizierungsdatum cross-confirmed werden konnte, wurde sie von dieser Karte weggelassen, anstatt erraten zu werden.

Wechsel von gpt-5-mini (oder Opus) zu Sonnet 4.6 in 5 Schritten

1
Holen Sie sich einen Anthropic API Key
console.anthropic.com → Settings → API Keys → Create Key. Fügen Sie vor dem ersten Live-Call einen kleinen Credit-Kauf hinzu. Stellen Sie `ANTHROPIC_API_KEY=...` in `.env` ein.
2
Installieren Sie das SDK und senden Sie einen minimalen Call
`pip install anthropic` (Python) oder `npm install @anthropic-ai/sdk` (Node). Python: `from anthropic import Anthropic; c = Anthropic(); r = c.messages.create(model='claude-sonnet-4-6', max_tokens=1024, messages=[{'role': 'user', 'content': 'Hallo'}]); print(r.content[0].text)`. `max_tokens` ist erforderlich.
3
Fügen Sie Prompt Caching zu Ihrem System-Prompt hinzu
Wickeln Sie Ihre stabilen Anweisungen ein: `system=[{'type': 'text', 'text': '...', 'cache_control': {'type': 'ephemeral'}}]`. 5-Min.-TTL standardmäßig. Innerhalb der TTL werden gecachte Lesevorgänge zu $0,30/M statt $3/M — 90% Rabatt auf den gecachten Teil.
4
Konvertieren Sie Ihren Prompt in XML-Tags
Umstrukturieren: anstelle von "Sie sind ein hilfreicher Assistent. Hier ist die Anfrage des Benutzers: ...", verwenden Sie `<role>hilfreicher Research-Assistent</role><task>{user_request}</task><output_format>JSON mit Feldern summary, sources, confidence</output_format>`. Sonnet beachtet XML-Tags zuverlässiger als Markdown-Überschriften.
→ Open the ChatGPT Prompt Generator (Claude-Modus)
5
Opt-in zu 1M Context nur wenn nötig
Die meisten Sonnet-Workloads passen in 200K. Wenn Sie wirklich ein 500K-Token-Dokument in einem Call übergeben müssen, fügen Sie Header `anthropic-beta: context-1m-2025-08-07` hinzu. Preise für Input >200K wechseln zu $6/M (2× Tier). Für die meisten Teams ist RAG bei 200K dramatisch günstiger als 1M Context für die gleiche Antwort-Qualität.

Digital Dashboard Hub

The prompt patterns above work 10x better when they live in a library you actually own — tunable to your niche, exportable to GPT-5, Claude, Gemini, Perplexity, Midjourney, Llama. Stop pasting across 6 tools.

Try DDH's AI Prompt Builder — free 14 days, no card. →

Related calculators

OpenAI Pricing Calculator →GPT-5.5, 5.4, mini, nano — full per-call cost in one input.Claude Pricing Calculator →Opus 4.8, Sonnet 4.6, Haiku 4.5, Fable 5 — input + output combined.Context Window Comparison →Max input length and price per 1M for every current model.

Related prompt tools

Prompt Generator (Claude-Modus)→Code Prompt Builder (XML-getaggt)→Claude Opus 4.7 Spec Sheet→GPT-5 Mini Spec Sheet→Claude API Cost Calculator→

Frequently Asked Questions

Wie viel kostet Claude Sonnet 4.6 2026?

$3 pro 1M Input-Token, $15 pro 1M Output-Token, $0,30 pro 1M für gecachte Input-Lesevorgänge (90% Rabatt). Cache-Schreibvorgänge kosten $3,75/M (5-Min.-TTL) oder $6/M (1-Std.-TTL). Batch-API nimmt 50% beider Standard-Streams. Die 1M-Context-Beta wird zu $6/M Input (2× Tier) und $22,50/M Output für Input >200K abgerechnet. Ein repräsentativer 1.000-Input / 500-Output Call kostet ~$0,0105. Quelle: anthropic.com/pricing, verifiziert 2026-06-20.

Was ist Claudia Sonnets 4.6 Context-Fenster?

200.000 Token standardmäßig, mit optional verfügbarem 1.000.000-Token-(1M-)Fenster über den Header `anthropic-beta: context-1m-2025-08-07`. Die 1M-Beta rechnet Input >200K mit 2× Standardrate und Output mit 1,5× ab. Sonnet ist die einzige Claude-Tier, die derzeit 1M exponiert — Opus 4.7 nicht.

Was ist der Unterschied zwischen Claude Sonnet 4.6 und Claude Opus 4.7?

Gleiches Context (200K Standard), gleiche Modalitäten, gleiche Feature-Oberfläche (Tool Use, Prompt Caching, Extended Thinking). Opus 4.7 kostet $15/$75 pro 1M — 5× teurer als Sonnets 4.6 $3/$15. Opus gewinnt bei hartem Reasoning, komplexer Code-Synthese, Multi-Step-Planung. Sonnet gewinnt bei Preis-Leistung und ist die richtige Standard-Wahl für >80% des Production-Traffics. Sonnet hat auch die 1M-Context-Beta; Opus nicht.

Unterstützt Sonnet 4.6 Extended Thinking?

Ja. Konfigurieren Sie über `thinking={'type': 'enabled', 'budget_tokens': 3000}`. Sonnet verbraucht bis zu 3.000 interne Reasoning-Token, bevor die sichtbare Antwort produziert wird; Thinking-Token werden zum Output-Rate ($15/M) abgerechnet. Ökonomischer als Opus Extended Thinking ($75/M) — wenden Sie es auf eine breitere Klasse von Analyse-Tasks an.

Wie funktioniert Prompt Caching auf Sonnet 4.6?

Explizit: markieren Sie Blöcke mit `cache_control: {type: 'ephemeral'}` (5-Min.-TTL Standard) oder `{type: 'ephemeral', ttl: '1h'}` (1-Std.-TTL). Erste Schreib kosten 25% mehr (5-Min.) oder 100% mehr (1-Std.). Nachfolgende Lesevorgänge innerhalb TTL werden zu 10% des Input-Preises abgerechnet. Größter Kosten-Hebel auf Sonnet — eine stabile gecachte System-Präfix reduziert typischerweise die Input-Rechnung um 70-90%.

Sollte ich Sonnet 4.6 oder gpt-5-mini verwenden?

gpt-5-mini ist 12× günstiger beim Input, 7,5× günstiger beim Output ($0,25/$2 vs. $3/$15). Sonnet 4.6 gewinnt bei Long-Form-Writing Voice, Instruction-Following-Disziplin bei komplexen Prompts, Prompt-Caching-Mechaniken und dem optionalen 1M-Context. Für reine kostengetriebene mechanische Tasks, gpt-5-mini. Für Claude-Qualität Production-Workloads, Sonnet. Siehe Claude Sonnet vs. GPT-5 Mini.

Wo ist Sonnet 4.6 verfügbar?

Anthropic API (console.anthropic.com), Amazon Bedrock, Google Cloud Vertex AI und über die Claude Consumer Apps (claude.ai Pro-Tier und höher). Bedrock und Vertex Pricing entsprechen Anthropic Direct ab Juni 2026.

Kann ich Sonnet 4.6 fine-tunen?

Fine-Tuning auf Claude-Modellen ist begrenzt. Anthropic bietet Fine-Tuning auf Claude Haiku über Amazon Bedrock; Sonnet Fine-Tuning ist ab Juni 2026 nicht allgemein verfügbar. Für die meisten Anwendungsfälle schließt Sonnet + ein gut gestalteter XML-getaggter Prompt + gecachte System-Präfix die Qualitätslücke, die Fine-Tuning ansprechen würde.

Sonnet ist das Production-Sweet-Spot. Machen Sie jeden Call Cache.

Unser AI Prompt Generator schreibt Sonnet-optimierte Prompts (XML-getaggt, Cache-verankert, dynamischer Context zuletzt) basierend auf IHREM Business + Task — damit der 90%-Rabatt-gecachte Read-Preis tatsächlich auslöst. 14-Tage kostenloses Trial von DDH Pro, keine Kreditkarte.

Browse all prompt tools →