Tarjeta de modelo · Verificado contra docs de Anthropic · 2026-06-20

Claude Sonnet 4.6: Ficha Completa (Junio 2026)

By The DDH Team at Digital Dashboard Hub·Updated June 19, 2026

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

Claude Sonnet 4.6 es el modelo de nivel medio de Anthropic y el caballo de batalla de producción de la familia Claude 4. Lanzado en septiembre de 2025 como sucesor de Sonnet 4 y Sonnet 3.7, se sitúa entre Opus (modelo insignia, $15/$75 por 1M) y Haiku (nivel costo-volumen, ~$1/$5). Sonnet ha sido el modelo más desplegado de Anthropic desde Claude 3 en 2024 porque captura la mayoría de la disciplina de Opus por aproximadamente el 20% del costo de Opus.

Números principales: $3 por 1M tokens de entrada, $15 por 1M de salida, $0.30 por 1M en lecturas de entrada cacheadas (90% descuento), $3.75 por 1M en escrituras de caché (TTL 5 min). La ventana de contexto es de 200.000 tokens estándar, con 1.000.000 tokens (1M) beta disponibles a través del header beta `context-1m-2025-08-07`. La salida máxima es de 64.000 tokens. Las modalidades son entrada de texto + visión; salida solo texto. Uso de herramientas, llamadas paralelas de herramientas, caché de prompts, pensamiento extendido y la API Batch (50% descuento) son todas compatibles.

Abajo: tabla de especificaciones completa, cuándo Sonnet es la opción correcta frente a Opus o GPT-5 mini, comparación lado a lado con el resto del menú de nivel medio, la solicitud API mínima y 8 preguntas frecuentes. Páginas hermanas: Ficha Claude Opus 4.7 · Ficha GPT-5 mini · Ficha Gemini 2.5 Flash. Escribe un prompt optimizado para Sonnet gratis con nuestro generador de prompts ChatGPT (modo Claude).

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card. →

Claude Sonnet 4.6 — Ficha de especificaciones completa (Junio 2026)

Feature	Especificaciones Sonnet 4.6
Proveedor	Anthropic
ID del modelo (API)	claude-sonnet-4-6
Lanzado	Septiembre 2025
Precio de entrada (por 1M)	$3.00
Lectura de entrada cacheada (por 1M)	$0.30 (90% descuento)
Escritura de caché (por 1M, TTL 5 min)	$3.75 (25% prima)
Escritura de caché (por 1M, TTL 1 hora)	$6.00 (2× prima)
Precio de salida (por 1M)	$15.00
Descuento API Batch	50% entrada + salida
Ventana de contexto (estándar)	200.000 tokens
Ventana de contexto (beta 1M)	1.000.000 tokens
Precio de entrada beta 1M (>200K entrada)	$6.00 (2× nivel)
Precio de salida beta 1M (>200K entrada)	$22.50 (1.5× nivel)
Tokens de salida máximos	64.000 tokens
Modalidades (entrada)	Texto, imagen
Modalidades (salida)	Texto
Uso de herramientas
Uso paralelo de herramientas
Salidas estructuradas (via esquemas de herramientas)
Streaming
Caché de prompts
Pensamiento extendido (razonamiento)
Visión (comprensión de imágenes)
Corte de conocimiento	Marzo 2025
Endpoint	/v1/messages

Fuentes verificadas 2026-06-20: documentación de modelos Anthropic (https://docs.anthropic.com/en/docs/about-claude/models), página de precios Anthropic (https://www.anthropic.com/pricing), docs de caché de prompts Anthropic (https://docs.anthropic.com/en/docs/build-with-claude/prompt-caching). La beta de contexto 1M requiere el header `anthropic-beta: context-1m-2025-08-07` y se factura a 2× entrada / 1.5× salida nivel para entrada >200K tokens. Verifica nuevamente las páginas en vivo antes de presupuestar.

Qué es realmente Sonnet 4.6 (y por qué es el estándar)

Sonnet 4.6 es el modelo de nivel producción de Anthropic: no tan caro como Opus, no tan pequeño como Haiku, con el conjunto completo de características de Claude 4. Anthropic posiciona Sonnet como la opción correcta para 'la mayoría de cargas de trabajo de producción' y los datos lo respaldan — en los despliegues de clientes, Sonnet maneja la mayoría del tráfico con Opus reservado para el subconjunto difícil y Haiku reservado para el subconjunto económico.

Misma arquitectura que Opus 4.7 (misma base Claude 4), entrenada con los mismos datos y la misma disciplina RLHF, con un tamaño de modelo más pequeño que intercambia algunos puntos porcentuales de calidad en razonamiento difícil por una reducción de precio de 5×. La superficie de características es idéntica: uso de herramientas, llamadas paralelas de herramientas, pensamiento extendido, caché de prompts, entrada de visión, salidas estructuradas via esquemas de herramientas, la API Batch.

La característica destacada de Sonnet vs cualquier otro modelo de nivel medio: la ventana de contexto opcional de 1M tokens. Opt-in a través del header `anthropic-beta: context-1m-2025-08-07`. Anthropic duplica el precio de entrada y añade 50% a la salida para la porción de una solicitud que excede 200K tokens — pero la opción de contexto largo permite que Sonnet compita con Gemini 2.5 Pro en cargas de trabajo a escala de documento. Ningún otro nivel de Claude expone 1M.

Matemáticas de precios: qué cuesta realmente Sonnet 4.6 por llamada

Tarifas estándar: `costo = (tokens_entrada / 1M) × $3 + (tokens_salida / 1M) × $15`. La llamada representativa 1.000-entrada / 500-salida: `0.001 × $3 + 0.0005 × $15 = $0.003 + $0.0075 = $0.0105`. Aproximadamente 1¢ por llamada — 5× más barato que Opus con los mismos tokens, pero 8× más caro que gpt-5-mini.

El caché de prompts es la palanca de costo más grande. Marca bloques estables con `cache_control: {type: 'ephemeral'}` y Anthropic cachea ese prefijo durante 5 minutos (u 1 hora con `ttl: '1h'`). Las lecturas cacheadas bajan de $3/M a $0.30/M — 90% descuento. Primas de primera escritura: 25% en TTL 5 min, 100% en TTL 1 hora.

Trabajado: un pipeline de soporte al cliente con un prompt de sistema cacheado de 3.000 tokens, 100K llamadas/mes, 600 entrada dinámica + 200 salida. Sin caché: `(0.0036 × $3 + 0.0002 × $15) × 100K = $4.080/mes`. Con caché (90% tasa de acierto): el prefijo del sistema se factura a $0.30/M la mayoría del tiempo, el total baja a ~$1.250/mes. ~70% descuento — enteramente de la estructura del prompt, sin cambio de modelo.

API Batch encima: 50% descuento ambas corrientes para cargas de trabajo asincrónicas. La pila de caché + batch transforma Sonnet en una opción competitiva en precio incluso contra gpt-5-mini para la forma correcta de carga de trabajo. Trabajado $ en toda la familia Claude: calculadora de costo API Claude.

La beta de contexto 1M — cuándo vale la 2× prima de entrada

Opt-in a contexto 1M agregando `anthropic-beta: context-1m-2025-08-07` a tus headers de solicitud API. Sonnet entonces acepta hasta 1.000.000 tokens de entrada en una sola llamada. Los precios cambian cuando la entrada excede 200K: el nivel de precio de entrada se desplaza a $6/M (2×), salida a $22.50/M (1.5×).

Vale la prima cuando: necesitas ajustar un documento largo completo (un libro completo, un fragmento completo de base de código, un historial de conversación de meses) en una llamada para razonamiento de corte transversal. El contexto 1M permite que Sonnet haga cosas que ningún modelo de 200K puede — responder preguntas que requieren tirar de la página 2 y página 600 del mismo documento.

No vale la prima cuando: la generación aumentada por recuperación (RAG) sobre documentos fragmentados es suficiente. RAG en Sonnet en 200K estándar es dramáticamente más barato que Sonnet de contexto 1M, y en la mayoría de cargas de trabajo de Q&A de conocimiento, RAG bien ajustado golpea la misma calidad de respuesta.

Comparación: Gemini 2.5 Pro también ofrece contexto 1M con una estructura de precios diferente ($2.50 entrada >200K vs $6 de Sonnet). Para costo puro de contexto 1M, Gemini 2.5 Pro es más barato. Para voz de calidad Anthropic + disciplina en 1M, la beta 1M de Sonnet 4.6 es la única opción.

Pensamiento extendido en Sonnet 4.6

Sonnet 4.6 soporta la misma característica de pensamiento extendido que Opus 4.7. Configura via `thinking: {type: 'enabled', budget_tokens: 3000}` en la llamada API. Sonnet quemará hasta 3.000 tokens internos de razonamiento antes de producir la respuesta visible.

La dinámica de costos es diferente en Sonnet que en Opus porque la tarifa de salida de Sonnet es 5× más barata. Un presupuesto de pensamiento de 3.000 tokens en Sonnet añade `0.003 × $15 = $0.045` a la llamada. El mismo presupuesto en Opus añade `0.003 × $75 = $0.225`. El pensamiento extendido es más económicamente defendible en Sonnet — puedes permitirte aplicarlo a una clase más amplia de tareas.

Presupuestos típicos de pensamiento Sonnet: 1.000-2.000 tokens para tareas de análisis rutinarias, 3.000-5.000 para síntesis de código con lógica no trivial, 5.000+ para tareas de matemáticas/pruebas. Como en Opus, no añadas pensamiento a clasificación o extracción — añade costo sin mejorar la calidad.

Cuándo elegir Sonnet 4.6 vs Opus 4.7 vs gpt-5-mini

**Elige Sonnet 4.6** como estándar de producción en cualquier flujo de trabajo que se beneficie de la voz, disciplina o herramientas de Anthropic: chat orientado al cliente, generación de contenido, pipelines de datos estructurados, resumen con requisitos de calidad, revisión y explicación de código, flujos de trabajo agentes que no necesitan planificación de nivel Opus. La mayoría de equipos que estandarizan en Claude ejecutan >80% del tráfico en Sonnet.

**Elige Opus 4.7** cuando la calidad de Sonnet en un subconjunto específico difícil no es suficiente — loops agents complejos, síntesis de código de múltiples archivos con corrección estricta, análisis legal/financiero donde una respuesta incorrecta es costosa, síntesis de investigación profunda. Paga 5× por el empuje de Opus solo en las tareas que lo necesitan.

**Elige gpt-5-mini** ($0.25 / $2 por 1M) sobre Sonnet cuando: el costo es la restricción dominante, la tarea es mecánica (clasificación, extracción), ya estás en el ecosistema OpenAI, o necesitas el contexto más grande 400K sin la complejidad de beta 1M. gpt-5-mini es 12× más barato que Sonnet en entrada. Sonnet lo vence en voz, escritura de formato largo y disciplina de seguimiento de instrucciones.

Comparación entre niveles: Claude Sonnet vs GPT-5 mini.

Uso de herramientas, salidas estructuradas y la convención de etiqueta XML

Sonnet 4.6 viene con la API completa de uso de herramientas de Anthropic: define herramientas como JSON Schema en el parámetro `tools`, Sonnet elige una (o varias, en paralelo) y devuelve los argumentos en un bloque de contenido `tool_use`. El uso paralelo de herramientas está activo por defecto; opt-out con `disable_parallel_tool_use: true`.

Las salidas estructuradas siguen el mismo patrón de uso de herramientas que Opus: define una herramienta cuyo esquema de entrada es tu esquema de salida deseado, fuerza la llamada con `tool_choice: {type: 'tool', name: 'extract_data'}`. La aplicación de JSON Schema es confiable; las salidas inválidas son extremadamente raras en esquemas bien formados.

Los prompts de etiqueta XML funcionan bien: `<task>...</task>`, `<context>...</context>`, `<example>...</example>`, `<output_format>...</output_format>`. Sonnet, como Opus, está entrenado para atender a estos de manera confiable y la documentación de patrones avanzados de Anthropic los usa consistentemente. Los prompts con encabezados markdown o párrafos simples también funcionan pero tienden a bajo rendimiento vs equivalentes etiquetados en XML en instrucciones complejas de múltiples secciones.

Fuentes verificadas y cómo revisar los números nuevamente

Cada número en esta página se verificó contra la documentación en vivo de Anthropic el 2026-06-20. Fuentes: docs.anthropic.com/en/docs/about-claude/models para ventana de contexto, modalidades y soporte de características; anthropic.com/pricing para precios de entrada/salida/cacheados y el nivel 1M-beta; docs.anthropic.com/en/docs/build-with-claude/prompt-caching para mecánica de escritura/lectura de caché.

La beta de contexto 1M requiere el header explícito `anthropic-beta: context-1m-2025-08-07`. Anthropic versiona características beta por ID — cuando la beta se mueve a disponibilidad general, el header cambia. Observa docs.anthropic.com/en/release-notes para el anuncio de GA.

Metodología: cuando un número no se pudo confirmar de forma cruzada contra una página oficial de Anthropic en la fecha de verificación, fue omitido de esta tarjeta en lugar de adivinar.

Cambia de gpt-5-mini (u Opus) a Sonnet 4.6 en 5 pasos

1
Obtén una clave API de Anthropic
console.anthropic.com → Settings → API Keys → Create Key. Añade una pequeña compra de crédito antes de que la primera llamada se active. Establece `ANTHROPIC_API_KEY=...` en `.env`.
2
Instala el SDK y envía una llamada mínima
`pip install anthropic` (Python) o `npm install @anthropic-ai/sdk` (Node). Python: `from anthropic import Anthropic; c = Anthropic(); r = c.messages.create(model='claude-sonnet-4-6', max_tokens=1024, messages=[{'role': 'user', 'content': 'Hello'}]); print(r.content[0].text)`. `max_tokens` es requerido.
3
Añade caché de prompts a tu prompt del sistema
Envuelve tus instrucciones estables: `system=[{'type': 'text', 'text': '...', 'cache_control': {'type': 'ephemeral'}}]`. TTL 5 min por defecto. Dentro del TTL, las lecturas cacheadas se facturan a $0.30/M en lugar de $3/M — 90% descuento en la porción cacheada.
4
Convierte tu prompt a etiquetas XML
Reestructura: en lugar de 'Eres un asistente útil. Aquí está la solicitud del usuario: ...', usa `<role>asistente de investigación útil</role><task>{user_request}</task><output_format>JSON con campos resumen, fuentes, confianza</output_format>`. Sonnet atiende a etiquetas XML más confiablemente que a encabezados markdown.
→ Open the Generador de prompts ChatGPT (modo Claude)
5
Opt-in a contexto 1M solo si lo necesitas
La mayoría de cargas de trabajo Sonnet caben en 200K. Si realmente necesitas pasar un documento de 500K tokens en una sola llamada, añade el header `anthropic-beta: context-1m-2025-08-07`. Los precios para entrada >200K se desplazan a $6/M (nivel 2×). Para la mayoría de equipos, RAG a 200K es dramáticamente más barato que contexto 1M para la misma calidad de respuesta.

Digital Dashboard Hub

The prompt patterns above work 10x better when they live in a library you actually own — tunable to your niche, exportable to GPT-5, Claude, Gemini, Perplexity, Midjourney, Llama. Stop pasting across 6 tools.

Try DDH's AI Prompt Builder — free 14 days, no card. →

Related calculators

OpenAI Pricing Calculator →GPT-5.5, 5.4, mini, nano — full per-call cost in one input.Claude Pricing Calculator →Opus 4.8, Sonnet 4.6, Haiku 4.5, Fable 5 — input + output combined.Context Window Comparison →Max input length and price per 1M for every current model.

Related prompt tools

Generador de prompts (modo Claude)→Constructor de prompts de código (etiquetado en XML)→Ficha Claude Opus 4.7→Ficha GPT-5 mini→Calculadora de costo API Claude→

Frequently Asked Questions

¿Cuánto cuesta Claude Sonnet 4.6 en 2026?

$3 por 1M tokens de entrada, $15 por 1M tokens de salida, $0.30 por 1M en lecturas de entrada cacheadas (90% descuento). Las escrituras de caché cuestan $3.75/M (TTL 5 min) o $6/M (TTL 1 hora). La API Batch toma 50% descuento en ambas corrientes estándar. La beta de contexto 1M se factura a $6/M entrada (nivel 2×) y $22.50/M salida para entrada >200K. Una llamada representativa 1.000-entrada / 500-salida cuesta ~$0.0105. Fuente: anthropic.com/pricing, verificado 2026-06-20.

¿Cuál es la ventana de contexto de Claude Sonnet 4.6?

200.000 tokens estándar, con una beta opcional de 1.000.000 tokens (1M) a través del header `anthropic-beta: context-1m-2025-08-07`. La beta 1M factura entrada >200K al doble de la tarifa estándar y salida a 1.5×. Sonnet es el único nivel de Claude que actualmente expone 1M — Opus 4.7 no lo hace.

¿Cuál es la diferencia entre Claude Sonnet 4.6 y Claude Opus 4.7?

Mismo contexto (200K estándar), mismas modalidades, misma superficie de características (uso de herramientas, caché de prompts, pensamiento extendido). Opus 4.7 es $15/$75 por 1M — 5× más caro que Sonnet 4.6's $3/$15. Opus gana en razonamiento difícil, síntesis de código complejo, planificación de múltiples pasos. Sonnet gana en precio-rendimiento y es el estándar correcto para >80% del tráfico de producción. Sonnet también tiene la beta de contexto 1M; Opus no lo hace.

¿Sonnet 4.6 soporta pensamiento extendido?

Sí. Configura via `thinking={'type': 'enabled', 'budget_tokens': 3000}`. Sonnet quema hasta 3.000 tokens internos de razonamiento antes de producir la respuesta visible; los tokens de pensamiento se facturan a la tarifa de salida ($15/M). Más económico que pensamiento extendido Opus ($75/M) — aplícalo a una clase más amplia de tareas de análisis.

¿Cómo funciona el caché de prompts en Sonnet 4.6?

Explícito: marca bloques con `cache_control: {type: 'ephemeral'}` (TTL 5 min por defecto) o `{type: 'ephemeral', ttl: '1h'}` (TTL 1 hora). La primera escritura cuesta 25% más (5 min) o 100% más (1 hora). Las lecturas posteriores dentro del TTL se facturan al 10% del precio de entrada. La palanca de costo más grande en Sonnet — un prefijo de sistema cacheado estable típicamente corta la factura de entrada 70-90%.

¿Debo usar Sonnet 4.6 o gpt-5-mini?

gpt-5-mini es 12× más barato en entrada, 7.5× más barato en salida ($0.25/$2 vs $3/$15). Sonnet 4.6 gana en voz de escritura de formato largo, disciplina de seguimiento de instrucciones en prompts complejos, mecánica de caché de prompts y el contexto opcional de 1M. Para tareas mecánicas puras impulsadas por costo, gpt-5-mini. Para cargas de trabajo de producción de calidad Claude, Sonnet. Ver Claude Sonnet vs GPT-5 mini.

¿Dónde está disponible Sonnet 4.6?

API Anthropic (console.anthropic.com), Amazon Bedrock, Google Cloud Vertex AI y a través de las apps de consumidor Claude (nivel Claude.ai Pro y superior). Los precios de Bedrock y Vertex coinciden con Anthropic directo a partir de junio de 2026.

¿Puedo afinar Sonnet 4.6?

El ajuste fino en modelos de Claude es limitado. Anthropic ofrece ajuste fino en Claude Haiku a través de Amazon Bedrock; el ajuste fino de Sonnet no está generalmente disponible a partir de junio de 2026. Para la mayoría de casos de uso, Sonnet + un prompt bien elaborado etiquetado en XML + un prefijo del sistema cacheado cierra la brecha que el ajuste fino abordaría.

Sonnet es el punto dulce de producción. Cachea cada llamada.

Nuestro Generador de Prompts IA escribe prompts optimizados para Sonnet (etiquetados en XML, anclados al caché, contexto dinámico al final) basado en TU negocio + tarea — así el precio de lectura cacheada 90% descuento se activa realmente. Prueba gratis 14 días de DDH Pro, sin tarjeta.

Browse all prompt tools →