Skip to contentNew: Does ChatGPT recommend your brand? Free 60-second AI visibility check →
Por El Equipo DDH · Digital Dashboard Hub

Calculadora de Costos de Prompts IA: Estima Costos de Tokens en Todos los Modelos (2026)

By DDH Research Team at Digital Dashboard HubUpdated

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

14 days, no card. Cancel in 2 clicks.

Para estimar el costo de un prompt de IA, cuenta los tokens de entrada y salida, luego multiplica cada uno por el precio por token del modelo: costo = (tokens de entrada ÷ 1.000.000 × precio de entrada) + (tokens de salida ÷ 1.000.000 × precio de salida). Una regla práctica útil es que 1 token es aproximadamente 4 caracteres o alrededor de 0,75 palabras en inglés, por lo que 1.000 palabras son aproximadamente 1.333 tokens.

Los precios se cotizan por millón de tokens y difieren para entrada y salida, siendo la salida típicamente varias veces más cara. A continuación encontrarás la fórmula, ejemplos resueltos con precios actuales reales, una tabla completa entre proveedores, y los descuentos por caché y procesamiento por lotes que pueden reducir significativamente las facturas. Los precios cambian constantemente — siempre confirma contra las páginas de precios en directo enlazadas en la tabla.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card.

Precios de API por 1M de tokens (entrada / salida) — a partir de junio de 2026

Feature
Entrada ($/1M)
Salida ($/1M)
OpenAI gpt-5.5$5.00$30.00
OpenAI gpt-5.5-pro$30.00$180.00
OpenAI gpt-5.4$2.50$15.00
OpenAI gpt-5.4-mini$0.75$4.50
OpenAI gpt-5.4-nano$0.20$1.25
Anthropic Claude Opus 4.8$5.00$25.00
Anthropic Claude Sonnet 4.6$3.00$15.00
Anthropic Claude Haiku 4.5$1.00$5.00
Anthropic Claude Fable 5$10.00$50.00
Google Gemini 3.5 Flash$1.50$9.00
Google Gemini 3.1 Pro (Preview, ≤200k)$2.00$12.00
Google Gemini 2.5 Pro$1.25$10.00
Google Gemini 2.5 Flash$0.30$2.50
Google Gemini 2.5 Flash-Lite$0.10$0.40

Fuentes, a partir de junio de 2026: OpenAI (https://developers.openai.com/api/docs/pricing), Anthropic (https://claude.com/pricing y https://platform.claude.com/docs/en/about-claude/pricing), Google Gemini (https://ai.google.dev/gemini-api/docs/pricing). Los precios cambian frecuentemente — confirma en las páginas en directo antes de presupuestar.

¿Cómo se calcula el costo de tokens?

Dos números impulsan cada estimación: cuántos tokens envías (entrada) y cuántos devuelve el modelo (salida). Cada uno tiene su propio precio, cotizado por 1.000.000 de tokens.

La fórmula:

``` cost = (input_tokens / 1,000,000) * input_price_per_M + (output_tokens / 1,000,000) * output_price_per_M ```

Para estimar conteos de tokens antes de tener un conteo exacto del tokenizador, usa la regla práctica de que 1 token es aproximadamente 4 caracteres o alrededor de 0,75 palabras en inglés (una estimación aproximada según la documentación de OpenAI y Anthropic). Entonces un prompt de 500 palabras es aproximadamente 500 ÷ 0,75 ≈ 667 tokens de entrada. Esta es una aproximación; espacios en blanco, puntuación, código y texto en otros idiomas cambian la proporción.

La salida domina muchas facturas porque los precios de salida son típicamente varias veces el precio de entrada, y las generaciones largas se suman rápidamente. Si una tarea puede devolver una respuesta estructurada corta en lugar de prosa, eso por sí solo reduce el costo.


Ejemplo resuelto 1: una única llamada de pregunta y respuesta

Digamos que envías un prompt de 750 palabras y obtienes una respuesta de 750 palabras. Con ~0,75 palabras por token, son aproximadamente 1.000 tokens de entrada y 1.000 tokens de salida — 0,001 M cada uno.

En gpt-5.4 ($2,50 entrada / $15,00 salida por 1M): entrada = 0,001 × $2,50 = $0,0025; salida = 0,001 × $15,00 = $0,015; total ≈ $0,0175 por llamada.

En Claude Sonnet 4.6 ($3,00 / $15,00): entrada = 0,001 × $3,00 = $0,003; salida = 0,001 × $15,00 = $0,015; total ≈ $0,018 por llamada.

En Gemini 2.5 Flash ($0,30 / $2,50): entrada = 0,001 × $0,30 = $0,0003; salida = 0,001 × $2,50 = $0,0025; total ≈ $0,0028 por llamada.

La misma carga de trabajo, aproximadamente 6 veces más barata en Gemini 2.5 Flash que en los modelos de nivel medio de OpenAI o Anthropic — que es justamente el punto de adecuar el nivel del modelo a la dificultad de la tarea.


Ejemplo resuelto 2: escalando a 100.000 llamadas

Ahora ejecuta esa misma llamada de 1.000 entrada / 1.000 salida 100.000 veces — digamos un trabajo de clasificación o resumen por lotes. Multiplica los totales por llamada anteriores por 100.000:

gpt-5.4: $0,0175 × 100.000 ≈ $1.750. Claude Sonnet 4.6: $0,018 × 100.000 ≈ $1.800. Gemini 2.5 Flash: $0,0028 × 100.000 ≈ $280.

A esta escala, los descuentos importan. Si el trabajo no es sensible a la latencia, la API por lotes de Anthropic ofrece 50% de descuento en entrada y salida, reduciendo a la mitad la cifra de Sonnet a aproximadamente $900. El caché de prompts ayuda cuando un prefijo grande e idéntico (prompt del sistema, instrucciones, documento de referencia) se repite entre llamadas. Consulta los métodos a continuación.


¿Cómo cambian el cálculo los descuentos de caché y procesamiento por lotes?

Dos mecanismos pueden reducir drásticamente el costo cuando tu carga de trabajo encaja en ellos.

Caché de prompts (Anthropic): cuando muchas llamadas comparten el mismo prefijo grande, lo cacheas una vez y pagas una tarifa reducida en la porción cacheada de llamadas posteriores. Según el precio de Anthropic, una lectura de caché (un acierto) cuesta 0,1x el precio de entrada base — es decir, 10% de la tarifa de entrada normal para los tokens cacheados. Escribir en el caché cuesta más que la entrada base (1,25x para un caché de 5 minutos, 2x para un caché de 1 hora), por lo que el caché se amortiza cuando el mismo prefijo se reutiliza lo suficiente. Ejemplo: la entrada de Claude Opus 4.8 es $5/M, y su lectura de caché es $0,50/M — un ahorro del 90% en la porción repetida.

API por lotes (Anthropic): 50% de descuento en entrada y salida para trabajos asincrónico no sensibles al tiempo. Esto se combina perfectamente con grandes cargas de trabajo sin conexión como el ejemplo anterior de 100.000 llamadas.

Adecúa el descuento a la forma del trabajo: caché para un prefijo grande repetido con cola variable, procesamiento por lotes para trabajos grandes en los que puedas esperar. Confirma las tasas y mecánicas actuales en las páginas de precios enlazadas, ya que estos términos cambian.


¿Cómo estimo sin un tokenizador exacto?

Para la planificación, los conteos de caracteres o palabras te acercan. Toma el conteo de caracteres de tu prompt y divide entre 4, o su conteo de palabras y divide entre 0,75, para estimar tokens de entrada. Estima tokens de salida a partir de la longitud de respuesta que esperes.

Luego introduce ambos en la fórmula y el precio de tu modelo elegido. Trata el resultado como una estimación de orden de magnitud, no como una garantía de facturación — la cifra exacta depende del tokenizador del modelo y tu longitud de salida real. Para redactar prompts más ajustados (menos tokens, instrucciones más claras) para el modelo que eligas, nuestro generador de prompts para ChatGPT y constructor de prompts de código ayudan a mantener las entradas breves.

Frequently Asked Questions

¿Cuántos tokens son 1.000 palabras?

Aproximadamente 1.333 tokens, usando la regla práctica de que 1 token es alrededor de 0,75 palabras (o aproximadamente 4 caracteres) en inglés. Esta es una aproximación; el código, la puntuación y el texto en otros idiomas cambian la proporción.

¿Por qué la salida es más cara que la entrada?

Generar tokens es computacionalmente más costoso que leerlos, por lo que los proveedores cotizan la salida más cara — a menudo varias veces la tarifa de entrada. En gpt-5.4, por ejemplo, la salida ($15/1M) es seis veces la entrada ($2,50/1M), según los precios de OpenAI.

¿Cuál es la forma más barata de ejecutar un gran trabajo por lotes?

Para trabajos no sensibles al tiempo, la API por lotes de Anthropic ofrece 50% de descuento en entrada y salida. Combina eso con un nivel de modelo de bajo costo donde la calidad lo permita. Confirma los términos actuales en los precios de Anthropic.

¿Cuánto ahorro proporciona el caché de prompts?

En Anthropic, una lectura de caché (acierto) cuesta 0,1x el precio de entrada base — 90% de descuento en la porción cacheada — aunque escribir en el caché cuesta más que la entrada base, por lo que se amortiza cuando un prefijo grande se reutiliza lo suficiente. Consulta el detalle de precios de Anthropic.

¿Puedo confiar en estimaciones de conteo de caracteres para presupuestos?

Como estimación de orden de magnitud, sí — divide caracteres entre 4 (o palabras entre 0,75) para tokens de entrada. Para facturación exacta necesitas el tokenizador del modelo y tu longitud de salida real, así que trata el resultado de la fórmula como un plan, no como una garantía.

¿Cuál es el modelo actual más barato para tareas simples?

Entre los niveles en la tabla, Gemini 2.5 Flash-Lite ($0,10 entrada / $0,40 salida por 1M) y gpt-5.4-nano ($0,20 / $1,25) son las opciones de menor costo a partir de junio de 2026. Adecúa el nivel más barato que aún cumpla con tu estándar de calidad.

¿Todos los proveedores cobran por separado para entrada y salida?

Sí — OpenAI, Anthropic y Google todos cotizan precios distintos de entrada y salida por millón de tokens. La fórmula en este artículo se aplica a los tres; solo los números por token difieren. Consulta la página de precios enlazada de cada proveedor para cifras actuales.

Escribe prompts más ajustados

Menos tokens de entrada e instrucciones más claras significan facturas más bajas. Comienza con nuestros generadores de prompts.

Browse all prompt tools →

Biblioteca gratuita de prompts — más de 100 prompts listos para copiar

Prompts seleccionados cada semana para ChatGPT, Claude, Midjourney y DALL·E. Sin spam. Cancela cuando quieras.

Sin spam. Un correo por semana. Más de ~12.000 usuarios de prompts ya suscritos.