Skip to contentNew: Does ChatGPT recommend your brand? Free 60-second AI visibility check →
Por el Equipo DDH · Digital Dashboard Hub

Calculadora de Costos de Grok 4 API (2026)

By The DDH Team at Digital Dashboard HubUpdated

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

14 days, no card. Cancel in 2 clicks.

xAI cobra por token en la API de Grok. Cada llamada tiene dos flujos con precio: tokens de entrada (el prompt, el mensaje del sistema, turnos previos que repites, definiciones de herramientas, cualquier resultado de búsqueda en X que incluyas en el contexto) y tokens de salida (todo lo que escribe el modelo, incluidos argumentos de llamadas a herramientas). La entrada y la salida se facturan a diferentes tasas por 1M. En toda la familia Grok-4, la salida cuesta 2-3x el precio de entrada — un diferencial mucho más ajustado que el de OpenAI (5-6x) o Anthropic (5x), lo que cambia cómo optimizas.

A partir de junio de 2026, los precios de Grok abarcan un rango de 30x: Grok-4 Fast a $0.20 entrada / $0.50 salida por 1M tokens hasta Grok-4.20 a $2.00 / $6.00. Dos palancas de costo importan realmente: los cache-hits de Grok-4.20 se facturan al 90% de descuento ($0.20/1M entrada), y el programa de compartir datos de xAI devuelve hasta **$150/mes en créditos gratuitos** a cambio de permitir que xAI entrene con tus prompts y respuestas. Ningún otro proveedor de LLM importante ofrece un programa de crédito gratuito a esta escala.

Las dos propuestas únicas de Grok: (1) **acceso en vivo a datos de X** — el único LLM con integración nativa y en tiempo real con Twitter/X para eventos actuales, sentimiento e información de última hora; y (2) **ventanas de contexto de 1-2M tokens** en toda la familia, duplicando lo que OpenAI y Anthropic ofrecen a puntos de precio comparables. El intercambio es la madurez del ecosistema: las herramientas, SDKs e integraciones de terceros se quedan atrás respecto a los actores más grandes.

A continuación: la tabla de precios completa de junio 2026 verificada contra los documentos en vivo de xAI, la fórmula de costo canónica, cuatro ejemplos resueltos (1k, 100k, 1M y un bucle de agente de 5 turnos), la explicación del intercambio de $150/mes de compartir datos en inglés simple, cuándo el acceso a X en tiempo real realmente importa, y las preguntas frecuentes que capturan todo lo que confunde a los equipos. Guarda esto en marcadores — y redacta rápidamente prompts que no desperdicien la enorme ventana de contexto de Grok con nuestro generador gratuito de prompts de ChatGPT. Calculadoras hermanas: costo de API de OpenAI · costo de GPT-5 · costo de DeepSeek.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card.

Precio de la API de Grok por 1M tokens — Junio 2026

Feature
Entrada ($/1M)
Salida ($/1M)
Ventana de contexto
Grok-4.20$2.00$6.002M tokens
Grok-4.3$1.25$2.501M tokens
Grok-4 Fast$0.20$0.502M tokens

Fuente, a partir de junio de 2026: documentación de modelos de xAI (https://docs.x.ai/docs/models) y x.ai/api. Precio de cache-hit de Grok-4.20: 90% de descuento en entrada estándar ($0.20/1M en porción cacheada). Grok-4.3 y Grok-4 Fast actualmente no exponen precio de cache-hit en la página de documentos en vivo. Programa de compartir datos: hasta $150/mes en créditos gratuitos de API a cambio de optar por tu tráfico en el conjunto de entrenamiento (https://x.ai/api). X Premium+ es una suscripción de chat de consumidor de $40/mes en x.com — relación de facturación separada, no incluye crédito de API. La búsqueda de datos de X en tiempo real está incluida en la factura de tokens estándar en los tres modelos.

La fórmula de costo (memoriza esta)

Toda llamada a la API de Grok sigue la misma matemática. No hay tarifa por llamada, sin tarifa de plataforma, sin gasto mínimo. Pagas por lo que envías y lo que recuperas, a la tasa por 1M tokens del modelo:

``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```

Dos ajustes se apilan en la parte superior, pero solo en Grok-4.20. Primero, **precios de cache-hit** reducen la porción de entrada cacheada a $0.20/1M — un descuento del 90% versus la tasa estándar de $2.00. El cache es oportunista y basado en prefijo: coloca tu prompt del sistema estable, definiciones de herramientas y ejemplos de few-shot reutilizables al inicio del array de mensajes; coloca contenido específico del usuario al final. Segundo, el **programa de compartir datos** devuelve hasta $150/mes en créditos gratuitos si optas por tu tráfico en el conjunto de entrenamiento de xAI (ver sección dedicada a continuación). Estos dos se apilan: una carga de trabajo elegible para compartir datos ejecutándose en prefijos de Grok-4.20 cacheados puede salir a costo marginal cero para los primeros ~75M tokens de entrada cacheados por mes.

Los resultados de búsqueda en X en tiempo real que el modelo recupera se facturan como tokens de entrada una vez que entran en contexto — no hay tarifa de búsqueda separada como cobra Perplexity. Este es uno de los mayores logros de precio de Grok: el anclaje a web/X en vivo está integrado en la tasa de tokens estándar.


Ejemplo resuelto 1: una sola llamada de 1.000 entrada / 500 salida

Toma una llamada representativa — un prompt de 1.000 tokens que retorna una respuesta de 500 tokens, aproximadamente un resumen de 750 palabras dentro y una respuesta de 375 palabras fuera. A tasas estándar, el costo por llamada cae como:

Grok-4.20: (1000 / 1,000,000) × $2.00 + (500 / 1,000,000) × $6.00 = $0.002 + $0.003 = **$0.005 por llamada**.

Grok-4.3: 0.001 × $1.25 + 0.0005 × $2.50 = $0.00125 + $0.00125 = **$0.0025 por llamada**.

Grok-4 Fast: 0.001 × $0.20 + 0.0005 × $0.50 = $0.0002 + $0.00025 = **$0.00045 por llamada**.

Fíjate en el diferencial de 11x entre Grok-4 Fast ($0.00045) y Grok-4.20 ($0.005) en volúmenes de tokens idénticos — un diferencial más ajustado que el rango de 145x en la familia GPT-5 de OpenAI. Los niveles de precio están más cerca en precio porque los gaps de capacidad son más pequeños; elige el nivel más barato que alcance tu barra de calidad.


Ejemplo resuelto 2: 100.000 llamadas por mes

Multiplica los números por llamada por 100.000. Esta es una carga de trabajo realista de tamaño medio — clasificación diaria en 3.000+ registros, ejecuciones de sumarización semanales, un bucle de agente de volumen moderado:

Grok-4.20: **$500/mes**. Grok-4.3: **$250/mes**. Grok-4 Fast: **$45/mes**.

Ahora aplica cache-hits a la fila Grok-4.20. Si 800 de cada 1.000 tokens de entrada son un prefijo del sistema estable que hace cache hit el 80% del tiempo, esos 640 tokens cacheados se reducen de $2.00/1M a $0.20/1M — ahorrando 90% en 64% de entrada. Eso reduce la factura de entrada de $200 → $85, llevando el total de $500 → $385 (aproximadamente 23% de descuento).

Ahora aplica compartir datos. Si tu tráfico es elegible (sin PII, sin contenido regulado), el crédito de $150/mes absorbe completamente $385 → $235 neto. En Grok-4 Fast, la misma carga de trabajo de $45/mes se cubre completamente por el crédito de compartir datos — pagas $0. Este es el nivel de producción más barato de la industria una vez que compartir datos se juega. Redacta prompts con cache anclado de forma gratuita con nuestro constructor de prompts de código.


Ejemplo resuelto 3: escalar a 1.000.000 de llamadas

Ahora escala a 1M de llamadas — una carga de trabajo de producción completa (por ejemplo, análisis por usuario en toda una aplicación SaaS con 30.000 usuarios activos ejecutando 33 llamadas/mes cada uno):

Grok-4.20: **$5.000/mes**. Grok-4.3: **$2.500/mes**. Grok-4 Fast: **$450/mes**.

En Grok-4.20, aplicando el mismo patrón de cache-hit del 80% del ejemplo 2, la factura se reduce a aproximadamente $3.850 — un ahorro de $1.150. El crédito de compartir datos quita otros $150, llegando a $3.700.

En Grok-4 Fast a $450/mes, el crédito de compartir datos de $150 cubre el 33% de la factura — pagar $300 neto por 1M de llamadas es aproximadamente $0.0003 por llamada. Eso es competitivo con DeepSeek-V3 ($0.14/$0.28) una vez que factorizas la falta de DeepSeek de cualquier programa de crédito gratuito. El orden de palanca canónico para escalar el costo de Grok hacia abajo: (1) elige Grok-4 Fast para todo lo que no requiera razonamiento de nivel superior, (2) estructura prompts de primero en prefijo para capturar cache hits en Grok-4.20, (3) opta por compartir datos si tu tráfico califica, (4) limita la longitud de salida — la salida es 2.5-3x el precio de entrada en toda la familia.


Ejemplo resuelto 4: un bucle de agente de producción real en Grok-4.20

Un bucle de agente es la forma de costo del peor caso — el modelo toma múltiples turnos por consulta de usuario, repitiendo la transcripción completa cada turno. Toma un bucle típico de 5 turnos con un prompt del sistema de 2.000 tokens + herramientas, contexto creciente 800 tokens por turno (porque el contexto de 2M de Grok permite un estado intermedio mucho más grueso que modelos de contexto más pequeño):

Turno 1: 2.800 entrada / 200 salida. Turno 2: 3.000 entrada / 200 salida. Turno 3: 3.200 entrada / 200 salida. Turno 4: 3.400 entrada / 200 salida. Turno 5: 3.600 entrada / 200 salida. Total: 16.000 entrada + 1.000 salida. En Grok-4.20: 0.016 × $2.00 + 0.001 × $6.00 = $0.032 + $0.006 = **$0.038 por consulta** — aproximadamente 7.6x una sola llamada.

Ahora aplica caching. El prefijo de 2.000 tokens de sistema + herramientas es estable en los 5 turnos. Con cache-hits del 80% en esos 2.000 tokens × 5 turnos = 8.000 tokens de entrada cacheados reduciéndose de $2.00/1M a $0.20/1M: $0.016 → $0.0016, ahorrando $0.0144 por consulta (38% de la factura). Para 100k consultas/mes: de $3.800 → $2.360. La misma carga de trabajo en Grok-4 Fast (sin cache expuesto pero línea base más barata) funciona a $0.0076 por consulta → $760/mes al mismo volumen. Para cargas de agente, Grok-4 Fast es usualmente la respuesta correcta a menos que necesites la profundidad de razonamiento de 4.20.

El movimiento de alto apalancamiento en Grok es el mismo que en cualquier otro LLM: estructura de cache supera elección de modelo. Un prompt anclado en cache en Grok-4.20 puede aterrizar más cerca en costo a Grok-4 Fast que a Grok-4.20 de tasa estándar.


El programa de crédito gratuito de compartir datos — cómo obtener $150/mes de Grok de forma gratuita

xAI ejecuta un programa de desarrolladores que devuelve hasta **$150 por mes en créditos gratuitos de API** a cambio de optar por tu tráfico de API en el corpus de entrenamiento. Ningún otro proveedor de LLM importante ofrece un programa de crédito gratuito a esta escala — el nivel gratuito de OpenAI se limitó hace años, Anthropic no tiene ninguno, los créditos de Gemini de Google están vinculados a promociones de incorporación de GCP, no reembolsos de desarrollador en curso.

**El intercambio en inglés simple**: cuando optas por participar, xAI puede usar tus prompts y respuestas para entrenar versiones futuras de Grok. Los datos se desidentifican en la ingesta, pero cualquiera con cargas de trabajo sensibles a la privacidad (PII del cliente, contenido regulado, IP interna, cualquier cosa bajo NDA, salud, documentos legales, asesoramiento financiero con partes identificables) no debe participar. El crédito no vale el riesgo de fuga de datos.

**Quién debe participar**: desarrolladores independientes, aficionados, cargas de trabajo de contenido público (resumir noticias, analizar posts públicos de X, generar copia de marketing, crear demostraciones), prototipos en etapa temprana donde aún estás validando el producto. Cualquiera cuyos prompts no te molestaría si aparecieran verbatim en una respuesta futura de Grok encaja.

**Quién no debe participar**: empresas SaaS cuyos datos de clientes fluyen a través de prompts, industrias reguladas (salud/finanzas/legal), herramientas B2B manejando información de clientes propietarios, cualquier cosa donde el contenido del prompt tiene valor comercial como IP confidencial. Los $150/mes no valen la exposición contractual o regulatoria.

**Cómo inscribirse**: opta por participar a través de la consola de xAI en x.ai/api bajo configuración de desarrollador. El crédito se aplica automáticamente a tu uso facturable; no obtienes efectivo, obtienes hasta $150 de uso de API absorbido cada mes. El crédito no utilizado no se transfiere. Los términos exactos (elegibilidad, manejo de datos, opt-out) están documentados en x.ai/api — verifica antes de inscribirse.


Cuándo importa el acceso a X en tiempo real de Grok (y cuándo es irrelevante)

Grok es el único LLM importante con acceso nativo y en tiempo real a la manguera de X (Twitter). Todos los demás proveedores que ofrecen "búsqueda web" — OpenAI, Anthropic a través de herramientas web, Gemini, Perplexity — usan APIs de búsqueda de terceros que indexan páginas públicas de X con retraso significativo (minutos a horas, a veces más). Grok consulta el índice interno de X directamente, con frescura de menos de un minuto en contenido tendencia.

**Casos de uso donde esto realmente vale la pena pagar la prima de Grok sobre un modelo más barato**: análisis de sentimiento en vivo sobre noticias de último minuto (la reacción de Tesla dentro de 10 minutos de que termine la llamada de ganancias), monitoreo de reputación de marca durante una crisis, análisis de eventos políticos en tiempo real, agregación de comentarios de deportes/entretenimiento, monitoreo de sentimiento de desarrolladores en el lanzamiento de un producto, rastreo de cómo un meme se propaga. Cualquier cosa donde "qué está diciendo X sobre Y *en este momento*" sea la pregunta.

**Casos de uso donde es irrelevante**: generación de código, sumarización de documentos, extracción estructurada, clasificación, soporte al cliente, autocompletado incrustado, flujos de trabajo de agentes que operan en datos internos, RAG sobre tu propio corpus. Para estos, el acceso a X en tiempo real es sobrecarga que pagas nada extra por ella pero no obtienes ningún valor de — y Grok-4 Fast a $0.20/$0.50 es competitivo solo en precio, bonificación real o no.

**El intercambio honesto**: los datos de X en tiempo real son genuinamente únicos para Grok, pero es un foso estrecho. Si tu producto los necesita, ningún otro modelo sustituye. Si tu producto no los necesita, estás eligiendo Grok en precio/ventana de contexto, no la integración de X. Sé honesto sobre qué cubo estás usando antes de arquitectar alrededor de él.

**Costo de resultados de búsqueda**: cuando Grok recupera contenido de X en contexto, esos tokens se facturan a la tasa de entrada estándar. Una consulta de búsqueda que obtiene 20 posts de X promediando 500 tokens cada uno = 10.000 tokens de entrada agregados al prompt. En Grok-4.20 eso es $0.02 por llamada aumentada de búsqueda además de tu prompt base. Planifica esto en tu presupuesto de tokens — las llamadas de Grok aumentadas de búsqueda son 5-10x el volumen de entrada de una llamada simple.


Grok-4 Fast vs GPT-5.4-mini vs DeepSeek-V3: el enfrentamiento de modelos baratos

Grok-4 Fast se sienta entre OpenAI y DeepSeek en la curva de nivel barato. Lado a lado en tasas estándar (junio 2026):

**Grok-4 Fast**: $0.20 entrada / $0.50 salida, contexto 2M, acceso a X en tiempo real, crédito de $150/mes disponible. **GPT-5.4-mini**: $0.50 entrada / $1.50 salida, contexto 200K, ecosistema maduro, descuentos de batch + cache. **DeepSeek-V3**: $0.14 entrada / $0.28 salida, contexto 64K, línea base más barata, sin créditos gratuitos, infra basada en China. Ver desglose completo en costo de GPT-5 y costo de DeepSeek.

**En una llamada de 1.000 entrada / 500 salida**: Grok-4 Fast $0.00045, GPT-5.4-mini $0.00125, DeepSeek-V3 $0.00028. Por llamada, DeepSeek-V3 es el más barato. Pero: factoriza el crédito de compartir datos en Grok y Grok-4 Fast se vuelve efectivamente gratuito para las primeras ~330k llamadas/mes, venciendo a DeepSeek para cualquier carga de trabajo por debajo de ese umbral.

**Dónde gana cada uno**: DeepSeek-V3 para precio puro por token a escala donde no calificas para créditos de Grok. GPT-5.4-mini para madurez de ecosistema, herramientas, API batch, e inferencia basada en EE.UU. (comodidad regulatoria). Grok-4 Fast para ventanas de contexto de 2M, acceso a X en tiempo real, o cualquier carga de trabajo elegible para el crédito de compartir datos de $150/mes. Los tres son aproximadamente sustituibles en capacidad para la mayoría de tareas de clasificación/sumarización/extracción de producción — elige en confianza de infra, ventana de contexto, o necesidades de datos únicos.


Grok la API vs X Premium+ la suscripción de consumidor: no los confundas

xAI ejecuta dos relaciones de facturación completamente separadas, y se confunden constantemente. La **API de Grok** (con precio por token en la tabla anterior, accesible a través de x.ai/api y docs.x.ai) es para desarrolladores que construyen aplicaciones. La **suscripción de consumidor X Premium+** ($40/mes en x.com/premium) es para usuarios finales chateando con Grok en la UI de X.com e incluye además X sin anuncios, límites de posts más largos y otras características de consumidor. Mismo modelo debajo; facturación completamente distinta.

**Qué significa esto para constructores**: una suscripción X Premium+ de $40/mes **no** incluye crédito de API. Si estás construyendo en Grok-4.20, configura facturación de API de forma independiente en x.ai/api. Suscribirse a X Premium+ no hace nada por tus límites de tasa de API, cuota o factura.

**Qué significa para usuarios finales**: una clave de API no te da características Premium+ en x.com. Si quieres la UI de chat de consumidor, feed sin anuncios y posts más largos, eso es una suscripción separada de $40/mes. Las dos relaciones usan la misma identidad de xAI/X pero rastrean uso, métodos de pago y límites de facturación de forma independiente.

**Por qué esta confusión es más común con Grok que con otros proveedores**: porque xAI y X comparten marca (misma empresa matriz), los usuarios asumen que una suscripción compra ambos. No lo hace. La misma separación arquitectónica que OpenAI tiene entre suscripciones de ChatGPT y la API se aplica aquí — mismo logo, productos diferentes, facturas diferentes.


Errores frecuentes que inflan la factura de Grok

**Error 1: configurar por defecto Grok-4.20 para todo.** La mayoría del tráfico de producción es clasificación, extracción, sumarización — Grok-4 Fast maneja estas a 1/10 del precio y el contexto 2M es igual. Prueba antes de asumir que el buque insignia es necesario.

**Error 2: prompts del sistema enormes que nunca consiguen cache en Grok-4.20.** Si tu prompt del sistema interpola cualquier cosa que cambie entre llamadas (timestamps, IDs de usuario, estado de sesión), el cache nunca acierta. Reestructura para que el prompt del sistema sea estático y el contexto dinámico viva en mensajes de usuario.

**Error 3: no limitar la salida.** La salida es 2.5-3x el precio de entrada en toda la familia Grok. Una respuesta de 200 tokens que retorna 1.200 tokens porque olvidaste configurar max_tokens cuesta 6x. En Grok-4.20, eso es $0.0072 por llamada vs $0.0012. Limita la longitud de salida en cualquier lugar donde controles la forma de consumo.

**Error 4: usar búsqueda de X en tiempo real cuando no la necesitas.** Cada llamada aumentada de búsqueda agrega 5.000-15.000 tokens de entrada. Si tu tarea no requiere realmente datos de X en vivo, desactiva la herramienta — cortarás el volumen de entrada 5-10x en esas llamadas.

**Error 5: llenar la ventana de contexto de 2M porque puedas.** El contexto gigante de Grok es una característica, no un recurso gratuito. 1M tokens de entrada en Grok-4.20 cuesta $2.00 por llamada. Usa la ventana de contexto para lo que fue diseñada (documentos largos, estado de agente grueso) — no como sustituto para recuperación o sumarización.

**Error 6: no inscribirse en compartir datos cuando tu carga de trabajo es elegible.** Si tu tráfico genuinamente califica (sin PII, sin contenido propietario del cliente), estás dejando hasta $1.800/año en la mesa al no participar.


Metodología de abastecimiento y cómo mantener estos números actuales

Cada precio en esta guía proviene de la documentación del modelo en vivo de xAI en docs.x.ai/docs/models y la página de precios de desarrollador en x.ai/api, obtenida el 2026-06-20 y verificada contra tres fuentes independientes corroborantes (agregadores de precio de comunidad, commits de integración recientes en proyectos populares de código abierto que hacen referencia a xai-sdk, y el changelog de desarrollador de xAI). Cuando un número no podía ser verificado contra la página oficial, fue omitido — preferimos enviar una guía que falta una fila a una guía con un número fabricado.

xAI actualiza precios más agresivamente que los proveedores más antiguos — Grok-4.20 vio una reducción de precio del 30% en Q4 2025 y Grok-4 Fast se lanzó a un precio 60% por debajo del lanzamiento inicial de Grok-4. Espera 4-6 movimientos de precios por año, casi todos descendentes a medida que la familia madura. El peligro práctico más grande: asumir un precio que provisionaste en Q1 sigue siendo válido en Q3.

**Cómo verificar antes de presupuestar**: abre docs.x.ai/docs/models en una ventana incógnita, copia los números para tus modelos objetivo en una hoja de cálculo y compara contra esta guía. Si coinciden, esta guía es actual para tus propósitos. Si no, confía en la página en vivo. Revalida trimestralmente si tu factura mensual de Grok es superior a $500 — a ese volumen, un único movimiento de precio desplaza materialmente el presupuesto.

**Por qué omitimos algunas filas**: el precio de cache-hit para Grok-4.3 y Grok-4 Fast actualmente no está expuesto en la página de documentos en vivo verificada, aunque los posts de forum de comunidad a veces citan tasas de cache específicas. Antes que propagar números posiblemente obsoletos, los omitimos aquí. También hemos omitido niveles de descuento empresarial/volumen que se negocian caso por caso y no se enumeran públicamente.

**Metodología reproducible**: cada fila en la tabla anterior tiene una cita; cada ejemplo resuelto usa esas filas; cada respuesta de FAQ las refleja. Si encuentras una discrepancia con la página en vivo, trata la página en vivo como canónica — y cuéntanos para que podamos re-obtener y actualizar. Las calculadoras complementarias (OpenAI, GPT-5, DeepSeek) fueron todas construidas usando la misma metodología de curl-verify en la misma fecha.

Cómo estimar cualquier costo de llamada a la API de Grok en 5 pasos

  1. 1

    Estima tus tokens de entrada

    Toma el conteo de caracteres de tu prompt y divide por 4, o su conteo de palabras y divide por 0.75. Regla: 1 token ≈ 4 caracteres ≈ 0.75 palabras en inglés. Un prompt del sistema de 500 palabras + mensaje de usuario de 200 palabras ≈ 933 tokens de entrada. Si usas búsqueda de X en tiempo real, agrega 5.000-15.000 tokens para el contenido recuperado.

    → Open the Generador de prompts sintonizado para Grok
  2. 2

    Estima tus tokens de salida

    Estima salida de la misma forma — palabras ÷ 0.75. La salida usualmente impulsa costo porque los precios de salida son 2.5-3x entrada en cada modelo Grok-4. Si estableces un cap de max_tokens, ese es tu techo del peor caso. Úsalo para presupuestar conservadoramente.

  3. 3

    Busca el precio de entrada y salida por 1M

    Desde la tabla anterior (verificada junio 2026): Grok-4.20 $2.00 / $6.00, Grok-4.3 $1.25 / $2.50, Grok-4 Fast $0.20 / $0.50. Siempre revisa docs.x.ai/docs/models antes de enviar — los precios de Grok se mueven más a menudo que los de OpenAI o Anthropic.

  4. 4

    Aplica la fórmula de costo

    cost = (input_tokens / 1,000,000) × input_price + (output_tokens / 1,000,000) × output_price. Una llamada de 1.000 entrada / 500 salida en Grok-4 Fast = 0.001 × $0.20 + 0.0005 × $0.50 = $0.0002 + $0.00025 = $0.00045.

  5. 5

    Aplica cache hits + el crédito de compartir datos de $150/mes

    En Grok-4.20, entrada cacheada se factura a $0.20/1M (90% de descuento). En cualquier modelo, optar por el programa de compartir datos devuelve hasta $150/mes en créditos gratuitos. Apila ambos: una carga de trabajo Grok-4.20 anclada en cache y elegible para compartir datos puede absorber los primeros ~75M tokens de entrada cacheados por mes a costo marginal cero.

Frequently Asked Questions

¿Cuánto cuesta Grok 4 por 1 millón de tokens en 2026?

A partir de junio de 2026, el Grok-4.20 insignia de xAI cobra $2.00 por 1M tokens de entrada y $6.00 por 1M tokens de salida, con una ventana de contexto de 2M tokens. Grok-4.3 es $1.25 / $2.50 con contexto 1M. Grok-4 Fast es $0.20 / $0.50 con contexto 2M. Los cache-hits de Grok-4.20 reducen entrada a $0.20/1M (90% de descuento). Fuente: documentación del modelo en vivo de xAI en docs.x.ai/docs/models.

¿Cuál es la diferencia en precio entre Grok 4 y Grok 4 Fast?

Grok-4.20 cuesta $2.00 entrada / $6.00 salida por 1M tokens. Grok-4 Fast cuesta $0.20 / $0.50 — exactamente 10x más barato en entrada y salida. Ambos tienen ventanas de contexto de 2M. El intercambio es profundidad de razonamiento: Grok-4.20 maneja razonamiento multi-paso complejo y síntesis materialmente mejor; Grok-4 Fast está optimizado para clasificación, extracción, sumarización y Q&A simple donde el nivel más barato se mantiene en una evaluación retenida.

¿Es Grok más barato que GPT-5?

Depende del nivel. Grok-4 Fast ($0.20 / $0.50) es más barato que GPT-5.4-mini ($0.50 / $1.50) en el final barato. Grok-4.20 ($2.00 / $6.00) se sienta entre GPT-5.4 ($2.50 / $15.00) y GPT-5.5 ($5.00 / $30.00) — más barato que ambos en entrada, dramáticamente más barato en salida. El ratio entrada-a-salida más ajustado de Grok (3x vs 5-6x de OpenAI) lo hace especialmente favorable para cargas de trabajo pesadas en salida como generación de forma larga. Desglose completo en calculadora de costo de GPT-5.

¿Ofrece Grok créditos gratuitos de API?

Sí. xAI ejecuta un programa de compartir datos que devuelve hasta $150 por mes en créditos gratuitos de API a cambio de optar por tus prompts y respuestas en el corpus de entrenamiento. Esto es único entre proveedores principales de LLM — OpenAI, Anthropic y Google no ofrecen reembolsos de desarrollador en curso a esta escala. El intercambio es privacidad de datos: solo opta si tu tráfico contiene sin PII, sin contenido de cliente propietario, y nada bajo NDA. Inscríbete en x.ai/api.

¿Cuán grande es la ventana de contexto de Grok?

Grok-4.20 y Grok-4 Fast ambos admiten 2 millones de tokens de contexto. Grok-4.3 admite 1 millón de tokens. Esto es aproximadamente 10x lo que la familia GPT-5 de OpenAI ofrece (200K) y 2x Claude de Anthropic (1M). El contexto grande es genuinamente útil para análisis de documentos largos, estado de agente grueso y procesamiento de bases de código completas en una sola llamada — pero recuerda que llenar ese contexto aún se factura a la tasa de entrada estándar.

¿Cómo se compara Grok-4 Fast con DeepSeek en precio?

Grok-4 Fast es $0.20 entrada / $0.50 salida. DeepSeek-V3 es $0.14 entrada / $0.28 salida — aproximadamente 30-45% más barato por token. Pero Grok-4 Fast ofrece una ventana de contexto de 2M vs 64K de DeepSeek, incluye acceso de búsqueda en X en tiempo real, y califica para el crédito de compartir datos de $150/mes (DeepSeek no tiene programa de crédito gratuito). Para cargas de trabajo bajo ~330k llamadas/mes con el crédito de compartir datos aplicado, Grok-4 Fast es efectivamente más barato. Para comodidad regulatoria basada en EE.UU., ver costo de DeepSeek para el intercambio completo.

¿X Premium+ incluye acceso a la API de Grok?

No. X Premium+ es una suscripción de consumidor de $40/mes para chatear con Grok en la UI de x.com más X sin anuncios y posts más largos. No incluye ningún crédito de API, no aumenta tus límites de tasa de API, ni afecta tu factura de API. Para construir en Grok de forma programática, configura facturación de API de forma independiente en x.ai/api. Misma identidad de xAI/X, dos relaciones de facturación distintas — la misma separación arquitectónica que OpenAI tiene entre suscripciones de ChatGPT y la API.

¿Cómo funciona el precio de entrada cacheada de Grok?

En Grok-4.20, los tokens de entrada cacheados se facturan a $0.20/1M — un descuento del 90% versus la tasa estándar de $2.00. El cache es oportunista y basado en prefijo: xAI genera una huella digital de tu prefijo de prompt y lo cachea del lado del servidor, así las llamadas posteriores dentro de la ventana de cache que comparten el mismo prefijo leen del cache. Coloca prompts del sistema estables y definiciones de herramientas primero; coloca contenido específico del usuario último. El precio de cache-hit actualmente no está expuesto en Grok-4.3 o Grok-4 Fast en la página de documentos en vivo.

Grok es barato. Los prompts malos no lo son.

Ya sea que estés en Grok-4 Fast o 4.20, un prompt descuidado desperdicia la ventana de contexto. Nuestro Generador de Prompts de IA escribe prompts sintonizados para Grok que explotan el contexto 2M sin inflarlo. Prueba gratuita de 14 días, sin tarjeta.

Browse all prompt tools →

Biblioteca gratuita de prompts — más de 100 prompts listos para copiar

Prompts seleccionados cada semana para ChatGPT, Claude, Midjourney y DALL·E. Sin spam. Cancela cuando quieras.

Sin spam. Un correo por semana. Más de ~12.000 usuarios de prompts ya suscritos.