La fórmula de costo (memoriza esta)
Toda llamada a la API de Grok sigue la misma matemática. No hay tarifa por llamada, sin tarifa de plataforma, sin gasto mínimo. Pagas por lo que envías y lo que recuperas, a la tasa por 1M tokens del modelo:
``` cost = (input_tokens / 1,000,000) × input_price_per_M + (output_tokens / 1,000,000) × output_price_per_M ```
Dos ajustes se apilan en la parte superior, pero solo en Grok-4.20. Primero, **precios de cache-hit** reducen la porción de entrada cacheada a $0.20/1M — un descuento del 90% versus la tasa estándar de $2.00. El cache es oportunista y basado en prefijo: coloca tu prompt del sistema estable, definiciones de herramientas y ejemplos de few-shot reutilizables al inicio del array de mensajes; coloca contenido específico del usuario al final. Segundo, el **programa de compartir datos** devuelve hasta $150/mes en créditos gratuitos si optas por tu tráfico en el conjunto de entrenamiento de xAI (ver sección dedicada a continuación). Estos dos se apilan: una carga de trabajo elegible para compartir datos ejecutándose en prefijos de Grok-4.20 cacheados puede salir a costo marginal cero para los primeros ~75M tokens de entrada cacheados por mes.
Los resultados de búsqueda en X en tiempo real que el modelo recupera se facturan como tokens de entrada una vez que entran en contexto — no hay tarifa de búsqueda separada como cobra Perplexity. Este es uno de los mayores logros de precio de Grok: el anclaje a web/X en vivo está integrado en la tasa de tokens estándar.