Precios: Gemini 2.5 Pro es más barato, pero solo dentro del rango de 200K de contexto
**GPT-4o lista a $2.50/1M entrada y $10/1M salida.** Ese es el mismo precio de entrada que GPT-5.4 y 40% del precio de entrada de GPT-5.5 — GPT-4o está claramente en gama media en la línea de OpenAI de 2026.
**Gemini 2.5 Pro lista a $1.25/1M entrada y $10/1M salida** para prompts bajo 200K tokens. Eso es la mitad del precio de entrada de GPT-4o con el mismo precio de salida — una victoria clara en costo para cualquier carga de trabajo que quepa en 200K de contexto.
**Por encima de 200K de contexto, los precios de Gemini se duplican en entrada ($2.50/1M) y aumentan 1.5x en salida ($15/1M).** Esto importa: la ventana de contexto de 2M es capacidad real, pero no es gratis — usarla cuesta más por token que usar un prompt más corto. Planifica el uso de tu ventana de contexto teniendo esto en cuenta.
**El descuento de caché en Gemini 2.5 Pro es 75% en lectura** — reduce la entrada caché a $0.31/1M (contexto corto) o $0.625/1M (contexto largo). Agresivo, y segunda solo por el descuento de 90% en lectura de caché de Anthropic en Claude.
**El descuento de 50% en lectura de caché de prompt en GPT-4o** reduce la entrada caché a $1.25/1M — acercándolo al precio sin caché de Gemini. El caché ayuda a ambos, pero el descuento de Gemini es estructuralmente mayor.
**En una llamada típica de 5K entrada, 1K salida**: GPT-4o sin caché cuesta $0.0225. Gemini 2.5 Pro sin caché (contexto corto) cuesta $0.01625 — 28% más barato. Con caché, ambos se reducen a algunos centésimos por llamada. Con 100K llamadas/día, eso es una diferencia de $7-8K/año sin caché, cayendo a ruido con caché. **El costo rara vez es el factor decisivo** a la escala en que operan la mayoría de equipos; las diferencias de capacidad importan más.