Qué es realmente Gemini 2.5 Pro (y qué lo hace único)
Gemini 2.5 Pro es el modelo insignia de Google DeepMind en la familia Gemini 2.x, lanzado en marzo de 2025. Sucedió a Gemini 2.0 Pro (que a su vez reemplazó a Gemini 1.5 Pro a finales de 2024) y trajo tres cambios significativos: modo reasoning nativo (presupuesto de razonamiento configurable por llamada), visión de calidad tier-2 que coincide con los benchmarks de visión de GPT-5, y comportamiento de contexto de 1M tokens estable con recall que se mantiene en toda la ventana.
Lo que hace que Gemini 2.5 Pro sea estructuralmente diferente de GPT-5 o Claude Opus: es nativamente multimodal en más modalidades que cualquiera de los dos. Entrada de texto, imagen, audio, video y PDF fluyen todas a través del mismo array `contents`. Pasa un archivo MP4 de video, una grabación de audio, un conjunto de PDFs y una pregunta de texto libre — Gemini acepta todo en una sola llamada y razona en todas ellas. GPT-5 soporta texto + imagen. Claude soporta texto + imagen. Solo Gemini 2.5 Pro (y su hermano Flash) soportan video y audio nativamente en producción.
El modo reasoning (nombre de Google para razonamiento configurable) está habilitado por defecto en Gemini 2.5 Pro con un presupuesto decidido por el modelo. Fuerza un presupuesto específico con `thinking_config: {thinking_budget: 5000}`; desactiva el reasoning completamente con `thinking_budget: 0` para la respuesta más rápida posible. Los tokens de reasoning se facturan a la tarifa de salida como los tokens de reasoning en GPT-5 y tokens de reasoning en Claude.