Ficha técnica del modelo · Verificado contra documentación oficial de Google · 2026-06-20

Gemini 2.5 Pro: Especificaciones Completas (Junio 2026)

By The DDH Team at Digital Dashboard Hub·Updated June 19, 2026

Stop writing AI prompts from scratch.

Tell us your business + your task + your model. We write the prompt — perfectly tuned for ChatGPT, Claude, Grok, Gemini, Midjourney, or any model. Plus 500+ pre-built prompts in your library.

Gemini 2.5 Pro es el modelo de propósito general insignia de Google DeepMind, lanzado en marzo de 2025 como sucesor de Gemini 2.0 Pro. Es el único modelo frontier de un proveedor importante con una ventana de contexto nativa de 1.000.000 tokens en disponibilidad general (Sonnet de Anthropic tiene 1M en beta; GPT-5 de OpenAI alcanza máximo 400K). También es el único modelo frontier con comprensión nativa de video — pasa un archivo MP4 directamente al modelo y formula preguntas sobre él.

Números clave: precios escalonados por tamaño de entrada. Para entrada ≤200.000 tokens: $1,25 por 1M entrada / $10 por 1M salida. Para entrada >200.000 tokens: $2,50 por 1M entrada / $15 por 1M salida. La entrada en caché cuesta $0,31/M (tier ≤200K) o $0,625/M (tier >200K) — 75% descuento. La ventana de contexto es de 1.000.000 tokens (2M en vista previa privada). La salida máxima es 65.536 tokens. Las modalidades son entrada de texto, imagen, audio, video y PDF; salida solo de texto. Function calling, salidas estructuradas, ejecución de código y modo reasoning están todos soportados.

A continuación: tabla completa de especificaciones, cuándo Gemini 2.5 Pro es la opción correcta frente a Claude Opus o GPT-5, cuándo el contexto de 1M justifica el incremento de precio del tier >200K, la solicitud API mínima y 8 preguntas frecuentes. Páginas relacionadas: ficha técnica Gemini 2.5 Flash · ficha técnica GPT-5 · ficha técnica Claude Opus 4.7. Crea prompts optimizados para Gemini gratis con nuestro generador de prompts Gemini.

Digital Dashboard Hub

Writing good prompts for ONE AI is hard. Writing them for GPT-5, Claude, Gemini, Perplexity, Midjourney and 6 more is a full-time job. DDH's AI Prompt Builder writes once, runs everywhere — locked to your niche, voice, and brand tone.

Free 14 days, no card. →

Gemini 2.5 Pro — Ficha técnica completa (Junio 2026)

Feature	Especificación Gemini 2.5 Pro
Proveedor	Google DeepMind
ID del modelo (API)	gemini-2.5-pro
Lanzamiento	Marzo 2025
Precio entrada ≤200K (por 1M)	$1,25
Precio entrada >200K (por 1M)	$2,50
Entrada en caché ≤200K (por 1M)	$0,31 (75% descuento)
Entrada en caché >200K (por 1M)	$0,625 (75% descuento)
Precio salida ≤200K (por 1M)	$10,00
Precio salida >200K (por 1M)	$15,00
Descuento Batch API	50% descuento entrada + salida
Ventana de contexto	1.000.000 tokens
Tokens de salida máximos	65.536 tokens
Modalidades (entrada)	Texto, imagen, audio, video, PDF
Modalidades (salida)	Texto
Function calling
Function calling paralelo
Salidas estructuradas (JSON Schema)
Streaming
Ejecución de código (herramienta integrada)
Búsqueda Google anclada (herramienta integrada)
Modo reasoning (razonamiento)
Comprensión de video
Comprensión de audio
Corte de conocimiento	Enero 2025
Endpoint (Google AI)	generativelanguage.googleapis.com/v1/models/gemini-2.5-pro:generateContent
Endpoint (Vertex AI)	{LOCATION}-aiplatform.googleapis.com

Fuentes verificadas 2026-06-20: documentación de modelos Gemini API de Google (https://ai.google.dev/gemini-api/docs/models/gemini), precios de Google AI Studio (https://ai.google.dev/pricing), precios de Vertex AI Gemini (https://cloud.google.com/vertex-ai/generative-ai/pricing). El cambio de tier de precios ocurre en 200K tokens de entrada — las llamadas menores a 200K entrada se facturan al tier inferior incluso si la asignación de ventana de contexto es mayor. Vuelve a verificar las páginas activas antes de presupuestar.

Qué es realmente Gemini 2.5 Pro (y qué lo hace único)

Gemini 2.5 Pro es el modelo insignia de Google DeepMind en la familia Gemini 2.x, lanzado en marzo de 2025. Sucedió a Gemini 2.0 Pro (que a su vez reemplazó a Gemini 1.5 Pro a finales de 2024) y trajo tres cambios significativos: modo reasoning nativo (presupuesto de razonamiento configurable por llamada), visión de calidad tier-2 que coincide con los benchmarks de visión de GPT-5, y comportamiento de contexto de 1M tokens estable con recall que se mantiene en toda la ventana.

Lo que hace que Gemini 2.5 Pro sea estructuralmente diferente de GPT-5 o Claude Opus: es nativamente multimodal en más modalidades que cualquiera de los dos. Entrada de texto, imagen, audio, video y PDF fluyen todas a través del mismo array `contents`. Pasa un archivo MP4 de video, una grabación de audio, un conjunto de PDFs y una pregunta de texto libre — Gemini acepta todo en una sola llamada y razona en todas ellas. GPT-5 soporta texto + imagen. Claude soporta texto + imagen. Solo Gemini 2.5 Pro (y su hermano Flash) soportan video y audio nativamente en producción.

El modo reasoning (nombre de Google para razonamiento configurable) está habilitado por defecto en Gemini 2.5 Pro con un presupuesto decidido por el modelo. Fuerza un presupuesto específico con `thinking_config: {thinking_budget: 5000}`; desactiva el reasoning completamente con `thinking_budget: 0` para la respuesta más rápida posible. Los tokens de reasoning se facturan a la tarifa de salida como los tokens de reasoning en GPT-5 y tokens de reasoning en Claude.

Matemáticas de precios: el tier de entrada de 200K y qué significa

Gemini 2.5 Pro utiliza un modelo de precios escalonado único entre proveedores frontier. Por debajo de 200.000 tokens de entrada por llamada: $1,25/M entrada, $10/M salida. Arriba de 200.000 tokens de entrada: $2,50/M entrada, $15/M salida. El tier se aplica a la llamada completa — si envías 250K tokens de entrada, los 250K completos se facturan al tier superior, no solo la parte por encima de 200K.

Ejemplo: una llamada de entrada 100K + 1K salida se factura como `(0,100 × $1,25) + (0,001 × $10) = $0,125 + $0,01 = $0,135`. La misma entrada como 250K + 1K salida se factura como `(0,250 × $2,50) + (0,001 × $15) = $0,625 + $0,015 = $0,640`. Cruzar el umbral de 200K es una función escalón de 2× precio de entrada + 1,5× precio de salida, no una rampa suave.

Implicación: mantén las llamadas por debajo de 200K entrada donde puedas. Si estás en 195K, rellenar a 205K para encajar un trozo más es un aumento de precio de 5×. Si vas a cruzar 200K, ve todo el camino — 250K y 500K se facturan a la misma tarifa por token.

Caché: explícito, a través del endpoint `cachedContents` de la API. Precrea un bloque de contenido en caché (TTL predeterminado de 1 hora, configurable hasta 24 horas), hazle referencia por ID en llamadas posteriores. La porción en caché se lee con 75% descuento ($0,31/M en el tier ≤200K, $0,625/M en el tier >200K). Mayor palanca de costo en cargas de trabajo de contexto largo. Calculadora de costo entre proveedores: calculadora de costo GPT/Claude/Gemini.

La ventana de contexto de 1M: cuándo realmente importa

Gemini 2.5 Pro acepta 1.000.000 tokens en una sola llamada. Para referencia: un guión de largometraje completo es ~30K tokens, una novela de 300 páginas es ~150K tokens, la base de código de una aplicación SaaS mediana es 200-500K tokens, la trilogía completa de El Señor de los Anillos es ~600K tokens. Gemini 2.5 Pro encaja cualquiera de estos en una sola llamada.

El recall se mantiene en toda la ventana de 1M — los benchmarks needle-in-haystack de Google muestran >99% recall a través de ~1M tokens para el modelo Pro. El cuello de botella práctico es el costo y la latencia, no el recall. Una llamada de 1M tokens se factura como `1,0 × $2,50 + (salida × $15) = $2,50+` por llamada antes de costos de salida y se ejecuta 30-60 segundos de extremo a extremo a tasas de streaming típicas.

Cuándo 1M realmente importa: razonamiento de base de código completa (planificación de refactorización en todo un repositorio), Q&A de documento completo en libros o contratos legales, comprensión de audio/video de larga duración (transcribe y analiza una reunión de 1 hora en una sola llamada), síntesis de investigación multidocumento.

Cuándo 1M no importa: clasificación, extracción, chat, tareas de datos estructurados, cualquier cosa que encaje en 50K tokens con RAG. Para la mayoría de cargas de trabajo de producción, el tier más pequeño ≤200K en Gemini 2.5 Pro (o incluso Gemini 2.5 Flash a $0,30/M) es la opción correcta.

Multimodal: video, audio, PDF — nativamente en una sola llamada

Pasa un archivo de video como un blob base64 en línea o a través de Google File API (recomendado para archivos >20MB). Gemini extrae fotogramas a 1 FPS por defecto, transcribe audio y razona en el flujo combinado. Contabilidad de tokens: video se factura a ~258 tokens por segundo de metraje (comprimido en video + audio).

Un video de 5 minutos se factura como `300 segundos × 258 tokens = 77.400 tokens` — aún por debajo del tier de 200K. Una grabación de reunión de 30 minutos es ~465K tokens — por encima del umbral de 200K, en el tier >200K. Planifica en consecuencia.

Los PDFs se procesan página por página con extracción de imagen + texto. Una página PDF típica con contenido textual es ~258 tokens; las páginas con mucha imagen pueden ser sustancialmente más. Pasa a través de File API para documentos mayores a 20MB.

Audio (sin video) se factura a ~32 tokens por segundo. Una grabación de audio de 10 minutos es ~19.200 tokens. Usa para transcripción + resumen de reuniones, análisis de podcast, estructuración de notas de voz.

Advertencia práctica: las entradas multimodales inflaban los conteos de tokens rápidamente. Una llamada ingenua 'resume esta reunión de una hora' puede fácilmente exceder 200K tokens (video de 1 hora = ~930K tokens). Almacena el video en caché a través de File API y hazle referencia en múltiples llamadas analíticas en lugar de volver a subirlo.

Function calling, salidas estructuradas y herramientas integradas

Gemini 2.5 Pro soporta function calling con JSON Schema: declara funciones en el parámetro `tools`, el modelo elige una (o varias en paralelo) y devuelve los argumentos. El function calling paralelo está soportado y activado por defecto en el modelo Pro.

Las salidas estructuradas son de primera clase: pasa un `responseSchema` (subconjunto JSON Schema) en `generationConfig` y Google garantiza que la salida del modelo valida contra ese esquema. Soporta objetos anidados, arrays, enums — comparable a las salidas estructuradas de OpenAI y al patrón tool-use-as-output de Anthropic.

Herramientas integradas que no tienes que implementar tú mismo: **ejecución de código** (el modelo escribe y ejecuta Python en una sandbox, ve la salida, itera), **búsqueda Google anclada** (el modelo emite una búsqueda Google y cita los resultados en su respuesta, con atribución), **contexto de URL** (el modelo obtiene y lee URLs en la conversación). Las herramientas integradas son únicas a Gemini en el menú de modelos frontier y reducen dramáticamente el código de orquestación para flujos de trabajo agentes.

Modo reasoning: el dial de razonamiento de Google

El modo reasoning está habilitado por defecto en Gemini 2.5 Pro con un presupuesto de reasoning decidido por el modelo. Sobrescribe con `thinking_config: {thinking_budget: N}` donde N es el máximo de tokens de reasoning para la llamada. Establece N=0 para desactivar el reasoning completamente; establece N=-1 (o muy alto) para dejar que el modelo decida dinámicamente.

Los tokens de reasoning se facturan a la tarifa de salida (igual que los tokens de reasoning en GPT-5 y tokens de reasoning en Claude). En Gemini 2.5 Pro: `$10/M` en el tier ≤200K, `$15/M` en el tier >200K. Un presupuesto de reasoning de 3.000 tokens en una llamada del tier ≤200K agrega $0,03 a la llamada.

Cuándo establecer presupuestos de reasoning explícitos: control de costo (tope a 1.000 para tareas rutinarias), control de calidad (impulsa a 5.000-10.000 para razonamiento complejo), control de latencia (establece a 0 para la respuesta más rápida posible en tareas simples). Cuándo dejar el reasoning en automático: chat de propósito general donde la calibración de Gemini está bien sintonizada para la mezcla de tareas.

Cuándo elegir Gemini 2.5 Pro vs Claude Opus 4.7 vs GPT-5

**Elige Gemini 2.5 Pro** cuando necesites multimodal nativo en video/audio/PDF, cuando necesites contexto de 1M en disponibilidad general, cuando las herramientas integradas (ejecución de código, búsqueda anclada) reemplacen la orquestación personalizada, o cuando ya estés en el ecosistema de Google Cloud / Workspace y la facturación de Vertex AI simplifique la adquisición.

**Elige Claude Opus 4.7** cuando la voz de escritura de larga duración, la disciplina de calibración de rechazo o el razonamiento riguroso sea el cuello de botella. Opus es $15/$75 vs Gemini 2.5 Pro's $1,25/$10 (≤200K) — Gemini es dramáticamente más barato para todo excepto las tareas estrechas donde la prima de calidad de Opus se justifica.

**Elige GPT-5** cuando necesites contexto de 400K sin el incremento de tier >200K en Gemini, cuando estés en el ecosistema de herramientas de OpenAI (Responses API, Assistants, ChatGPT Pro), o cuando las salidas estructuradas con la aplicación más madura de JSON Schema importen.

Comparación entre proveedores: GPT-4o vs Gemini 2.5 Pro.

Fuentes verificadas y cómo verificar nuevamente los números

Cada número en esta página fue verificado contra la documentación en vivo de Google el 2026-06-20. Fuentes: ai.google.dev/gemini-api/docs/models/gemini para contexto, modalidades y soporte de características; ai.google.dev/pricing para precios directos de AI Studio; cloud.google.com/vertex-ai/generative-ai/pricing para precios de Vertex AI (actualmente idénticos a directos de AI Studio).

Las actualizaciones de precios de Google se anuncian a través de las notas de lanzamiento de Vertex AI y el changelog de ai.google.dev. Los precios han cambiado dos veces en Gemini 2.5 Pro desde el lanzamiento (ambos hacia abajo). Vuelve a verificar trimestralmente si tu factura es significativa.

Metodología: cuando un número no podía ser confirmado en múltiples fuentes contra una página oficial de Google en la fecha de verificación, fue omitido de esta ficha en lugar de ser adivinado.

Haz tu primera llamada a Gemini 2.5 Pro en 5 pasos

1
Obtén una clave API
Ruta más fácil: aistudio.google.com → Get API key → Create. Copia a `.env` como `GEMINI_API_KEY=...`. Para producción a escala, usa Vertex AI en Google Cloud en su lugar (mejor cuota, SLAs, control regional).
2
Instala el SDK
Python: `pip install google-genai`. Node: `npm install @google/genai`. El SDK `google-genai` es el cliente canónico actual a partir de 2026; el SDK más antiguo `google-generativeai` está deprecado para código nuevo.
3
Envía una llamada mínima
Python: `from google import genai; client = genai.Client(); r = client.models.generate_content(model='gemini-2.5-pro', contents='Hello'); print(r.text)`. Ese es el viaje completo de ida y vuelta.
4
Agrega salidas estructuradas y presupuesto de reasoning explícito
Para producción: `client.models.generate_content(model='gemini-2.5-pro', contents=prompt, config={'response_mime_type': 'application/json', 'response_schema': MySchema, 'thinking_config': {'thinking_budget': 2000}})`. Fuerza salida tipada y tapa el costo de reasoning.
→ Open the Generador de prompts
5
Usa File API para entradas multimodales grandes
Para PDFs/videos/audio mayores a 20MB: `file = client.files.upload(file='meeting.mp4'); r = client.models.generate_content(model='gemini-2.5-pro', contents=[file, 'Summarize the key decisions'])`. Los archivos persisten en el servidor durante 48 horas y pueden ser referenciados en múltiples llamadas sin volver a subirlos.

Digital Dashboard Hub

The prompt patterns above work 10x better when they live in a library you actually own — tunable to your niche, exportable to GPT-5, Claude, Gemini, Perplexity, Midjourney, Llama. Stop pasting across 6 tools.

Try DDH's AI Prompt Builder — free 14 days, no card. →

Related calculators

OpenAI Pricing Calculator →GPT-5.5, 5.4, mini, nano — full per-call cost in one input.Claude Pricing Calculator →Opus 4.8, Sonnet 4.6, Haiku 4.5, Fable 5 — input + output combined.Context Window Comparison →Max input length and price per 1M for every current model.

Related prompt tools

Generador de prompts (optimizado para Gemini)→Ficha técnica Gemini 2.5 Flash→Ficha técnica GPT-5→Ficha técnica Claude Opus 4.7→Calculadora de costo GPT/Claude/Gemini→

Frequently Asked Questions

¿Cuánto cuesta Gemini 2.5 Pro en 2026?

Escalonado por tamaño de entrada. Para entrada ≤200K tokens: $1,25 por 1M entrada, $10 por 1M salida. Para entrada >200K tokens: $2,50 por 1M entrada, $15 por 1M salida. La entrada en caché se factura con 75% descuento sobre la tarifa del tier ($0,31/M ≤200K, $0,625/M >200K). Batch API toma otro 50% descuento en ambos flujos. Fuente: ai.google.dev/pricing, verificado 2026-06-20.

¿Cuál es la ventana de contexto de Gemini 2.5 Pro?

1.000.000 tokens — la más grande de cualquier modelo frontier en disponibilidad general. Un contexto de 2M tokens está en vista previa privada. El recall se mantiene en toda la ventana de 1M tokens según los benchmarks needle-in-haystack de Google (>99% precisión en 1M tokens para el modelo Pro).

¿Qué es el tier de precio de entrada de 200K?

Gemini 2.5 Pro utiliza precios escalonados: las llamadas con ≤200.000 tokens de entrada se facturan a $1,25/$10 por 1M; las llamadas con >200.000 tokens de entrada se facturan a $2,50/$15 por 1M. El tier se aplica a la llamada completa, no solo la porción por encima de 200K. Implicación: una llamada de entrada de 195K es dramáticamente más barata que una de 205K. Planifica en consecuencia.

¿Gemini 2.5 Pro soporta video y audio?

Sí — nativamente, en la misma llamada que la entrada de texto. El video se factura a ~258 tokens por segundo de metraje; el audio a ~32 tokens por segundo. Pasa a través de base64 en línea (archivos pequeños) o Google File API (recomendado para >20MB). Un video de 5 minutos es ~77K tokens; una reunión de 30 minutos es ~465K (cruza hacia el tier >200K).

¿Qué es el modo reasoning en Gemini 2.5 Pro?

El nombre de Google para razonamiento explícito de cadena de pensamiento, activado por defecto con un presupuesto decidido por el modelo. Sobrescribe con `thinking_config={'thinking_budget': N}` donde N es el máximo de tokens de reasoning. Establece N=0 para desactivar y obtener la respuesta más rápida. Los tokens de reasoning se facturan a la tarifa de salida. Usa para tareas de razonamiento riguroso; desactiva para clasificación/extracción.

¿Cuál es la diferencia entre Gemini 2.5 Pro y 2.5 Flash?

Mismo contexto (1M), mismas modalidades, mismo soporte multimodal, mismas herramientas integradas. Flash es más pequeño y rápido, con una estructura de precios plana ($0,30/$2,50 por 1M para entrada de texto/imagen/video). Usa Pro para razonamiento riguroso y síntesis de código; Flash para volumen de producción y el dulce punto medio amplio. Ver nuestra ficha técnica Gemini 2.5 Flash.

¿Gemini 2.5 Pro soporta function calling y salidas estructuradas?

Sí a ambos. Function calling con soporte de llamada paralela; salidas estructuradas a través de `responseSchema` JSON Schema en `generationConfig`. La salida está garantizada que valida contra el esquema. Las herramientas integradas (ejecución de código, búsqueda Google anclada, contexto de URL) son únicas a Gemini — reduce la orquestación personalizada para flujos de trabajo agentes.

¿Dónde está disponible Gemini 2.5 Pro?

Google AI Studio (directo, tier gratuito + pagado), Google Cloud Vertex AI (tier empresarial, control regional, SLAs) y las aplicaciones de consumidor Gemini (gemini.google.com tiers Pro y Advanced). La facturación de API y consumidor son separadas.

1M contexto es poder. 1M contexto desperdiciado es factura.

Nuestro Generador de Prompts IA crea prompts optimizados para Gemini (contexto largo estructurado, contents+parts listos, thinking-budget ajustado) basado en TU negocio + tarea — para que gastes el 1M donde importa. Prueba gratuita de 14 días de DDH Pro, sin tarjeta.

Browse all prompt tools →