La fórmula de coste de BD vectorial
El coste de BD vectorial tiene tres componentes independientes. En proveedores serverless los tres se facturan por separado; en proveedores basados en cluster el almacenamiento y la computación se incluyen en la tarifa del cluster:
``` monthly_cost = (vectors_stored × bytes_per_vector / 1_000_000_000) × storage_$/GB_month + (monthly_writes / 1_000_000) × write_$/M + (monthly_queries / 1_000_000) × read_$/M ```
Bytes por vector = dimension_count × 4 (float32). Un vector de 384 dimensiones = 1.536 bytes. Un vector de 1.536 dimensiones = 6.144 bytes. Un vector de 3.072 dimensiones = 12.288 bytes. Este es el número que más sorprende a los equipos — cambiar de un modelo de embedding de 384 dimensiones a uno de 3.072 dimensiones aumenta los bytes brutos de almacenamiento 8 veces antes de cualquier diferencia de precio.
Las operaciones de escritura son típicamente únicas o infrecuentes (construcción inicial del índice, actualizaciones incrementales periódicas). Las operaciones de lectura/consulta son recurrentes — cada consulta de usuario es al menos una lectura. En producción, las lecturas dominan la factura. En Pinecone Serverless, las escrituras son 25 veces más baratas por unidad que las lecturas ($0.33 vs $8.25 por millón). Planifica tu presupuesto alrededor del volumen de consultas, no del volumen de escrituras.