Die Vector-DB-Kostenformel
Vector-DB-Kosten bestehen aus drei unabhängigen Komponenten. Bei Serverless-Providern werden alle drei separat berechnet; bei Cluster-basierten Providern sind Speicherung und Compute in der Cluster-Rate gebündelt:
``` monatliche_kosten = (gespeicherte_vektoren × bytes_pro_vektor / 1_000_000_000) × speicher_$/GB_monat + (monatliche_schreibvorgänge / 1_000_000) × schreib_$/M + (monatliche_abfragen / 1_000_000) × lese_$/M ```
Bytes pro Vektor = dimensionen × 4 (float32). Ein 384-dimensionaler Vektor = 1.536 Bytes. Ein 1.536-dimensionaler Vektor = 6.144 Bytes. Ein 3.072-dimensionaler Vektor = 12.288 Bytes. Dies ist die Zahl, die Teams am meisten überrascht — der Wechsel von einem 384-dimensionalen auf ein 3.072-dimensionales Embedding-Modell verachtfacht die rohen Speicherbytes, bevor Preisunterschiede überhaupt eine Rolle spielen.
Schreibvorgänge sind typischerweise einmalig oder selten (initiales Indexaufbau, periodische inkrementelle Updates). Lese-/Abfragevorgänge sind wiederkehrend — jede Benutzerabfrage ist mindestens eine Leseoperation. In der Produktion dominieren Lesevorgänge die Rechnung. Bei Pinecone Serverless sind Schreibvorgänge 25x billiger pro Einheit als Lesevorgänge ($0,33 vs $8,25 pro Million). Berechnen Sie Ihr Budget basierend auf Abfragevolumen, nicht auf Schreibvolumen.