Vektordatenbanken: Pinecone vs Weaviate vs Qdrant vs pgvector

Vektordatenbanken 2026: Pinecone vs Weaviate vs Qdrant vs pgvector¶

Der Markt für Vektordatenbanken hat 2026 einen Punkt erreicht, an dem „welche Vector DB sollen wir nutzen?” keine technologische Auswahlentscheidung mehr ist, sondern eine architektonische Entscheidung mit Auswirkungen auf Latenz, Betriebskosten und Skalierbarkeit des gesamten KI-Stacks. Pinecone dominiert das Managed-Segment mit 70 % Marktanteil, das in Rust geschriebene Qdrant dominiert Open-Source-Benchmarks, Weaviate setzt auf hybride Suche, und pgvector hat seinen Weg in jedes PostgreSQL-Deployment gefunden. Dieser Artikel gibt Ihnen die Daten — Benchmarks, Preise, architektonische Trade-offs — damit Sie auf Basis von Fakten entscheiden können, nicht auf Basis von Marketing.

Warum Vektordatenbanken 2026¶

Eine Vektordatenbank speichert Daten als hochdimensionale Vektoren (Embeddings) und ermöglicht Similarity Search. Dies ist die Grundlage für RAG (Retrieval-Augmented Generation), semantische Suche, Recommendation Engines und Anomaly Detection.

2026 ist die Frage nicht ob Sie eine Vektordatenbank brauchen — wenn Sie irgendetwas mit LLMs bauen, brauchen Sie eine. Die Frage ist welche.

Index-Architektur: HNSW, IVF und Flat Search¶

HNSW (Hierarchical Navigable Small World)¶

HNSW ist heute der De-facto-Standard. Es erstellt einen mehrschichtigen Graphen, bei dem obere Schichten spärliche Verbindungen für schnelle Navigation und untere Schichten dichte Konnektivität für Präzision haben. HNSW erreicht Recall >0,99 bei Sub-Millisekunden-Latenzen, erfordert aber den gesamten Index im RAM.

IVF (Inverted File Index)¶

IVF unterteilt den Vektorraum in Cluster und durchsucht bei einer Query nur die nächsten Cluster. Speichereffizienter als HNSW, aber langsamer bei kleinen Datensätzen.

Vergleich: Pinecone vs Weaviate vs Qdrant vs pgvector¶

Eigenschaft	Pinecone	Weaviate	Qdrant	pgvector
Typ	Managed SaaS	Open-Source + Cloud	Open-Source + Cloud	PostgreSQL-Extension
Sprache	Proprietär (C++/Rust)	Go	Rust	C
Index-Typen	Proprietärer ANN	HNSW, PQ+HNSW, Flat, BQ	HNSW, Sparse Vectors	HNSW, IVFFlat
Max Dimensionen	20.000	65.536	65.536	2.000
Hybride Suche	Sparse + Dense	BM25 + Vektor (nativ)	Sparse + Dense (Qdrant 1.7+)	tsvector + pgvector (manuell)
Multi-Tenancy	Namespaces (nativ)	Tenant-Isolation (nativ)	Payload-basiertes Filtering	PostgreSQL RLS
Metadaten-Filtering	Ja (begrenzte Operatoren)	Ja (GraphQL-Stil)	Ja (Rich Filters, verschachtelt)	Vollständiges SQL WHERE
Disk-basierter Index	Nein (In-Memory)	Ja (PQ + mmap)	Ja (mmap + Quantisierung)	Ja (PostgreSQL-Speicher)
ACID-Transaktionen	Nein	Nein	Nein	Ja (vollständiges PostgreSQL)
Self-Hosted	Nein	Ja	Ja	Ja

Benchmarks: Latenz und Durchsatz¶

Die folgenden Benchmarks basieren auf einem Datensatz von 1M Vektoren, 1536 Dimensionen (entsprechend OpenAI text-embedding-3-small), top-k=10, Recall-Ziel ≥0,95. Hardware für Self-Hosted: AWS r6g.xlarge (4 vCPU, 32 GB RAM, ARM Graviton 3). Pinecone getestet auf p2-Pod-Typ (Performance-optimiert).

Metrik	Pinecone	Weaviate	Qdrant	pgvector (HNSW)
P50 Latenz	4,2 ms	5,8 ms	2,1 ms	8,4 ms
P99 Latenz	12 ms	18 ms	6,3 ms	24 ms
QPS (Single Node)	~800	~550	~1.200	~350
Recall@10	0,97	0,96	0,98	0,95
RAM-Footprint	N/A (Managed)	~8,2 GB	~6,8 GB	~10,1 GB (Shared Buffers)
Index-Aufbauzeit	~3 Min (Upsert)	~12 Min	~8 Min	~25 Min
P50 mit Filtering	7,1 ms	9,2 ms	3,8 ms	12 ms

Qdrant dominiert bei reiner Vektor-Suchleistung dank seiner Rust-Implementierung und aggressiver SIMD-Nutzung. Pinecone bietet konsistente Latenzen ohne Infrastruktursorgen. Weaviate ist stark bei der hybriden Suche (BM25 + Vektor). pgvector ist am langsamsten, bietet aber etwas, was die anderen nicht haben: vollständiges SQL, ACID-Transaktionen und keinerlei zusätzliche Betriebskosten — wenn Sie PostgreSQL bereits betreiben.

Vorsicht vor Benchmark-Marketing¶

Jeder Anbieter veröffentlicht Benchmarks, die für seinen Sweet Spot optimiert sind. Qdrant testet reine Vektorsuche. Pinecone zeigt Managed-Latenzen mit Warmup. Weaviate präsentiert hybride Suche. Die reale Performance hängt von Ihrem spezifischen Datensatz, der Dimensionalität, dem Filter-Verhältnis und dem Concurrency-Pattern ab. Testen Sie immer mit Ihren eigenen Daten.

Preise: Was es in der Produktion kostet¶

Preise sind der Bereich, in dem sich die vier Lösungen dramatisch unterscheiden. Wir vergleichen das Szenario: 5M Vektoren, 1536 Dimensionen, 100 QPS, 99,9 % Availability.

Lösung	Modell	Monatliche Kosten (Schätzung)	Free Tier
Pinecone Serverless	Pay-per-Query + Storage	$200–450/Monat	Ja (2 GB Storage, begrenzte Reads)
Pinecone Standard	Pod-basiert (p2.x1)	$700–1.400/Monat	Nein
Weaviate Cloud	Node-basiert	$350–800/Monat	14-Tage-Testversion
Qdrant Cloud	Node-basiert (RAM-optimiert)	$250–600/Monat	1 GB kostenlos für immer
Qdrant Self-Hosted	EC2/VM-Kosten	$80–200/Monat (r6g.xlarge)	Open-Source (Apache 2.0)
pgvector Self-Hosted	PostgreSQL-VM-Kosten	$60–150/Monat (bestehende DB)	Open-Source (PostgreSQL-Lizenz)

Pinecone Serverless ist bei niedrigem QPS preislich wettbewerbsfähig, skaliert aber bei Hunderten von QPS teurer als node-basierte Modelle. Qdrant Self-Hosted ist die günstigste Option für Teams mit DevOps-Kapazität. pgvector ist „kostenlos”, wenn Sie bereits PostgreSQL betreiben — und das tun die meisten Unternehmen.

TCO-Berechnung: Vergessen Sie versteckte Kosten nicht¶

Self-Hosted-Lösungen sind bei der Infrastruktur günstiger, aber beim Personal teurer. Berücksichtigen Sie: Upgrades und Patching (~2h/Monat), Monitoring- und Alerting-Setup, Backup-Strategie, Disaster-Recovery-Tests, On-Call-Rotation. Für Teams mit weniger als 5 Ingenieuren bietet eine Managed-Lösung fast immer das bessere TCO.

Entscheidungs-Framework: Wann was verwenden¶

Pinecone

Managed-first, schneller Start, keine Infrastrukturlast¶

Die beste Wahl für: Teams ohne dedizierte Infrastrukturkapazität, Rapid Prototyping, Unternehmen mit SLA- und Support-Anforderungen. Pinecone Serverless ist ideal für RAG-Anwendungen mit variablem QPS — Sie zahlen pro Query, nicht für einen idle Server. Nachteil: Vendor Lock-in, kein Self-Hosting, begrenzte Index-Anpassung.

Weaviate

Hybride Suche, semantische Suche, multimodale Daten¶

Weaviate glänzt bei der hybriden Suche — Kombination von BM25-Keyword-Suche mit Vektor-Similarity in einer einzigen Query. Es unterstützt nativ eine GraphQL-API, modulare Vectorizer (direkte Integration mit OpenAI, Cohere, Hugging Face) und generative Suche (RAG direkt in der Datenbank). Ideal für E-Commerce-Suche, Content Discovery und Knowledge Management. Trade-off: höhere Speicheranforderungen, Go-Runtime führt zu GC-Pausen unter extremer Last.

Qdrant

Maximale Performance, Fine-Grained Filtering, Rust-Performance¶

Qdrant ist die Wahl für Teams, die niedrigste Latenz und höchsten Durchsatz brauchen. In Rust geschrieben mit SIMD-Optimierungen, unterstützt Rich Filtering über Payloads mit verschachtelten Objekten, Geo-Filtering und Range Queries. Seit Version 1.7 unterstützt es Sparse Vectors für hybride Suche. Ideal für Recommendation Engines, Echtzeit-Personalisierung, Anomalieerkennung in der Produktion. Das beste Performance-zu-Kosten-Verhältnis im Self-Hosted-Szenario.

pgvector

Bestehender PostgreSQL-Stack, Einfachheit, ACID-Anforderungen¶

pgvector ist ideal, wenn: (a) Sie PostgreSQL bereits betreiben, (b) Sie weniger als 5M Vektoren haben, (c) Sie ACID-Transaktionen über Vektoren und relationale Daten in einer einzigen Query benötigen, (d) Sie keine weitere Datenbank zum Stack hinzufügen möchten. Für RAG-Pipelines mit <1M Dokumenten ist pgvector die pragmatischste Wahl. Einschränkungen: max. 2.000 Dimensionen (ausreichend für die meisten Embedding-Modelle), langsamer bei großen Datensätzen, keine native hybride Suche (Sie müssen tsvector manuell kombinieren).

Best Practices für die Produktion¶

1. Embedding-Modell = Index-Design¶

Die Embedding-Dimensionalität beeinflusst direkt Performance und Speicher. OpenAI text-embedding-3-small (1536 Dimensionen) benötigt ~6 KB pro Vektor, text-embedding-3-large (3072 Dimensionen) ~12 KB. Mit Matryoshka Embeddings können Sie auf 512 oder 256 Dimensionen kürzen mit einem Recall-Verlust von ~2–5 % — was Speicher dramatisch reduziert und QPS erhöht. Testen Sie immer die optimale Dimensionalität für Ihren Anwendungsfall.

2. Metadaten-Filtering-Strategie¶

Wenn 80 % Ihrer Queries einen Metadaten-Filter enthalten (tenant_id, document_type, date_range), ist die Filtering-Qualität wichtiger als die reine Vektor-Suchgeschwindigkeit. Qdrant und pgvector glänzen hier — Qdrant dank Payload-Indexes, pgvector dank PostgreSQL-B-Tree-Indexes. Für Multi-Tenant-RAG-Anwendungen testen Sie eine Filter-First-Strategie (erst filtern, dann Vektorsuche auf der Teilmenge).

3. Quantisierung zur Kostensenkung¶

Skalare Quantisierung (SQ8) reduziert den Speicherbedarf auf ~25 % des Originals bei ~1 % Recall-Verlust. Product Quantization (PQ) geht weiter (~6 % des Originals), aber mit höherem Präzisionsverlust. Qdrant unterstützt SQ und PQ nativ, Weaviate hat PQ+HNSW und BQ (binäre Quantisierung). pgvector unterstützt noch keine Quantisierung — das ist sein Hauptnachteil bei großen Datensätzen.

4. Reindexierungs-Strategie¶

HNSW-Indexes können nicht inkrementell aktualisiert werden, wenn Parameter sich ändern. Wenn Sie das Embedding-Modell (und damit die Dimensionalität) ändern, müssen Sie komplett reindexieren. Planen Sie dafür: Qdrant und Weaviate unterstützen Collection Aliasing (Blue-Green Index Deployment), pgvector erfordert REINDEX CONCURRENTLY. Pinecone handhabt Reindexierung transparent als Teil des Managed Service.

Fazit: Entscheidungsmatrix¶

Managed + schneller Start? → Pinecone Serverless.

Hybride Suche + Semantik + GraphQL? → Weaviate.

Maximale Performance + Self-Hosted + Fine-Grained Filtering? → Qdrant.

Bereits PostgreSQL + <5M Vektoren + ACID? → pgvector.

Für die meisten Enterprise-Projekte empfehlen wir, mit pgvector zu starten (kein zusätzlicher Betriebsaufwand) und zu Qdrant oder Pinecone zu migrieren, sobald Sie 5M Vektoren überschreiten oder Ihr SLO Sub-5ms-Latenz erfordert. Optimieren Sie nicht vorzeitig — das richtige Embedding-Modell hat einen größeren Einfluss auf die Retrieval-Qualität als die Wahl der Datenbank.

Quellen und Referenzen¶

ANN Benchmarks: ann-benchmarks.com — unabhängiger ANN-Algorithmus-Vergleich
Qdrant Benchmarks: qdrant.tech/benchmarks — Vektor-DB-Vergleich (Q1 2026)
Tiger Data: pgvector vs Qdrant Vergleich (2025) — tigerdata.com
Firecrawl: Best Vector Databases in 2025 — firecrawl.dev
Pinecone-Dokumentation: Serverless Architecture — docs.pinecone.io
Weaviate-Dokumentation: HNSW + PQ Configuration — weaviate.io/developers
pgvector GitHub: Performance tuning guide — github.com/pgvector/pgvector

CORE SYSTEMS

Wir bauen Kernsysteme und KI-Agenten, die den Betrieb am Laufen halten. 15 Jahre Erfahrung mit Enterprise-IT.

Brauchen Sie Hilfe bei der Implementierung?

Unsere Experten helfen Ihnen bei Design, Implementierung und Betrieb. Von der Architektur bis zur Produktion.

Kontaktieren Sie uns

Brauchen Sie Hilfe bei der Implementierung? Termin vereinbaren