Schlüsselinfrastruktur für KI, RAG und semantische Suche.
Prinzip¶
Daten → Embedding-Modell → Vektor → Speicherung. Abfrage → Embedding → Nearest Neighbor → Ergebnisse.
Algorithmen¶
- HNSW — am beliebtesten
- IVF — Partitionierung
- Flat — Brute Force
Datenbanken¶
- Pinecone — verwaltet
- ChromaDB — OSS eingebettet
- Weaviate — hybride Suche
- Qdrant — Rust, Leistung
- pgvector — PG-Erweiterung
Anwendungsfälle: - RAG - Semantische Suche - Empfehlungen - Bildähnlichkeit
Die richtige Vektordatenbank waehlen¶
Beruecksichtigen Sie bei der Auswahl mehrere Faktoren: Datasetgroesse, Latenzanforderungen, Betriebskomplexitaet und Budget. Fuer Prototypen und kleinere Projekte (bis 100K Vektoren) ist ChromaDB oder pgvector der einfachste Einstieg. Fuer Produktions-Workloads mit Millionen von Vektoren erwaegen Sie Pinecone (verwaltet, kein Betriebsaufwand) oder Qdrant (self-hosted, hohe Leistung).
Der HNSW-Algorithmus bietet das beste Verhaeltnis von Geschwindigkeit zu Genauigkeit fuer die meisten Anwendungsfaelle. Der Index wird beim Einfuegen von Daten aufgebaut und ermoeglicht Approximate Nearest Neighbor (ANN) Suche in sublinearer Zeit. Die Parameter ef_construction und M beeinflussen die Indexqualitaet vs. Aufbaugeschwindigkeit. Fuer hybride Suche (Kombination von Vektoraehnlichkeit und Keyword-Filterung) ist Weaviate dank nativer BM25- und Vektor-Suchunterstuetzung die fuehrende Wahl.
Vektordatenbanken für KI¶
Unverzichtbar für RAG und semantische Suche.