Einfache Vektordatenbank für Prototypen.
Installation¶
pip install chromadb
Verwendung¶
import chromadb
client = chromadb.Client()
col = client.create_collection('docs')
col.add(documents=['PG ist eine DB','Redis ist ein Cache'], ids=['d1','d2'])
results = col.query(query_texts=['relationale Datenbank'], n_results=5)
Persistent¶
client = chromadb.PersistentClient(path='/data/chroma')
Wann ChromaDB einsetzen¶
ChromaDB ist ideal fuer das schnelle Prototyping von KI-Anwendungen, insbesondere RAG-Pipelines (Retrieval-Augmented Generation). Mit der einfachen Python-API koennen Sie innerhalb von Minuten eine funktionale semantische Suche erstellen. ChromaDB generiert automatisch Embeddings mit einem Standardmodell, sodass Sie keine separate Embedding-Pipeline verwalten muessen.
Fuer Produktionsumgebungen mit Millionen von Dokumenten sollten Sie den Wechsel zu Qdrant oder Pinecone in Betracht ziehen, die bessere Skalierbarkeit und verteilte Verarbeitung bieten. ChromaDB bleibt jedoch die beste Wahl fuer lokale Entwicklung, Experimente und kleinere Projekte mit bis zu etwa 100.000 Dokumenten. Es unterstuetzt auch Metadaten-Filterung, sodass Sie Vektorsuche mit klassischen Filtern kombinieren koennen.
ChromaDB zum Einstieg¶
Einfachste Vektorsuche. Für Produktion Pinecone/Qdrant verwenden.