Naive RAG nestačí. Občas vrátí nerelevantní kontext, občas halucinuje. Pro produkci potřebujete pokročilé techniky.
Problémy naive RAG¶
- Semantic gap: Dotaz a dokument nemusí být sémanticky podobné
- Lost in the middle: LLM ignoruje kontext uprostřed
- Multi-hop queries: Vyžadují řetězení
Query transformation¶
Query expansion: 3-5 variant dotazu. Query decomposition: komplexní dotaz na sub-dotazy.
Hybrid search + reranking¶
Vector + BM25 (Reciprocal Rank Fusion). Cross-encoder reranking: retrieve top-50, rerank na top-5.
Chunking strategie¶
- Semantic chunking: Boundaries na základě sémantických změn
- Parent-child chunks: Retrieve child, kontext parent
- Metadata enrichment: Zdroj, datum, kategorie
RAG je spektrum, ne binární stav¶
Investujte do evaluace (RAGAS) — bez metrik nepoznáte, co zlepšovat.
ragadvanced aiarchitecturellm