Přeskočit na obsah
_CORE
AI & Agentic Systems Core Informační Systémy Cloud & Platform Engineering Data Platforma & Integrace Security & Compliance QA, Testing & Observability IoT, Automatizace & Robotika Mobile & Digital Banky & Finance Pojišťovnictví Veřejná správa Obrana & Bezpečnost Zdravotnictví Energetika & Utility Telco & Média Průmysl & Výroba Logistika & E-commerce Retail & Loyalty
Reference Technologie Blog Knowledge Base O nás Spolupráce Kariéra
Pojďme to probrat

Advanced RAG patterns — od naive RAG k produkční kvalitě

18. 02. 2024 1 min čtení CORE SYSTEMSai

Naive RAG nestačí. Občas vrátí nerelevantní kontext, občas halucinuje. Pro produkci potřebujete pokročilé techniky.

Problémy naive RAG

  • Semantic gap: Dotaz a dokument nemusí být sémanticky podobné
  • Lost in the middle: LLM ignoruje kontext uprostřed
  • Multi-hop queries: Vyžadují řetězení

Query transformation

Query expansion: 3-5 variant dotazu. Query decomposition: komplexní dotaz na sub-dotazy.

Hybrid search + reranking

Vector + BM25 (Reciprocal Rank Fusion). Cross-encoder reranking: retrieve top-50, rerank na top-5.

Chunking strategie

  • Semantic chunking: Boundaries na základě sémantických změn
  • Parent-child chunks: Retrieve child, kontext parent
  • Metadata enrichment: Zdroj, datum, kategorie

RAG je spektrum, ne binární stav

Investujte do evaluace (RAGAS) — bez metrik nepoznáte, co zlepšovat.

ragadvanced aiarchitecturellm