Agentic workflows slibují revoluci v automatizaci — LLM agenti, kteří sami plánují, rozhodují a vykonávají úkoly. Ale jak vypadá realita, když takový systém běží 24/7 v produkci? Sdílíme zkušenosti z ostrých nasazení v roce 2026.
Co jsou Agentic Workflows a proč teď¶
Agentic workflow je systém, kde LLM agent autonomně orchestruje sekvenci kroků k dosažení cíle. Na rozdíl od klasických workflow enginů (Airflow, Temporal) agent sám rozhoduje o dalším kroku na základě aktuálního kontextu — ne podle pevně definovaného DAGu.
V roce 2026 konverguje několik faktorů: modely s dostatečným reasoning (o3, Claude 4, Gemini 2.0), stabilní tool-use protokoly (MCP, function calling), a hlavně — dostatek produkčních zkušeností, aby bylo jasné, co funguje a co ne.
Anatomie produkčního agentic workflow¶
Typický agentic workflow v enterprise prostředí má pět vrstev:
- Intent layer: Přijímá požadavek (ticket, email, API call) a klasifikuje záměr
- Planning layer: Agent vytvoří plán — sekvenci kroků s podmínkami a fallbacky
- Execution layer: Jednotlivé kroky volají nástroje — API, databáze, další agenty
- Validation layer: Kontrola výstupů, self-reflection, human-in-the-loop checkpointy
- Memory layer: Persistence kontextu, učení z předchozích běhů
Klíčové zjištění: planning layer je nejkritičtější. Pokud agent špatně naplánuje, žádné množství execution excellence to nezachrání. Proto investujeme do few-shot promptů pro plánování a deterministických guardrails.
Failure modes — co se pokazí¶
Po stovkách produkčních běhů jsme identifikovali nejčastější failure modes:
- Infinite loop: Agent se zasekne v cyklu opakování stejného kroku. Řešení: max iteration count + divergence detection.
- Hallucinated tool calls: Agent volá neexistující API endpoint nebo posílá špatný payload. Řešení: strict schema validation na každém tool callu.
- Context window overflow: U dlouhých workflow agent ztrácí kontext. Řešení: summarizace po každém kroku + hierarchická paměť.
- Cascading failures: Selhání jednoho kroku vyvolá řetězovou reakci. Řešení: circuit breaker pattern + izolované retry s exponential backoff.
- Confidence drift: Agent je příliš sebejistý u edge cases. Řešení: calibrated confidence scoring + eskalace při nízké jistotě.
Observability — bez ní to nejde¶
Agentic workflows bez observability jsou jako letadlo bez přístrojů. V produkci měříme:
- Token consumption per workflow: Kolik stojí jeden běh — a jak se to mění v čase
- Step success rate: Úspěšnost každého kroku zvlášť — identifikuje weak points
- Latency distribution: P50, P95, P99 pro celý workflow i jednotlivé kroky
- Human escalation rate: Jak často agent eskaluje k člověku — a zda oprávněně
- Plan accuracy: Jak často počáteční plán odpovídá finálně provedeným krokům
Používáme OpenTelemetry s custom spans pro každý agent call. Traces propojujeme přes celý workflow, včetně tool callů do externích systémů. Vizualizace v Grafana Tempo ukazuje celý „příběh” každého běhu.
Ekonomika: kdy se to vyplatí¶
Upřímně — agentic workflows nejsou levné. Průměrný workflow spotřebuje 50–200K tokenů na jeden běh. Při stovkách běhů denně to jsou tisíce dolarů měsíčně jen za LLM API.
Vyplatí se tam, kde:
- Manuální proces stojí více než 30 minut lidské práce na instance
- Chybovost manuálního procesu má reálný finanční dopad
- Rychlost řešení je business-critical (SLA, incident response)
- Proces se opakuje stovky až tisícekrát měsíčně
Typický break-even: 3–6 měsíců u workflow nahrazujících L1/L2 support procesy.
Lekce z produkce¶
Pět klíčových lekcí, které bychom chtěli znát dříve:
- Začněte deterministicky, přidávejte agentnost postupně. Hybridní workflow (80 % pevných kroků, 20 % agent rozhodnutí) jsou stabilnější než plně autonomní.
- Investujte do eval pipeline. Automatické testování na historických datech odhalí regresi dřív než produkční incident.
- Verzujte prompty jako kód. Git, code review, staging environment — stejná disciplína jako pro aplikační kód.
- Designujte pro graceful degradation. Když agent selže, systém musí mít fallback — i kdyby to byl jen ticket pro člověka.
- Human-in-the-loop není porážka. Nejlepší systémy vědí, kdy požádat o pomoc.
Agentic ≠ autonomní za každou cenu¶
Agentic workflows v produkci fungují — ale ne tak, jak si je představují marketingové materiály. Úspěch závisí na pragmatickém přístupu: jasné hranice autonomie, robustní observability a pokora přiznat, že agent není vždy nejlepší řešení.
Náš tip: Začněte jedním konkrétním workflow, změřte ROI, iterujte. Nepokoušejte se automatizovat vše najednou.