PoC agent za odpoledne? Jasně. Produkční agent s 1000 req/h, graceful failures a auditem? Jiná liga.
Produkční výzvy¶
- Reliability: LLM API má výpadky, timeout, rate limits
- Determinism: Stejný input, jiný output
- Cost control: Agent v loop = neomezené calls
- Security: Agent s přístupem k produkci
- Auditability: Proč agent udělal tohle?
Vzory¶
Circuit breaker: Fallback na jednodušší logiku. Human-in-the-loop: Confirmation pro high-impact. Budget limiter: Max tokens/cost per request. Audit log: Každý call zalogovat.
State management¶
Externalizujte state do Redis/PostgreSQL. Agent se může restartovat a pokračovat. Saga pattern pro multi-step.
Testing¶
Unit testy pro deterministic parts. Integration testy s mock LLM. E2E s reálným LLM na golden dataset.
Production agents vyžadují engineering discipline¶
Stavějte jako kritický distribuovaný systém — s retry, fallback, monitoring a audit.