KI & Agentische Systeme
Ein Agent ist kein Chatbot. Ein Agent ist ein Mitarbeiter.
Wir bauen KI-Agenten mit Governance, Sicherheit und Produktionsbetrieb. Keine Demos, keine PoCs im Regal.
RAG & Knowledge Base
KI antwortet aus Ihren Dokumenten — präzise, mit Quellenangaben, ohne Halluzinationen. Wir bauen Retrieval-Pipelines mit hybrider Suche, Re-Ranking und Chunk-Strategien, die auf Ihre Domäne optimiert sind.
Agent workflows
Der Agent führt Schritte in Systemen aus — liest, schreibt, entscheidet, eskaliert. Wir orchestrieren mehrstufige Workflows mit Tool-Use, paralleler Verarbeitung und Human-in-the-Loop-Eskalation.
Evaluation & monitoring
Wir messen Antwortqualität, Latenz, Kosten und Drift. Produktions-KI ohne Evaluierung ist eine Zeitbombe — wir bauen den Observability-Stack ab dem ersten Tag.
Governance & security
RBAC, Audit-Trail, Kill-Switch, menschliche Eskalation, Prompt-Injection-Schutz. Produktions-KI erfordert dieselbe Governance wie jedes andere kritische System.
Fine-tuning & optimization
Wir optimieren Modelle auf Ihre Daten — kleiner, schneller, günstiger. Destillation großer Modelle in produktionsreife, domänenadaptierte Embeddings, maßgeschneidertes Prompt Engineering.
Process integration
KI ist keine Insel. Wir verbinden mit ERP, CRM, Ticketing, E-Mail und internen Systemen. Wir bauen eine robuste Integrationsschicht mit Retry-Logik, Circuit Breakern und Monitoring.
AI Agent
Autonomer KI-Arbeiter mit definiertem Ziel, Kontext, Werkzeugen und Berechtigungen. Im Gegensatz zum Chatbot handelt der Agent aktiv in Systemen.
- ✓ Hat definierte Berechtigungen (was er darf und was nicht)
- ✓ Protokolliert jede Aktion (Audit-Trail)
- ✓ Hat Kill-Switch und menschliche Eskalation
- ✓ Wird gemessen (Erfolgsrate, Latenz, Kosten)
Jak to děláme
Discovery Workshop
Wir kartieren Prozesse, identifizieren Use-Cases für KI-Agenten und definieren Erfolgskriterien.
PoC auf realen Daten
Wir bauen einen funktionalen Agenten-Prototyp auf Ihren Daten und überprüfen den praktischen Nutzen.
Governance & Integration
Wir verbinden den Agenten mit Ihren Systemen, richten Regeln, Sicherheit und Audit-Trail ein.
Shadow mode & rollout
Der Agent läuft parallel mit Menschen, wir optimieren die Genauigkeit und er übernimmt schrittweise Routineaufgaben.
Betrieb & Optimierung
Kontinuierliches Monitoring, Modell-Retraining und Erweiterung auf weitere Use-Cases.
When AI agent makes sense¶
AI agent pays off where you have repetitive processes with clearly defined rules, but too complex for simple automation. Key indicator: process requires understanding unstructured data (text, documents, emails) and contextual decision-making.
Decision matrix¶
| Criteria | Classic automation | AI Agent | Human |
|---|---|---|---|
| Structured data, clear rules | ✅ Ideal | ❌ Overkill | ❌ Expensive |
| Unstructured data, clear rules | ⚠️ Difficult | ✅ Ideal | ⚠️ Slow |
| Structured data, complex decisions | ⚠️ Limited | ✅ Suitable | ✅ Suitable |
| Unstructured data, creative decisions | ❌ Impossible | ⚠️ With oversight | ✅ Necessary |
Typical use-cases¶
1. Document processing Invoices, contracts, complaints, orders. Agent reads document (PDF, scan, email), extracts structured data, validates against business rules, writes to target system. Typical result: 85-95% documents processed fully automatically, rest escalated with pre-filled data.
2. Customer support L1/L2 Agent answers from knowledge base, handles standard requests (address change, order status, complaints), escalates complex cases with full context. Typical result: 60-70% tickets resolved without human intervention, average response time from hours to seconds.
3. Data enrichment & research Agent goes through internal and external sources, enriches CRM/ERP records, prepares research, monitors competition. Typical result: saves 15-20 hours/week on manual research.
4. Monitoring & anomaly detection Agent analyzes logs, metrics, tickets, financial transactions. Detects anomalies, classifies severity, notifies right people with context. Typical result: MTTD (mean time to detect) from hours to minutes.
5. Internal assistant / knowledge management Agent knows your processes, documentation, decision history. Answers employees, helps with onboarding, searches internal knowledge base. Typical result: 40-60% reduction in time spent searching for information.
6. Compliance & audit automation Agent checks transactions, documents, processes against regulatory requirements. Generates compliance reports, detects violations, escalates. Typical result: 80% reduction in manual compliance work.
How we proceed¶
┌─────────────────────────────────────────────────────────────┐
│ DISCOVERY WORKSHOP (1 day) │
│ → Identify top 3 use-cases with highest ROI │
│ → Analyze data, systems, processes │
│ → Define success metrics │
└──────────────────────┬──────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────┐
│ PoC (4 weeks) │
│ → Functional prototype on real data │
│ → Evaluation: accuracy, latency, costs │
│ → Go/no-go decision with hard numbers │
└──────────────────────┬──────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────┐
│ PRODUCTION (4-8 weeks) │
│ → Governance: RBAC, audit trail, kill-switch │
│ → Integration into target systems │
│ → Monitoring & alerting stack │
│ → Shadow mode → pilot (10% traffic) → full rollout │
└──────────────────────┬──────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────────┐
│ OPERATIONS & OPTIMIZATION (ongoing) │
│ → Continuous evaluation and monitoring │
│ → Prompt/model optimization based on data │
│ → Scope expansion (new use-cases, new sources) │
│ → Monthly reporting for stakeholders │
└─────────────────────────────────────────────────────────────┘
Technology stack¶
| Layer | Technologies |
|---|---|
| LLM | Claude, GPT-4, Llama, Mistral (chosen per use-case) |
| Orchestration | LangGraph, custom DAG engine, event-driven |
| Vector DB | Qdrant, Weaviate, pgvector |
| Embeddings | OpenAI, Cohere, domain-tuned open-source |
| Monitoring | LangSmith, custom dashboards, Grafana |
| Infra | Kubernetes, serverless (AWS Lambda/Azure Functions) |
| Integration | REST, GraphQL, webhooks, message queues |
What doesn’t make sense¶
Let’s be honest — AI agent isn’t solution for everything:
- Simple if/then rules → classic automation is cheaper and more reliable
- Creative decisions with high risk → human must decide, AI can prepare materials
- Processes without data → agent needs context, without quality data it has nothing to draw from
- One-off tasks → ROI returns only with repeated processing (typically 100+ cases/month)
Häufig gestellte Fragen
Ja. Produktions-KI in regulierter Umgebung = Zugriffskontrollen, Audit, Evaluierung, Betrieb. Wir haben Erfahrung mit dem Einsatz im Bankensektor.
Retrieval-Augmented Generation. Eine Methode, mit der KI aus Ihren Daten antwortet — ohne Halluzinationen, mit Quellenangaben.
Abhängig von der Komplexität. Typisches Projekt: Workshop (1 Tag) → PoC (4 Wochen) → Produktion (4–8 Wochen). Preis ab 500K CZK.
Wir kombinieren kommerzielle (Claude, GPT-4) und Open-Source-Modelle (Llama, Mistral). Wir wählen nach Use-Case, Regulierung und Kosten.
Nicht unbedingt. Die meisten Agenten laufen über APIs. Für sensible Daten bieten wir On-Premise-Deployment mit Open-Source-Modellen an.
Typischerweise 8–12 Wochen ab Kickoff. Discovery-Workshop (1 Tag) → PoC auf realen Daten (4 Wochen) → Produktions-Deployment mit Governance (4–8 Wochen). Wir iterieren in 2-Wochen-Sprints.
Halluzinationen sind ein Feature, kein Bug — jedes LLM erzeugt sie. Deshalb bauen wir eine mehrschichtige Verteidigung: RAG mit Quellenangaben, Output-Validierung, Faithfulness-Scoring, Konfidenz-Schwellenwerte und Human-in-the-Loop-Eskalation. Wir messen die Halluzinationsrate und optimieren kontinuierlich.
Jeder Agent hat definierte Berechtigungsgrenzen — was er lesen darf, wohin er schreiben darf, wann er eskalieren muss. Wir implementieren RBAC, Audit-Trail, Prompt-Injection-Schutz, PII-Schwärzung. Für regulierte Sektoren liefern wir Compliance-Reports.