Meta udělala odvážný krok — Llama 2 je open-source, komerčně použitelný LLM. Pro enterprise: konečně alternativa k vendor lock-in na OpenAI.
Llama 2 — co je nového¶
Tři velikosti: 7B, 13B a 70B parametrů. Chat verze fine-tuned s RLHF. Licence umožňuje komerční použití.
Naše benchmarky¶
- Sumarizace: 85% kvality GPT-3.5. Použitelné.
- Code generation: Java/Python solidní, niche jazyky slabší.
- Czech language: Výrazně horší než GPT-3.5.
- Reasoning: 70B verze překvapivě dobrá.
Self-hosting¶
70B model potřebuje ~140GB VRAM. Quantizované verze běží i na consumer hardware — 13B na RTX 4090. Data nikdy neopustí vaši infrastrukturu.
Enterprise strategie¶
Open-source LLM mění kalkulaci. Pro high-volume use-casy může být self-hosting ekonomicky výhodnější. Plus: žádný vendor lock-in, plná kontrola, data sovereignty.
Open-source AI je legitimní enterprise volba¶
Doporučujeme hybridní strategii — GPT-4 pro komplexní reasoning, open-source pro high-volume, privacy-sensitive úlohy.