„Který model to byl? Ten s learning rate 0.01 nebo 0.001?” — pokud vám to zní povědomě, potřebujete MLOps. My jsme zvolili MLflow.
Problém: ML bez procesu¶
Jupyter notebooky, lokální kopie dat, „nejlepší modely” na lokálním disku. Reprodukovat experiment z minulého týdne = hodiny detektivní práce.
MLflow čtyři komponenty¶
- Tracking — parametry, metriky, artefakty + git hash
- Projects — balení ML kódu pro reprodukovatelnost
- Models — standardní formát pro deployment
- Registry — verzování, stage management (None → Staging → Production → Archived)
Automatizovaný pipeline¶
V Airflow: data ingestion → feature engineering → training → evaluation. Pokud nový model překoná produkční (AUC > current + 0.02), registruje se jako Staging. Manuální approval pro Production.
MLOps = ML + DevOps disciplína¶
Bez MLOps je ML experiment. S MLOps je to engineering disciplína.