Syntetická data pro AI testing — kvalita bez privacy problémů

05. 08. 2024 1 min čtení CORE SYSTEMSai

Potřebujete data pro AI, ale reálná jsou chráněná GDPR? Syntetická data řeší privacy, bias i nedostatek trénovacích dat.

Proč syntetická data¶

Rule-based: Definovaná pravidla. ML-based: GANs, VAEs. LLM-based: GPT-4 generuje realistická textová data.

Distribuce, korelace, utility (model accuracy), privacy (re-identification risk). Vždy validujte.

Pro AI testing a development jsou must-have. LLM-based pro text, ML-based pro tabulární data.

synthetic dataai testingprivacygdpr

25. května 2018 začne platit GDPR. Co to znamená pro technické týmy a jaké architektonické změny musíme udělat.

25. května 2018 je tady. Rekapitulace naší technické přípravy na GDPR, co funguje a co jsme nestihli.

Jak splnit GDPR technicky. Pseudonymizace, šifrování, data retention, práva subjektů.