S rostoucím objemem dat roste i zodpovědnost. Kdo má přístup k jakým datům? Kde jsou osobní údaje? Jak dlouho je uchováváme? Data governance odpovídá.
Klasifikace dat¶
- Public — veřejně dostupné (blog, marketing)
- Internal — firemní, ne pro veřejnost
- Confidential — obchodní tajemství, klientská data
- Restricted — osobní údaje, finanční data, zdravotní záznamy
Každý dataset v Snowflake má tag data_classification.
Automatická PII detekce (jméno, rodné číslo, email) přes Azure Purview.
GDPR compliance¶
Right to erasure: musíme umět smazat všechna data o konkrétní osobě napříč systémy. Implementovali jsme „data lineage” — víme, kam osobní data tečou. Retention policies: automatická anonymizace po uplynutí doby.
Access management¶
Role-based access v Snowflake. Analytik vidí agregovaná data, ne raw PII. Data scientist přistupuje k anonymizovaným datasetům. Plný přístup jen pro data stewardy s audit logem.
Governance ≠ byrokracie¶
Automatizovaná governance chrání firmu i zákazníky. PII detekce, retention policies a access control — vše automaticky.