Data cleaning

L’objectif est de permettre à une organisation de mettre en place un processus de nettoyage des données (Data cleansing / Data cleaning).

Chaque entité possède des données sensibles. Ces dernières peuvent porter sur son activité propre (propriété intellectuelle, savoir-faire, etc.) ou sur ses clients, administrés ou usagers (données personnelles, contrats, etc.). Afin de pouvoir les protéger efficacement, il est indispensable de les identifier.

À partir de la liste de données sensibles détectées, il sera ainsi possible de déterminer sur quels composants du système d’information elles se localisent (bases de données, partages de fichiers, postes de travail, etc.). Ces composants correspondent aux serveurs et postes critiques pour l’organisation. À ce titre, ils devront faire l’objet de mesures de sécurité spécifiques pouvant porter sur le nettoyage, la sauvegarde, la journalisation, les accès, etc.

Ce type de procédure peut faire appel à plusieurs profils au sein d’une même organisation :


RSSI/DPO : pour définir les données dites sensibles

Les référents métiers : pour valider et définir les actions sur les sources de données sensibles
Les avantages
Avantages
Interface dédiée ergonomique pour solliciter les métiers dans les actions à mener (archivage, suppression, conservation)
Analyse sur des volumes de données limités ou à l’échelle de l’organisation
Analyse de données issues de sources multilingues
Service déployable en mode SaaS ou en mode On-Premise
Etapes du Data Cleaning
Data cleaning
1. Préparer l'audit

Paramétrer le processus de nettoyage en activant les concepts à rechercher

2. Automatiser

Lancer et automatiser les audits sur les volumes de données à analyser

3. Valider les actions

Solliciter les référents métiers afin de statuer sur les actions à mener sur les sources de données remontées

4. Nettoyer / Archiver

Mener les actions d’archivage, de suppression des sources de données