Une « quatrième de couverture » pour vos données !

8 décembre 2022

Stéphane Le Lionnais

Data Gouvernance

Selon Gartner, la définition d’un data catalog est la suivante : «un catalogue de données maintient un inventaire des données actives grâce à la découverte, la description et l’organisation d’un ensemble de données».

Souvent on décrit le data catalog en utilisant la métaphore de la bibliothèque. En effet, pour rechercher/trouver facilement un livre dans les rayons (comme une donnée dans un système d’information) on fait appel à des métadonnées (classification, auteur, sujet, etc.)

Pourquoi ne pas aller plus loin et reprendre, dans un data catalog, le principe de la quatrième de couverture des livres ?

En effet, avec le livre, la quatrième de couverture est primordiale pour déclencher l’envie d’en savoir davantage, de le feuilleter, d’en télécharger un extrait ou de l’acheter.

Pour promouvoir l’intérêt d’un inventaire des données dans les organisations, il faut aller plus loin que le simple catalogage des métadonnées (lieu de stockage, liste des attributs, nombre d’enregistrements, nombre d’utilisations, etc.), il est ainsi primordial de comprendre les données recensées (les enregistrements saisis).

Chez Dawizz, au-delà de la récupération automatique de métadonnées existantes liées au contenant (les tables par exemple), nous créons également des métadonnées liées au contenu (les enregistrements). Pour faire simple, nous gérons une sorte de quatrième de couverture sur les données. Les algorithmes et les modèles d’IA créés par Dawizz ne sont pas utilisés pour extraire des échantillons mais bien pour décrire davantage les données et ainsi captiver les utilisateurs du data catalog et faciliter leur appropriation du patrimoine de données de leur organisation.