Normalisation des données

Les partenaires du portail Données Québec travaillent de concert pour diffuser des données de qualité. En plus de respecter les lignes directrices sur la diffusion des données ouvertes, les partenaires établissent des schémas de données qui s’inspirent des meilleures pratiques de normalisation et des standards internationaux en matière de données ouvertes.

Qu’est-ce qu’un schéma de données?

Un schéma de données présente les instructions techniques permettant de normaliser un jeu de données, soit :

  • le format de fichier à adopter;
  • la structure détaillée du fichier;
  • la nomenclature des champs à respecter;
  • le domaine de valeurs pour certains champs.

 

Pourquoi normaliser les données?

Interopérabilité : garantir la compatibilité entre systèmes grâce aux formats ouverts et aux structures communes.

Combiner : pouvoir faciliter l’agrégation de sources et de territoires variés par une nomenclature uniforme.

Comparer : analyser directement les données sans transformation grâce aux unités et référentiels communs.

Qualité : prévenir les erreurs humaines en éliminant le besoin de nettoyer ou restructurer manuellement les données.

Fiabiliser : assurer la conformité des valeurs grâce à des règles de formatage strictes (exemple : dates ISO 8601).

Documenter : offrir un « dictionnaire » clair au moyen du schéma de données pour une compréhension rapide.

Automatiser : rendre les données directement exploitables par les API, la programmation et l’intelligence artificielle.

Valoriser : stimuler l’innovation (exemples : applications, marathons de programmation [hackathons], cartes interactives) en offrant un écosystème facile à réutiliser.

Exemple

La normalisation des données sur la localisation des pistes cyclables permet de facilement rassembler les jeux publiés par différentes villes et MRC et de mettre en valeur ces données sur l’ensemble du territoire, au moyen d’une application citoyenne.

 

Vous souhaitez contribuer à la normalisation des données?