• Contenus gratuits
  • Notre offre
Menu
  • Ressources
    • Toutes les ressources
  • Infos
    • Toutes les infos
  • Essentiels
    • Tous les essentiels
  • Analyses
    • Toutes les analyses
  • Data
    • Data
  • Newsletters
  • Profil
    • Je teste 15 jours
    • Je me connecte
  • Profil
    • Mon profil
    • Je me déconnecte
CLOSE

Accueil > Marques & Agences > Achat média > Qu’est-ce qu’une bonne donnée ?

Qu’est-ce qu’une bonne donnée ?

Alors que la data devient omniprésente dans les discours et les offres publicitaires, Blandine Multrier, co-directrice générale de 3W.relevanC, entreprise qui exploite la data et les inventaires publicitaires du groupe Casino, estime que la qualité d'une donnée revêt certes de multiples critères mais s'évalue d'abord par sa capacité à générer de la connaissance dans le cadre d'une stratégie marketing claire et cohérente.

Par . Publié le 06 juillet 2019 à 16h24 - Mis à jour le 06 juillet 2019 à 16h24
  • Ressources

Des frameworks variés ont été développés dans les dix dernières années pour évaluer ce qu’est une bonne donnée : les concepts du “4C” (Correctness, Currency, Completeness, Consistency), du “6C” (Clean, Complete, Current, Consistency, Compliant, Collaborative), ou encore du “5V” (Volume, Vitesse, Varieté, Veracité, Valeur)… Aujourd’hui, les caractéristiques d’une “bonne”  donnée sont-elles en train d’évoluer, avec la multiplication des algorithmes et des échanges de données entre entités ?

D’abord comment définir une donnée ? Selon Le Petit Larousse, une donnée est “ce qui est connu ou admis comme tel, sur lequel on peut fonder un raisonnement, qui sert de point de départ pour une recherche”. Cette définition souligne que la donnée est un élément brut qui – tel quel – n’a pas de valeur.

Ce n’est qu’un point de départ. La donnée a besoin d’être transformée pour créer de la valeur. Roger Bohn, professeur de gestion au MIT, faisait la distinction en 1994 entre donnée, information et connaissance (data, information and knowledge) dans la Sloan Review of Management . « Les données sont ce qui est directement produit par les capteurs». L’information, en structurant les données et en les plaçant dans un contexte leur donne un sens. Enfin la connaissance, en analysant l’information, permet d’établir des liens de causalité ou des prédictions qui génèrent la valeur.

Une bonne donnée au service d’une stratégie marketing cohérente 

Une bonne donnée est donc une donnée que nous pouvons traiter et transformer en information pour générer de la connaissance. La qualité de la donnée va ainsi être liée à la connaissance recherchée. Connaissance du consommateur, connaissance de l’efficacité de ma campagne…

Pour évaluer la qualité de la donnée, Philip Russom, membre du TDWI Research for Data Management a introduit en décembre 2010 le framework des 6C.

Ce framework se compose des 6 caractéristiques suivantes qui restent une référence dans notre industrie :

  • Clean (Propre) : La propreté et la qualité de la donnée font partie des caractéristiques les plus importantes d’une bonne donnée. Le travail de nettoyage et de formatting de la donnée est un travail essentiel qui nécessite les compétences spécifiques de data ingénieurs et de data stewards. Nous avons besoin d’avoir une donnée toujours plus précise car les données sont utilisées pour des finalités toujours plus nombreuses et avec des algorithmes de plus en plus sophistiqués.

  • Complete (Complète) : La donnée ne doit pas avoir d’éléments manquants, même si avec l’intelligence artificielle, nous pouvons de plus en plus finement pallier des données manquantes.

  • Current (Fraiche) : Quelle est la date de péremption d’une donnée ? Quelle est la valeur additionnelle d’une donnée temps réel (ou quasi temps réel) par rapport à une donnée qui est vieille de 1 mois ou 6 mois ? Tout dépend de son utilisation. Dans l’écosystème publicitaire, cette fraicheur est clef pour des segments de données intentionnistes par exemple. Si je cible des acheteurs de « Poussettes », et que la donnée que j’active n’est pas fraiche, très probablement mon consommateur aura déjà acheté sa poussette lorsque je communiquerai. Nos systèmes ont besoin d’intégrer plus systématiquement des renseignements sur la fraicheur de la donnée.

  • Consistency (Homogène) : Lorsque les données de plusieurs métiers avec des définitions parfois différentes sont agrégées ou transitent entre entités, les données ont besoin d’être homogènes pour qu’elles soient agrégées de façon précise et juste. La documentation permettra de maintenir l’homogénéité nécessaire à une bonne utilisation de la donnée.

  • Compliant (Conforme) : La data doit être conforme à la réglementation, en particulier au RGPD dans le cadre des données personnelles. Dans ce cadre-là, une bonne donnée est une donnée qui protège nos droits fondamentaux, y compris le droit à la vie privée et le droit à l’oubli. Mais au-delà de la conformité au RGPD, parce que les données sont utilisées dans des systèmes algorithmiques et d’intelligence artificielle, il est important de bien comprendre la donnée utilisée, les biais qu’elle peut avoir pour pouvoir par la suite corriger ces biais dans les algorithmes que la donnée va alimenter.

  • Collaborative (Collaboration) : Cette dernière caractéristique est moins liée à la qualité intrinsèque de la donnée qu’aux organisations de travail autour de la donnée en soulignant l’importance de l’alignement et de la collaboration entre les équipes (alignement sur les KPIs, processes) pour permettre de générer de la valeur à partir de cette donnée.

Une data enrichie et réconciliée apporte plus de valeur

La valeur de la donnée réside de plus en plus dans sa capacité à être enrichie et réconciliée avec d’autres acteurs. Il y a une quinzaine d’années, chacun avait son système, on ne s’échangeait pas la donnée. Mais les organisations ont réalisé que la data n’est pas un bien rival : sa consommation par un agent n’affecte pas celle faite par un autre. Mutuellement gagnants dans le partage des données, on enrichit ainsi de plus en plus la donnée pour en augmenter sa valeur.

Mais pour que cet enrichissement des données puisse être possible, deux éléments sont nécessaires :

  1. Communication des systèmes de façon sécurisée : les données sont encore souvent traitées et utilisées dans des environnements éclatés et silotés, bien qu’on assiste à une certaine normalisation des échanges entre ces systèmes avec la normalisation des procédés de cryptage par exemple.

  2. Conformité à la législation, tout particulièrement le RGPD : En particulier pour des données à caractère personnel, le respect des principes de transparence sur la finalité de traitement et de minimisation de la collecte sont indispensables.

Une bonne donnée est donc une donnée qui peut être réconciliée de façon sûre et conforme.

La valeur d’une donnée se mesure enfin aux revenus qu’elle est capable de générer, à sa capacité à être utilisée opérationnellement. La valeur de l’exploitation de la donnée est dans le ROI généré. Nous avons conçu 3W.relevanC pour que les industriels puissent exploiter la donnée des enseignes du groupe Casino pour générer de la croissance et des revenus, en comprenant mieux leurs consommateurs, en les ciblant de manière plus précise et en mesurant ces campagnes.

Une bonne donnée est donc une donnée qui peut être transformée en information pour générer de la connaissance permettant de prendre des décisions dont on pourra par la suite mesurer les effets. Nous pourrions ainsi compléter la trilogie de Roger Bohn : Data-Information-Knowledge-Actions-Measures–ROI.

TRANSPARENCE PUBLICITAIRE

mind media lance un deuxième “hub” pour comprendre les enjeux et les chiffres clés de la transparence publicitaire en ligne afin de faciliter vos prises de décision : lire notre synthèse

Et sur notre site : #Transparence

  • Adtech
  • Alliances Data
  • Données personnelles
  • RGPD
  • Tribunes

Besoin d’informations complémentaires ?

Contactez Mind Research

le service d’études à la demande de mind

À lire

Tribunes gratuit

"La publicité en ligne doit radicalement changer"

Entretiens

Data et tech, quelle contribution au modèle des agences de communication ?

Gravity s'associe à Axionable pour automatiser la production d'études marketing

essentiels

Nos synthèses et chiffres sur les principales thématiques du marché

Les mutations du search à l'ère de l'IA générative

L'application inaboutie de la loi sur les droits voisins

Google vs DOJ : tout ce qu'il faut savoir sur le procès qui pourrait redéfinir l'adtech

L’essentiel sur les identifiants publicitaires 

La transformation du marché publicitaire en 2024

2023 : le marché publicitaire doit se préparer à la fin du tracking utilisateur

Comment l’intelligence artificielle générative bouleverse les médias

Les enjeux réglementaires des médias en 2023

analyses

Les articles d'approfondissement réalisés par la rédaction

Protection et valorisation des contenus des médias : des discussions très laborieuses entre éditeurs et fournisseurs IA

INFO MIND MEDIA - Les Échos veut faire un premier pas vers les contenus en anglais

L’Apig et le SEPM fustigent le discours de Google concernant l’absence de l’AI Mode en France

L'IA tient-elle ses promesses dans le marketing et l'achat média ?

L’IA dans les rédactions : les exemples de l’AFP, Ouest-France et Humanoid 

Synthèse de l'étude mind Media-366 sur l’IA générative appliquée à la recherche, aux médias et à la publicité

INFO MIND MEDIA - Yahoo lance un plan social en France pour se séparer de son équipe éditoriale

Baromètre RECMA - mind Media : le bilan des gains de budgets en France depuis début 2025

Heikel Manai (France Télévisions) : “En matière d’IT, un dogmatisme 100% européen serait contre-productif”

INFO MIND MEDIA - L’Équipe gagne son match judiciaire contre Fedcom Media

data

Les baromètres, panoramas et chiffres sur l'évolution du marché

Le classement des éditeurs français qui ont le plus d'abonnés purs numériques

Les données récoltées par les acteurs de la publicité en ligne

La liste des sociétés présentes dans les fichiers ads.txt des éditeurs français

Les gains de budget des agences médias

Opt-out : quels éditeurs français interdisent les robots crawlers de l'IA générative ?

Le panorama des sociétés spécialisées dans les technologies de l’e-retail media

La liste des outils utilisés par les équipes éditoriales, marketing et techniques des éditeurs français

Le détail des aides à la presse, année par année

La liste des CMP choisies par les principaux médias en France

Digital Ad Trust : quels sites ont été labellisés, pour quelles vagues et sur quel périmètre ?

Réserve ta place dès maintenant pour le mind Media Day J'en profite
  • Le groupe mind
  • Nos activités
  • Notre histoire
  • Notre équipe
  • Nos clients
  • Nos services
  • mind Media
  • mind Fintech
  • mind Health
  • mind Rh
  • mind Retail
  • mind Research
  • Les clubs
  • mind et vous
  • Présentation
  • Nous contacter
  • Vous abonner
  • A savoir
  • Mentions légales
  • CGU
  • CGV
  • CGV publicité
  • Politique des cookies
Tous droits réservés - Frontline MEDIA 2025
Social Media Auto Publish Powered By : XYZScripts.com
  • Twitter
  • LinkedIn
  • Email