Accueil > Marques & Agences > “L’unification des données client nécessite une grande rigueur méthodologique” “L’unification des données client nécessite une grande rigueur méthodologique” Stéphane Dehoche, principal fondateur de la société de logiciel de gestion de campagnes marketing Neolane, revendue en 2013 pour 600 millions de dollars à Adobe, est maintenant CEO et cofondateur d’imagino, société qui propose une customer data platform (CDP). Il explique les bonnes pratiques de l’unification des données client, essentielle pour les activités marketing et commerciales des entreprises. Par Contribution externe. Publié le 19 juillet 2022 à 12h08 - Mis à jour le 15 février 2023 à 19h29 Ressources Que ce soit pour la création de référentiels clients ou son utilisation directe au sein de campagnes marketing, l’unification de la donnée est la quête absolue pour toute entreprise qui veut développer la connaissance de ses consommateurs ou communiquer de manière cohérente auprès d’eux. Une cohérence qui doit s’exprimer dans le temps, dans l’espace de produits ou de services de la marque, et au travers des canaux de communication utilisés. Cet objectif, “rassembler la donnée”, s’exprime très simplement. Et puisque le cerveau humain sait le faire sans effort, son automatisation semble facile. Pourtant il n’en est rien. En effet, notre cerveau est un expert pour reconnaître les similitudes qui permettent au quotidien la reconnaissance des objets et des personnes, et il l’applique naturellement et sans effort aux données présentées. Mais la variété et surtout l’hétérogénéité des données en font un sujet plus difficilement automatisable. Il faut donc y mettre un peu d’ordre pour y réussir. Quatre enjeux stratégiques pour accompagner les marques dans l’exploitation de leurs données propriétaires L’unification des données client nécessite une grande rigueur méthodologique. Trois étapes sont essentielles dans ce process. 1) La normalisation des données La même information peut être représentée de multiples façons. Par exemple, une date peut être stockée de plusieurs manières : avec un format texte, avec plusieurs représentations possibles (souvent dépendantes de la langue), avec un format numérique, avec un nombre représentant les secondes ou toute autre unité de temps depuis une date de référence. Au-delà du jour, il est aussi nécessaire de codifier l’heure locale utilisée ou son équivalent en temps universel. Que de variantes et de complications ! Ce champ date doit ainsi être normalisé, de sorte que la date anniversaire d’un client puisse plus tard être comparée à une autre. C’est ce que fera cette première étape de normalisation, à partir de scripts ou par l’utilisation d’outils spécialisés comme les CDP. Il en va de même des adresses postales, de la casse utilisée ou de l’encodage des caractères, etc. Cette étape vise à ce qu’un même objet ait une seule représentation possible et qu’il soit donc comparable. “L’idée de déposer les données sous forme brute dans d’immenses entrepôts, en espérant que des intelligences artificielles miraculeuses en sortent la substantifique moelle, a désormais vécu” 2) Le rapprochement de premier niveau Une fois la donnée normalisée, il convient de rapprocher les enregistrements semblables pour les dédoublonner puis les unifier. En partant des enregistrements initiaux et en appliquant des jeux de règles priorisés, des algorithmes paramétrés vont décider des opportunités de fusion, de la priorisation, et ainsi du résultat (aussi appelé “master trecord” ou “golden record”). Les règles appliquées peuvent dépendre du cas d’usage servi. Ces choix dépendent aussi des industries auxquelles elles s’appliquent et de la disponibilité de clés particulières de rapprochement, ou de combinaisons de clés (numéro de commande, numéro de carte grise dans l’automobile, numéro de contrat pour la banque, email, numéro de fidélisation, etc.). Le résultat est un jeu d’enregistrements clients uniques, qui est une bonne représentation des données principales. “Intégration et collaboration sont les maîtres-mots des nouvelles organisations marketing” 3) Le rapprochement de deuxième niveau Un client ne pouvant être réduit à ce seul enregistrement “plat”, il importe ensuite de lui rattacher, et donc d’unifier, les informations qui lui sont propres (transactions, web logs, etc.), c’est-à-dire lui attacher les collections de données. Cette étape est absolument essentielle car elle seule permet de reconstituer les informations globales : panier client moyen, cross canaux, identification des produits les plus achetés, segments RFM (pour Récence, fréquence, montant), etc. En ayant gardé trace des enregistrements initiaux fusionnés (“lineage”), il est de fait possible de lier à l’enregistrement principal tous les enregistrements associés (logs web, transactions, commandes, envois…) et d’obtenir ainsi l’image complète, c’est-à-dire l’équivalent d’une fiche client reconstituée, nettoyée, avec tous ses attributs. Cette fiche devient alors la base de toute nouvelle action vers le client. “Comment concilier branding et performance à l’ère de la data et du e-commerce” Ces données si essentielles Si les données sont un trésor pour l’entreprise, elles forment un actif périssable qui nécessite en pratique un véritable soin pour conserver, voire développer leur valeur intrinsèque. L’idée de déposer les données sous forme brute dans d’immenses entrepôts, en espérant que des intelligences artificielles miraculeuses en sortent la substantifique moelle, a désormais vécu. La mise en œuvre et l’exploitation des données client dans l’entreprise passeront par la mise en place de process à valeur ajoutée dont l’unification est la pierre angulaire. Cette unification nécessitera la participation de tous les départements (métier, juridique, data, IT) pour un projet qui sera en général mené par les directions informatiques sur la base d’objectifs partagés. ___ Par Stéphane Dehoche,CEO et cofondateur d’imagino Contribution externe AdtechCRMDonnées personnellesMartechStratégies annonceursTransformation marketingTribunes Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind À lire Analyses Dossiers Quatre enjeux stratégiques pour accompagner les marques dans l'exploitation de leurs données propriétaires Tribunes gratuit "La stratégie client doit être orchestrée par une approche méthodique des flux de données propriétaires" Tribunes gratuit "Comment concilier branding et performance à l’ère de la data et du e-commerce" Tribunes gratuit "Intégration et collaboration sont les maîtres-mots des nouvelles organisations marketing" Analyses Tribunes gratuit "Les valorisations et la visibilité médiatiques données aux Licornes semblent déraisonnables" Dossiers Martech : comment les marques peuvent accélérer sur la collecte et l'usage de données propriétaires Dossiers gratuit Comment concilier rentabilité et durabilité du marketing ? Le compte-rendu de notre conférence Agency Futures 2022 Comment Le Monde utilise la plateforme de notifications Batch pour l’acquisition d'abonnés Analyses Comment Carrefour veut devenir une "digital retail company" Tribunes gratuit "Les achats contextuels par panels permettent une publicité ciblée respectueuse de la vie privée" Analyses Dossiers Les nouveaux enjeux du marketing mix modeling Dossiers Solutions d'automatisation du marketing digital multi-local : acteurs, enjeux et perspectives Le fonds Ardian s'apprête à acquérir l'agence Artefact pour 329 millions d'euros essentiels Nos synthèses et chiffres sur les principales thématiques du marché Les mutations du search à l'ère de l'IA générative L'application inaboutie de la loi sur les droits voisins Google vs DOJ : tout ce qu'il faut savoir sur le procès qui pourrait redéfinir l'adtech L’essentiel sur les identifiants publicitaires La transformation du marché publicitaire en 2024 2023 : le marché publicitaire doit se préparer à la fin du tracking utilisateur Comment l’intelligence artificielle générative bouleverse les médias Les enjeux réglementaires des médias en 2023 analyses Les articles d'approfondissement réalisés par la rédaction Adtech : pourquoi la Commission européenne sanctionne Google de près de 3 milliards d’euros Retail media : une consolidation indispensable des régies pour répondre aux attentes des acheteurs publicitaires IA et monétisation des contenus : comment l’IAB Tech Lab veut contrôler les robots crawlers Droits voisins : l’Apig veut introduire une plainte contre Meta devant l'Autorité de la concurrence Paul Boulangé (Starcom France) : "Nous sommes en train de déployer Captiv8 en France, notre solution d'automatisation du marketing d'influence" Claire Léost devient DG de CMA Média, WPP Media promeut Stéphanie Robelus… Comment les SSP généralistes investissent le secteur du retail media Bénédicte Wautelet (Le Figaro) : “Toute solution qui utilise de l’IA en rapport avec nos contenus doit y être autorisée et nous rémunérer” Aides à la presse : combien les éditeurs ont-ils perçu en 2024 ? Le New York Times affiche toujours une croissance très robuste portée par le numérique data Les baromètres, panoramas et chiffres sur l'évolution du marché Le classement des éditeurs français qui ont le plus d'abonnés purs numériques Les données récoltées par les acteurs de la publicité en ligne La liste des sociétés présentes dans les fichiers ads.txt des éditeurs français Les gains de budget des agences médias Opt-out : quels éditeurs français interdisent les robots crawlers de l'IA générative ? Le panorama des sociétés spécialisées dans les technologies de l’e-retail media La liste des outils utilisés par les équipes éditoriales, marketing et techniques des éditeurs français Le détail des aides à la presse, année par année La liste des CMP choisies par les principaux médias en France Digital Ad Trust : quels sites ont été labellisés, pour quelles vagues et sur quel périmètre ?