Que ce soit pour la création de référentiels clients ou son utilisation directe au sein de campagnes marketing, l’unification de la donnée est la quête absolue pour toute entreprise qui veut développer la connaissance de ses consommateurs ou communiquer de manière cohérente auprès d’eux. Une cohérence qui doit s’exprimer dans le temps, dans l’espace de produits ou de services de la marque, et au travers des canaux de communication utilisés.
Cet objectif, « rassembler la donnée », s’exprime très simplement. Et puisque le cerveau humain sait le faire sans effort, son automatisation semble facile. Pourtant il n’en est rien. En effet, notre cerveau est un expert pour reconnaître les similitudes qui permettent au quotidien la reconnaissance des objets et des personnes, et il l’applique naturellement et sans effort aux données présentées. Mais la variété et surtout l’hétérogénéité des données en font un sujet plus difficilement automatisable. Il faut donc y mettre un peu d’ordre pour y réussir.
L’unification des données client nécessite une grande rigueur méthodologique. Trois étapes sont essentielles dans ce process.
1) La normalisation des données
La même information peut être représentée de multiples façons. Par exemple, une date peut être stockée de plusieurs manières : avec un format texte, avec plusieurs représentations possibles (souvent dépendantes de la langue), avec un format numérique, avec un nombre représentant les secondes ou toute autre unité de temps depuis une date de référence. Au-delà du jour, il est aussi nécessaire de codifier l’heure locale utilisée ou son équivalent en temps universel. Que de variantes et de complications !
Ce champ date doit ainsi être normalisé, de sorte que la date anniversaire d’un client puisse plus tard être comparée à une autre. C’est ce que fera cette première étape de normalisation, à partir de scripts ou par l’utilisation d’outils spécialisés comme les CDP.
Il en va de même des adresses postales, de la casse utilisée ou de l’encodage des caractères, etc. Cette étape vise à ce qu’un même objet ait une seule représentation possible et qu’il soit donc comparable.
« L’idée de déposer les données sous forme brute dans d’immenses entrepôts, en espérant que des intelligences artificielles miraculeuses en sortent la substantifique moelle, a désormais vécu »
2) Le rapprochement de premier niveau
Une fois la donnée normalisée, il convient de rapprocher les enregistrements semblables pour les dédoublonner puis les unifier. En partant des enregistrements initiaux et en appliquant des jeux de règles priorisés, des algorithmes paramétrés vont décider des opportunités de fusion, de la priorisation, et ainsi du résultat (aussi appelé « master trecord » ou « golden record »). Les règles appliquées peuvent dépendre du cas d’usage servi. Ces choix dépendent aussi des industries auxquelles elles s’appliquent et de la disponibilité de clés particulières de rapprochement, ou de combinaisons de clés (numéro de commande, numéro de carte grise dans l’automobile, numéro de contrat pour la banque, email, numéro de fidélisation, etc.).
Le résultat est un jeu d’enregistrements clients uniques, qui est une bonne représentation des données principales.
3) Le rapprochement de deuxième niveau
Un client ne pouvant être réduit à ce seul enregistrement « plat », il importe ensuite de lui rattacher, et donc d’unifier, les informations qui lui sont propres (transactions, web logs, etc.), c’est-à-dire lui attacher les collections de données. Cette étape est absolument essentielle car elle seule permet de reconstituer les informations globales : panier client moyen, cross canaux, identification des produits les plus achetés, segments RFM (pour Récence, fréquence, montant), etc.
En ayant gardé trace des enregistrements initiaux fusionnés (« lineage »), il est de fait possible de lier à l’enregistrement principal tous les enregistrements associés (logs web, transactions, commandes, envois…) et d’obtenir ainsi l’image complète, c’est-à-dire l’équivalent d’une fiche client reconstituée, nettoyée, avec tous ses attributs. Cette fiche devient alors la base de toute nouvelle action vers le client.
Ces données si essentielles
Si les données sont un trésor pour l’entreprise, elles forment un actif périssable qui nécessite en pratique un véritable soin pour conserver, voire développer leur valeur intrinsèque. L’idée de déposer les données sous forme brute dans d’immenses entrepôts, en espérant que des intelligences artificielles miraculeuses en sortent la substantifique moelle, a désormais vécu. La mise en œuvre et l’exploitation des données client dans l’entreprise passeront par la mise en place de process à valeur ajoutée dont l’unification est la pierre angulaire.
Cette unification nécessitera la participation de tous les départements (métier, juridique, data, IT) pour un projet qui sera en général mené par les directions informatiques sur la base d’objectifs partagés.
___
Par Stéphane Dehoche,
CEO et cofondateur d’imagino
Voir tous les articles à ce sujet11