Accueil > Médias & Audiovisuel > Comment Le Figaro crée un datalake pour pallier les insuffisances de sa DMP Comment Le Figaro crée un datalake pour pallier les insuffisances de sa DMP Par La rédaction. Publié le 25 août 2017 à 11h47 - Mis à jour le 29 janvier 2021 à 17h28 Ressources Le Figaro fait partie des rares grands groupes médias à n’avoir pas intégré l’alliance Gravity. La raison avancée : le groupe a investi 10 millions d’euros en deux ans dans des technologies et des équipes data. Nouvelle étape :la constitution d’un datalake, qui doit répondre à la double exigence de reach et de puissance des annonceurs. Alexis Marcombe, directeur général délégué de MEDIA.Figaro, et Cedric Arnal, CTO de la régie, détaillent à mind Media les origines et les objectifs de ce processus. Origines Alexis Marcombe : “MEDIA.Figaro a mis en place une DMP en 2011 avec Krux, alimentée notamment avec nos données de navigation et nos données CRM, cinq personnes étaient consacrées à la data au sein du groupe, ce qui constituait une belle équipe et donnait au groupe une longueur d’avance sur nombre de ses concurrents dans la qualification de ses cookies, la DMP servait principalement à associer à un cookie des centres d’interets ou un profil socio-demographique Nous nous sommes vite rendus compte que ce n’était pas suffisant pour améliorer significativement le ROI des campagnes de nos clients. Nous arrivions vite à un problème de reach : y-compris sur des segments a priori simples (comme “les hommes 25-34 ans intentionnistes d’achat automobile”), le reach était réduit drastiquement et chaque contact devenait très coûteux à atteindre (puisqu’il fallait à chaque fois que le cookie se présente sur notre réseau, que l’annonceur puisse l’acheter et pour se faire propose l’enchère la plus élevée). L’autre limite de la DMP était que l’optimisation des campagnes et du ciblage se faisait manuellement au jour le jour, mais pas en temps réel. Nous avons donc eu le besoin d’aller plus loin et d’étoffer nos outils et nos équipes. Dispositif Cedric Arnal : “J’ai rejoint le groupe Figaro en 2015 pour développer un datalake. Contrairement à la DMP, le datalake contient l’ensemble des données dont nous disposons, même quand elles ne sont pas reliées ou non structurées (il peut s’agir d’emails, de cookies, de transactions, de données metétéo, de points de géolocalisation…). Pour rendre exploitable cet amas de donnés, nous avons construit des dataware, c’est-à-dire des systèmes de calculs et des algorithmes qui permettent d’agréger cette donnée, la transformer et la réconcilier pour qu’elle soit interprétable. Cela permet de constituer une architecture des données. La DMP nous sert toujours mais dans un second temps, pour créer des segments au travers de mots-clés, de rubriquages et de catégories, tandis que le datalake nous permet de créer des segments en fonction des KPI. Ce travail nous a pris deux ans, pendant lesquels nous avons investi près de 5 millions d’euros par an (2,5 millions en investissement pur, 2,5 millions en fonctionnement). Le travail a consisté dans un premier temps à unifier nos données, afin d’apposer un ID Le Figaro dans l’ensemble de nos bases, puis développer les algorithmes pour les exploiter.” Alexis Marcombe : “L’autre gros chantier est le recrutement et la montée en compétences des équipes : nous avons recruté près de 20 personnes dédiées à la data pour la régie ce qui représente une équipe de plus de 60 personnes au total dans le groupe, pour piloter la data et nos sujets adtech. Nous avons commencé début 2017 à pouvoir réellement exploiter ce que nous avions construit. Concrètement, cela nous permet d’optimiser une campagne en temps réel en fonction de l’objectif de campagne l’annonceur. Par exemple si un client nous demande de cibler les femmes 18-34 ans, nous utiliserons les segments que nous aurons pu valider comme performant sur ce KPI. En revanche si la demande du client est orientée vers de la génération de trafic ou des ventes, nos algorithmes identifieront dans le datalake les critères discriminants qui permettront de créer les segments impression par impression en temps réel afin d’atteindre les objectifs de notre client sur une campagne donnée. Tous types de critères peuvent être pris en compte, et non plus seulement “la personne a visité la rubrique automobile, donc elle est intentionniste”. Cette approche de Big data associée à notre reach nous permet également de proposer à nos clients des indicateurs à forte valeur ajoutée en termes de connaissance client. Résultat Alexis Marcombe : “Les résultats ont été visibles dès le premier semestre 2017 : le digital représente aujourd’hui près de 40 % des revenus publicitaires. Les campagnes à la pure performance, qui ne pesaient quasiment rien dans notre chiffre d’affaires en 2016, constituent aujourd’hui 15 % de nos revenus digitaux et nous devrions tendre vers 20% en base annuelle. Les revenus programmatiques ont progressé de 100 % et le nombre de client actifs est en croissance de 20%.” Et après ? Alexis Marcombe : “Le groupe Figaro dispose aujourd’hui d’une équipe de data scientist et data analyst inégalée dans un groupe média, et même plus nombreuse que chez certaines sociétés spécialisées. Nous allons continuer à optimiser nos algorithmes en fonction des performances que les annonceurs souhaitent atteindre, pour travailler avec de plus en plus de marques en fil rouge et, qui sait, notre technologie intéressera peut-être d’autres régies avec lesquelles nous pourrions travailler » Propos recueillis par Marion-Jeanne Lefebvre La rédaction DMPDonnées personnelles Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind essentiels Nos synthèses et chiffres sur les principales thématiques du marché Les mutations du search à l'ère de l'IA générative L'application inaboutie de la loi sur les droits voisins Google vs DOJ : tout ce qu'il faut savoir sur le procès qui pourrait redéfinir l'adtech L’essentiel sur les identifiants publicitaires La transformation du marché publicitaire en 2024 2023 : le marché publicitaire doit se préparer à la fin du tracking utilisateur Comment l’intelligence artificielle générative bouleverse les médias Les enjeux réglementaires des médias en 2023 analyses Les articles d'approfondissement réalisés par la rédaction Adtech : pourquoi la Commission européenne sanctionne Google de près de 3 milliards d’euros Retail media : une consolidation indispensable des régies pour répondre aux attentes des acheteurs publicitaires IA et monétisation des contenus : comment l’IAB Tech Lab veut contrôler les robots crawlers Droits voisins : l’Apig veut introduire une plainte contre Meta devant l'Autorité de la concurrence Paul Boulangé (Starcom France) : "Nous sommes en train de déployer Captiv8 en France, notre solution d'automatisation du marketing d'influence" Claire Léost devient DG de CMA Média, WPP Media promeut Stéphanie Robelus… Comment les SSP généralistes investissent le secteur du retail media Bénédicte Wautelet (Le Figaro) : “Toute solution qui utilise de l’IA en rapport avec nos contenus doit y être autorisée et nous rémunérer” Aides à la presse : combien les éditeurs ont-ils perçu en 2024 ? Le New York Times affiche toujours une croissance très robuste portée par le numérique data Les baromètres, panoramas et chiffres sur l'évolution du marché Le classement des éditeurs français qui ont le plus d'abonnés purs numériques Les données récoltées par les acteurs de la publicité en ligne La liste des sociétés présentes dans les fichiers ads.txt des éditeurs français Les gains de budget des agences médias Opt-out : quels éditeurs français interdisent les robots crawlers de l'IA générative ? Le panorama des sociétés spécialisées dans les technologies de l’e-retail media La liste des outils utilisés par les équipes éditoriales, marketing et techniques des éditeurs français Le détail des aides à la presse, année par année La liste des CMP choisies par les principaux médias en France Digital Ad Trust : quels sites ont été labellisés, pour quelles vagues et sur quel périmètre ?