Accueil > Adtechs & Martechs > Privacy Sandbox : ce que nous apprennent les tests de Fledge et Topics Privacy Sandbox : ce que nous apprennent les tests de Fledge et Topics Si la marche jusqu’à un dispositif fonctionnel se substituant entièrement au cookie tiers semble encore longue, les tests quasi-grandeur nature sur Topics permettent d'envisager une appropriation rapide par les adtechs - notamment en développant leurs propres algorithmes complémentaires. Fledge est toujours très dépendant des évolutions sur les autres API. Par Paul Roy. Publié le 16 décembre 2022 à 15h27 - Mis à jour le 16 décembre 2022 à 17h04 Ressources Pour répondre aux critiques de l’industrie sur la première version de sa Privacy Sandbox, et sous observation de l’Autorité de la concurrence britannique – à qui il fournit un rapport trimestriel de l’avancée des travaux -, Google a largement revu sa copie de son alternative post-cookies tiers en 2022. Au cœur de sa proposition, les API Topics, pour le ciblage, et Fledge, répondant aux cas d’usage du retargeting. Fin septembre 2022, le groupe annonçait une vingtaine de partenaires de tests pour ces API sur mobile et sur web. Dans un billet de blog publié mercredi 14 décembre, Joey Trotz, director of product management de Privacy Sandbox, a de nouveau exhorté les acteurs du marché à tester les API, en complément d’autres dispositifs post-cookies tiers. En France, Criteo et à plus petite échelle Weborama ont été particulièrement actives concernant l’API de ciblage Topics (voir la courte liste de testeurs). Quels enseignements tirer de cette deuxième vague de tests ? Des échantillons conséquents pour des tests plus représentatifs Lors de ses premiers tests de FloC en 2021, Criteo avait pointé le biais lié à la petite taille de l’échantillon pour les tests, qui étaient menés principalement sur la version bêta de Chrome, utilisée par les développeurs, une population peu représentative de l’alternative. Un problème de représentativité que Weborama a dans un premier temps constaté dans ses tests de Topics arrêtés début août. En France, les opt-in Topics (utilisateurs et sites) pour l’Origin Trial ne représentait alors que 0,001 % du trafic total. La forte proportion de développeurs parmi les bêta testeurs conduisait alors à une surreprésentation de certains centres d’intérêt (cybersécurité, tablettes, matériel et appareils informatiques, etc.) et le nombre de sites opt-in était très faible (environ 600 sites). Privacy Sandbox : que faut-il retenir du test de FLoC réalisé par Criteo ? La situation a réellement évolué à partir de l’ouverture plus large aux tests en septembre, à la suite de l’annonce de Google de repousser la fin des cookies tiers. Dans ses tests de l’API Topics, Criteo – qui n’a pas souhaité s’exprimer sur le sujet – a ainsi constaté une augmentation rapide du nombre d’internautes ayant opt-in à partir de mi-septembre, jusqu’à un million d’utilisateurs quotidiens (1 % du trafic) ayant au moins une catégorie de centre d’intérêt associée mi-novembre. Dans son étude de l’API Fledge, publiée mercredi 15 décembre, le spécialiste du retargeting indique avoir tagué 5 % du trafic sur Chrome – comme promis par Google. Comment fonctionnent Topics et Fledge ? Topics a été dévoilé en janvier 2022 pour répondre aux critiques de l’industrie sur le premier dispositif de ciblage post-cookies tiers développé par Google, FLoC : une efficacité moindre, un risque pour les données personnelles des utilisateurs, mais aussi une potentielle utilisation des identifiants de cohortes pour reconstituer des profils utilisateurs via le fingerprinting, mettant à mal le respect du RGPD. Les dizaines de milliers de cohortes de FLoC sont ainsi remplacées par quelques centaines de thématiques représentatives des intérêts de l’utilisateur. Concrètement, lorsque l’internaute visite un site, les thèmes – déterminés à partir du nom de domaine d’un site – sont transmis au site et à l’annonceur par l’API. Ceux-ci sont enregistrés sur son terminal à raison d’un par semaine – choisi aléatoirement sur les cinq thématiques les plus consultées pour chacune de ces périodes – sur les trois dernières semaines de navigation. Fledge – qui repose aussi sur la logique de centre d’intérêts développée dans Topics – répond quant à lui au cas d’usage du retargeting. Il s’appuie notamment sur l’idée d’un “serveur tiers de confiance” stockant les informations sur la stratégie d’enchères et les budgets des campagnes des annonceurs. Pour formuler cette alternative, les équipes de Chrome se sont inspirées de Dovekey, la proposition des équipes de Google Ads pour le retargeting – qui se basait elle-même sur Sparrow, une proposition de Criteo. La classification des URL de Topics est pour le moment très large Dans leurs tests de Topics, Criteo comme Weborama pointent une classification des URL large et parfois approximative. D’abord parce que la taxonomie n’est pas assez granulaire, selon Criteo, qui souligne l’absence de catégories valorisables commercialement telles que “chaussures” ou “robe”. Deuxième raison, le mécanisme d’attribution de Topics à des utilisateurs, qui tend à favoriser les catégories les plus larges, telles qu’”actualités” ou “communautés en ligne”, plus que d’autres davantage affinitaires, réellement valorisables par l’annonceur – car s’appuyant uniquement sur la fréquence absolue des visites sur les sept derniers jours. On vous explique : comment fonctionne l’analyse sémantique pour le ciblage contextuel Mais la principale limite reste que l’attribution des URL dans chaque catégorie au moment de la visite de l’utilisateur repose uniquement sur les noms de domaines et sous-domaines. Les visites sur les sous-sections des sites d’e-commerce ou d’actualités, qui permettent de tirer nombre d’enseignements sur les intérêts d’un utilisateur, ne sont pas prises en compte. Ces trois éléments conduisent à une surreprésentation de certaines catégories très larges. Criteo note ainsi que 60 % des Topics observés sur les utilisateurs correspondent à la catégorie 1, regroupant seulement 24 sujets : les catégories “arts et divertissements”, “actualités” et “shopping” représentent chacune 15 % des sujets observés par la société dans son étude. Une opportunité : aller plus loin dans l’analyse du contexte Weborama insistait au moment de la publication de ses tests en octobre sur la nécessité de coupler Topics avec une approche contextuelle pour tirer profit des enseignements sur les visites chez des éditeurs plus verticalisés. “Dans l’état actuel de l’algorithme, quand un topic “spécialisé” ressort pour un internaute, cela donne beaucoup de confiance sur sa pertinence, et permet de construire une audience de personnes “très intéressées” sur un sujet. Même si le volume est faible, l’annonceur d’un site très verticalisé aura la certitude de cibler une audience de qualité”, expose Nicolas Tastevin, chief data scientist. Cette pertinence est néanmoins limitée par la dimension aléatoire du choix des Topics représentatifs de l’historique de navigation. Google a encouragé et précisé cette approche dans son billet de blog du 14 décembre “Une méthode plus avancée consiste à comparer les Topics d’un utilisateur et le contexte d’une page, et de déduire des affinités supplémentaires pour les utilisateurs. […] Les adtechs pourraient entraîner un modèle machine-learning pour prédire qu’un visiteur d’un site web d'”activités de plein air” pourrait être intéressé par les grillades, même si “barbecue & grillades” n’est pas renvoyé comme sujet par l’API Topic”, explique Joey Trotz, director of Product Management de Privacy Sandbox. Globalement, Criteo recommande une analyse plus poussée du contexte avec l’URL, voire le contenu de la page, comme le font la majorité des acteurs sur le marché publicitaire pour plus de précision. La société démontre qu’aujourd’hui le ciblage des audiences sur Topics est beaucoup moins efficace que les modèles basés sur les cookies tiers, en partie du fait de cette catégorisation trop large. Les audiences ciblées via cookies tiers généreraient 3 à 10 fois plus d’événements pertinents (visites organiques, paniers e-commerce et événements d’achat) que celles visées via Topics. Fledge toujours dépendant des API de reporting et d’attribution L’autre API principale proposée au sein de Privacy Sandbox, Fledge, n’a quant à elle pas évolué autant que les acteurs de l’industrie l’espérait sur cette année. “Il y a eu des avancées pour que les acteurs testeurs puissent plus facilement déboguer (voir le billet de blog), mais sur le fond, les problèmes non-résolus restent les mêmes”, constate Rémi Lemonnier, cofondateur de Scibids. Il y a un an, mind Media pointait déjà un certain nombre de critiques de l’industrie, avec entre autres l’impossibilité d’optimiser les campagnes sur des critères autres que les groupes d’intérêt, comme la fréquence publicitaire ; et les problématiques liées au reporting d’événement et via des données agrégées. Seller Defined Audiences est encore en phase d’observation en France Dans son étude publiée le 15 décembre, Criteo indique recevoir depuis début octobre 10 millions de bid requests quotidienne associées à Fledge via Google Ad Manager (seule SSP participant aux tests pour le moment), mais insiste sur son incapacité à produire des tests complets, en raison de plusieurs fonctionnalités manquantes (possibilité d’utiliser son propre serveur et pas un “serveur de confiance”, utilisation du reporting de données agrégées impossible…). La société souligne la nécessité d’améliorer les capacités de reporting pour optimiser la performance publicitaire mais aussi technique dans les enchères programmatiques ; et appelle également à la création d’un espace tiers “sans cookies tiers” pour faciliter les A/B tests et rendre compte réellement de la performance des campagnes sur Fledge. Selon les acteurs que nous avons interrogés, Google devrait apporter davantage d’éléments sur la marche à suivre et sur certains aspects techniques des API lors d’une réunion avec l’IAB Europe début janvier. Une démarche qu’il met en place chaque année à la même époque, depuis l’annonce de la fin des cookies tiers. Contacté par mind Media, le groupe réaffirme son ambition de tenir le planning prévu initialement et de faire des tests plus globaux. “L’objectif des tests en 2022 a été de tester les fonctionnalités (par ex.les conceptions de base sont techniquement solides et prêtes pour des tests approfondis). En 2023, les tests s’étendront à des expériences de bout en bout axées sur la compréhension des résultats de l’écosystème et de l’impact réel de la transition des cookies tiers”, indique un porte-parole. Paul Roy CookiesGoogle ChromeIdentifiant unique Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind À lire Seller Defined Audiences est encore en phase d’observation en France Analyses Entretiens Sylvain Le Borgne (MediaMath) : "Les marketplaces représenteront rapidement 50 % des investissements sur notre plateforme" Privacy Sandbox : Google revendique une vingtaine de partenaires de tests pour ses API Privacy Sandbox : Google va lancer les tests pour ses API Fledge, Topics et Attribution reporting Privacy Sandbox sur Android : l'industrie du marketing mobile se veut confiante Privacy sandbox : Google confirme le remplacement de FLoC par Topics essentiels Nos synthèses et chiffres sur les principales thématiques du marché Les mutations du search à l'ère de l'IA générative L'application inaboutie de la loi sur les droits voisins Google vs DOJ : tout ce qu'il faut savoir sur le procès qui pourrait redéfinir l'adtech L’essentiel sur les identifiants publicitaires La transformation du marché publicitaire en 2024 2023 : le marché publicitaire doit se préparer à la fin du tracking utilisateur Comment l’intelligence artificielle générative bouleverse les médias Les enjeux réglementaires des médias en 2023 analyses Les articles d'approfondissement réalisés par la rédaction Adtech : pourquoi la Commission européenne sanctionne Google de près de 3 milliards d’euros Retail media : une consolidation indispensable des régies pour répondre aux attentes des acheteurs publicitaires IA et monétisation des contenus : comment l’IAB Tech Lab veut contrôler les robots crawlers Droits voisins : l’Apig veut introduire une plainte contre Meta devant l'Autorité de la concurrence Paul Boulangé (Starcom France) : "Nous sommes en train de déployer Captiv8 en France, notre solution d'automatisation du marketing d'influence" Claire Léost devient DG de CMA Média, WPP Media promeut Stéphanie Robelus… Comment les SSP généralistes investissent le secteur du retail media Bénédicte Wautelet (Le Figaro) : “Toute solution qui utilise de l’IA en rapport avec nos contenus doit y être autorisée et nous rémunérer” Aides à la presse : combien les éditeurs ont-ils perçu en 2024 ? Le New York Times affiche toujours une croissance très robuste portée par le numérique data Les baromètres, panoramas et chiffres sur l'évolution du marché Le classement des éditeurs français qui ont le plus d'abonnés purs numériques Les données récoltées par les acteurs de la publicité en ligne La liste des sociétés présentes dans les fichiers ads.txt des éditeurs français Les gains de budget des agences médias Opt-out : quels éditeurs français interdisent les robots crawlers de l'IA générative ? Le panorama des sociétés spécialisées dans les technologies de l’e-retail media La liste des outils utilisés par les équipes éditoriales, marketing et techniques des éditeurs français Le détail des aides à la presse, année par année La liste des CMP choisies par les principaux médias en France Digital Ad Trust : quels sites ont été labellisés, pour quelles vagues et sur quel périmètre ?