• Contenus gratuits
  • Notre offre
Menu
  • Ressources
    • Toutes les ressources
  • Infos
    • Toutes les infos
  • Essentiels
    • Tous les essentiels
  • Analyses
    • Toutes les analyses
  • Data
    • Data
  • Newsletters
  • Profil
    • Je teste 15 jours
    • Je me connecte
  • Profil
    • Mon profil
    • Je me déconnecte
CLOSE

Accueil > Médias & Audiovisuel > IA générative : Google précise à son tour comment bloquer ses crawlers 

IA générative : Google précise à son tour comment bloquer ses crawlers 

Comme OpenAI avec ChatGPT, Google propose aux éditeurs de bloquer ses crawlers via leur fichier robots.txt. En parallèle, selon notre décompte du 29 septembre, huit éditeurs ont intégré le TDM Reservation protocol pour communiquer leur politique de réservation de droits sur le contenu.

Par Paul Roy et Aymeric Marolleau. Publié le 29 septembre 2023 à 15h42 - Mis à jour le 29 septembre 2023 à 19h23
  • Ressources

Google a présenté jeudi 28 septembre Google Extended, un processus qui permet aux éditeurs de ne pas consentir à l’utilisation de leurs contenus pour entraîner ses dispositifs d’IA générative Bard et Vertex AI. Comme la démarche indiquée par OpenAI pour ChatGPT, cela consiste au blocage des robots crawlers via le fichier robots.txt. Google ne donne pas d’informations quant à l’impact sur le référencement des sites qui refuseraient d’entraîner ses modèles. 

Selon notre dernier relevé du 29 septembre 2023, TF1 est le seul éditeur français de notre panel de 389 sites à avoir bloqué les robots de Google. Au total, 60 sites (18,2 %) appartenant à 26 éditeurs (16,9 %) bloquent les bots Google-Extended, GPTBot, ChatGPT-User, ou les trois. 

Huit éditeurs français utilisent le TDM Reservation protocol 

Robots.txt n’est pas la seule possibilité pour un éditeur de signifier son non-consentement, mais la seule reconnue par les fournisseurs d’AI pour le moment. Le Geste recommande l’utilisation du TDM Reservation protocol pour communiquer sa politique en matière de réservation de droits sur le contenu.

Nous avons vérifié vendredi 29 septembre la présence du protocole TDMRep au sein des sites de notre panel. Il ressort que 31 sites (7,7 %) appartenant à huit éditeurs (4 %) (Groupe EBRA, Groupe Les Echos – Le Parisien, Groupe Télégramme, Groupe La Dépêche du Midi, Eurosport, Groupe Centre France, Groupe Figaro, Groupe Amaury) ont ajouté ce protocole dans leur code html, l’en-tête http de leur site ou dans un fichier json dédié, parfois en bloquant également via robots.txt. Interrogé au mois d’août, Laurent Le Meur, CTO d’European Digital Reading Lab, la structure au sein de laquelle a été développé le protocole, soulignait l’enjeu d’adoption pour envisager d’en faire un standard au sens du W3C.

Paul Roy et Aymeric Marolleau
  • Concurrence
  • Droits voisins
  • Intelligence artificielle

Besoin d’informations complémentaires ?

Contactez Mind Research

le service d’études à la demande de mind

À lire

Analyses Confidentiels

[Info mind Media] Le Geste appelle l'Etat à intervenir pour réguler le crawling des outils d'IA générative

[Info mind Media] IA générative : le Télégramme intègre la norme TDM Reservation protocol

ChatGPT utilise désormais les nouveaux contenus publiés sur le web

Plus d'une vingtaine d’éditeurs d’information français bloquent le robot crawler de ChatGPT ou Google sur leurs sites

essentiels

Nos synthèses et chiffres sur les principales thématiques du marché

Les mutations du search à l'ère de l'IA générative

L'application inaboutie de la loi sur les droits voisins

Google vs DOJ : tout ce qu'il faut savoir sur le procès qui pourrait redéfinir l'adtech

L’essentiel sur les identifiants publicitaires 

La transformation du marché publicitaire en 2024

2023 : le marché publicitaire doit se préparer à la fin du tracking utilisateur

Comment l’intelligence artificielle générative bouleverse les médias

Les enjeux réglementaires des médias en 2023

analyses

Les articles d'approfondissement réalisés par la rédaction

Adtech : pourquoi la Commission européenne sanctionne Google de près de 3 milliards d’euros 

Retail media : une consolidation indispensable des régies pour répondre aux attentes des acheteurs publicitaires 

IA et monétisation des contenus : comment l’IAB Tech Lab veut contrôler les robots crawlers 

Droits voisins : l’Apig veut introduire une plainte contre Meta devant l'Autorité de la concurrence 

Paul Boulangé (Starcom France) : "Nous sommes en train de déployer Captiv8 en France, notre solution d'automatisation du marketing d'influence"

Claire Léost devient DG de CMA Média, WPP Media promeut Stéphanie Robelus…

Comment les SSP généralistes investissent le secteur du retail media

Bénédicte Wautelet (Le Figaro) : “Toute solution qui utilise de l’IA en rapport avec nos contenus doit y être autorisée et nous rémunérer”

Aides à la presse : combien les éditeurs ont-ils perçu en 2024 ? 

Le New York Times affiche toujours une croissance très robuste portée par le numérique 

data

Les baromètres, panoramas et chiffres sur l'évolution du marché

Le classement des éditeurs français qui ont le plus d'abonnés purs numériques

Les données récoltées par les acteurs de la publicité en ligne

La liste des sociétés présentes dans les fichiers ads.txt des éditeurs français

Les gains de budget des agences médias

Opt-out : quels éditeurs français interdisent les robots crawlers de l'IA générative ?

Le panorama des sociétés spécialisées dans les technologies de l’e-retail media

La liste des outils utilisés par les équipes éditoriales, marketing et techniques des éditeurs français

Le détail des aides à la presse, année par année

La liste des CMP choisies par les principaux médias en France

Digital Ad Trust : quels sites ont été labellisés, pour quelles vagues et sur quel périmètre ?

Découvrez nos contenus gratuitement et sans engagement pendant 15 jours J'en profite
  • Le groupe mind
  • Nos activités
  • Notre histoire
  • Notre équipe
  • Nos clients
  • Nos services
  • mind Media
  • mind Fintech
  • mind Health
  • mind Rh
  • mind Retail
  • mind Research
  • Les clubs
  • mind et vous
  • Présentation
  • Nous contacter
  • Vous abonner
  • A savoir
  • Mentions légales
  • CGU
  • CGV
  • CGV publicité
  • Politique des cookies
Tous droits réservés - Frontline MEDIA 2025
Social Media Auto Publish Powered By : XYZScripts.com
  • Twitter
  • LinkedIn
  • Email