Accueil > Médias & Audiovisuel > IA générative : Google précise à son tour comment bloquer ses crawlers IA générative : Google précise à son tour comment bloquer ses crawlers Comme OpenAI avec ChatGPT, Google propose aux éditeurs de bloquer ses crawlers via leur fichier robots.txt. En parallèle, selon notre décompte du 29 septembre, huit éditeurs ont intégré le TDM Reservation protocol pour communiquer leur politique de réservation de droits sur le contenu. Par Paul Roy et Aymeric Marolleau. Publié le 29 septembre 2023 à 15h42 - Mis à jour le 29 septembre 2023 à 19h23 Ressources Google a présenté jeudi 28 septembre Google Extended, un processus qui permet aux éditeurs de ne pas consentir à l’utilisation de leurs contenus pour entraîner ses dispositifs d’IA générative Bard et Vertex AI. Comme la démarche indiquée par OpenAI pour ChatGPT, cela consiste au blocage des robots crawlers via le fichier robots.txt. Google ne donne pas d’informations quant à l’impact sur le référencement des sites qui refuseraient d’entraîner ses modèles. Selon notre dernier relevé du 29 septembre 2023, TF1 est le seul éditeur français de notre panel de 389 sites à avoir bloqué les robots de Google. Au total, 60 sites (18,2 %) appartenant à 26 éditeurs (16,9 %) bloquent les bots Google-Extended, GPTBot, ChatGPT-User, ou les trois. Huit éditeurs français utilisent le TDM Reservation protocol Robots.txt n’est pas la seule possibilité pour un éditeur de signifier son non-consentement, mais la seule reconnue par les fournisseurs d’AI pour le moment. Le Geste recommande l’utilisation du TDM Reservation protocol pour communiquer sa politique en matière de réservation de droits sur le contenu. Nous avons vérifié vendredi 29 septembre la présence du protocole TDMRep au sein des sites de notre panel. Il ressort que 31 sites (7,7 %) appartenant à huit éditeurs (4 %) (Groupe EBRA, Groupe Les Echos – Le Parisien, Groupe Télégramme, Groupe La Dépêche du Midi, Eurosport, Groupe Centre France, Groupe Figaro, Groupe Amaury) ont ajouté ce protocole dans leur code html, l’en-tête http de leur site ou dans un fichier json dédié, parfois en bloquant également via robots.txt. Interrogé au mois d’août, Laurent Le Meur, CTO d’European Digital Reading Lab, la structure au sein de laquelle a été développé le protocole, soulignait l’enjeu d’adoption pour envisager d’en faire un standard au sens du W3C. Paul Roy et Aymeric Marolleau ConcurrenceDroits voisinsIntelligence artificielle Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind À lire Analyses Confidentiels [Info mind Media] Le Geste appelle l'Etat à intervenir pour réguler le crawling des outils d'IA générative [Info mind Media] IA générative : le Télégramme intègre la norme TDM Reservation protocol ChatGPT utilise désormais les nouveaux contenus publiés sur le web Plus d'une vingtaine d’éditeurs d’information français bloquent le robot crawler de ChatGPT ou Google sur leurs sites essentiels Nos synthèses et chiffres sur les principales thématiques du marché L’essentiel sur les identifiants publicitaires La transformation du marché publicitaire en 2024 2023 : le marché publicitaire doit se préparer à la fin du tracking utilisateur Comment l’intelligence artificielle générative bouleverse les médias Les enjeux réglementaires des médias en 2023 Intégrer la transition écologique dans les performances des médias et de la publicité Les enjeux réglementaires de la publicité en ligne en 2023 2023 : la transformation du marché publicitaire analyses Les articles d'approfondissement réalisés par la rédaction ENQUÊTE - La régie publicitaire du Monde a réduit ses effectifs de 8 % INFO MIND MEDIA - Le CESP va lancer sa certification Retail Data Trust Agence79 officialise la consolidation du budget média numérique de Carrefour Publicis et Omnicom, champions de la croissance au premier semestre 2024 INFO MIND MEDIA - Une levée de fonds d’environ 750 000 euros en vue pour le nouveau média The Big Whale Google reconnu coupable de monopole dans la recherche en ligne : ce qu'il faut retenir 24 lobbys enjoignent Bruxelles d’harmoniser le RGPD Outbrain acquiert Teads sur une valorisation d’1 milliard de dollars : les détails de l’opération Fin des cookies tiers : derrière l’annonce de Google, la méfiance du marché INFO MIND MEDIA - Marketing des abonnements : TBS Group rachète OwnPage data Les baromètres, panoramas et chiffres sur l'évolution du marché IA générative : quels éditeurs français bloquent les robots d’OpenAI et Google, lesquels ont adopté le protocole TDMRep ? Le panorama des sociétés spécialisées dans les technologies de l’e-retail media La liste des outils utilisés par les équipes éditoriales, marketing et techniques des éditeurs français Digital Ad Trust : quels sites ont été labellisés, pour quelles vagues et sur quel périmètre ? Panorama des offres AVOD alternatives Le détail des aides à la presse, année par année Ads.txt : la liste des relations établies entre les éditeurs français et les vendeurs et revendeurs programmatiques Les indicateurs financiers des grands groupes de communication Les levées de fonds des start-up des médias, du marketing et de la culture en France Les principales solutions de paywall dynamique