Accueil > Médias & Audiovisuel > Bénédicte Wautelet (Le Figaro) : “Toute solution qui utilise de l’IA en rapport avec nos contenus doit y être autorisée et nous rémunérer”

Bénédicte Wautelet (Le Figaro) : “Toute solution qui utilise de l’IA en rapport avec nos contenus doit y être autorisée et nous rémunérer”

Les éditeurs de presse français adoptent des stratégies défensives pour faire face à la multiplication des robots qui aspirent leurs contenus. Entre révision de ses conditions générales, mises à jour régulières de son fichier robots.txt et négociations avec les acteurs de l’IA générative, le groupe Figaro cherche à se perfectionner dans la détection des robots crawlers. Pour mind Media, Bénédicte Wautelet, directrice juridique du groupe, revient sur les moyens mis en place.

Par Charlène Salomé. Publié le 27 août 2025 à 17h11 - Mis à jour le 28 août 2025 à 15h12

Ressources

Le fichier robots.txt du Figaro interdit les robots sur une dizaine d’URL spécifiques et plus de 200 sur l’ensemble de son site, dont une vingtaine sont liés à des finalités d’intelligence artificielle… Quelles sont les règles qui entourent ces interdictions ? Comment le groupe choisit-il d’interdire ou non certains robots ?

Nous avons entrepris une démarche de reprise en main de nos contenus, qui s’est mise en place dans le contexte du crawl, c’est-à-dire des activités de collecte de contenus en ligne. Nous nous sommes équipés d’une cellule de pilotage de reprise des contenus afin d’analyser le crawl sur nos sites, dont je suis en charge avec un juriste. Cette cellule est transverse et pluridisciplinaire. Elle dispose d’un prisme à trois têtes : juridique, technique mais aussi commerciale, car nous voulons nouer des relations financières avec les acteurs qui jouent le jeu. On monte en puissance en accélérant nos démarches dans une logique d’assainissement de notre trafic et de chasse aux crawlers non autorisés. On s’est notamment équipé de la solution BotsCorner pour analyser le trafic. On a également revu nos conditions générales et retravaillé notre fichier robots.txt. On priorise toujours la négociation et la conclusion d’un accord, mais si elle n’aboutit pas, on annonce une interdiction d’accès (Le Figaro interdit l’accès à ses contenus notamment pour les bots d’OpenAI – GPTBot, ChatGPT-User et OAI-Search Bot -, mais aussi ceux d’Anthropic – Anthropic AI, Claude Bot et Claude Web -, d’Amazon – Amazon Bot et Meta -, et Query Metasearch, ndlr).

Opt-out : quels éditeurs français interdisent les robots crawlers de l’IA générative ?

Pourquoi avoir choisi BotsCorner ? Comment se passe la collaboration ?

C’est une société française qui est partenaire de nombreux éditeurs français, et qui gravite dans le milieu de la surveillance du crawling depuis longtemps. Elle nous permet d’avoir une vraie visibilité sur ces acteurs du crawling. C’est un vrai partenaire pour protéger les droits d’auteur.

Plusieurs bots d’entraînement sont désignés dans vos fichiers (CCBot, ClaudeBot, GPTBot), mais pas Google-Extended et Applebot-Extended. L’absence de certains bots vaut-elle accord pour la collecte de vos contenus ? Ou illustre-t-elle la difficulté à maintenir ce fichier à jour ?

Ces absences ne valent pas pour accord, comme indiqué dans nos conditions générales, que nous avons modifiées en fin d’année dernière. Elles peuvent s’expliquer par des discussions qui sont encore en cours. Parfois, on est en train de faire des constats, ou ce sont des agents que nous n’avons pas encore identifiés.

Ces fichiers robots.txt ne sont pas toujours consultés par les robots crawlers. Selon une étude de TollBit, le crawl des robots IA passant outre ces interdictions a augmenté de 40 % entre le troisième et le quatrième trimestre 2024. Avez-vous observé que les robots que vous bloquiez explicitement continuaient de crawler vos contenus ?

Une fois bloqués, les robots ne crawlent pas nos contenus directement, mais nous savons qu’il existe des stratégies de contournement. Il existe plusieurs façons de contourner ces mesures. Les robots peuvent, par exemple, passer par d’autres acteurs, qui se sont fait une spécialité de récupérer les contenus pour d’autres en les revendant à des tarifs dérisoires. Il existe des acteurs de toute taille sur le marché, de très petits mais aussi de très grandes entreprises internationales, rendant le traçage difficile et nous contraignant à adapter nos négociations en fonction de nos interlocuteurs, des produits qu’ils proposent et de l’utilisation qu’ils font de nos contenus.

IA, veille, publicité, agrégation de contenus… Quels sont les robots crawlers que les éditeurs français bloquent ou autorisent sur leurs sites ?

Recevez-vous du trafic en provenance des robots que vous bloquez ?

Non. Quand on bloque, on ne reçoit plus de trafic en provenance de ces acteurs.

Le Figaro a-t-il conclu des accords rémunérés avec des acteurs de l’IA afin d’autoriser l’utilisation de ses contenus contre rémunération, à l’instar du Monde avec OpenAI ?

L’IA est partout. Dès lors, toute solution qui utilise de l’IA en rapport avec nos contenus doit y être autorisée et nous rémunérer spécifiquement pour cet usage. Nous avons signé des accords avec des acteurs majeurs qui ont fait le choix de conclure avec nous, en leur octroyant des licences d’utilisation de nos contenus. Ils sont désormais des diffuseurs autorisés de nos contenus. Des accords historiques ont par ailleurs été remodelés pour y intégrer l’IA, comme celui avec l’agrégateur Factiva/ Dow Jones. Nous avons également signé avec de nouveaux acteurs, à l’instar de Meltwater et Signal AI. Nous voulons savoir ce qui est fait de nos contenus et être rémunérés à notre juste valeur.

Robots.txt : notre Tracker

Pour faire valoir leurs droits face aux acteurs de l’intelligence artificielle générative, de nombreux éditeurs français ont choisi de leur signifier leur refus d’accès ou de préciser leur position via le TDM Reservation Protocol. Dans un tracker dédié, mind Media surveille quotidiennement les fichiers robots.txt de plusieurs centaines de sites d’environ 150 éditeurs français majeurs. Consultez les choix de chacun d’eux dans notre rubrique Data.

Charlène Salomé