Accueil > Médias & Audiovisuel > IA générative : l’Apig et le SEPM agissent contre le crawling des bases de données publiques IA générative : l’Apig et le SEPM agissent contre le crawling des bases de données publiques Par Jean-Michel De Marchi. Publié le 01 septembre 2025 à 17h39 - Mis à jour le 02 septembre 2025 à 11h14 Ressources Le SEPM et l’Apig ont annoncé lundi 1er septembre “une action coordonnée” de leurs membres pour faire respecter leurs droits juridiques par les trois principales bases de données publiques mondiales, Common Crawl, C4 et Oscar, dont se servent les outils d’IA générative. “Ces datasets constituent un véritable écosystème de blanchiment d’usages non autorisés, permettant aux fournisseurs de services d’IA générative de contourner la loi en utilisant des données soi-disant libres d’accès”, indiquent les deux associations dans un communiqué. À retenir. L’opt-out signalé par les éditeurs sur leur site est rarement respecté par les LLM. Concrètement, l’initiative repose sur trois axes. D’abord constater la présence de leurs contenus dans ces bases par un huissier spécialisé. Ensuite, demander à ces acteurs le retrait des contenus concernés par des mises en demeure, et le cas échéant amorcer des négociations. Enfin, constituer “un arsenal juridique pour de futures actions (contentieuses).“ Selon nos informations, les éditeurs sont assistés dans leur initiative par le cabinet d’avocats Normand & Associés (Renaud Le Gunehec). Jean-Michel De Marchi IA générativeJuridiqueSites d'actualitéTechnologies Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind À lire Entretiens Paul Boulangé (Starcom France) : "Nous sommes en train de déployer Captiv8 en France, notre solution d'automatisation du marketing d'influence" IA générative : selon le MIT, 95 % des projets n'apportent pas de ROI Entretiens Bénédicte Wautelet (Le Figaro) : “Toute solution qui utilise de l’IA en rapport avec nos contenus doit y être autorisée et nous rémunérer” Perplexity rémunérera les éditeurs en fonction de l'usage qu'il fait des contenus OpenAI utilise les résultats de Google Search dans SearchGPT AI search : Profound lève 35 millions de dollars Analyses Le New York Times affiche toujours une croissance très robuste portée par le numérique Opt-out : quels éditeurs français interdisent les robots crawlers de l'IA générative ? Les mutations du search à l'ère de l'IA générative essentiels Nos synthèses et chiffres sur les principales thématiques du marché Les mutations du search à l'ère de l'IA générative L'application inaboutie de la loi sur les droits voisins Google vs DOJ : tout ce qu'il faut savoir sur le procès qui pourrait redéfinir l'adtech L’essentiel sur les identifiants publicitaires La transformation du marché publicitaire en 2024 2023 : le marché publicitaire doit se préparer à la fin du tracking utilisateur Comment l’intelligence artificielle générative bouleverse les médias Les enjeux réglementaires des médias en 2023 analyses Les articles d'approfondissement réalisés par la rédaction Adtech : pourquoi la Commission européenne sanctionne Google de près de 3 milliards d’euros Retail media : une consolidation indispensable des régies pour répondre aux attentes des acheteurs publicitaires IA et monétisation des contenus : comment l’IAB Tech Lab veut contrôler les robots crawlers Droits voisins : l’Apig veut introduire une plainte contre Meta devant l'Autorité de la concurrence Paul Boulangé (Starcom France) : "Nous sommes en train de déployer Captiv8 en France, notre solution d'automatisation du marketing d'influence" Claire Léost devient DG de CMA Média, WPP Media promeut Stéphanie Robelus… Comment les SSP généralistes investissent le secteur du retail media Bénédicte Wautelet (Le Figaro) : “Toute solution qui utilise de l’IA en rapport avec nos contenus doit y être autorisée et nous rémunérer” Aides à la presse : combien les éditeurs ont-ils perçu en 2024 ? Le New York Times affiche toujours une croissance très robuste portée par le numérique data Les baromètres, panoramas et chiffres sur l'évolution du marché Le classement des éditeurs français qui ont le plus d'abonnés purs numériques Les données récoltées par les acteurs de la publicité en ligne La liste des sociétés présentes dans les fichiers ads.txt des éditeurs français Les gains de budget des agences médias Opt-out : quels éditeurs français interdisent les robots crawlers de l'IA générative ? Le panorama des sociétés spécialisées dans les technologies de l’e-retail media La liste des outils utilisés par les équipes éditoriales, marketing et techniques des éditeurs français Le détail des aides à la presse, année par année La liste des CMP choisies par les principaux médias en France Digital Ad Trust : quels sites ont été labellisés, pour quelles vagues et sur quel périmètre ?