• Contenus gratuits
  • Notre offre
Menu
  • Ressources
    • Toutes les ressources
  • Infos
    • Toutes les infos
  • Essentiels
    • Tous les essentiels
  • Analyses
    • Toutes les analyses
  • Data
    • Data
  • Newsletters
  • Profil
    • Je teste 15 jours
    • Je me connecte
  • Profil
    • Mon profil
    • Je me déconnecte
CLOSE

Accueil > Médias & Audiovisuel > Le New York Times peine à rassembler des preuves contre OpenAI

Le New York Times peine à rassembler des preuves contre OpenAI

La procédure engagée par le New York Times contre OpenAI pour violation du droit d'auteur dans le cadre de l'entraînement de ses modèles d'IA générative, est semée d'embuches, techniques mais aussi juridiques. Une première décision judiciaire rendue dans une autre affaire pourrait avoir un impact sur l'issue du dossier.

Par Raphaële Karayan. Publié le 13 novembre 2024 à 17h48 - Mis à jour le 15 novembre 2024 à 18h45
  • Ressources

Après trois semaines d’examen des données d’entraînement des modèles GPT, dans le cadre de la plainte qui l’oppose à OpenAI et Microsoft qu’il accuse d’avoir utilisé des contenus protégés par le droit d’auteur, le New York Times déplore des “obstacles” techniques et des “obstructions” l’empêchant de mener correctement à bien ses recherches. Il a demandé au juge le 1er novembre d’ordonner qu’OpenAI fournisse lui-même ces informations. Les plaignants affirment avoir déjà découvert “des millions” de contenus leur appartenant. OpenAI, de son côté, déclare avoir mis à disposition le hardware et le software nécessaires pour explorer ces “centaines de terabytes de données”, mais regrette des “centaines de requêtes non pertinentes” de la part des éditeurs, qui ont retardé le processus.

La publication des résultats du New York Times, le 4 novembre, a révélé que l’éditeur du quotidien américain avait déjà dépensé 7,6 millions de dollars depuis neuf mois pour sa procédure judiciaire contre OpenAI et Microsoft.

Une première victoire en justice pour OpenAI

Selon une étude de Ziff Davis relayée par Axios, les LLM s’appuient 5 à 100 fois plus sur le contenu des éditeurs premium que sur le reste du web pour entraîner leurs modèles.

Mais la démonstration du préjudice, condition sine qua non pour convaincre un juge, sera difficile à réaliser pour les éditeurs. Contrairement à un plagiat, les réponses apportées par les IA génératives sont des synthèses qui réarrangent un agrégat d’informations utilisées pendant la phase d’entraînement. Récemment, un tribunal de New York a rejeté la plainte de Raw Story Media et AlterNet Media contre OpenAI, au motif que le préjudice direct ne pouvait pas être identifié. Les deux éditeurs s’appuyaient sur une disposition du Digital millenium copyright act, qui empêche de supprimer ou d’altérer les moyens d’identification de l’auteur d’une oeuvre (nom, titre, métadonnées…) sans autorisation. Cette décision pourrait faire jurisprudence, explique VentureBeat. 

Raphaële Karayan
  • Etats-Unis
  • IA générative
  • Juridique
  • OpenAI

Besoin d’informations complémentaires ?

Contactez Mind Research

le service d’études à la demande de mind

À lire

Le New York Times voit ses revenus publicitaires papier baisser de 12 % en un an

IA générative : Microsoft amorce la rétribution de certains médias aux États-Unis et au Royaume-Uni 

Entretiens

Joëlle Toledano (CNNum) : "Si on procède avec l'IA générative de la même manière que pour les droits voisins, on repartira sur le même scénario, en pire"   

Le New York Times développe son propre outil de ciblage basé sur l'IA générative

Le New York Times attaque en justice OpenAI et Microsoft

OpenAI déploie ChatGPT Search

OpenAI : au Danemark, les médias sollicitent une médiation auprès du ministre de la Culture

OpenAI a ouvert une filiale en France

essentiels

Nos synthèses et chiffres sur les principales thématiques du marché

Les mutations du search à l'ère de l'IA générative

L'application inaboutie de la loi sur les droits voisins

Google vs DOJ : tout ce qu'il faut savoir sur le procès qui pourrait redéfinir l'adtech

L’essentiel sur les identifiants publicitaires 

La transformation du marché publicitaire en 2024

2023 : le marché publicitaire doit se préparer à la fin du tracking utilisateur

Comment l’intelligence artificielle générative bouleverse les médias

Les enjeux réglementaires des médias en 2023

analyses

Les articles d'approfondissement réalisés par la rédaction

Adtech : pourquoi la Commission européenne sanctionne Google de près de 3 milliards d’euros 

Retail media : une consolidation indispensable des régies pour répondre aux attentes des acheteurs publicitaires 

IA et monétisation des contenus : comment l’IAB Tech Lab veut contrôler les robots crawlers 

Droits voisins : l’Apig veut introduire une plainte contre Meta devant l'Autorité de la concurrence 

Paul Boulangé (Starcom France) : "Nous sommes en train de déployer Captiv8 en France, notre solution d'automatisation du marketing d'influence"

Claire Léost devient DG de CMA Média, WPP Media promeut Stéphanie Robelus…

Comment les SSP généralistes investissent le secteur du retail media

Bénédicte Wautelet (Le Figaro) : “Toute solution qui utilise de l’IA en rapport avec nos contenus doit y être autorisée et nous rémunérer”

Aides à la presse : combien les éditeurs ont-ils perçu en 2024 ? 

Le New York Times affiche toujours une croissance très robuste portée par le numérique 

data

Les baromètres, panoramas et chiffres sur l'évolution du marché

Le classement des éditeurs français qui ont le plus d'abonnés purs numériques

Les données récoltées par les acteurs de la publicité en ligne

La liste des sociétés présentes dans les fichiers ads.txt des éditeurs français

Les gains de budget des agences médias

Opt-out : quels éditeurs français interdisent les robots crawlers de l'IA générative ?

Le panorama des sociétés spécialisées dans les technologies de l’e-retail media

La liste des outils utilisés par les équipes éditoriales, marketing et techniques des éditeurs français

Le détail des aides à la presse, année par année

La liste des CMP choisies par les principaux médias en France

Digital Ad Trust : quels sites ont été labellisés, pour quelles vagues et sur quel périmètre ?

Découvrez nos contenus gratuitement et sans engagement pendant 15 jours J'en profite
  • Le groupe mind
  • Nos activités
  • Notre histoire
  • Notre équipe
  • Nos clients
  • Nos services
  • mind Media
  • mind Fintech
  • mind Health
  • mind Rh
  • mind Retail
  • mind Research
  • Les clubs
  • mind et vous
  • Présentation
  • Nous contacter
  • Vous abonner
  • A savoir
  • Mentions légales
  • CGU
  • CGV
  • CGV publicité
  • Politique des cookies
Tous droits réservés - Frontline MEDIA 2025
Social Media Auto Publish Powered By : XYZScripts.com
  • Twitter
  • LinkedIn
  • Email