-
Google France
Publicité, Technologies
Pour entraîner leurs grands modèles de langage (LLM), les fournisseurs d’outils d’intelligence artificielle générative ont besoin de collecter des contenus du web, notamment des articles d’information. Selon une étude publiée en 2021, la moitié du top 20 des sources du corpus anglais de Common Crawl, sur lequel se sont appuyés Open AI et Google, est composée de sites de presse – New York Times, LA Times, Forbes, HuffPost, etc. Les éditeurs s’en inquiètent et font valoir leurs droits,...