Accueil > Médias & Audiovisuel > Laurent Hué (Sipa Ouest-France) : “Nous avons un peu plus d’une centaine de cas d’usage de l’IA générative au sein du groupe” Laurent Hué (Sipa Ouest-France) : “Nous avons un peu plus d’une centaine de cas d’usage de l’IA générative au sein du groupe” Avec plus d’une centaine de proof-of-concept (POC) liés à l’IA, le groupe Sipa Ouest-France figure parmi les acteurs les plus avancés sur ces sujets au sein des grands médias français. Laurent Hué, cofondateur et dirigeant de la filiale Saooti (création et hébergement de podcasts et web radio) et coordinateur Intelligence Artificielle pour le groupe, détaille la stratégie et la vision déployée actuellement au siège et au sein des filiales. Par Benoît Zante. Publié le 12 décembre 2024 à 9h58 - Mis à jour le 12 décembre 2024 à 16h49 Ressources Quelles sont les grandes lignes de la stratégie de Sipa Ouest-France en matière d’intelligence artificielle ? Laurent Hué. Elle recoupe de nombreux aspects, en amont comme en aval. En amont, il y a un premier sujet d’architecture technique et de compréhension des impacts techniques de l’IA, avec des réponses à mettre en place au niveau du groupe. Il y a ensuite une dimension importante d’acculturation, de formation et d’accompagnement de l’ensemble des salariés. L’ambition est de faire en sorte que les 5 500 collaborateurs du groupe soient mieux informés que la moyenne des gens sur l’IA, afin que chacun comprenne ce que la technologie permet et ne permet pas, et pourquoi elle représente un enjeu stratégique pour le groupe. Il y a ensuite un troisième volet, qui tourne autour des POC [proof of concept, soit des projets de démonstration de faisabilité – ndlr], qui sont chez nous toujours liés à des usages et pilotés par les métiers. Puis, en aval, il y a la bascule de ces POC dans l’opérationnel et le déploiement à l’échelle, cas d’usage par cas d’usage, après le passage par le filtre d’un comité. Il y en a un par filiale, puisque 20 Minutes n’a pas les mêmes enjeux que Ouest-France, Medialex ou Additi Média. Ce ne sont souvent pas les mêmes cultures, ni les mêmes métiers. IA, veille, publicité, agrégation de contenus… Quels sont les robots crawlers que les éditeurs français bloquent ou autorisent sur leurs sites ? Pour l’instant, seuls quelques POC sont industrialisés, mais nous avons commencé cette phase il y a peu de temps. La phase opérationnelle débute juste, et c’est beaucoup plus lent que de lancer des POC ! L’idée, c’est de ne surtout pas traiter l’IA comme un grand tout, mais d’aborder le sujet au cas par cas et d’impliquer tous les acteurs concernés, les métiers, les instances représentatives du personnel, les RH, le juridique… Comment s’organise la gouvernance de ces sujets, entre le groupe et ses filiales ? Certaines filiales, par exemple Ouest-France, ont monté un comité ad hoc, en allant chercher un représentant éthique – Philippe Boissonnat, en l’occurrence -, un représentant RH, un représentant juridique, etc. Dans d’autres filiales, comme Groupe actu (ex-Publihebdos) ou Additi Média, c’est dans la structure managériale que se prennent les décisions, au niveau de la direction générale. On fait venir les porteurs de projets afin qu’ils expliquent au comité comment le POC s’est déroulé, ses limites, leurs interrogations, le temps gagné, etc. Ensuite le comité donne ou non son accord pour déployer plus largement, en listant les points à corriger éventuellement. Les accords entre médias et fournisseurs d’IA générative peuvent violer le RGPD, selon la Cnil italienne En revanche, l’architecture et les choix techniques restent communs à l’ensemble du groupe. C’est un sujet que nous avons vraiment mutualisé, avec un comité de pilotage qui regroupe les patrons des DSI de toutes les structures. Cela nous permet d’aligner tout le monde sur des choix techniques, en utilisant des briques communes. Il y a donc des co-développements et des développements mutualisés, notamment pour éviter les doublons entre les POC. Le but, c’est de jouer au maximum les synergies au sein du groupe. Justement, quels sont vos choix techniques ? Nous avons choisi de faire tourner certains de nos modèles en interne, sur nos propres GPU : nous utilisons alors des modèles open source comme LLama et Mistral. Concrètement, pour chaque cas d’usage, on se demande quel est le modèle d’IA le plus efficace, tout en étant économique pour la planète, c’est-à-dire le plus petit possible. De fait, la qualité du résultat dépend moins de la taille du modèle que de la qualité de la data qu’on injecte dans la requête. Ainsi, chaque cas d’usage est abordé en choisissant la data avec soin. Candidatures TNT : L’Express, CMI France et Ouest-France veulent transformer leurs modèles Le groupe a aussi signé un contrat avec Microsoft Azure pour utiliser les modèles d’OpenAI, que nous considérons comme étant parmi les meilleurs au monde. L’avantage de ce contrat est d’avoir des garanties sur ce qui est fait de nos données. Car certes, nous considérons que l’IA est fantastique, mais sans la data, elle n’est pas grand-chose. Et notre data, nous tenons à la conserver chez nous ! Nous avons donc fait le choix très clair de ne pas l’exporter chez Microsoft pour la vectoriser dans leurs serveurs, mais plutôt d’utiliser leurs modèles couplés avec certains morceaux choisis de notre data, en fonction des besoins. Quels sont les outils IA que vous déployez au niveau du groupe ? Chez Sipa Ouest-France, nous avons 100 millions d’articles, d’images, de vidéos et de podcasts au sein de notre banque de contenus, qui est mise à jour tous les jours en temps réel. Tout cela est entièrement hébergé chez nous. Pour “fouiller” nos données ou celles de nos partenaires (pour les données sportives en temps réel, notamment), nous avons développé nos propres outils de RAG [pour “Retrieval-augmented generation” ou “génération augmentée de récupération” en français]. Comment Prisma Media teste un chatbot alimenté par l’IA générative sur son site Ça m’intéresse Nous avons aussi développé Muse, un portail qui regroupe des robots spécialisés. Un robot étant un couplage entre un modèle d’IA et de la data. Chaque robot a un prénom – Salvador pour la génération d’images, ou Greg pour les sports, par exemple. Muse permet également de partager des prompts entre collaborateurs et de constituer des librairies de prompts. Nous allons bientôt permettre aux utilisateurs de créer leurs propres modèles, avec leurs propres documents. Et au niveau des filiales, quels sont les cas d’usage les plus convaincants de l’IA générative ? Nous avons un peu plus d’une centaine de cas d’usage. Par exemple, nous avons une solution d’IA qui nous permet de proposer des mots-clés à associer à un article – rien que chez Ouest-France, il y en a 12 000 possibles -, que le journaliste doit ensuite confirmer et hiérarchiser. Pour cela, nous utilisons un petit modèle d’IA en open source, qui tourne sur nos propres GPU. Ouest-France et 20 Minutes utilisent un modèle qui permet de générer des résumés d’articles en 3-4 puces, que les journalistes relisent et corrigent, puisqu’il peut y avoir des contresens ou des choses mal formulées. Un autre exemple : Additi a développé une solution basée sur de l’IA qui permet de générer des publicités à partir d’un brief créatif. L’outil aide à créer une image, à faire un slogan, un intitulé, etc. Cela permet de construire une première base de départ à partir de laquelle travailler. Toujours chez Additi, nous utilisons un outil d’IA pour vérifier qu’une publicité est conforme aux chartes de déontologie publicitaire. Le principe est assez simple, puisqu’il suffit de prendre l’image de la publicité et de la rentrer dans notre modèle qui s’appuie sur GPT Vision pour décrire de façon exhaustive la publicité. Cette description est ensuite confrontée à un autre modèle que nous avons spécialisé en l’entraînant sur les règles publicitaires. Nous avons aussi un modèle qui simule un client, pour permettre aux commerciaux de s’entraîner, et un autre qui permet de renforcer les mails envoyés aux clients. Comment le média allemand Express.de utilise l’IA pour automatiser la rédaction de ses articles Nos centres d’appels ont aussi un modèle d’IA couplé avec nos FAQ sur les règles relatives à nos offres d’abonnement : quand vous appelez un téléconseiller pour avoir des informations sur nos offres, celui-ci peut saisir la question dans le modèle et obtenir des réponses très précises. Comment tous ces cas d’usage ont été identifiés et priorisés ? Lorsqu’on organise une session d’acculturation, on le fait avec toute une équipe et à la fin de la journée, les idées remontent assez naturellement. Une partie d’après-midi est même consacrée à des travaux pratiques où les collaborateurs peuvent expérimenter avec notre solution de chatbots internes. Pour ces formations, on regroupe les collaborateurs par métier dans des petits groupes d’une dizaine de personnes, ou on croise certains métiers. Tout le monde échange et ça génère pas mal d’idées. On les trie alors selon trois critères : bénéfices, coûts, risques. Et on développe en priorité tout ce qui représente un gros bénéfice, un petit coût et pas de risque ! Il y a aussi des sujets pour lesquels il n’y a tout simplement pas besoin d’IA, car on peut tout à fait les traiter avec des outils déterministes. Mais globalement, à l’issue d’une journée de formation, tout le monde comprend très bien ce qu’il est possible de faire ou non avec l’IA. Comment gérez-vous les inquiétudes des syndicats concernant l’utilisation de l’IA ? Dès le départ, les DG et les directions ont fixé une règle : être totalement transparents en interne sur ce qu’on faisait, sur ce qui marche, ce qui ne marche pas, combien ça coûte, etc. Les élus ont été formés, les CSE sont régulièrement tenus au courant du sujet. On a vraiment mis en place un dialogue maximal. Donc chez nous ça se passe en bonne intelligence, sans jeu de mots. IA générative : comment les rédactions françaises amorcent les premiers usages éditoriaux C’est important, parce que l’intelligence artificielle touche à des choses très sensibles, elle peut changer le geste métier. Ce n’est pas évident, parce qu’on aborde rapidement des peurs individuelles et des visions sur ce qu’est le métier… Mais un journaliste qui ne se forme pas à l’IA aujourd’hui ou dans les 18 mois aura un problème d’employabilité. C’est pour cela que l’acculturation est fondamentale. Un autre point important, c’est aussi une conviction portée par François-Xavier Lefranc, le président du directoire de Ouest-France, et les autres directeurs généraux et responsables de publications du groupe : il n’y a pas assez de journalistes sur la planète, alors qu’on n’en a jamais eu autant besoin. Le temps que nous allons gagner grâce à l’IA va nous permettre de mieux faire notre métier, en faisant plus rapidement et plus efficacement un certain nombre d’actions qui ne sont pas à forte valeur ajoutée, et, à l’inverse, en allant davantage sur le terrain ou en faisant des enquêtes qui n’étaient pas possibles avant. L’objectif, c’est finalement de vraiment se concentrer sur notre cœur de métier et de gagner du temps. Benoît Zante IA générativeInformation localeInnovationsIntelligence artificielle Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind À lire Mouvements Fabrice Bakhouche nommé directeur général de Sipa-Ouest-France Analyses Confidentiels INFO MIND MEDIA - Technologies publicitaires : Google attaqué en justice par une dizaine de médias français Analyses Dossiers IA générative : comment les rédactions françaises amorcent les premiers usages éditoriaux Analyses Confidentiels [Info mind Media] IA générative : premiers accords technologiques entre Microsoft et des médias français Analyses 2024, année charnière pour 20 Minutes François-Xavier Lefranc nommé président de Ouest-France, Fabrice Bazard directeur général Confidentiels Ouest-France, 20 Minutes et Actu.fr lancent une alliance data avec la DMP/CDP de mediarithmics Additi (Sipa Ouest-France) développe une offre de marketing multi-local avec la plateforme Deepreach Le groupe Sipa - Ouest France lance France Live, un agrégateur de contenus d’actualités essentiels Nos synthèses et chiffres sur les principales thématiques du marché Les mutations du search à l'ère de l'IA générative L'application inaboutie de la loi sur les droits voisins Google vs DOJ : tout ce qu'il faut savoir sur le procès qui pourrait redéfinir l'adtech L’essentiel sur les identifiants publicitaires La transformation du marché publicitaire en 2024 2023 : le marché publicitaire doit se préparer à la fin du tracking utilisateur Comment l’intelligence artificielle générative bouleverse les médias Les enjeux réglementaires des médias en 2023 analyses Les articles d'approfondissement réalisés par la rédaction Adtech : les réactions et analyses du secteur à la condamnation de Google par la Commission européenne Hélène Zemmour (TV5Monde) : “TV5MondePlus va devenir notre plateforme unique de streaming vidéo” Pseudonymisation : comment la décision de la CJUE dans l’affaire CRU/CEPD impacte l'industrie de l'adtech AI search : quels changements dans les stratégies de référencement ? Adtech : pourquoi la Commission européenne sanctionne Google de près de 3 milliards d’euros Retail media : une consolidation indispensable des régies pour répondre aux attentes des acheteurs publicitaires IA et monétisation des contenus : comment l’IAB Tech Lab veut contrôler les robots crawlers Droits voisins : l’Apig veut introduire une plainte contre Meta devant l'Autorité de la concurrence Paul Boulangé (Starcom France) : "Nous sommes en train de déployer Captiv8 en France, notre solution d'automatisation du marketing d'influence" Claire Léost devient DG de CMA Média, WPP Media promeut Stéphanie Robelus… data Les baromètres, panoramas et chiffres sur l'évolution du marché Le classement des éditeurs français qui ont le plus d'abonnés purs numériques Les données récoltées par les acteurs de la publicité en ligne La liste des sociétés présentes dans les fichiers ads.txt des éditeurs français Les gains de budget des agences médias Opt-out : quels éditeurs français interdisent les robots crawlers de l'IA générative ? Le panorama des sociétés spécialisées dans les technologies de l’e-retail media La liste des outils utilisés par les équipes éditoriales, marketing et techniques des éditeurs français Le détail des aides à la presse, année par année La liste des CMP choisies par les principaux médias en France Digital Ad Trust : quels sites ont été labellisés, pour quelles vagues et sur quel périmètre ?