Accueil > Médias & Audiovisuel > Text-to-speech (2/2) : les éditeurs d’informations dressent un premier bilan satisfaisant Text-to-speech (2/2) : les éditeurs d’informations dressent un premier bilan satisfaisant De plus en plus de sites d'actualités proposent la lecture audio automatisée de leurs articles en s'appuyant sur le player de sociétés spécialisées. Les chiffres d'usages sont encore modestes, mais les progrès techniques réguliers, le faible coût des solutions, l'audio embarqué dans les véhicules, voire, pour certains acteurs, leur potentiel publicitaire ouvrent des perspectives. Par Jean-Michel De Marchi. Publié le 15 juillet 2023 à 11h29 - Mis à jour le 15 juillet 2023 à 11h29 Ressources Les progrès depuis deux ans dans le rendu des synthèses vocales alimentées par l’intelligence artificielle ont déjà convaincu une quinzaine de groupes médias français. Prisma Media, Le Monde, Le Point, Le Figaro, 20 Minutes, Sud Ouest, La Dépêche du Midi, mais aussi L’Express, Challenges, La Tribune, Brief.me, Numerama… depuis deux ans, de plus en plus de groupes installent sur leurs sites et/ou leur application une solution de text-to-speech. Soit une trentaine de sites d’informations. Ces synthèses vocales, des technologies de transformation de mots ou d’expressions en audio en imitant la voix humaine, sont développées et commercialisées par les grandes plateformes ; essentiellement Microsoft, mais aussi Amazon et Google, et d’autres fournisseurs spécialisés. Leur qualité est satisfaisante mais pas suffisante pour qu’elles soient intégrées telles quelles. Pour déployer ce nouveau service, les éditeurs s’appuient donc sur des sociétés audio spécialisées – en France, Odia, ETX Studio, Audion, Podle, et plus marginalement Global Player : ils entraînent et enrichissent les synthèses vocales pour parvenir à un rendu audio suffisamment qualitatif pour correspondre aux attentes des éditeurs – et de leurs lecteurs. Seul Le Monde a déployé son dispositif directement à partir de la suite audio de Microsoft. Text-to-speech (1/2) : enjeux techniques et panorama des outils pour les médias français Des stratégies opportunistes sur les usages audio Pour les éditeurs de presse, le text-to-speech est un outil idéal pour proposer un nouveau service au lecteur et s’inscrire dans les usages audio, notamment en mobilité. L’objectif est de développer les usages et la visibilité de ce nouveau service, en pariant sur une utilisation plus massive dans les années qui viennent et, parfois, leur monétisation publicitaire. Pour un coût modeste, équivalent à quelques milliers d’euros par mois seulement quand la société prestataire a fait un effort commercial pour signer avec un éditeur comme référence client, un peu plus dans le cas contraire. Les sociétés proposant ces solutions se placent dans l’immédiat dans une optique d’évangélisation du secteur et de visibilité. Elles proposent souvent des tarifs attractifs pour convaincre les éditeurs, traditionnellement réticents dès qu’il s’agit d’engager des coûts importants sans perspectives de rentabilité, afin de déployer leurs dispositifs sur un maximum de sites. “L’objectif est triple : proposer une nouvelle expérience à nos internautes, s’inscrire dans notre stratégie multimédia et exploiter de nouveaux dispositifs publicitaires” Bertrand Gié (Le Figaro) C’est d’ailleurs cette problématique de la rentabilité qui a conduit L’Express a changé de stratégie audio en juin, en passant d’une lecture humaine à une solution automatisée. En 2019, le titre avait d’abord opté pour l’écoute en ligne de la totalité des articles issus de son magazine hebdomadaire via leur lecture vocale par des comédiens. “Le dispositif de lecture humaine a amélioré notre notoriété et notre image, mais les usages n’étaient pas satisfaisants. L’utilisation était concentrée sur une petite population de lecteurs déjà abonnés et sur application”, explique Diane Lemoine, directrice générale déléguée de L’Express. Le taux de lecture audio avoisinait 0,15 % des visites totales et 1 % des visiteurs. Le dispositif, qui coûtait plusieurs centaines de milliers d’euros par an, s’est vite heurté à une réalité budgétaire. S’y ajoutait une difficulté organisationnelle liée à la chronologie des articles textes et audio. L’offre audio a donc été revue à la baisse avec seulement six articles lus par des comédiens, avant d’être stoppée définitivement il y a quelques semaines, dans la première quinzaine de juin 2023. Le service a été remplacé par l’outil de text-to-speech ETX Studio, pour quelques milliers d’euros par mois. [Info mind Media] Le Monde étend son dispositif de text-to-speech à son application “L’outil a été très simple à intégrer dans notre CMS (Arc Publishing, ndlr), le rendu audio est bon. Nous allons développer l’usage et nous y déploierons des publicités dans un deuxième temps. Les premiers chiffres sont satisfaisants, en particulier dans l’application”, affirme Diane Lemoine. Un mois après la mise en place de l’outil automatisé, L’Express indique que 8 % des abonnés ayant utilisé l’application ont activé le player audio au moins une fois, contre 3,5 % en moyenne lors de la lecture humaine déployée sur six articles. Souvent moins de 1 % de taux de clic Le Figaro a un peu plus de recul, ayant installé sa solution – lui aussi celle d’ETX Studio – au printemps 2022. Le titre, qui a lancé il y a quelques mois une chaine TV locale et une offre radio, se veut ambitieux. “L’objectif est triple : proposer une nouvelle expérience à nos internautes, s’inscrire dans notre stratégie de développement multimédia associant texte, TV/vidéo et audio, et enfin exploiter de nouveaux dispositifs publicitaires”, explique Bertrand Gié, directeur du pôle News du Figaro. Le Figaro mentionne entre 0,7 et 0,9 % de taux de clic sur le player audio selon les articles, des chiffres stables depuis le lancement du service il y a 16 mois, en mars 2022, avec 70 à 80 % de taux de complétion. “Cette stabilité des usages a plutôt tendance à nous conforter, cela montre une appétence des utilisateurs dans la durée”, estime Bertrand Gié. Les chiffres sont similaires chez les autres éditeurs. Pour sa part, Le Monde a déployé en octobre 2022 sa fonctionnalité de text-to-speech au sein de son application La Matinale, et ce sans passer par une société intermédiaire. Elle repose sur l’infrastructure technique de Microsoft Azur. Le service est disponible sur son application mobile principale depuis avril 2023. L’objectif affiché par le titre : diversifier ses services, engager et fidéliser ses lecteurs. Sur ce dispositif, “nous sommes particulièrement attentifs à l’engagement et la rétention des abonnés”, nous indiquait au printemps Lou Grasser, directrice produit du Monde. Elle en dressait un bilan positif : entre le 10 octobre et mi-avril, le service a totalisé 1,2 million d’écoutes et il a été activé au moins une fois par 56 000 personnes. Sur la même période, une fois le player lancé, le taux de complétion avoisine 70 % et la durée moyenne de cession est passée de 13 à 14 minutes par jour (+ 5 %, ndlr)”. Enfin le volume de VU mensuels a progressé de 17 % sur la décembre-janvier par rapport à septembre-octobre, selon des chiffres internes au Monde. L’usage du text-to-speech est-il cantonné aux médias généralistes ? Pour Satellifacts, lettre professionnelle sur l’audiovisuel par abonnement, qui utilise l’outil de Podle pour environ un demi-millier d’euros par mois, les usages sont anecdotiques. “Mais je n’en attendais pas un usage important, confie Joël Wirsztel, fondateur et président de Satellifacts. Cela a été très simple à installer, le service client répond très vite et le résultat audio est satisfaisant, même s’il y a un travail d’enrichissement à faire de la base de données de mots qui peut être fastidieux si on veut améliorer le rendu. Pour nous, l’intérêt de proposer cet outil correspond d’abord à une question d’image de marque auprès de nos abonnés et du secteur.” Imaginer de nouveaux produits Les chiffres d’usages semblent modestes, mais les éditeurs interrogés autant que leurs prestataires insistent sur les prémices des usages audio appliqués à la presse et la nécessité d’évangéliser les internautes. Les promesses sont multiples : offrir un nouveau format éditorial pour fidéliser et/ou conquérir des audiences, se positionner sur l’innovation marketing et développer de nouveaux inventaires publicitaires. Le Figaro déclare d’ailleurs générer déjà quelques centaines de milliers d’euros annuels de revenus publicitaires audio via son dispositif, commercialisé par sa régie. D’autant que le marché de la publicité audio numérique continue de progresser. L’Observatoire de l’e-pub SRI-Udecam publié mardi 11 juillet a fait était au premier semestre d’un marché en hausse de 39 %, à 42 millions d’euros (podcasts, radios en ligne, audio en ligne…). La publicité audio numérique devrait donc se situer entre 90 et 100 millions d’euros sur l’ensemble de l’année 2023 en France. Observatoire e-pub : les 5 informations à retenir du marché publicitaire en ligne au S1 2023 Outre les perspectives publicitaires, les éditeurs d’informations peuvent espérer le déploiement de nouveaux produits audio grâce au text-to-speech. Par exemple en linéarisant leurs contenus audio dans des playlists, constituées par l’utilisateur, ou thématiques et éditorialisées. Ces playlists audio peuvent devenir des services supplémentaires proposés sur les sites d’informations et distribués sous la forme de podcasts sur les plateformes de streaming ; projet sur lequel travaille d’ailleurs la société Audion. D’autres acteur (ETX Studio, Odia) travaillent également à l’intégration de leur solution de text-to-speech dans les futurs véhicules. Des projets sont en cours avec les constructeurs automobiles qui souhaitent, pour beaucoup d’entre eux, proposer des contenus de divertissement au sein de certains modèles, dont de l’information, d’abord sous forme vocale. Les éditeurs peuvent envisager ici un nouveau levier d’audience et de revenus. Lecture humaine : 23 000 écoutes par mois sur Mediapart Mediapart et Le Monde Diplomatique sont les deux seuls grands médias d’informations à proposer une lecture humaine de leurs articles depuis l’abandon en juin de ce type de dispositif par L’Express. Ils sollicitent des comédiens qui lisent leurs articles. Mediapart propose ce service audio depuis début 2014. Deux articles étaient sélectionnés et lus chaque semaine jusqu’en septembre 2021. Depuis 2014, c’est cinq articles, du lundi au vendredi. Soit 20 articles par mois. Le service est réservé aux abonnés (environ 220 000 en juin 2023) et repose sur le player audio de la société Audiomeans. Interrogé par mind Media, Mediapart revendique 23 000 écoutes audio par mois en moyenne, soit une moyenne de 1 150 écoutes pour chaque article, dont 70 % sur ses supports numériques propriétaires et 30 % via les plateformes audio. La société n’étudie pas le passage à la technologie automatique du text-to-speech et se dit satisfaite du recours à une voix humaine et des résultats générés. “C’est un moyen de répondre à la problématique du manque temps pour lire nos articles qui nous a été remontée comme étant une cause du désabonnement. C’est un outil de fidélisation de nos abonnés plutôt que d’acquisition”, nous indique Mediapart. La prestation est effectuée en alternance par deux comédiens (un homme, une femme), qui sont rémunérés sous forme de salaires et en direct, sans passer par une société spécialisée. Pour 20 articles lus, le coût du forfait total pour Mediapart s’élève à 2 000 euros chaque mois. Soit une moyenne de 100 euros par article et un budget annuel de 24 000 euros. Jean-Michel De Marchi Audio digitalDiversificationsInnovationsPublicité programmatiqueSites d'actualitéStart-upTechnologies Besoin d’informations complémentaires ? Contactez le service d’études à la demande de mind À lire Analyses Dossiers Text-to-speech (1/2) : les outils s'installent dans le paysage média français Analyses Obs e-pub S1 2023 : les 5 informations à retenir Analyses Confidentiels [Info mind Media] Un nouveau client pour le CMS du Monde Analyses Confidentiels [Info mind Media] Subscribe with Google va être ouvert à de nouveaux médias en France Comment l’intelligence artificielle générative bouleverse les médias Analyses Entretiens Nicolas Sterckx (Groupe Sud-Ouest) : “On ne s’interdit pas de sortir de notre territoire régional via certaines verticales” Analyses Entretiens Gabriel d’Harcourt (Groupe La Provence-Corse Matin) : “L’objectif est d’augmenter de 20 à 30 % nos audiences en ligne dès 2023” Analyses Entretiens Jean-Louis Pelé (Groupe Nice-Matin) : “Nous visons une progression de nos revenus de 15 % en 2023” Confidentiels [info mind Media] Le Figaro va ouvrir un bureau à Marseille [Info mind Media] Un médiateur nommé après la plainte en justice du Parisien, Le Figaro et Le Monde contre Twitter Confidentiels Mouvements [Info mind Media] M Publicité a recruté son nouveau directeur délégué digital et adtech Confidentiels Mouvements [Info mind Media] Utiq a recruté son directeur des opérations en France Confidentiels Mouvements [Info mind Media] Sébastien Noël quitte la régie M Publicité Confidentiels [Info mind Media] Julien Bich reprend les attributions de Philippe Boutron à Stellantis France Confidentiels [Info mind Media] Une nouvelle responsable du web à La Provence Confidentiels [Info mind Media] Le Monde déploie son dispositif de text-to-speech dans son application Confidentiels [Info mind Media] 20 Minutes teste le registration wall pour développer son nombre d'utilisateurs logués essentiels Nos synthèses et chiffres sur les principales thématiques du marché Les mutations du search à l'ère de l'IA générative L'application inaboutie de la loi sur les droits voisins Google vs DOJ : tout ce qu'il faut savoir sur le procès qui pourrait redéfinir l'adtech L’essentiel sur les identifiants publicitaires La transformation du marché publicitaire en 2024 2023 : le marché publicitaire doit se préparer à la fin du tracking utilisateur Comment l’intelligence artificielle générative bouleverse les médias Les enjeux réglementaires des médias en 2023 analyses Les articles d'approfondissement réalisés par la rédaction Adtech : pourquoi la Commission européenne sanctionne Google de près de 3 milliards d’euros Retail media : une consolidation indispensable des régies pour répondre aux attentes des acheteurs publicitaires IA et monétisation des contenus : comment l’IAB Tech Lab veut contrôler les robots crawlers Droits voisins : l’Apig veut introduire une plainte contre Meta devant l'Autorité de la concurrence Paul Boulangé (Starcom France) : "Nous sommes en train de déployer Captiv8 en France, notre solution d'automatisation du marketing d'influence" Claire Léost devient DG de CMA Média, WPP Media promeut Stéphanie Robelus… Comment les SSP généralistes investissent le secteur du retail media Bénédicte Wautelet (Le Figaro) : “Toute solution qui utilise de l’IA en rapport avec nos contenus doit y être autorisée et nous rémunérer” Aides à la presse : combien les éditeurs ont-ils perçu en 2024 ? Le New York Times affiche toujours une croissance très robuste portée par le numérique data Les baromètres, panoramas et chiffres sur l'évolution du marché Le classement des éditeurs français qui ont le plus d'abonnés purs numériques Les données récoltées par les acteurs de la publicité en ligne La liste des sociétés présentes dans les fichiers ads.txt des éditeurs français Les gains de budget des agences médias Opt-out : quels éditeurs français interdisent les robots crawlers de l'IA générative ? Le panorama des sociétés spécialisées dans les technologies de l’e-retail media La liste des outils utilisés par les équipes éditoriales, marketing et techniques des éditeurs français Le détail des aides à la presse, année par année La liste des CMP choisies par les principaux médias en France Digital Ad Trust : quels sites ont été labellisés, pour quelles vagues et sur quel périmètre ?