• Contenus gratuits
  • Notre offre
Menu
  • Ressources
    • Toutes les ressources
  • Infos
    • Toutes les infos
  • Essentiels
    • Tous les essentiels
  • Analyses
    • Toutes les analyses
  • Data
    • Data
  • Newsletters
  • Profil
    • Je teste 15 jours
    • Je me connecte
  • Profil
    • Mon profil
    • Je me déconnecte
CLOSE

Accueil > Services bancaires > Banque au quotidien > Analyse de la voix dans le secteur financier : quels cas d’usages et choix technologiques ?

Analyse de la voix dans le secteur financier : quels cas d’usages et choix technologiques ?

La maturité des technologies de retranscription et d’analyse de la voix ouvre de nouvelles perspectives dans le secteur financier : chatbots vocaux, outils de conformité dans les salles de marché, outils de support dans les centres d’appels… Tour d’horizon des cas d’usage et des possibilités technologiques.

Par Aude Fredouelle. Publié le 09 octobre 2018 à 14h47 - Mis à jour le 09 octobre 2018 à 14h47
  • Ressources

Les projets d’analyse de la voix (speech analytics) commencent à trouver leur place dans le secteur financier grâce à l’apparition de nouvelles techniques et technologies. D’abord, les technologies de transcription de la voix se sont considérablement améliorées sous l’effet de nouvelles techniques de deep-learning, de l’amélioration de la puissance de calcul et de la croissance des volumes de données. Ensuite, ces nouvelles techniques algorithmiques ont aussi fait évoluer la reconnaissance du timbre ou de l’émotion de la voix et l’analyse sémantique des mots prononcés.

Authentification du client

L’un des cas d’usage les plus évidents de l’analyse de la voix dans le secteur financier réside dans l’authentification d’un utilisateur sur une application bancaire. Grâce à l’analyse biométrique de la voix, le client peut accéder à ses comptes et effectuer des opérations sans avoir à renseigner de mot de passe. “Cette fonctionnalité va se généraliser car elle améliore énormément l’expérience client et elle permet de débloquer les interactions et les transactions tout en diminuant le risque de fraude”, commente Nofel Goulli, partner chez Bearing Point.

Barclays a fait office de pionnier en 2016 en lançant une fonctionnalité d’authentification par la voix sur son application. En France, la Banque Postale a suivi en juin 2017 avec son service “Talk to Pay”. Mais aucune des deux banques n’a encore communiqué sur l’usage de l’outil par ses clients et selon nos informations, il serait faible à la Banque Postale. Chase a de son côté dévoilé en avril 2018 le lancement d’une fonctionnalité d’authentification baptisée Voice ID, qui permettra aux clients appelant le centre d’appels de la banque pour poser des questions sur leurs transactions d’être reconnus automatiquement, sans avoir à communiquer d’informations personnelles d’authentification.

Voice bot

D’autres cas d’usage destinés au client final commencent à émerger. Les chatbots vocaux sont encore peu nombreux mais, prévoit Nofel Goulli de Bearing Point, “l’un des grands cas d’usage de l’analyse de la voix dans le futur sera celui des “voice virtual agents”, des assistants comme Alexa d’Amazon, Siri ou Amélia d’IP Soft avec lesquels on peut échanger de manière fluide et poser des questions sur son compte bancaire. Le temps d’attente de l’appel téléphonique sera alors supprimé et l’expérience client en sera considérablement améliorée”. L’assureur Geico a par exemple lancé début 2017 un assistant virtuel baptisé Kate, capable de répondre aux questions écrites des clients mais qui donne aussi la possibilité de les poser à voix haute. BNP Paribas a créé avec Google Home un assistant permettant de répondre à des questions génériques. JPMorgan investit aussi massivement sur le sujet : en mars 2018, le groupe a présenté une fonctionnalité développée sur Alexa d’Amazon et destinée aux clients de la banque d’investissement souhaitant demander des informations sur les rapports des analystes.

Generali France a même développé avec IBM Watson un voicebot utilisant la solution de reconnaissance vocale de Zaion pour transformer les appels des clients en texte, comprendre l’intention puis apporter la réponse. Il est à la disposition des clients en assurance habitation et depuis sa sortie en juillet 2018, il délivre “chaque semaine plus de 350 certificats d’assurance habitation”, indique Generali, dont 60% entièrement réalisés via le serveur vocal interactif et 40% finalisés par des gestionnaires humains. Le service a été étendu début octobre aux attestations scolaires et responsabilité civile.

Mais pour la plupart des assureurs et banques françaises, ce sujet n’est encore qu’à l’étape des PoC, révèle Nofel Goulli. Un constat que partage Johann Chazelle, manager chez Wavestone : “quand les banques créent un chatbot, elles se posent systématiquement la question d’y ajouter une interface vocale. Mais elles décident souvent d’en rester au stade des PoC et expérimentations sur ce segment.” La start-up spécialisée dans les chatbots OWI est par exemple en train d’élaborer une offre commerciale de chatbot vocal et a effectué une expérimentation avec la MGEN en créant un chatbot vocal permettant aux assurés de poser des questions sur les offres optiques. Mais le test a été interrompu. “Le chatbot vocal présente encore des difficultés, reconnaît Christophe Dany, CEO. Le temps de réponse global dépasse les 4 à 5 secondes, cela rend donc les conversations désagréables. Surtout, il faut recourir à énormément de solutions différentes (speech to text, compréhension du langage, analyse globale, accès aux informations, génération de langage naturel…) et cela requiert beaucoup de paramétrages, ce qui rend le gros projet informatique peu viable.” OWI a créé un environnement unique de paramétrage pour la compréhension du langage, la base de connaissances et le “text to speech” et oeuvrera sur deux premières mises en oeuvre commerciales au premier semestre 2019, dont une dans le secteur financier, révèle le CEO.

Quant à la possibilité de greffer des fonctionnalités sur les assistants vocaux du marché, elle commence tout juste à émerger. “Google Home et Alexa parlent français depuis peu, donc la question ne commence à se poser que depuis peu de temps, et cette solution pose des contraintes d’intégration”, décrit Nofel Goulli de Bearing Point. En France, Amaguiz a tout de même déjà lancé une application vocale de devis d’assurance sur l’assistant Google et Boursorama une application permettant de demander via la voix le solde de son compte courant et d’épargne.

“La généralisation de l’IoT fera exploser les usages de la voix”
Jean-Philippe Desbiolles
Vice-président Watson chez IBM Watson

“Ce qui provoquera exploser l’usage de la voix sera la généralisation de l’IoT, avec les enceintes connectées à la maison, les systèmes connectés dans les voitures… Et ce, combiné avec une dimension d’intelligence artificielle”, assure Jean-Philippe Desbiolles, vice-président Watson chez IBM Watson. Actuellement, Watson propose à ses clients de déployer des serveurs vocaux interactifs sur lesquels l’utilisateur peut interagir en langage naturel, mais uniquement sur des sujets précis et prédéfinis. Le système auto-apprenant revendique un taux de 5% d’erreur seulement sur le vocabulaire, contre 10% il y a douze mois.

Centres d’appels

Si les chatbots vocaux auront besoin de plusieurs années et de technologies plus fines pour se développer, d’autres cas d’usage internes liés à la voix ont déjà prouvé leur intérêt, parmi lesquels l’analyse des appels dans les centres d’appels. Preuve de l’intérêt de ces solutions, le canal téléphonique reste le canal préféré d’interaction de 82% des Français pour la prise de contact avec un service client, devant l’e-mail (77%), selon une enquête IFOP réalisée en 2015 pour DoYouDreamUp. “L’un de nos clients assureur reçoit par exemple 1,6 million d’appels par an alors qu’il traite 20 000 mails”, confirme Johann Chazel, de Wavestone. Et “le besoin d’analytics a augmenté ces dernières années parce que les opérations simples se règlent de plus en plus en ligne et les demandes complexes représentent la grande majorité des appels”, analyse Ariane Nabeth-Halber, directrice des solutions “speech” chez Bertin IT, filiale du groupe CNIM et éditeur de solutions logicielles pour la cybersécurité et la veille stratégique qui commercialise notamment une solution de “speech to text”.

L’analyse du ton et de la sémantique de la conversation par des entreprises spécialisées permet de déterminer l’émotion du client, le sens de l’échange, l’urgence de la demande et de détecter des opportunités commerciales. Cela peut permettre aux acteurs financiers de réagir en direct en rebasculant un appel ou en aidant le conseiller à répondre au client, mais aussi de réorganiser les centres d’appels en fonction des statistiques d’analyse. “Ce cas d’usage s’inscrit dans la continuité de l’analyse multicanal : tous les banquiers ont déjà déployé des solutions d’analyse sémantique des mails et ils s’attaquent désormais aux conversations téléphoniques”, indique Nofel Goulli de Bearing Point. “Parmi les acteurs du marché de l’analyse téléphonique, on peut trouver NICE Systems ou Nexidia…”

OWI propose par exemple une solution d’analyse statistique des appels qui met en relief des problèmes ou anomalies récurrentes et décrypte les motifs de contacts et les irritations des clients. “Par exemple, nous avons réalisé des analyses ponctuelles dans des agences bancaires qui ont révélé que le conseiller passe entre 20% et un tiers de son temps à décaler des rendez-vous avec les clients, décrit le CEO. De quoi envisager de rediriger les appels quand il n’y a pas d’enjeu commercial”. OWI a travaillé pour deux entités du réseau Banque Populaire, deux Caisses d’Epargne, la MGEN, Harmonie…

A mi-chemin entre l’analyse dans les centres d’appels et les chatbots vocaux, “nous pourrions imaginer à terme la mise en place d’un premier niveau d’échange avec un chatbot vocal pour déterminer la demande avant de rediriger sur le centre d’appels en cas de besoin”, prévoit Johann Chazelle, de Wavestone. Le cabinet, qui a dressé pour son client assureur la liste des cas d’application possibles de l’IA dans les années à venir, a mis en exergue cette solution. “20% des appels de notre client sont liés à la réinitialisation de mots de passe. Si le sujet pouvait être traité directement par un bot, la satisfaction client serait améliorée et des économies de coûts seraient réalisées dans les centres d’appels.” Wavestone conseille d’analyser les conversations des centres d’appels pour pousser au conseiller des solutions a posteriori – ou même en temps réel à horizon de trois ans. OWI proposera d’ailleurs au second semestre 2019 une solution poussant des informations, offres, préconisations et tournures de phrases au conseiller pendant l’appel, pour accompagner les conseillers, dévoile Christophe Dany.

Salles de marché

Du côté des banques d’investissement, des usages touchant à la conformité se dessinent. Bertin IT travaille ainsi sur le déploiement de sa technologie de speech to text dans les salles de marché, pour retranscrire les conversations des traders. Objectif : la mise en conformité avec la directive MIFID II, qui oblige les banques d’investissement à surveiller activement les conversations téléphoniques de leurs traders et non plus seulement à les enregistrer. Bertin IT a développé des modèles spécifiquement adaptés au bruit des salles de marché et au jargon et accents des traders, explique Ariane Nabeth-Halber. “Nous avons signé avec trois grandes banques françaises d’investissement et le premier déploiement massif est déjà en production à Paris et à Londres”, indique la directrice. Et si la solution est présentée comme un chantier de conformité, “ces projets entrent aussi dans le cadre de la convergence des canaux car ils permettent de casser les silos de données”. L’outil peut également automatiser une partie du reporting réglementaire ou aider les traders à remplir le carnet d’ordres.

Bertin IT apporte la brique de speech to text et parfois “l’intégration dans le moteur d’indexation des mails ou chats afin que les appels soient pris en compte au même titre”, indique Ariane Nabeth-Halber, mais pas la solution d’analyse de la conformité, que les banques doivent apporter. Elle est facturée sous forme de licence par trader et de coûts de maintenance annuels.

Associer des briques technologiques

Le marché est divisé entre plusieurs briques technologiques. D’une part, la reconnaissance des mots et la retranscription de la voix (speech to text), sur laquelle se positionnent Nuance Transcription Engine, Google Speech to Text, Bertin IT, Amazon Lex… Ensuite, la brique d’analyse sémantique. IBM Watson en est l’un des leaders. Sa plateforme cognitive couvre le langage, la reconnaissance visuelle, l’empathie, le raisonnement, la gestion du savoir… mais aussi la voix. “Nous commençons souvent à traiter l’aspect texte pour nos clients, comme pour le chatbot Djingo d’Orange Bank ou bien celui dédié aux collaborateurs du Crédit Mutuel, décrit Jean-Philippe Desbiolles. Puis petit à petit, nos clients nous demandent comment combiner d’autres dimensions comme la voix.”

Des start-up comme OWI se positionnent aussi sur le segment. “Nous exploitons les données venant du coeur sémantique et nous apportons un moteur de règles”, commente Christophe Dany, CEO. Google propose aussi des outils d’analyse et ses équipes assurent même que la technologie réduit drastiquement la durée d’apprentissage grâce à la masse de données déjà détenue par le géant.

Stratégie par ligne de métier

Wavestone conseille à ses clients “de mettre en place une stratégie commune au sein de chaque ligne métier en termes de choix de solution, pour avoir un moteur unique pour les problématiques sémantiques et améliorer l’apprentissage”, explique Johann Chazelle. Quatre options s’offrent aux acteurs pour choisir la technologie : “faire appel au leader commercial de la sémantique, Watson, comme l’ont fait Orange Bank et Crédit Mutuel.” Mais cette option coûte cher et “les données transitent dans le cloud”. Deuxième choix : sélectionner un pure-player comme Inbenta ou Expert System, ou bien une start-up comme Personetics ou OWI. “Mais attention dans ce cas à la couverture fonctionnelle, prévient le consultant : certains sont davantage spécialisés sur certains canaux.”

“Google se montre agressif en termes de coûts”
Johann Chazelle
Manager chez Wavestone

La troisième option consiste à se tourner vers Google, Amazon ou Microsoft, qui n’ont “pas la couverture fonctionnelle de Watson mais se développent beaucoup sur ces usages”, d’autant que “Google se montre agressif en termes de coûts”. La banque ou l’assureur fait alors appel à un intégrateur agréé, comme SFEIR pour Google par exemple. C’est le choix qui a été fait par l’assureur accompagné par Wavestone. Avantage : Google couvre à la fois l’analyse et le “speech to text” et “text to speech”. Inconvénient : le client ne peut pas choisir la meilleure brique pour chacun de ces segments. “Aujourd’hui, il n’y a pas d’équivalent à Google en termes de qualité de la solution de “speech to text” et encore moins sur le “text to speech”, assure Johann Chazelle, de Wavestone. Par contre, sur l’analyse sémantique, le moteur Watson est leader. Certains pure-players comme Inbenta se défendent aussi, avec des approches globales de traitement de la voix et de la sémantique.”

La dernière option consiste à “développer les applications en interne, avec des technologies open source”, énonce Johann Chazelle. “Il existe des technologies open source très performantes pour l’analyse sémantique. Par exemple, un acteur bancaire français a développé sa propre solution d’analyse sémantique des mails pour catégoriser les demandes et les rediriger et a atteint en six mois des taux de réponses et de compréhension comparables à ce que propose Watson.” Parmi ces technologies open source figurent CoreNLP ou spaCy. Par contre, souligne le manager de Wavestone, “il est difficile de trouver les bonnes compétences sur le marché pour le développement : data scientists, data engineers, linguistes…”. Sans compter que du côté de la brique de “speech to text”, les technologies open source sont loin d’être aussi matures que celles des leaders du marché.

Chatbot vocal : 30 000 euros à plusieurs millions

 Le choix final dépendra des cas d’usage définis, de la stratégie court et long terme mais aussi du time-to-market et du coût global. “Les coûts de mise en oeuvre d’un chatbot sont par exemple multipliés par deux à trois quand on y ajoute de la voix car il faut acheter une technologie de “speech to text” et parce que le paramétrage demande beaucoup plus de temps”, indique Christophe Dany, d’OWI. Il faudra donc compter “30 000 à 50 000 euros pour la mise en oeuvre” d’un bot, puis “il faudra ensuite multiplier le coût de l’abonnement par 1,5 environ par rapport à l’écrit”. OWI facture par millions de minutes analysées, entre 2 000 et 50 000 euros par mois selon le volume.

“Sur un cas d’usage comme un chatbot vocal simple permettant la réinitialisation de mot de passe, le coût d’entrée n’est pas énorme pour la plateforme sémantique, affirme de son côté Johann Chazelle, mais il faut ensuite construire les interfaces pour échanger avec le système du client, mettre en place une solution d’anonymisation… Ce sont des projets informatiques de 3 à 6 mois qui coûtent 200 000 à 300 000 euros environ avec des acteurs comme Google ou Microsoft (avec un pure-player, le prix descend en dessous de 100 000 euros). Le coût monte à un demi-million d’euros au moins pour des cas d’usage plus complexes, comme vérifier son solde ou passer des transactions.” Avec un gros du marché comme IBM, les montants gonflent encore : plusieurs centaines de milliers d’euros pour un PoC et plusieurs millions d’euros pour un cas d’usage industrialisé.

Aude Fredouelle
  • chatbot
  • intelligence artificielle
  • machine learning

Besoin d’informations complémentaires ?

Contactez Mind Research

le service d’études à la demande de mind

Découvrez nos contenus gratuitement et sans engagement pendant 15 jours J'en profite
  • Le groupe mind
  • Notre histoire
  • Notre équipe
  • Nos clients
  • Nos services
  • mind Media
  • mind Fintech
  • mind Health
  • mind Rh
  • mind Retail
  • mind Research
  • Les clubs
  • mind et vous
  • Présentation
  • Nous contacter
  • Vous abonner
  • A savoir
  • Mentions légales
  • CGU
  • CGV
  • CGV publicité
  • Politique des cookies
Tous droits réservés - Frontline MEDIA 2025