Comment mind RH a utilisé l’IA générative pour mesurer les progrès du télétravail dans les accords d’entreprise

Image à la une de l'article Comment mind RH a utilisé l’IA générative pour mesurer les progrès du télétravail dans les accords d’entreprise
Il y a quelques jours, nous avons publié une grande enquête sur l'évolution du nombre de jours de télétravail octroyés par les grands groupes français dans les accords d'entreprise. Découvrez les coulisses de ce comparatif inédit, où nous détaillons comment nous avons utilisé des API publiques pour collecter 225 accords et exploré les capacités de l’IA générative pour analyser ces données.
Cet article vous est proposé gratuitement par la rédaction.
Lancez votre essai gratuit de 1 mois pour découvrir l’ensemble de nos contenus

Début juin, nous avons publié une analyse de 225 accords de télétravail signés entre 2020 et 2023. Il apparaît que si le nombre d’accords a connu une hausse importante en 2021, il a nettement ralenti en 2022 et 2023. Mais le rythme de deux jours par semaine demeure la norme (2,28 jours en moyenne), en hausse l’année dernière avec 2,46 jours. Un résultat qui contraste avec certaines déclarations récente de dirigeants de grands groupes français, mettant en avant les conséquences négatives du travail à distance. Des disparités importantes existent entre secteurs d’activité : certains offrent jusqu’à 3,07 jours de télétravail par semaine contre 1,57 ailleurs.

Pour objectiver notre analyse, nous avons choisi d’étudier les accords d’entreprise et de quantifier le nombre maximal de jours de télétravail accordés. Cela nous a conduit à interroger l’API publique de Légifrance (une interface de programmation qui facilite l’accès et le traitement automatisé des données), pour sélectionner les accords des plus grandes entreprises françaises. En utilisant les capacités d’OpenAI, notamment via ChatGPT, nous avons exploré les forces et les limites de l’IA générative dans l’extraction et l’analyse de données complexes. Notre étude approfondie des pratiques de télétravail dans ces grandes entreprises et leurs filiales a abouti à la publication d’un dossier, paru le 6 juin 2024 sur mind RH, exposant en détail la méthodologie et les techniques employées pour parvenir à ces conclusions.

Établir la liste des entreprises

Notre premier objectif a été de constituer une base de données fiable et exhaustive des accords de télétravail de grands groupes signés en France. Il nous a d’abord fallu définir une liste des entreprises dont nous voulions récupérer les accords. Car nous ne souhaitions pas analyser ceux de l’ensemble des sociétés françaises mais nous concentrer sur celles dont les pratiques sont susceptibles de faire référence auprès des spécialistes des entités où les relations sociales sont développées, qui constituent l’essentiel du lectorat de mind RH. Pour cela, nous avons interrogé la base de données Sirene, un service public en Open Data qui fournit de précieuses informations sur l’ensemble des entreprises de l’Hexagone (raison sociale, activité, tranche d’effectif…).

Un ensemble d’environ 500 grandes entreprises a été extrait en se fondant sur le critère des effectifs. Puis nous l’avons filtré en excluant les services publics, les groupes hospitaliers, les fondations et les branches régionales de groupes nationaux, en utilisant les filtres proposés par la base de données. Nous avons ensuite exclu manuellement les filiales restantes non pertinentes. Au bout de ce processus, nous disposions d’une base de données de 179 entités.

Récupérer les accords d’entreprises de la liste

La deuxième étape a consisté à récupérer les accords eux-mêmes. Nous avons pour cela interrogé l’API Légifrance, mise à disposition par la Direction de l’information légale et administrative (DILA) sur la plateforme gouvernementale Piste. Un script Python que nous avons développé parcourt notre liste de 179 entreprises, et interroge cette API via la requête “/search afin de récupérer tous les accords de télétravail signés par chacune d’elles entre le 1er janvier 2020 et le 31 décembre 2023.

Pour chaque accord, l’API Légifrance nous donne huit informations : 

ID : un identifiant unique permettant de distinguer chaque accord
Titre : le nom de l’accord
Raison sociale de l’entreprise : le nom de l’entreprise signataire
IDCC : ID de la convention collective de l’entreprise
Date de signature : la date à laquelle l’accord a été signé
Date de diffusion : la date à laquelle l’accord a été rendu public sur Légifrance
Référence : la référence de la version de l’accord sur Légifrance
Thème : la thématique sur laquelle l’accord porte (le télétravail, donc, mais aussi, l’aménagement du temps de travail, la couverture complémentaire santé-maladie ou encore l’égalité salariale femmes/hommes)

Un tableau de données de 9 200 lignes – une pour chaque accord – et huit colonnes – une pour chaque information associée aux accords, structure ensuite toutes ces informations. Enfin, nous avons filtré cette base sur la colonne « Thème », ne conservant que ceux qui portaient sur le télétravail. Cela a permis de réduire le nombre d’accords analysés à 369.

Récupérer le contenu des accords

Nous n’en avions pas encore fini avec l’API de Légifrance, car pour mener notre analyse à terme, il nous fallait récupérer le contenu des accords eux-mêmes. Pour cela, nous avons développé une seconde fonction Python qui parcourt la liste des 369 codes d’indentification (ID) afin de les obtenir auprès de Légifrance. Pour chaque ID, la requête “consult/acco” nous a permis d’obtenir quatre informations supplémentaires : le SIRET de l’entreprise (nous n’avions jusque là que des raisons sociales), son secteur, la nature du texte (s’il s’agit d’un accord ou d’un avenant venant modifier un accord), et bien sûr le texte intégral. 

Cette démarche nous a permis d’obtenir un deuxième tableau de données de 369 lignes et cinq colonnes, que nous avons fusionné avec le précédent grâce aux identifiants des accords. 

IA générative

Une fois ces textes récupérés, nous souhaitions en extraire le nombre de jours de télétravail accordés aux salariés. Un obstacle de taille s’est alors présenté : l’hétérogénéité des formats et l’absence de structures standardisées. Les accords, des textes longs qui ont généralement une structure claire, sont parfois révisés par des avenants très courts. Chaque entreprise a opté pour son propre style et sa propre organisation des textes en parties et sous-parties. Au sein d’une même entreprise, ces parties et sous-parties évoluent souvent d’un accord à l’autre. Cela complexifie considérablement l’extraction automatique d’informations, même avec des techniques d’intelligence artificielle fondées sur le traitement du langage naturel (NLP). 

Nous nous sommes alors tournés vers l’IA générative pour mettre à notre profit les capacités des grands modèles de langage (LLM) à synthétiser des documents et répondre à des questions sur le nombre maximum de jours de télétravail dans chaque accord. Plus précisément, nous nous sommes appuyés sur l’API d’OpenAI et son modèle GPT-4-Turbo. Pour ce faire, nous avons divisé notre tableau d’accords en plusieurs batchs de 50 chacun. Nous avons développé une fonction Python nommée “ask_question” pour héberger notre prompt et une fonction “process_dataframe” pour traiter chaque lot. Cela nous a permis de générer un troisième tableau de données regroupant les informations initiales des accords, les synthèses produites par le LLM et le nombre de jours maximum de télétravail accordés aux salariés.

La vérification

Les LLM étant des modèles probabilistes, il leur arrive d’être sujets à des “hallucinations”, malgré toutes les précautions prises dans les prompts. L’analyse des synthèses et des chiffres produits ne pouvait donc commencer avant une étape de validation. Pour cela, nous avons mis en place un process afin que les journalistes de mind RH et de la cellule datajournalisme puissent détecter et corriger les anomalies et erreurs dans les synthèses, et celles dans l’extraction du nombre jours de télétravail maximum produites par le LLM. Cette étape nous a aussi permis d’identifier les cas particuliers d’accords à exclure du panel, dont ceux liés à la pandémie de covid-19, ceux portant sur l’égalité professionnelle et le handicap, ceux concernant les aidants, etc. Ces accords, ne relevant pas de notre champ d’analyse principal (salariés en CDI à temps plein), ont été retirés du corpus de données.

Analyse

Certains accords prévoient des jours de télétravail fixes par semaine, d’autres par mois, d’autres encore par année. Ces jours fixes sont parfois complétés de jours flottants, attribués par mois ou par année. Cela aboutit à une grande diversité de situations. Pour être en mesure de comparer tous les accords, nous avons élaboré un calcul visant à normaliser le nombre de jours de télétravail maximum accordés sur la base d’une semaine de cinq jours travaillés. Afin de neutraliser les week-ends, jours fériés et jours de congé, nous avons retenu le nombre de 213 jours travaillés effectifs en 2022, en moyenne, indiqué par la dernière étude de l’INSEE sur la durée et l’organisation du travail. Cela correspond à 17,75 jours travaillés par mois.. 

Le nombre de jours de télétravail par semaine normalisé (TSN) est ainsi calculé à partir du nombre de jours de télétravail par semaine (TS), du nombre de jours de télétravail par mois (TM) et du nombre de jours de télétravail par an (TA).

Notre comparatif public des grands groupes français est inédit : seuls le cabinet Sia Partners et la Dares, service d’études du ministère du Travail (sans préciser le nombre de jours) avaient étudié les accords dédiés, mais pour l’ensemble des entreprises, en 2022.

Pour aller plus loin
Étude mind RH – Les grands groupes français n’ont pas réduit le droit au télétravail depuis 2020
Depuis quelques mois, l’heure est à la renégociation de la première génération d’accords de télétravail post-confinement. Plus de quatre ans après le début de la pandémie de Covid-19, les…
France : la flexibilité reste une priorité pour les salariés (étude)
La conciliation vie professionnelle-vie privée et la quête d’autonomie dans le travail sont au cœur des priorités des Français. C’est ce que met en…
Vous avez une information à nous partager ?
Nos autres services
mind Research
Décider : un service de recherche et de market intelligence sur mesure pour alimenter vos analyses et appuyer vos prises de décisions.
En savoir plus
mind Ads
Communiquer : des dispositifs sur mesure pour maximiser votre visibilité et engager une communauté de professionnels qualifiés.
En savoir plus
Ce que vous devez absolument lire cette semaine
Les contenus essentiels de la semaine sélectionnés par la rédaction.
Voir tout
Catherine Chavanier (CDC Habitat) : “Le dialogue social sur l’IA permet de faciliter son déploiement”
CDC Habitat (10 500 salariés) a signé en février un accord encadrant pour deux ans le dialogue social sur l’IA. Catherine Chavanier, DRH de la filiale de la Caisse des dépôts et consignations...
UE : le Conseil fixe sa position sur la simplification des règles relatives à l’IA
Le Conseil de l’UE a approuvé le 13 mars sa position sur la proposition de règlement omnibus, publiée en novembre dernier par la Commission afin de simplifier l’IA...
20 mars 2026
Allemagne : les problèmes liés à la ménopause, enfin un sujet pour les entreprises
Avec 12 millions de femmes de plus de 40 ans dans la population active, les entreprises et la médecine du travail allemandes sont actuellement en train de s’ouvrir à une politique d’aide aux...
Grèce : l’hôtellerie-restauration signe une première convention collective conforme à l’Accord social national
Le secteur de l’hôtellerie-restauration (125 000 salariés), l’un des plus importants de Grèce après le commerce, a signé le 17 mars une nouvelle...
Les articles les plus consultés du mois sur mind RH
Ce sur quoi les lecteurs cliquent le plus le mois dernier.
Ce sur quoi les lecteurs cliquent le plus le mois dernier.
1
France : le gouvernement rend sa copie sur la transparence salariale
Le 6 mars, le gouvernement français a envoyé aux partenaires sociaux un avant-projet de loi de transposition de la directive européenne sur la transparence salariale. Il apporte des précisions sur...
2
France : les partenaires sociaux parviennent à un compromis sur les ruptures conventionnelles
Le 25 février au soir, les partenaires sociaux français ont conclu un avenant à la convention d’assurance chômage qui réduit la durée maximale d’indemnisation après une rupture conventionnelle et...
3
Valérie Decaux (La Poste) : “Notre politique seniors se base sur l’individualisation pour sortir de la stigmatisation liée à l’âge”
Le groupe La Poste (près de 200 000 personnes en France) a dévoilé fin février son premier accord sur les seniors, qui fixe des mesures d’aide à la retraite anticipée, d’adaptation des conditions...
10 mars 2026
4
Espagne : un rapport propose de démocratiser la participation des salariés
La ministre espagnole du Travail Yolanda Diaz a présenté, le 2 février, les conclusions d’un rapport sur la démocratie au travail. Ce document, qui appelle à ouvrir aux salariés la participation...
5
Mexique : promulgation de la réforme des 40 heures
Approuvée à l’unanimité par les députés mexicains, le 25 février, la réforme instaurant la semaine de travail de 40 heures a été publiée au Journal officiel. Le nouveau temps de travail sera...
6
Italie : Deliveroo et Glovo dans la ligne de mire de la justice en raison des conditions de travail des livreurs
Le parquet de Milan a ordonné le placement sous contrôle judiciaire des deux principales sociétés de livraison de repas à domicile en Italie, Foodinho (Glovo) et Deliveroo. Selon les magistrats...