Guillaume Avrin a été nommé “Coordonnateur national pour l’intelligence artificielle”, en janvier dernier. Son rôle, transverse, consiste à structurer l’écosystème d’IA en France, à tous les stades du développement technologique. Alors que l’Europe cherche à encadrer les pratiques avec l’IA Act, Guillaume Avrin nous éclaire sur les forces et faiblesses de l’écosystème français de l’IA.

Comment vous préparez vous à l’arrivée de l’IA Act et que va changer ce texte pour les entreprises françaises ?

Les négociations européennes sur le Règlement IA sont toujours en cours. La Commission a présenté sa proposition de Règlement en avril 2021, et pendant 18 mois environ, les 27 Etats membres ont beaucoup discuté et trouvé des compromis afin d’aboutir, en décembre 2022, à un texte commun sur la base duquel ils négocieront avec le Parlement européen. Pour le moment, nous attendons que le Parlement termine ses travaux internes afin que les trilogues puissent commencer. C’est seulement à l’issue de cette dernière étape de négociations entre la Commission, le Parlement et le Conseil des Etats membres que le texte sera finalisé.

La France a soutenu l’approche horizontale et l’approche par le niveau de risque proposées par la Commission européenne. Cela signifie que le Règlement sera applicable, à quelques exceptions près, à tous les secteurs d’activité, dans le public comme dans le privé. C’est donc un texte dont l’impact sera important pour beaucoup d’entreprises, mais aussi pour les administrations publiques qui développeront des systèmes d’IA.

Pour les systèmes considérés à haut risque, le Règlement prévoit ainsi des obligations, notamment techniques, pour s’assurer de leur conformité avant qu’ils ne soient mis sur le marché européen ou mis en service. Peu importera si l’entreprise qui fournit un tel système est située dans l’Union européenne ou non. Il s’agit ici d’harmoniser les règles pour les systèmes d’IA qui sont considérés comme présentant des risques élevés pour la santé, la sécurité ou les droits fondamentaux des personnes. Le Règlement interdira également certains usages de l’IA, considérés comme non compatibles avec les valeurs européennes, comme par exemple les systèmes d’IA visant à faire de la notation sociale.

Nous considérons également qu’une fois adopté, le texte devrait laisser suffisamment de temps aux entreprises et aux administrations publiques des Etats membres pour se mettre en conformité, à l’instar du RGPD. En effet, il s’agit d’un règlement complexe, qui impactera quasiment tous les secteurs, et qui nécessite par ailleurs de mettre en œuvre au préalable un système de gouvernance et de contrôle, au niveau national et au niveau européen. C’est la raison pour laquelle les Etats membres ont proposé de fixer le délai laissé aux acteurs pour se mettre en conformité à 3 ans après l’entrée en vigueur du texte. Cela peut sembler théoriquement long mais en réalité, comme cela a été le cas pour le RGPD, ce délai nous semble nécessaire pour que les entreprises françaises et européennes puissent intégrer au mieux ces nouvelles exigences de manière intelligente, cohérente et efficace dans leurs processus de développement et d’utilisation de l’IA, sans que cela ne freine ni n’interrompe les processus d’innovation et de développement. 

“La qualité de la formation en France permet de faire émerger de nombreux talents dans le domaine de l’IA”

Quelles sont selon vous les forces et faiblesses de l’écosystème français autour de l’IA ?

Il me semble important de signaler tout d’abord la qualité de la formation en France qui permet de faire émerger de nombreux talents dans le domaine de l’IA, qui sont ensuite recherchés en France, en Europe et à l’international. 

Il faut ensuite signaler la qualité de notre infrastructure de recherche, avec des laboratoires de référence dans la plupart des domaines de l’IA. Les instituts 3IA constitués dans le cadre de la phase 1 de la SNIA ont mis l’écosystème R&D national en ordre de bataille et nous sommes à présent en mesure de passer à l’offensive sur un certain nombre de sujets identifiés comme prioritaires. 

Nos grands groupes se sont également emparés du sujet, comme le montre la constitution du Manifeste IA réunissant une quinzaine de ces groupes industrielles qui collaborent sur l’IA (dans le cadre du Grand défi “IA de confiance”, par l’organisation de challenges étudiants, etc.). Nous pouvons regretter de ne pas avoir encore en France d’équivalent aux Big Techs, comme Google, Microsoft, Meta, Baidu, qui, directement ou par le biais d’organisations  subventionnées comme OpenAI et DeepMind, investissent de manière massive dans des modèles d’IA, générant ainsi des avancées scientifiques et technologiques majeures, souvent destinées à un usage B2C (pour le consommateur). La France et l’Europe ont à minima la possibilité d’assurer un leadership sur le B2B (usage par l’entreprise), notamment par l’exploitation de viviers de données industrielles et commerciales inaccessibles aux Big Techs. Cela nécessite toutefois de nombreux investissements sur les communs numériques de l’IA (infrastructures de calcul et de stockage, banques de données, modèles open source entraînés sur le patrimoine national de données, etc.).

De nombreuses start-up, dont certaines des 29 licornes, émergent également sur l’IA et illustrent le dynamisme croissant de l’écosystème national. Certaines petites entreprises manquent cependant encore d’expérience sur l’IA, ce qui ralentit leur automatisation. La SNIA devra mettre en place les actions et dispositifs nécessaires pour assurer à l’ensemble du tissu économique national l’accès aux gains de compétitivité rendus possibles par l’automatisation des process industriels et administratifs par l’IA.   

ChatGPT fait les gros titres de tous les journaux depuis plusieurs semaines. Pensez-vous qu’il y a un effet d’emballement médiatique derrière cette innovation ou est-elle réellement disruptive ?

Les giga-modèles de type transformers font l’objet de publications scientifiques depuis plusieurs années). Plus que l’innovation technologique, c’est l’expérimentation et l’acculturation accélérée à l’IA du grand public qui constituent selon moi la véritable rupture. Le phénomène chatGPT a mis en évidence :

  • l’excellent niveau de performance sur certaines tâches de ces modèles,
  • la nécessité de faciliter l’expérimentation pour favoriser la diffusion de l’IA dans l’économie,
  • l’importance des communs numériques (larges bases de données d’apprentissages conformes à la réglementation européenne et respectant les droits d’auteur et de PI, giga-modèles pré-entrainés open source, supercalculateurs pour l’entraînement des modèles, métriques consensuelles pour l’évaluation de l’IA générative, etc.). Les cas d’usages de ces modèles sont très nombreux avec un potentiel de transformation de l’économie très important à condition de garantir la confiance dans ses résultats.

“L’ensemble des tâches administratives, de l’exécution de procédures aux expertises juridiques et financières, semblent pouvoir faire l’objet d’une automatisation par l’IA générative”

Dans quels domaines pensez-vous qu’elle pourrait d’abord s’appliquer ? Avec quels bénéfices et quels risques ?

L’ensemble des tâches administratives, de l’exécution de procédures aux expertises juridiques et financières, semblent pouvoir faire l’objet d’une automatisation par l’IA générative. Les giga-modèles multimodaux comme GPT-4 étendent encore le panorama de tâches concernées. D’importants gains de compétitivité pour les entreprises seraient ainsi accessibles à court terme. 

Concernant les risques, il semble important de signaler que l’IA générative n’est à ce jour pas une IA de confiance : certaines bases de données d’apprentissage, reposant principalement sur un scrapping du web, ne semblent pas respecter les droits d’auteur et de propriété. Il n’existe pas encore de métrique consensuelle permettant d’apprécier l’équité (absence de biais), la robustesse, la résilience de ces modèles.  

Par ailleurs, la dimension de ces giga-modèles rend leur entraînement inaccessible à la plupart des PME/ETI. Seules les multinationales, en particulier états-uniennes et chinoises, semblent réellement disposer des ressources suffisantes pour se positionner sur ce marché. Il y a un
véritable enjeu de souveraineté à court terme et de dépendance aux hyperscalers états-uniens. Enfin, son entraînement et chaque calcul d’inférence sont beaucoup plus coûteux en énergie que les modèles d’IA utilisés jusqu’à présent, il sera nécessaire d’accompagner son développement en veillant à notre impact environnemental. Elle n’est pas non plus “embarquable”, ce qui rend son utilisation complexe pour de nombreuses applications, notamment dans des domaines stratégiques pour l’Europe (mobilité, production industrielle nécessitant des calculs on premise, etc.).