L'Autorité de la concurrence alerte sur la domination américaine dans l'IA générative

Dans un avis publié le 28 juin 2024, l'Autorité de la concurrence tire la sonnette d'alarme sur l'intelligence artificielle (IA) générative. Une technologie pour laquelle les géants du numérique bénéficient d'avantages déterminants, dont le cloud et des données d'entrainement. Deux sujets sur lesquels la réponse des pouvoirs publics s'organise.

L'Autorité de la concurrence s'était autosaisie de l'intelligence artificielle générative (IAG) il y a quelques mois, alors que l'effervescence ne faiblit pas autour de cette technologie, y compris dans la sphère publique. Or, dans un avis rendu le 28 juin 2024, elle souligne l'existence de barrières à l'entrée considérables dans ce domaine. L'accès à une puissance de calcul colossale, la nécessité de disposer d'énormes volumes de données pour entrainer les modèles, le recrutement de talents rares et coûteux constituent autant d'obstacles pour les nouveaux entrants. Dans ce contexte, les grandes entreprises américaines du numérique bénéficient d'avantages concurrentiels exorbitants, notamment grâce à leur intégration verticale et à leur présence sur des marchés connexes.

Derrière l'IAG, les Gafam

L'avis identifie plusieurs risques pour la concurrence, allant des pratiques de verrouillage dans les services Cloud aux accords d'exclusivité, en passant par les prises de participation minoritaires des géants du secteur. La plupart des services actuels connus du grand public (Anthropic, Mistral, Open AI, Perplexity…) sont en effet financés au moins en partie par Google, Amazon, Microsoft, Intel, Saleforce ou encore Nvidia. L'Autorité s'inquiète particulièrement du manque de transparence entourant certains accords, rendant difficile l'évaluation de leur impact sur la dynamique concurrentielle. Par ailleurs, les géants du Net commencent à intégrer l'IAG dans leurs écosystèmes de produits et services (cf Copilot de Microsoft), renforçant ainsi leur position dominante sur le marché.

Réglementer mais pas trop

Face à ce tableau inquiétant, l'Autorité de la concurrence formule une série de recommandations. Elle appelle notamment la Commission européenne à envisager la désignation des fournisseurs de services d'IAG ou "Model as a Service" (MaaS) comme contrôleurs d'accès dans le cadre du Digital Market Act (DMA). L'Autorité insiste également sur la nécessité d'une vigilance accrue dans la mise en œuvre du règlement européen sur l'IA, afin qu'il ne freine pas l'émergence de nouveaux acteurs. La crainte de l'Autorité est que le texte – on rappellera qu'il prévoit la mise en place de bonnes pratiques pour les IA à portée générale - freine l'émergence d'acteurs de taille intermédiaire européens sans réussir à ralentir l'avancée des géants du numérique. L'Autorité recommande que la Commission européenne exige des informations détaillées sur les participations minoritaires dans le cadre des obligations de déclaration prévues par le DMA.

L'Arcep mobilisée sur le cloud

L'Autorité relève ensuite l'urgence à mettre en œuvre plusieurs dispositions prévues par la loi sur la sécurisation et la régulation de l'espace numérique (Sren). L'interopérabilité des services cloud, dossier dont hérite l'Arcep, se révèle un facteur décisif pour éviter la dépendance des utilisateurs à un fournisseur. La loi prévoit aussi une réglementation des avoirs cloud, distribués par les fournisseurs américains pour rendre les start-ups captives de leur solution. La DGCCRF est invitée à accorder une attention particulière à l’utilisation de ces avoirs dans le domaine de l'IA.

Accès à des ressources publiques

L'autorité insiste enfin sur la nécessité de donner accès à des ressources publiques ouvertes, telles que des données et de la puissance de calcul pour stimuler la recherche et le développement dans le domaine de l'IA générative. Pour favoriser l'innovation et la concurrence, l'avis préconise un développement soutenu de supercalculateurs publics – tels que le supercalculateur tricolore Jean Zay - au niveau européen. Elle suggère de permettre à des acteurs privés d'utiliser ses supercalculateurs publics contre rémunération, tout en conservant la priorité aux recherches académiques. Par ailleurs, les modèles d'IA générative entrainés sur ces supercalculateurs se verraient imposer des critères d'ouverture. Sur l'accès aux données, carburant de l'IA, l'autorité préconise enfin d'assurer un équilibre entre juste rémunération des ayants-droit et accès des développeurs de modèles aux données nécessaires pour innover.

Des textes en français et langues régionales pour l'IA

La part des données en langue française mobilisée pour entrainer les grands modèles de langage serait en moyenne de 0,2%. Cette part est un frein à la génération de contenus de qualité dépourvus des biais culturels anglosaxons. Ce constat a conduit l'Etat à financer plusieurs projets dans le cadre de France 2030.

On citera d'abord le projet Villers-Cotterêts, du nom du château où a été signée l'ordonnance royale imposant le français comme langue officielle et qui accueille désormais la Cité internationale de la langue française. Son ambition est de réunir une grande variété de ressources numériques en français mais aussi dans les langues régionales, dans une base centralisée pour qu'elles soient accessibles et exploitables par des IA. Les données mobilisées proviennent des Archives de France, de la Bibliothèque nationale de France, du CNRS et de diverses associations de la société civile. Le projet est porté par une startup d'Etat de la direction interministérielle du numérique (Dinum) et pourrait notamment servir à améliorer Albert, l'IA de l'État.

Parallèlement, on signalera le projet Argimi (Artefact, Giskard et Mistral) un consortium de startups qui veut exploiter les ressources multimédia de la BNF et de l'INA. Son objectif est d'exploiter les vastes ressources documentaires et linguistiques des deux institutions pour enrichir et améliorer les modèles de langage développés par ces trois pépites tricolores. Argimi fait partie des 8 projets sélectionnés par l'appel à projets "Communs numériques pour l'intelligence artificielle générative".