Europe/USA : Et si les 10 millions d’oeuvres de la BNF … ou comment les livres sont le meilleur moyen de bâtir une IA européenne et souveraine.

Challenges, édition du 21 mai

Il n’y a pas 36 façons de décrire comment se construit l’intelligence artificielle écrit Gilles Fontaine, rédacteur en chef de Challenges** dans sa rubrique de veille. Fort de 10 millions d’œuvres numérisés depuis 30 ans, la BNF pourrait être 100 fois plus compact que leurs équivalents actuels, 100 fois plus petit et 100 fois moins coûteux. Et de conclure que nos livres sont le meilleur moyen de bâtir une IA européenne et souveraine. Une source plus fiable pour alimenter l’IA !

Challenges, édition du 21 mai

Il n’y a pas 36 façons de décrire comment se construit l’intelligence artificielle : pour l’essentiel, les grands modèles, il y a s’entraînent avec de la soupe, autrement dit des milliards de pages aspiré sur le Web, ou l’opinion d’un prix Nobel a le même poids que le commentaire d’un anonyme et donc 40 % des contenus relève de la publicité.

Voilà la faiblesse, fondamentale sur laquelle repose toute la révolution de l’IA générative. J’ai 10 % des textes sur lequel un modèle appris affirme que la terre est plate, la machine apprendra que la terre est plate une fois sur 10. Le biais est structurel, inscrit dans la nature, même des données collectées.
Pour y remédier, les grandes sociétés technologiques, ont choisi la fuite en avant : toujours plus de données, toujours plus de paramètres, toujours plus de puissance de calcul. Au risque de produire des usines à gaz énergivores et peu fiables. À rebours de cette logique des volumes, Remi Daudin, le directeur scientifique de l’équipementier automobile Forvia suggère de repartir de zéro. Il propose de s’appuyer sur les fonds des bibliothèques nationales. Un livre rappelle-t-il n’est pas une page Web de 20 lignes c’est un raisonnement construit déployé sur des centaines de pages soumis à une chaîne d’éditoriale et contraint par le droit à respecter un minimum de rigueur factuel les fonds de la bibliothèque national de France (BNF), fort de 10 millions d’œuvres numérisés depuis 30 ans, pourrait être 100 fois, plus compact que leurs équivalents actuels. 100 fois, plus petit 100 fois, moins coûteux à faire fonctionner, 100 fois, moins Gourmand en énergie.

Dans un domaine où la course au data Center et au milliards de dollars d’investissement, semble sans fin, cette perspective a de quoi faire réfléchir. Mais l’argument ne s’arrête pas à l’efficacité technique il concerne aussi la souveraineté. À quoi bon héberger nos données sur des serveurs européens si les modèles qui les traite ont été façonné par des entreprises américaines ?

Le poste entraînement cette phase où les éditeurs modèle la personnalité de l’IA reste une boîte noire aux effets potentiellement dramatique. En Europe, l’acte impose des obligations de transparence sur les données d’entraînement, mais la vraie se construit à partir d’un corps qui incarne nos valeurs, notre culture, notre rapport à la vérité. C’est précisément ce que permettrait ce projet européen, agrégant les fonds des grandes bibliothèques national, son nom Mirandola en hommage à Saint-Jean, < strong>Pic de la Mirandole, le philosophe de la renaissance qui ambitionnais d’embrasser tout le savoir humain.

L’idée de constituer un modèle de connaissance fiable et non biaisé capable de répondre à des questions dans le périmètre de ce qu’il a appris enrichi en temps réel par des sources vérifies, ces systèmes qui vont chercher l’information dans des bases bien défini plutôt que de l’halluciner. Un modèle qui saurait dire « je ne sais pas » plutôt que d’inventer avec une assurance imperturbable.

** SOURCE: Challenges, publié le 30 avril 2026, Édition, 917

Acheter cette édition intégrale, papier ou numérique
https://www.journaux.fr/produits/sorties-du-jour

ApprofonLire.fr

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.