Plus vertigineux que les quatre tours de la BNF de l'architecte Dominique Perrault, les chiffres de son contenu : 18 millions de références, 2 pétaoctets (soit 2 millions de milliards d'octets) d'archives audiovisuelles, autant d'archives du Web et 500 milliards de mots...
La politique de numérisation massive lancée en 2005 a porté ses fruits, mais la masse est telle que, sans IA, rien ne serait possible. « C'est aussi l'une des premières bibliothèques nationales au monde à avoir publié une feuille de route pour l'intelligence artificielle dès 2021 », nous explique Isabelle Nyffenegger, directrice des services et des réseaux.
Aide à la « découvrabilité »
De l'IA dans Gallica, la bibliothèque en ligne ; et en 2027, de l'IA dans Gallica Images, une plateforme dévolue à la recherche iconographique. Son aide à la « découvrabilité », incite à la curiosité sans enfermer dans des bulles de connaissance ni pomper les données de ses utilisateurs. « Lorsque vous vous connectez, on ne sait pas qui vous êtes », rassure Jean-Philippe Moreux, responsable de la Cellule IA. L'utilisateur pourra sans doute bientôt se faire aider par un chatbot, c'est-à-dire un agent conversationnel, testé dès le mois prochain.
La bibliothèque Phosphore, aussi sur le logiciel Machines Reading Maps, conçu avec Stanford, l'Écosse et la Norvège, permettra de chercher des toponymes directement sur des cartes anciennes. CollabScore promet de pouvoir écouter la musique à partir des partitions passées à l'OCR, la reconnaissance optique de caractères. Un partenariat avec l'Institut national d'histoire de l'art (Inha), va offrir aux chercheurs la possibilité de suivre un objet à travers ses mises en vente au fil des siècles, grâce à la constitution d'une base de données de catalogues de vente.
Des lendemains radieux
Les algorithmes viennent aussi à la rescousse de l'organisation des collections, permettent d'anticiper les programmes de restauration, d'organiser le déploiement de la future annexe d'Amiens en 2030 avec ses 280 kilomètres linéaires supplémentaires. Bientôt, les 100 000 fiches en papier et 80 000 photos nées dans les ateliers des restaurateurs viendront alimenter l'histoire des précieux artefacts. La BNF va même servir de creuset au prochain ChatGPT. Un algorithme francophone et érudit puisque nourri notamment aux données de la BNF, grâce aux startups Mistral AI, Giskard et Artefact. Une IA 100 % française, accessible à tous, qui répond aux solutions réclamées par l'Union : un rêve en voie de réalisation.