La manière dont les agents conversationnels se nourrissent d'informations, puis les trient pour ensuite générer des textes, est bien opaque. Comment s'y fier ? En demandant à des bibliothèques, garantes d'un savoir fiable, d'être les nourrices de l'IA. C'est ce que font la Bibliothèque nationale de France et l'INA pour un consortium d'entreprises : Mistral AI développe un grand modèle de langage français en open source à partir de leurs millions de données, Giskard s'occupe d'évaluer la fiabilité du contenu et de le sécuriser, et Artefact rend le tout utilisable par les entreprises. C'est également dans les tuyaux de la Bibliothèque royale du Danemark, comme nous l'explique Cecile Christensen, directrice de la transformation digitale : les archives de l'Internet du pays peuvent entraîner un grand modèle de langage danois, qui pourrait servir de nourriture à des agents conversationnels alternatifs à l'Américain ChatGPT, par exemple. L'algorithme serait « en open source et transparent », précise cette diplômée en droit, qui est en discussion avec la Suède et la Norvège. « Il sera toujours biaisé, car tout choix implique un biais, mais ce seront nos biais à nous ! » Et de conclure : « Cela permettrait à notre bibliothèque d'entrer dans une nouvelle ère et de jouer pleinement un rôle dans notre démocratie. »

Les dernières
actualités