Tous frondeurs et unis contre le gouvernement : des républicains aux communistes, en passant par les écologistes et les socialistes, les députés ont ajouté à la loi Pour une République numérique, présentée par la secrétaire d’Etat chargée du Numérique, Axelle Lemaire, un article 18 bis qui autorise "les copies ou reproductions numériques réalisées à partir d’une source licite, en vue de l’exploration de textes et de données pour les besoins de la recherche publique, à l’exclusion de toute finalité commerciale". L’avis des sénateurs sera suivi avec attention. "Tous les éditeurs dont les contenus sont accessibles dans une base de données peuvent être concernés, et pas seulement ceux du secteur sciences, technique et médecine [STM]", prévient Catherine Blache, chargée de mission pour les relations internationales et les questions universitaires au Syndicat national de l’édition (SNE). Le gouvernement était opposé à l’ajout de ce dixième alinéa à la liste des exceptions au droit d’auteur. Il faut attendre la révision de la directive européenne sur le droit d’auteur, a fait valoir Axelle Lemaire.
C’est sur l’agenda de la Commission européenne, qui devrait présenter son projet d’ici à l’été, après l’avoir promis pour fin 2015. Un rapport rendu en 2014 par un groupe d’expert mandatés par la Commission recommande clairement d’inscrire l’autorisation du text and data mining (TDM) dans la loi, en passant si nécessaire par le raccourci d’une exception. "On perd du temps, il faut trouver une solution en France", estime Charles Huot, président du Groupement français de l’industrie de l’information (GFII) et directeur général délégué de Temis, société spécialisée dans le TDM, chargé par le gouvernement d’une mission de concertation entre le monde de la recherche et celui des éditeurs. Il n’a pas de temps à perdre : le gouvernement lui demande sa copie pour fin mars. "Mon rapport ne sera pas long", prévoit-il, pragmatique et sans s’avancer sur la nature d’une solution, "pourvu qu’elle soit acceptée par tout le monde".
L’édition n’est pas contre le TDM, mais elle est farouchement opposée à une nouvelle exception au droit d’auteur. "A chaque nouveauté, on invoque une exception, il y en a un peu marre", s’irrite Jean Frank Cavanagh, directeur des relations extérieures de Relx Group (ex-Reed Elsevier). Dans l’édition, le leader des STM est le premier concerné, eu égard à l’importance de sa base, forte de près de 13 millions d’articles. "Ce qui nous interpelle, c’est qu’il soit nécessaire de légiférer sur le sujet, alors que les demandes sont rarissimes. Pour Cairn, nous en avons reçu moins de cinq, toutes acceptées", explique Marc Minon, directeur général du portail de sciences humaines, qui compte environ 300 000 articles. "L’hypothèse de ces recherches est de montrer que l’apparition d’un terme, d’une occurrence est révélatrice d’un mouvement, d’une préoccupation, d’une thématique", ajoute-t-il.
Les éditeurs jugent que les accords avec les chercheurs répondent parfaitement aux besoins. "Nos contrats contiennent tous une clause autorisant le text and data mining pour les recherches non commerciales. Nous avons été les premiers à l’inclure systématiquement dans les licences que nous signons avec les bibliothèques, ce serait une piste possible", évoque Jean Frank Cavanagh. Ce n’est pas l’avis des universités et de leur réseau de bibliothèques, exprimé dans la réponse de l’ADBU et de Couperin au rapport rendu en 2014 au Conseil supérieur de la propriété littéraire et artistique (CSPLA) par Me Jean Martin. Il recommandait d’utiliser des accords contractuels, et d’attendre les nouvelles dispositions européennes. Considérant l’ampleur de certaines recherches, qui supposent d’interroger des millions d’articles dans plusieurs bases, cette solution est trop coûteuse en temps, jugent l’ADBU et Couperin. Mais le fond de l’affaire vient plutôt du prix de l’abonnement à ces bases, devenu bien trop élevé pour les BU, qui s’insurgent de devoir en plus prévoir des autorisations pour ce qui n’est finalement qu’une nouvelle forme de lecture.
En embuscade, il y aurait aussi Google Livres, gigantesque programme de fouille de données dans la littérature mondiale, approuvé par la justice américaine au nom du fair use. La Guilde des auteurs attend encore l’avis de la cour suprême des Etats-Unis. La base Google Scholar fait aussi du TDM pour recenser les publications scientifiques. Les experts de la Commission l’ont utilisée pour démontrer que c’est devenu un thème de recherche important. d