En préparation de la table ronde ESPCI/ Espace Pierre-Gilles de Gennes de lundi 11 mai 2015, j'ai relu l'intéressant Livre Blanc Pour une meilleure visibilité de la recherche française, d'Antoine Blanchard et Elifsu Sabuncu, de 2e Labo (mars 2015)1. La démarche même en est intéressante, un « livre blanc » fait par deux personnes (compétentes, associées dans leur entreprise 2e Labo), de manière indépendante de toute institution, mis à disposition gratuitement et soumis à la discussion (ce 11 mai) : je ne crois pas avoir déjà vu cela dans ma carrière administrativo-universitaire – et ça change, à la fois par le style enlevé2 et par le contenu, de nombre de rapports publics souvent assez creux. L'inclusion, à la fin du rapport, de commentaires qui ont été faits aux auteurs – dont certains critiques –, suite à leur tribune dans Le Monde du 2 décembre 2013, dénote aussi une démarche originale et contributive, de manière effective et pas seulement dans les discours.
Un premier point à noter est la focalisation sur les « données récoltées par les administrateurs de la recherche » (type ANR), et non les données de recherche elles-mêmes (qui sont un autre sujet, me semble-t-il)3. Les auteurs estiment qu'elles constituent les meilleures métadonnées possibles pour analyser l'ensemble de la recherche française, et déplorent qu'elles soient (notamment via l'ANR) difficilement accessibles (parfois dans des documents téléchargeables... en PDF!), pas assez détaillées, pas assez standardisées. Bref, on serait loin de l'Open Data, prôné notamment par la nouvelle structure publique qu'est Etalab – et loin de ce qu'a fait par exemple une institution culturelle, la BnF, avec son excellent portail de données data.bnf.fr.
Un deuxième point de grand intérêt est la comparaison internationale faite par les auteurs, et notamment avec le Royaume-Uni. Ils mentionnent la politique suivie de longue date par la structure interministérielle du JISC (Joint Information Systems Committee, depuis 1993), avec l'ouverture fin 2013, après 18 mois d'expérimentation, d'un moteur « Gateway to Resarch », avec l'accès standardisé, par mots-clefs, aux programmes de recherche publics, leurs montants de financement, leur durée, leurs auteurs, etc. Ce bon résultat s'explique par un travail de mutualisation (cinq des huit organismes de financement de la recherche ont accepté de travailler ensemble sous l'égide du JISC), et par bien sûr par un travail d'interopérabilité.
Une recherche « Coriolis » dans le moteur Gateway to Research donne 6 projets (dont l'un en mécanique, l'autre en météorologie – force de Coriolis oblige), et 13 chercheurs auteurs, directeurs de programme auxquels s'adresser. On voit aussi les montants des programmes en £.
La comparaison faite par les auteurs avec la situation française laisse alors songeur. Nous n'avions pas anticipé dans notre rapport Salençon/Moatti (2008) l'arrivée et l'importance prégnante du Big Data (par ailleurs l'ANR venait d'être créée), mais force est de constater, si l'on en croit ce Livre Blanc très documenté, que « la France en est réduite à bricoler », avec en concurrence le logiciel SANGRIA (issu du PGI Cocktail, si!) et le logiciel GRAAL (Gestion de la Recherche, Application concernant les Activités des Laboratoires) de l'AMUE (Agence de multualisation des universités et établissements), avant qu'elle ne s'en retire en 2010 ! L'enjeu est maintenant le logiciel CAPLAB (Cartographie, Activités et Pilotage du laboratoire) mais « un appel d'offres aurait dû être lancé en 2012 pour une réalisation en 2013 ; nous sommes en 2015 et l'appel d'offres n'a toujours pas été lancé ». Nous laisserons tout cela à la discussion du 11 mai – cependant ce qui frappe, par rapport au Royaume-Uni, est dans ce pays la permanence des structures, comme celle du JISC, et la réelle volonté de mutualisation entre institutions.
Ce qui précède est le principal enjeu du Livre Blanc, comme l'indique son titre. Accessoirement, il évoque aussi d'autres sujets tout à fait intéressants, comme les présentations de pages de chercheurs par les établissements de recherche français (basées elles aussi sur divers logiciels d'annuaires). Les auteurs mentionnent notamment la présentation permise par le logiciel Digital Vita, que je cite parce qu'elle me paraît tout à fait intéressante pour un chercheur (c'est comme ça que je souhaiterais détailler mes axes de recherche sur ma page Paris-VII) :
Current Major/ Current Minor, Non-current Major/ Non-current Minor
(ce sur quoi le chercheur travaille de manière principale actuellement, et de manière secondaire; ce sur quoi il a travaillé de manière principale par le passé, et de manière secondaire).
Enfin, une dernière incise figurant dans le Livre Blanc mériterait un développement (mais là non plus ce n'était pas le propos du Livre Blanc) : le développement des « résaux sociaux de la recherche » (de type Academia.edu, MyScienceWork, Mendeley rachetée par Elsevier) : ces réseaux, par leurs relances permanentes (« tel collègue a consulté votre article ») et par leurs services, font concurrence aux portails publics de dépôt d'articles de recherche, comme HAL. Je pense qu'il est important de montrer aux chercheurs que le dépôt de leurs articles dans des archives publiques type HAL est prioritaire ; et je pense qu'une analyse, si possible francophone, comparant les divers réseaux sociaux privés de la recherche, leurs avantages, inconvénients, et surtout leur activité effective devrait être faite4 [post-réunion du 11 mai : Stéphane Pouyllau me signale sur Twitter ce très bon billet de blog d'Eric Verdeil].
____________________________________________________________________
1 À noter qu'on peut se le procurer sur Kindle pour la modique somme de 0,5€ - sinon il est en téléchargement gratuit.
2 Certaines tournures très directes sont amusantes, comme « Patatras », ou « Qu'attend-on encore pour réagir ? ».
3 Les programmes de recherche (aussi bien en climatologie qu'en archéologie) produisent à présent un monceau de données brutes informatisées – mais ce n'est pas le sujet traité par le Livre Blanc.
4 Notamment Academia.edu, créé en 2008 à San Francisco (1 million d'utilisateurs enregistrés); Research Gate, créé en 2008 en Allemagne (5 millions d'utilisateurs enregistrés) ; Mendeley, créé en 2007 à Londres, racheté 80M$ en 2013 par Elsevier (c'est plus un logiciel de gestion de ses références qu'un réseau social) ; MyScienceWork, créé en 2010 en France. Au cours du débat du 11 mai, un intervenant dans la salle a indiqué que ces réseaux sociaux étaient des "gadgets à la mode", et ce qu'il importait c'est d'assurer en France l'interopérabilité entre les systèmes des organismes de recherche pour la meilleure visibilité. Il n'a pas totalement tort, mais pas totalement raison : si un moteur public "Gateway to Research" à la française n'est pas rapidement conçu, ces réseaux sociaux privés occuperont le terrain laissé libre (cf. la tentation Academia c/ HAL chez certains chercheurs, in Verdeil). C'est, mutatis mutandis, la même problémtique que nous avons connue avec Google dans le domaine de la recherche sur Internet, ou celui des bibliothèques numériques.