J'avais connu le précédent plan gouvernementale RE/SO 2007 ("Pour une république numérique dans la société de l'information"), avec le train de 71 mesures du Comité interministériel pour la société de l'information de juillet 2003 (voir ici ou là). En cette année 2008, c'est l'annonce de France Numérique 2012, avec ses 154 mesures (PDF). Pour ce qui nous intéresse, à savoir les bibliothèques numériques, nous retiendrons l'action n°40, une "passerelle" entre Gallica qui alimente Europeana d'une part, et le Réseau des bibliothèques numériques francophones d'autre part. Souhaitons que l'internaute ait son fil d'Ariane pour s'y retrouver. Extrait du relevé de décisions, mesure n°40 ci-dessous.
Document "France numérique 2012"
La langue française que nous partageons avec de nombreux pays dans le monde constitue un formidable vecteur d’apprentissage et de promotion de nos contenus. Elle est aussi un vecteur de fertilisation croisée des acteurs francophones agissant dans le domaine de technologies de l’information. Une passerelle francophone pourrait être mise en place pour valoriser notre patrimoine linguistique. Cette passerelle viendrait compléter deux actions déjà engagées par la France, au niveau européen et international : en premier lieu le projet de numérisation Gallica, conçu par la BnF pour contribuer à la bibliothèque numérique européenne Europeana, en second lieu le portail des bibliothèques nationales francophones, piloté par le réseau francophone des bibliothèques nationales numériques et soutenu depuis 2007 par l’Organisation internationale de la Francophonie.
Action n°40 : Mettre en place une “passerelle” francophone agrégateur de contenus en partenariat avec les pays membres de l’Organisation internationale de la Francophonie. Pérenniser le soutien à la politique de numérisation engagée par la BnF en vue de contribuer à la bibliothèque numérique européenne Europeana, ainsi que le portail du réseau francophone des bibliothèques nationales numériques, en promouvoir la visibilité et l’accessibilité, dans un souci d’ouverture et dans le respect du droit d’auteur.
Dans le cadre du projet BibNum, j'ai été amené à connaître (grâce au mathématicien Michel Waldschmidt) une nouvelle bibliothèque numérique avec textes scientifiques francophones. C'est celle de l'Université du Michigan.
Rechercher par exemple un texte de Charles Hermite à l'Académie des sciences en 1873 : ici.
Intéressant aussi, le mode texte est publié (les PDF ne sont pas cherchables, mais les fichiers texte le sont sans doute), avec ses inévitables erreurs d'OCR, mais somme toute assez convenable pour le texte (évidemment il ne faut pas chercher à comprendre les formules mathématiques sur le fichier texte). On savait que l'Université de Michigan était pionnière dans les bibliothèques numériques (cf. mon rapport BnUE, première à avoir signé avec Google, première à faire un serveur OAI,...), le développement de cette bibliothèque numérique scientifique montre qu'un organisme d'enseignement supérieur peut, en parallèle aux projets mondiaux ou européens, développer avec sa succès sa propore bibliothèque numérique.
The University of Michigan Historical Mathematics Collection (page de recherche)
J'ai remis en juin, à titre professionnel, un rapport "Information scientifique et technique" au ministère de l'enseignement supérieur et de la recherche (au directeur de la recherche et de l'innovation, et au directeur de l'enseignement supérieur). Vous trouverez ce rapporten lignesur le site du Ministère ; ce rapport est le fruit de cinq mois de travail d'un comité présidé par Jean Salençon, Vice-président de l'Académie des sciences. Vous pouvez mettre vos commentaires sur le présent blog à propos des sujets complexes de l'édition scientifique et des archives en ligne qui sont évoqués dans ce rapport.
(voir le colloque du CEA des lundi 29 et 30 septembre 2008 à l'Ecole polytechnique "Visibilité de la recherche, de la publication aux partenariats" ; j'y interviens le lundi 29 matin pour présenter le rapport)
(22 novembre 2008 : lire la dépêche GFII Groupement français de l'industrie de l'information signalant que la Loi de Finances 2009 reprend les conclusions du rapport)
La prestigieuse Smithsonian Institution de Washington, D.C. a annoncé le 18 juin avoir mis en accès et usage libres sur la phototèque Flickr environ 800 images de ses collections, provenant de sept de ses musées et centres d'archives (National Museum of the American Indian, National Postal Museum, Anacostia Community Museum, Archives of American Art, Smithsonian Institution Archives, Center for Folklife and Cultural Heritage, and Smithsonian Institution Libraries). Lire lecommuniquéde la Smithsonian ; Voir lacollectionsur Flickr (voir aussi la page Library of Congress consacrée à cela)
Certes, ce ne sont que 800 images sur les 13 millions que possède la Smithsonian, mais le fait mérite d'être noté ; on trouvera notamment de très intéressantes photos de scientifiques du XX° siècle comme Einstein, Bohr ou Marie Curie. Ceci nous interpelle quant à nos institutions françaises, qu'elles soient culturelles ou scientifiques : à l'heure actuelle, elles sont assez frileuses. Un groupe de travail se réunit sous l'égide de B. Ory-Lavollée au ministère de la Culture, certaines choses semblent avancer au moins dans la discussion (à vérifier dans l'action), mais la pierre d'achoppement est la réutilisation libre des images dans un usage commercial ; pourtant c'est la caractéristique et la politique des sites comme Flickr ou Wikipedia de proposer une iconographie totalement libre, y compris pour des usages commerciaux.
Les institutions américaines - Smithsonian par exemple, ou Library of Congress, ou NASA dont toutes les images sont en libres accès et utilisation - semblent avoir misé sur le fait que cette ouverture contribue à leur rayonnement. Il n'en est pas de même en France ou en Europe : ainsi la photographie de la page consacrée àC.de Gaullesur Wikipedia francophone ( !) provient de la Library of Congress, celle sur la page de N.Sarkozy a été prise par un photographe allemand à Aix-la-Chapelle en 2008. Les photos officielles de présidents, ministres, bien que payées sur fonds publics, ne sont pas libres de droit...
Avant les institutions culturelles françaises qui mettront, sans doute, un certain temps à avancer sur le sujet, il serait hautement souhaitable de sensibliser et mobiliser nos institutions scientifiques et mémorielles (histoire) sur l'ouverture de leur iconographie vers le public le plus large possible, au bénéfice, aussi, de leur rayonnement international.
Nous portons à votre connaissance le projet " Textes fondateurs de la science ", dont une première maquette se trouve à http://bibnum.cerimes.fret dont l’explication se trouveici.
Nous cherchons des auteurs susceptibles de nous proposer un texte scientifique important, qui seraient intéressés à analyser ce texte en 4 -5 pages, afin d’expliquer la démarche de l’auteur, la replacer dans son contexte historique, et le cas échéant la portée de ce texte dans la science d’aujourd’hui. Vous trouverez des exemples de tels textes commentés dans la maquette (cliquer onglet " analyse ").
L’objet est de constituer une bibliothèque numérique scientifique, dont les textes d’origine et les analyses soient accessibles au public le plus large possible. Les textes d’origine doivent être du domaine public, c’est à dire jusqu’à 1930 environ. Ce projet est mené par le CERIMES (Centre de ressources et d'information multimedia pour l'enseignement supérieur) dans le cadre de science.gouv.fr et est soutenu par le ministère de l’enseignement supérieur et de la recherche (à cet égard nous devrions disposer d’ici fin juillet de la structure définitive du site, qui n’est actuellement qu’une maquette avec certaines imperfections). La maquette comprend pour l'instant des textes de mathématiques et de physique, mais nous sommes ouverts à d'autres disciplines (chimie, sciences de la vie notamment).
Nous suggérons aussi que vous puissiez faire passer ce message à des scientifiques de votre connaissance, susceptibles d’être intéressés.
Je participe vendredi 9 mai à un colloqueorganisé par l'Alliance Française à Bologne, intitulé "Multiculturalità e plurilinguismo in Europa : percorsi alla francese?". En fait de "parcours à la française", je tâcherai de montrer, comme àl'ENSSIBà Lyon en janvier, comment le beau projet de BNuE prend du retard par rapport à un projet comme Google Books, plus fonctionnel. Abstract de la conférence :
Trois ans après l'annonce de la bibliothèque numérique Google Books (décembre 2004) l'heure est venue d'un premier bilan. L'idée de la Bibliothèque numérique européenne (mai 2005), après avoir soulevé beaucoup d'espoir, suscite à présent beaucoup d'interrogations : projet trop centralisé, avancement lent, faible notoriété, cibles peu définies. Vers quel site de bibliothèque numérique iront spontanément les internautes dans trois à cinq ans ? L'orateur propose un autre "percorso alla francese ", celui d'une bibliothèque numérique francophone des savoirs.
Terminons (provisoirement) ce tour d’horizon par l’annonce récente de la nouvelle maquette Europeana (pour ceux qui n'arrivent pas à suivre :)- Europeana, c’est le nom donné par J.N. Jeanneney à une première maquette qu’on ne trouve plus, le nom a été repris par TEL The European Library ; l’ossature de la première maquette a été reprise dans Gallica2). Donc deuxième maquette Europeana, avant la maquette « Ville » à venir en octobre 2008 sous présidence française de l’Union (on s'y perd dans toutes ces maquettes). Jetons un coup d’œil à cette maquette : le tableau « Les lacets » de Van Gogh. Bon, pourquoi pas ? Et surtout un site où la seule chose qui attire l’attention est la possibilité de gagner un Iphone ! Tiens je croyais qu’il ne devait pas y avoir de publicité sur BnuE / TEL , c’était même un des arguments majeurs du projet ?
J’ai participé le 16 janvier à une table ronde sur les bibliothèques numériques organisée par l’ENSSIB Lyon (Nicolas Morin), avec le directeur informatique de la BnF, le directeur de la BM de Lyon, le directeur de la bibliothèque cantonale de Vaud. J’ai aussi assisté avec intérêt, le 8 février, à une conférence sur le numérique donnée par le président de la BnF à l’ENS. Au cours de cette dernière, j’ai appris que le transfert Gallica vers Gallica2 va se faire par étapes : la presse en juillet 2008, l’intégralité de Gallica avant la fin de l’année (c’est pourquoi la poursuite de la numérisation en mode image seul (et non en mode image + texte) pour nourrir Gallica est incompréhensible, cf. post précédent). J’ai interrogé B. Racine sur le mille-feuilles des projets Gallica, Gallica2, Europeana, TEL, RBNF réseau de bibliothèques numériques francophones, maquette avec le SNE syndicat national de l’édition, maquette « Ville européenne » pour l’automne 2008,…, qui me paraît contraster avec la simplicité du message de Google Books (au moins pour le programme bibliothèques), sa facilité d’utilisation, et son état d’avancement. Concernant ces derniers, j’ai montré quelques copies d’écran aux étudiants de l’ENSSIB . Sur l’histoire des sciences qui m’est chère, j’ai comparé divers résultats sur une recherche qui m’était nécessaire : « Coriolis, effet des machines » (il s’agit de l’œuvre majeure de cet auteur, où il définit en physique la notion de travail). Ma première recherche était sur Google (pas Google Books), la référence Google Books avec l’œuvre que je cherchais était en premier. J’ai apprécié. Ma seconde recherche était dans Google Books, j’ai trouvé bien sûr le livre, et un certain nombre d’autres y faisant référence. La recherche d'occurrence de mots dans Google Books est aussi fort utile. Concernant Gallica2, le livre y est, mais pas en mode texte (curieux). Concernant TEL, la surprise fut grande : pour une œuvre scientifique française majeure, je ne trouve même pas le lien Gallica, je ne trouve qu’une fiche du catalogue de la British Library ! Où veux-je en venir ? ces écrans illustrent la question que je posais : d’un côté la possibilité pour l’internaute de base de trouver en premier résultat de sa recherche Google (et même pas Google Books) l’imprimé numérisé qu’il cherche – de l’autre des sites dont il ne connaît pas nécessairement l’adresse et qui n’indexent pas l’ouvrage qu’il cherche : où retournera l’internaute ? N'avait-on pas une autre ambition avec le projet BNuE ? Un autre point m’a frappé dans les interventions des orateurs à l’ENSSIB: sans nous concerter, chacun de nous a remarqué qu’était numérisé sur Google Books un des « trésors » de sa bibliothèque : une édition lyonnaise du Gargantua pour la BM Lyon, cours de l’Ecole polytechnique du XIX° s en ce qui me concerne,… ; en fait, le patrimoine des bibliothèques américaines en cours de numérisation par Google, c’est le patrimoine européen !
Les Dossiers de l'Observatoire des médias (édités par l'INA Institut national de l'audiovisuel) sont à présent une revue en ligne. Leur édition de février est consacrée au thème "Patrimoine numérique : mémoire virtuelle, mémoire commune ?". Vous y trouverez un certain nombre d'articles; j'y ai moi-même écrit un article intitulé "Internet et l’accès à la connaissance : quel rôle pour les pouvoirs publics ?". Le titre n'en est peut-être pas le meilleur, je souhaite en citer deux extraits. Je rappelle en première partie l'importance de Wikipedia dans l'accès à la connaissance sur Internet, car ce sujet est trop rarement mis en valeur dans la sphère publique (dont l'INA ou la BnF font partie, entre autres):
Prenons l’exemple du site, parfois décrié, symbole de ces nouveaux usages du Web, l’encyclopédie en ligne Wikipedia. C’est le site d’accès au savoir le plus visité au monde : en France, il rassemble environ 8 millions de visiteurs par mois, ce qui le place en dixième position, et bien évidemment premier site d’accès à la connaissance. Ce site a pourtant, dans la sphère publique française, « mauvaise presse », au sens propre du terme : et ce, alors qu’une grande majorité des journalistes, auteurs, et aussi professeurs, étudiants et élèves l’utilisent quotidiennement pour vérifier une date, un fait, voire y contribuent.
J'en profite pour informer les lecteurs du blog, par souci de transparence, que je suis devenu depuis ce week-end membre du conseil d'administration de l'association Wikimedia France : c'est pour moi un engagement citoyen important qui correspond à mes centres d'intérêt et à ma volonté d'action. L'association Wikimedia, ce sont des citoyens qui s'engagent pour faire fonctionner les différents projets, dont Wikipedia.
Dans la deuxième partie, je reviens sur le caractère centralisé et peu lisible (avec le mille-feuilles des différents projets Gallica, Gallica2, Europeana, TEL, BNuE,...) des initiatives publiques françaises ou européennes, faisant contraste avec la simplicité et la lisibilité pour les internautes de projets comme Google Books ou Wikipedia. Je conclus l'article ainsi :
Une telle approche fédératrice, de type « bottom-up » dirait-on dans le monde de l’entreprise, s’oppose – au moins partiellement – à l’approche centralisatrice et venant d’en haut, de type « top-down » pour reprendre le même langage, qui imprègne au niveau de nos institutions nationales ou européennes la communication et l’action autour des grands projets numériques. Elle est pourtant plus en phase avec les usages actuels de l’Internet et avec l’histoire de leurs développements : c’est une prise en compte de cette approche qui pourrait fort utilement inspirer l’action de la sphère publique à terme.
Incroyable mais vrai : on continue à numériser en mode image (image seulement) sur Gallica ! Deux ans après la remise du rapport BNuE qui avait décillé les yeux des responsables de la BnF d'alors sur l'utilité du mode texte (recherche des occurrences, indexation par les moteurs de recherche,...) associé au mode image, alors qu'en conséquence des fonds publics importants sont consacrés depuis à la "rétronumérisation de Gallica" (c'est à dire le passage en mode texte des documents numérisés en mode image), alors que les nouveaux marchés de numérisation (100 000 documents /an financés par la taxe CNL sur les photocopieurs/numériseurs) se font en mode texte/image, alors que Gallica2 a été ouvert qui devrait absorber Gallica fin 2008, eh bien il y a toujours dans un coin une dépense publique dont le robinet reste ouvert, la NUMERISATION EN PDF IMAGE, malgré tout cela !
Pour vous en convaincre allez voir la page "Liste des derniers documents numérisés" : même si vous n'arrivez pas à vous connecter à tous les documents (Gallica est de plus en plus laborieux en ce moment), vous arriverez à vérifier sur un document PDF que vous réussirez à ouvrir que c'est bien de la numérisation en mode image ! J'espère me tromper mais je crois que non !
C'est à dire qu'on dépense aujourd'hui pour de la numérisation en mode image, alors que tous les contenus devront être "rétroconvertis" en mode texte, dans une seconde passe, plus chère paraît-il que la numérisation texte et image combinés !
:
Humanités numériques, édition scientifique, diffusion numérique de la connaissance, Enseignement supérieur et recherche, géographie et histoire industrielles (auteur Alexandre Moatti) = ISSN 2554-1137
:
Discussions sur le projet de Bibliothèque numérique européenne, sur les bibliothèques numériques en général; sur l'édition scientifique papier & en ligne.
Ce blog est créé à la rentrée scolaire 2006 pour suivre les sujets suivants: # Bibliothèque numérique européenne (BNUE), et bibliothèques numériques en général. # Edition et revues scientifiques. Il est étendu en 2023 sur des sujets connexes aux précédents, mais néanmoins liés : patrimoine industriel, géographie industrielle.