9 avril 2007
1
09
/04
/avril
/2007
13:08
Suite à mon post précédent concernant Europeana, j’ai été amené à regarder un certain nombre de blogs, et ai retenu les URLs suivantes : -
– Retranscription d’une interview d’A. Saal, directrice générale de la BnF, dans une émission de France-Culture le samedi 17 février 2007 (merci au blog Tinihane, qui effectue ces transciptions !) -
Au hasard de ces derniers posts, même si je ne partage pas toujours le ton qui les anime, je retrouve un certain nombre de questions que je me pose. Au moment où les " porteurs " du giga-projet s’en vont (MM. Chirac et Jeanneney), et – pourquoi ne pas l’espérer ? – pour éclairer leurs successeurs, reprenons-en quelques-unes ci-dessous :
-
1) Comment peut-on à la fois voir se développer une " contribution française à la bibliothèque numérique européenne " (Europeana) et le projet de bibliothèque numérique européenne validé par l’Union Européenne (développement de The European Library, cf. mon post précédent) ? Il y a en effet fort à parier, comme on peut le lire dans ces billets, que : Europeana s’oriente doucement et sûrement vers un Gallica V2 (qui était absolument nécessaire, ne serait-ce que pour le mode texte)…et The European Library sera la BnUE, mais quand, et comment ?
-
2) pourquoi continue-t-on à lire que Google exige l’exclusivité d’une bibliothèque avec laquelle il signe ?
Le post d'O. Morin nous ramène au texte du contrat Google/ U of Michigan. Sous réserve d'interprétation erronnée de ma part, ce texte signifie qu’un ouvrage de bibliothèque numérisé par Google pourra être mis en ligne sur le site de la bibliothèque elle-même, mais ne pourra pas être vu dans le service MSN Book Search. -
A ce propos je pose une question à laquelle je n’ai toujours pas la réponse : le moteur simple MSN (pas MSN Book Search) pourra-t-il indexer les contenus numérisés par Google et Stanford Library par exemple ? autrement dit un internaute utilisant MSN peut-il accéder aux livres Google/ Stanford ? (ou un internaute utilisant Google peut-il accéder aux livres MSN/ Bristish Library ?)
-
3) Dans l’interview de la directrice générale de la BnF je lis : " l’adhésion à un système, celui de Google, de la part de ces bibliothèques, qui comprend, comporte intrinsèquement l’accès aux documents en fonction d’un ordre régi par des critères de rentabilité commerciale ". Autant ce débat sur le page ranking peut se justifier à propos du moteur Google, autant je ne comprends pas ce débat à propos de Google Book Search…Par exmple je fais une recherche " polytechnique " sur Google Book Search, j’obtiens des résultats, mais je ne vois pas quel type de " page ranking commercial " Google pourrait faire sur des livres patrimoniaux. Quelqu’un peut-il m’éclairer ?
N'hésitez pas à metre vos interprétations et réponses éventuelles, notamment sur les points 2) et 3).
Published by Alexandre Moatti
-
dans
Bibliothèque numérique
25 mars 2007
7
25
/03
/mars
/2007
14:25
J’ai regardé le site Europeana de la BnF, présenté à J. Chirac mercredi 21 mars. Ce n’est pas (encore ?) une bibliothèque numérique européenne : les documents non BnF qui y figurent, venant des bibliothèques nationales de Hongrie ou du Portugal, sont certes intégrés au moteur de recherche, mais restent visibles dans leur site d’origine.
C’est en revanche une évolution intéressante de Gallica, avec une interface utilisateur beaucoup plus moderne et conviviale. Bien évidemment tous les documents sont (aussi) en mode texte, à la différence de Gallica.
Moteur de recherche
-
> Recherche " Fermat " dans le moteur de recherche : apparaît en premier le résultat où Fermat figure dans le titre de l’ouvrage (ce qui est bien) ; dans les autres résultats, le terme recherché est dans le corps du document, et le moteur nous envoie vers la première page du document (et non vers la page d’occurrence " Fermat ", ce qui serait mieux).
-
> Le cartouche sur la gauche " Affiner la recherche " est bien fait, il permet de sélectionner, parmi les 144 occurrences de Fermat, les ouvrages par date (siècle) ou par auteur, etc.
Téléchargement -
> Comme l’indique la brochure, en un clic, il est possible de télécharger le document consulté.
-
> Cartouche orange Utiliser, cliquer sur la disquette d’enregistrement, le document complet est téléchargé en PDF. C’est le document PDF image (non cherchable plein texte) de Gallica.
Mode texte/ mode image
-
> Le mode texte semble comporter des erreurs assez importantes d’OCR (ex. recherche Fermat, premier document Brassinne 1853, en mode texte la page de garde, la page suivante, comportent des erreurs importantes). Ces re-numérisations en mode texte sont-elles issues des marchés passés par la BnF à partir d’octobre 2006, ou sont-ce des re-numérisations expérimentales ?
-
> Rappel : en tout état de cause le mode texte, même avec des erreurs, reste indispensable pour la recherche des termes dans les documents, et leur indexation par les moteurs de recherche.
-
> Le mode texte, proposé en affichage pour les " déficients visuels ", n’est pas téléchargeable.
Pour en savoir plus, revue de presse sur Internet à propos de cette maquette :
Dernière minute le 29 mars: M. Bruno Racine, conseiller à la Cour des Comptes, actuel directeur du Centre Georges Pompidou, a été nommé président de la BnF en remplacement de M. Jean-Noël Jeanneney.
Published by Alexandre Moatti
-
dans
Bibliothèque numérique
8 mars 2007
4
08
/03
/mars
/2007
23:29
L'actualité "Bibliothèques numériques" se calme, c'est dommage...mais Google semble continuer à engranger les partenariats en Europe, après l'Espagne (mon post du 14 janvier), c'est une grosse bibliothèque allemande, celle de Bavière, qui signe pour un million de livres avec Google. Et en Allemagne, pays dont l'unité fut récente, ce sont les bibliothèques des Länder importants , et non la Bibliothèque nationale, qui contiennent le plus de documents.
Extrait de la news Netéconomie: Après le Royaume-Uni et l'Espagne, l'Allemagne est le troisième pays européen, le second non-anglophone, a rejoindre le projet de bibliothèque numérique lancé fin 2004 par Google. La société Internet américaine et la Bibliothèque d'Etat de Bavière vont numériser et mettre en ligne plus d'un million de livres du domaine public, de Goethe à Schiller. «Nous ouvrons notre bibliothèque au monde entier pour remplir notre véritable mission - la découverte des livres et de la connaissance en franchissant le seuil décisif de l'ère numérique. Ce travail passionnant va permettre aux lecteurs du monde entier, à leur gré, où qu'ils se trouvent, de découvrir et de bénéficier en ligne de la riche tradition littéraire allemande », a souligné Rolf Griebel, directeur de la Bibliothèque d'Etat de Bavière, dans un communiqué daté du 6 mars 2007.
Lire aussi le communiqué de la Bayerische Staatsbibliothek (accord passé sous l'égide et en présence du Ministre de la Culture de l'Etat de bavière).
Published by Alexandre Moatti
-
dans
Edition scientifique
13 février 2007
2
13
/02
/février
/2007
14:52
J’ai peu entretenu cette rubrique " diffusion de la culture scientifique ", car il est parfois malaisé de faire de la vulgarisation (cf. mon blog de sciences) et d’en parler en même temps. J’ai cependant assisté hier, en partie, à un colloque " Sciences et Société en mutation " organisé au plus haut niveau du CNRS (voir page et podcast). J’en retirerai deux expériences intéressantes données par des orateurs du colloque.
La première concerne un jumelage effectif entre un chercheur, un membre de l’académie des sciences, un parlementaire (député ou sénateur) : sous le parrainage de l’académie des sciences (Mme. Dominique Meyer), cette opération, inspirée d’une opération analogue au Royaume-Uni a effectivement débuté en octobre 2005 et se traduit par plusieurs jours passés en trinôme, dans le laboratoire du chercheur comme en accompagnement du parlementaire (dans son Assemblée ou dans sa circonscription).
La deuxième expérience est allemande, il s’agit de la Kinder-Uni (Université des enfants) à l’université de Tübingen ; ce programme mené depuis 2002 fait venir huit fois dans l’année à l’université de Tübingen de 500 à 1000 enfants à chaque séance pour des conférences scientifiques dans un amphithéâtre. Le programme a été transposé, sous des formes diverses, dans 100 université et instituts universitaires en Allemagne.
On trouvera par ailleurs, à l’appui de ce colloque du CNRS, une intéressante étude d’une dizaine de pages effectuée par Pablo Jensen, physicien au CNRS, sur les pratiques de vulgarisation des chercheurs du CNRS (sous forme d’analyse statistique).
Complément du 25 mars (via blog Enro): on peut trouver en ligne sur le site de CanalU l'ensemble des interventions de cet intéressant colloque, URL.
Published by Alexandre Moatti
-
dans
Diffusion de la culture scientifique
4 février 2007
7
04
/02
/février
/2007
13:08
Le portail de l’Internet scientifique www.science.gouv.fr ouvre une nouvelle rubrique consacrée aux bibliothèques numériques scientifiques (cliquez dans la colonne de gauche). Le principe adopté est de recenser les bibliothèques numériques exclusivement consacrées à la science. L’idée est de faire connaître ainsi aux 140 000 visiteurs/mois de science.gouv.fr (soit un peu moins de 5 000 visiteurs/jour) les efforts de numérisation et de mise en ligne du patrimoine scientifique – souvent mal connus – faits par les instituts culturels, bibliothèques universitaires, équipes universitaires ou de recherche,…Dans ce dernier cas (équipes), il s’agit parfois d’initiatives non institutionnelles, d’un ou plusieurs chercheurs ou chargés de cours mettant en ligne des ressources scientifiques patrimoniales sur lesquelles il travaille.
La valorisation (on pourrait aussi dire la vulgarisation) en faveur d’un public ciblé a priori intéressé à la science, de ces initiatives décentralisées, s’inscrit dans le mouvement croissant d’un Internet " vernaculaire ", centré sur des communautés d’intérêt, à distinguer de projets plus centralisés comme celui de " Très Grande Bibliothèque numérique ". N’hésitez pas à nous faire connaître ici, en commentaires, votre avis sur cette initiative, ou toute bibliothèque numérique scientifique que vous souhaiteriez faire inscrire.
(certaines bibliothèques déjà répertoriées dans ce blog, comme Flaubert- Unversité de Rouen ou Euler - Université de Strasbourg dont partie du premier recensement du portail science.gouv.fr)
Published by Alexandre Moatti
-
dans
Bibliothèque numérique
20 janvier 2007
6
20
/01
/janvier
/2007
11:17
J’ai participé à une partie de la conférence consacrée à HAL-SHS (archives ouvertes en sciences humaines et sociales) jeudi 18 janvier à l'EHESS (voir aussi site de dépôt HAL-SHS). Visiblement le débat reste ouvert, certains chercheurs en SHS semblant plus réticents que leurs collègues de sciences exactes sur l’intérêt des archives ouvertes, leurs interrogations portant principalement sur la qualité des " pré-print " par rapport aux articles effectivement publiés dans une revue (internet ou papier). En ce qui me concerne, intéressé au sujet et auteur sur HAL-SHS, je retiens quelques idées simples de la conférence de Daniel Charnay, directeur d’unité HAL au CNRS :
1) l’adresse Internet permanente donnée par HAL-SHS permettant la citation permanente dans des articles (il semblerait que les liens vers d’autres articles, comme ceux des revues Internet, ont tendance à disparaître, le chiffre de 15% de liens inactifs après un an est cité).
2) la notion d’horodatage certain du dépôt.
3) et surtout, la notion de dépôt sans retrait possible, que je n’avais pas perçue à l’origine.
Ce dernier point est important : il n’y pas d’utilisation frauduleuse possible, on ne peut modifier a posteriori un article en changeant les hypothèses, etc. En revanche, la possibilité de mettre des versions successives existe (je suppose que ces versions sont référencées sur la même page de HAL). Non seulement le chercheur peut mettre plusieurs versions successives, mais – peut-être n’a-t-il pas été suffisamment insisté là-dessus –, il le doit, ardente obligation vis-à-vis de ses collègues. Ceci serait d’ailleurs un élément de réponse aux objections soulevées en introduction.
(voir aussi mon post antérieur sur l’inauguration HAL du 11 octobre à l’Académie des Sciences)
Published by Alexandre Moatti
-
dans
Edition scientifique
14 janvier 2007
7
14
/01
/janvier
/2007
16:37
Comme le Figaro du jeudi 11 janvier (sous la plume de Marie-Laetitia Bonavita) nous l'apprend, "Google signe un accord avec cinq bibliothèque catalanes".
Nous avons pu retrouver le communiqué originel (en catalan) sur le site de la Bibliothèque nationale de Catalogne, à Barcelone. Avec quatre autres bibliothèques catalanes de Barcelone, de moindre envergure, il s'agit de numériser quelques centaines de milliers de livres dans le cadre du projet "Google Library", afin que les contenus soient indexés dans Google Book Search (et non de centaines de milliards (sic) d'oeuvres comme l'écrit Le Figaro- toujours cette course aux grands nombres qui se fait au détriment du bon sens et parfois de l'efficacité).
C'est ainsi la deuxième bibliothèque hispanophone de grande envergure, après la Complutense de l'Université de Madrid (notre post de fin septembre 2006) à s'allier à Google.
Pour plus de clarté, nous signalerons que c'est une troisième bibliothèque, la Biblioteca nacional de España à Madrid (site) qui elle est engagée dans le projet BnUE- Europeana- EDL (European Digital Library)- The European Library.
La langue espagnole et la langue française sont sans doute les deux langues qui ont le plus besoin d'être présentes au niveau mondial sur Internet, et leurs patrimoines mis en valeur. La stratégie et la façon dont nos voisins espagnols avancent (rapidement) ne peut manquer de nous interpeller.
Rajoût du 12 février 2007: Comme nous n'avons pas l'intention d'ouvrir un post à chaque fois que Google annonce un partenariat dans son programme Google Library, nous mentionnons ici que depuis l'annonce ci-dessus, l'Université du Texas et l'Université de Pinceton ont rejoint le projet Google (cf. communiqué Princeton pour 1 million de livres sur six ans).
Published by Alexandre Moatti
-
dans
Bibliothèque numérique
10 janvier 2007
3
10
/01
/janvier
/2007
10:27
Suite à une lettre de Philippe Gautrot au courrier des lecteurs du journal Le Monde (nous n'avons pu en retrouver la date car visiblement les archives du journal ne comprennent pas le courrier des lecteurs), nous avons investigué le site suivant, pages historiques de l'Astrophysic Data Systems, unité documentaire de la NASA hébergée par l'université de Harvard, qui comprend par ailleurs les articles scientifiques les plus actuels en astrophysique.
Comme le souligne Ph. Gautrot, on trouve plusieurs publications francophones importantes d'astronomie du XIX° ou du XX° siècle (numérisation mode image faites à partir de microfilms de l'université Harvard):
-
Annales de l'Observatoire astronomique de Tokyo (oui, en français à l'époque!), 1899 à 1910 environ.
-
Annales de l'Observatoire de Paris
-
Annales de l'Observatoire royal de Belgique
-
Annales de l'Observatoire de Rio de Janeiro (en français aussi...)
-
Bulletin astronomique de l'Observatoire de Paris (de 1920 à 1950)
-
Observations astronomiques faites à l'Observatoire royal de Paris (1825).
Published by Alexandre Moatti
-
dans
Edition scientifique
30 décembre 2006
6
30
/12
/décembre
/2006
15:03
La Bibliothèque nationale du Luxembourg (BnL) a annoncé diverses initiatives numériques (article du Tageblatt du 7 décembre accessible après inscription); nous sommes allés voir les différents portails pour les décrire pour vous ici.
Le premier www.portail.bnu.lu est un méta-portail donnant accès à huit portails de revues scientifiques: par exemple les portails JSTOR, ScienceDirect d'Elsevier, Springer...S'agissant d'abonnements payants pris par la BnL auprès des grands groupes d'édition scientifique, on ne peut accéder à la plupart d'entre eux que losrqu'on est dans les locaux de la BnL, mais aussi en rentrant son numéro de carte de lecteur BnL (d'où la mise sur Internet du portail, car sinon cela n'aurait aucun intérêt). Cette possibilité est à ma connaissance unique en Europe, et je ne crois pas qu'une telle possibilité existe en France. Dommage que nous n'ayons pas de carte de lecteur de la BnL! Ce portail relève donc plus de l'édition scientifique (notre rubrique) que des bibliothèques numériques pour tous.
Le deuxième www.luxemburgensia.bnu.lu correspond, lui, à une première esquisse de bibliothèque numérique, avec trois types de documents:
1) livres imprimés (ce qui a été numérisé n'a pour l'instant pas grand intérêt)
2) cartes postales anciennes du Luxembourg. A signaler que la collection numérique de cartes postales est présentée en basse résolution, images non cliquables. Pour y accéder, il faut être sur un ordinateur dans le site physique de la BnL. C'est à ma connaissance la première restriction sur un contenu destiné à rejoindre la BnUE.
3) journaux luxembourgeois, un certain nombre d'années du XIX° et du XX° siècle, en français comme en allemand, la collection paraît intéressante (cf. illustration).
Le Luxembourg fait partie des 9 pays non encore intégrés à The European Library, qui seront intégrés dans le cadre du projet EDL (ces jargons européens ne sont pas toujours faciles à comprendre).
Published by Alexandre Moatti
-
dans
Bibliothèque numérique
26 décembre 2006
2
26
/12
/décembre
/2006
10:51
Les Echos du 26 décembre sous la plume de Nathalie Silbert:
Les Allemands se retirent du projet Quaero
[ 26/12/06 ]
Le partenariat noué entre les industriels français et allemands autour du projet de moteur de recherche Quaero a fait long feu. La semaine dernière, lors du sommet national de Potsdam sur les technologies de l'information, le secrétaire d'Etat allemand à l'Economie, Hartmut Schauerte a officialisé le retrait des industriels allemands qui devaient participer au projet, parmi lesquels notamment le géant de médias Bertelsmann. Ces derniers ont en effet décidé de monter leur propre programme baptisé Theseus. Outre Empolis GmbH, une filiale de Bertelsmann AG, il mobilisera plusieurs géants allemands, dont Siemens, SAP et la Fraunhofer Gesellschaft. « Le projet Quaero continue et certains laboratoires allemands restent partenaires du programme », soulignait vendredi un porte-parole de l'Agence de l'innovation industrielle qui doit financer 50 % de la recherche et développement de Quaero.
Des différences d'approche seraient à l'origine du divorce entre les industriels. Avec Quaero, les industriels français menés par le groupe Thomson, souhaitent développer un moteur de recherche grand public et multimédia. Les Allemands, en revanche, souhaitent développer avec Theseus une approche plus professionnelle avec une gestion de la connaissance sémantique, c'est-à-dire capable de faire des recherches « intelligentes » basées sur le sens des mots.
« En réalité, il n'y a pas rupture puisque le projet n'avait pas encore été approuvé par Bruxelles. Simplement désormais il y a deux programmes au lieu d'un et en réalité ils sont complémentaires », relativisait vendredi l'AII.
Une coloration hexagonale
Alors qu'il devait être le fruit d'une coopération franco-allemande, le projet Quaero (« je cherche » en latin) qui a été doté d'un budget de 250 millions d'euros sur cinq ans, va toutefois prendre une coloration nettement plus hexagonale. Aux côtés du groupe Thomson, chef de file du programme, le moteur de recherche français Exalead, Jouve, LTU et VecsyChef participent à ce programme, annoncé en 2005 par Jacques Chirac pour concurrencer le moteur de recherche américain Google.
Published by Alexandre Moatti
-
dans
Bibliothèque numérique