Overblog
Editer l'article Suivre ce blog Administration + Créer mon blog
30 janvier 2018 2 30 /01 /janvier /2018 11:58

Google NGramViewer est un outil certes intéressant, mais à manipuler avec précaution. Notamment pour l'utilisation que j'en fais, à savoir les dates d'apparition ou d'occurrence de certains termes (modernité, machinisme, technocratie, transhumanisme, etc.). Il y a déjà un biais qui est celui du corpus Google Books constitué : la recherche se fait sur le corpus numérisé par Google, pas sur les autres livres de la même période.

Mais admettons de travailler dans ce corpus-là. Il y a un biais bien plus grave, un bug même, c'est que, pour les revues (et elles étaient encore en nombre fort important auparavant), la date considérée est parfois celle de constitution de la revue, et non la date du numéro où apparaît le terme cherché ! Nombreux exemples, j'en donne un ici.

Recherche du mot technocratie

La tendance globale est valable : apparition dans les années 1930, et explosion dans les années 1960. Mais si l'on regarde en détail d'autres éléments (ex. le petit bourrelet années  1900, qui intrigue et intéresse, du coup), on tombe sur une occurrence de la revue Scientia, en effet créée en 1910 :

Mais la référence du mot est en fait celle d'un numéro bien ultérieur de la revue, puisqu'il parle d'un ouvrage paru en 1964 (et dont l'occurrence apparaît pourtant en 1910, puisque c'est la date de création de la revue qu'indexe Google Books...) !

Donc, vigilance sur ces dates d'occurrence de mots dans NGramViewer. C'est dû au mode d'indexation très grossier de Google Books pour les revues, point que nous avions déjà souligné à charge de Google Books dans notre ouvrage Au Pays de Numérix (PUF, 2015).

Partager cet article
Repost0

commentaires

Présentation

  • : Humanités numériques, édition scientifique, diffusion numérique de la connaissance, Enseignement supérieur et recherche, géographie et histoire industrielles (auteur Alexandre Moatti) = ISSN 2554-1137
  • : Discussions sur le projet de Bibliothèque numérique européenne, sur les bibliothèques numériques en général; sur l'édition scientifique papier & en ligne.
  • Contact

Avant-propos

Ce blog est créé à la rentrée scolaire 2006 pour suivre les sujets suivants:
# Bibliothèque numérique européenne (BNUE), et bibliothèques numériques en général.
# Edition et revues scientifiques.
Il est étendu en 2023 sur des sujets connexes aux précédents, mais néanmoins liés : patrimoine industriel, géographie industrielle.

 
Alexandre Moatti
 
 

Recherche