I-A-2

De UDPN wiki
Aller à la navigation Aller à la recherche

A- Qui numérise et pourquoi ?[modifier | modifier le wikicode]

Singulier et collectif : le travail de la numérisation[modifier | modifier le wikicode]

Olivier Ritz / oritz(a)orange.fr

Avertissement[modifier | modifier le wikicode]

Cette version 2, publiée le 3 mars 2021, contient une introduction un peu plus écrite (mais pas relue) et quelques éléments supplémentaires dans l'ébauche qui suit.


Introduction[modifier | modifier le wikicode]


Je passais douze à seize heures devant l’écran, le dos plié comme un ramasseur de haricots verts, à recopier fidèlement, avec mes quatre ou six doigts, des livres, des encyclopédies culinaires, des lettres manuscrites, des archives, tout ce que M. Bourrelier me passait. Le job portait bien son nom : saisie kilométrique, travail au kilomètre ; plus précisément « double saisie », car ce travail d’abruti était fait deux fois, par deux abrutis différents, et on croisait ensuite les résultats, ce qui donnait un fichier fiable, qui pouvait être remis au commanditaire (p. 128-129).


Lakhdar, le jeune héros du roman Rue des voleurs de Mathias Énard a accepté ce travail de numérisation parce qu’il a besoin d’argent pour vivre. Il est employé par une entreprise implantée dans la zone franche de Tanger, dirigée par un Français et répondant à des commandes publiques et privées. La situation romanesque met en évidence la distance entre les commanditaires de la numérisation et celui qui la fait. Par ce travail, Lakhdar se rapproche de l’Europe où il voudrait aller. Il numérise un patrimoine qu’il voudrait faire sien, même si ce n’est pas ce qu’on lui demande et que la frontière est fermée pour lui.


La fiction de Mathias Énard invite à s’interroger sur l’organisation du travail de numérisation et sur ses différents acteurs. Qui est à l’initiative de la numérisation ? Qui définit le corpus à numériser ? Comment les objets à numériser sont-ils rassemblés ?  Qui passe commande et à qui ? Qui produit les données numériques ? Qui s’occupe de leur traitement, de leur stockage, de leur archivage ? Qui prend en charge l’éditorialisation, la publication, la valorisation ? L’aboutissement du processus implique des tâches multiples. Les plus complexes retiennent surtout l’attention, lorsqu’il faut mettre au point un outil spécifique, élaborer un protocole original ou apprendre à se servir de techniques avancées. Cependant, la numérisation passe aussi par des tâches automatisées, le recours à des outils courants ou un simple travail d’exécution qui reste davantage dans l’ombre. Aux différentes opérations qui contribuent directement à la numérisation s’ajoute la recherche de financement, la gestion financière et, dès lors que le travail implique plusieurs personnes, la gestion des ressources humaines.


Paradoxalement, toutes ces tâches peuvent être accomplies par une personne seule. Des outils et des techniques désormais courants permettent de photographier des objets ou des textes, de les traiter automatiquement, par exemple par des logiciels d’OCR, de les classer, de les transmettre, de les publier… À l’inverse, il existe des entreprises de numérisation impliquant de très nombreux acteurs, le cas extrême étant celui de Google Books dont l’objectif annoncé est la numérisation de la totalité des livres imprimés (Voir Marin Dacos et Pierre Mounier, L’Édition électronique, Paris, La Découverte, 2010, p. 57).


L’ambition de ce chapitre est d’étudier la numérisation des patrimoines comme un travail, en s’interrogeant sur ses différents acteurs (personnes et institutions) et sur les relations qu’ils peuvent entretenir. La perspective qui est la mienne est celle d’un enseignant-chercheur, spécialiste de littérature française : par conséquent les exemples à partir desquels je mènerai cette réflexion seront plus souvent du côté des textes que d’autres objets et je me tournerai plus facilement vers l’université et la recherche que vers les institutions patrimoniales. Cependant, si ma situation professionnelle et les projets de numérisation auxquels je participe informent mon regard, je m’appuierai également sur d’autres retours d’expérience et je tenterai de m’inscrire dans une réflexion plus générale sur les transformations du travail. Les processus de numérisation du patrimoine ne consistent pas seulement à produire des données numériques : les protocoles de travail sont eux-mêmes en partie numérisés. De nouveaux outils et de nouvelles techniques transforment profondément les manières d’organiser le travail et les relations entre les personnes et les institutions impliquées.


(1) Questions d’échelle et de structure. (2) Organisation du travail. (3) Singulier et collectif : une articulation difficile.

1. De l’autoentreprise à la multinationale[modifier | modifier le wikicode]

Échelles et structures des programmes de numérisation. Analogie avec


L’individu. Celui ou celle qui numérise seul, pour son compte. Conservation. Photographies familiales (Référence : H. Bourdeloie et Ch. Chevret-Castellani, L’impossible patrimoine numérique). Chercheur qui numérise les objets sur lesquels il travaille, qui archive, classe. (Référence : J. Le Marec et F. Mairesse, Enquête sur les pratiques savantes ordinaires.)

Mais aussi les scientifiques qui travaillent seuls sur un projet de numérisation (Exemple à choisir).

Autoentrepreneur ? Pas au sens qu’a pris ce mot.

On numérise pour soi. À la fois commanditaire, prestataire et usager.


Mais aussi individus en lien avec d’autres.

Une personne isolée chargée de cette mission particulière dans une institution plus vaste (bibliothèque, musée, unité de recherche).

Et désormais l’autoentreprenariat se développe : prestataires qui proposent leurs services. Sur devis.

Polyvalence. Mais si vraiment le travail est isolé, fragilité et difficulté de la transmission. Nécessité de pouvoir s’appuyer à minima sur des infrastructures.

Exemple Guy Rosa.


L’atelier. Association, collectivité locale, institution patrimoniale, projet de recherche, cours. Petit groupe. Quelque chose d’artisanal au sens où empirique. Imite ce qui a été fait ailleurs. Invente des protocoles. Peu de moyens : infrastructures, compétences, matériel. Organisation souple, autour d’une ou plusieurs personnes qui dirigent / coordonnent.

Objectif : des projets spécifiques.

Imite souvent des projets antérieurs.

Exemple : Planete, la FabRev, les FabLab


Le chantier. Question d’échelle. Gros projets, moyens importants. Et surtout participation de plusieurs institutions. Exemples : grande collecte et ENCCRE. Équipes plus structurées, s’appuyant sur des moyens humains et matériels importants, mais limités dans le temps. Quand le chantier est achevé l’équipe ne continue pas. Modèle encouragé par les modes de financement de la recherche actuel.


L’industrie. Structure permanente, grande force de travail. Capitaux (économique, humains, scientifiques). Et question d’organisation : protocoles de travail plus élaborés, hiérarchies. Des entreprises privées (Arkhênum), des départements dédiés dans des institutions (Gallica, Stanford, l’Obvil …)


Objectif : projets aussi, mais pas une fin en soi. Image de l’entreprise : preuve de son efficacité. Et aussi capacité à se présenter comme prestataire.


La multinationale. Google bien sûr, et en particulier Google Livres pour le patrimoine. Concentration et accumulation du patrimoine. Puissance extraordinaire. Mais aussi institutions publiques : Europeana. Et organisations non lucratives : bien sûr Wikipédia (éditorialisation) et Wikimédia Commons.


La métaphore de l’industrie traditionnelle suivie jusque-là empêche de prendre en considération deux éléments :


Le réseau. Des personnes, des équipes, des institutions qui travaillent en lien les uns avec les autres.

Origine de la puissance des géants de la numérisation, marchands ou non. ((D. Cardon, Culture numérique, p. 296) Mise en relation de contenus. Mis en commun d’un travail produit par des acteurs nombreux et divers, de toutes tailles d’ailleurs (Google : depuis la collaboration avec de très grandes bibliothèques patrimoniales jusqu’au captcha qui permet d’améliorer la reconnaissance de caractères).

Mais aussi manière de faire avec des moyens limités. Consortiums d’Huma-Num. UDPN. Entraide, mise en commun de questionnements et de solutions.


Les transformations de l’économie. Institutions publiques. Entreprises. Mais aussi :

Capitalisme de plateforme et ses deux modèles alternatifs : les communs numériques et coopérativisme de plateformes (Compain et alii).


Le jeu. Playground. Intérêt dans le faire, pas dans le résultat. Inventer ses propres règles ou au moins sa propre manière de jouer. Gratuité ? Quelque chose qui sort du travail ?

(Trebor Scholz)


= Réseaux facilités par les outils numériques. Susceptible de modifier organisation du travail.

2. Quelle organisation du travail ?[modifier | modifier le wikicode]

Professionnels et amateurs. Degrés de savoir très divers. Mais grande diversité aussi des savoirs impliqués. Professionnels du patrimoine, de l’informatique, de la recherche, de l’édition…

Trading zone

Vision optimiste : personne ne pouvant être spécialiste de tout, chacun apprend des autres. La diversité des savoirs rend inévitable le travail collaboratif.

Poussé à l’extrême, c’est le modèle de Wikipédia : personne n’est spécialiste de rien.

Cardon, 131 : Wikipédia, l’encyclopédie des ignorants

« Les participants ne sont pas compétents, ils le deviennent parce qu’ils s’obligent mutuellement à respecter des procédures qui mobilisent leur intelligence. »

Vision pessimiste : on perd du temps à essayer de traiter des tâches pour lesquelles on n’a pas été formé et on a du mal à se comprendre entre spécialistes de différents domaines.

On oublie les rôles spécifiques des uns et des autres (Gautier Poupeau)

= La possibilité de travailler dépend beaucoup de l’organisation.

Organisation interne. Deux tendances : (1) division du travail, spécialisation et hiérarchies (2) collaboration, hybridation des compétences, apprentissage en faisant. (Voir peut-être le projet Corpus de la BNF.) Le plus souvent un mixte des deux, mais des degrés divers. Possibilités ouvertes par les outils collaboratifs (éditeur de texte, wiki…).

Attention cependant de se garder d’une illusion : on ne peut pas se passer de spécialistes. Et si l’on veut travailler de manière collaborative, il faut un support logistique très fort. Exemple : les projets du centre Seebacher et le rôle clé de l’ingénieure d’étude.


On est donc souvent amené à s’appuyer aussi sur des moyens externes.

Prestataires externes. Matériel, protocole et plus encore professionnels. Informaticiens qui travaillent sur devis (développeurs, graphistes). Externalisation contrainte, par manque de moyens, par le mode de financement des programmes de numérisation. Ou parce que besoins très spécifiques et limités dans le temps.


Institutions. Subventions, mais avec le système d’appel à projets, peu efficace. Services informatiques des organismes patrimoniaux ou de recherche (qui manquent souvent de moyens). Plus intéressant : des services d’aide à la numérisation. Des institutions qui numérisent et qui partagent leur savoir-faire (Gallica marque blanche). Services d’aide à la recherche, en particulier dans les BU. Et à plus grande échelle : TGIR HumaNum. Consortium.


Sous-traitance. Des tâches d’exécution qui ne demandent que des compétences limitées ? Saisie, quand l’OCR n’est pas mieux (comme chez Mathias Énard). Numérisation des images (photographies des mains sur Google Livre). Recours à des entreprises qui elles-mêmes peuvent externaliser... Vacations, stagiaires.

Nécessité ? Plus grande efficacité ? Perte d’information ?


Production participative. (Crowdsourcing). Possibilité de signaler des erreurs. Atlasmuseum. Testaments de poilus. Wikimédia bien sûr.

La production participative n’est-elle qu’une sous-traitance déguisée ? (Faire référence aux débats sur le digital labor, par exemple en repartant de la synthèse de D. Cardon).

Pierre-Carl Langlais

Différence : travail gratuit certes, mais usagers-producteurs. Intéressés au résultat, ou plus exactement, intéressés à l’élaboration du résultat. Apprendre en faisant (introduction livre F. Clavert)


3. Singulier et collectif : une articulation difficile[modifier | modifier le wikicode]

[Revoir le séminaire sur les risques.]


Le risque de l’isolement. Tout inventer soi-même ou réinventer. Faire les mauvais choix techniques. Ne pas réussir à évaluer le travail nécessaire pour mener à bien le projet. Faire ce qui a déjà été fait ailleurs. Produire des données obsolètes avant même leur publication complète… Se rendre compte qu’on aurait été plus rapidement au même résultat sans la numérisation.


Le risque de la dépendance. À des financements, à des logiciels, à des personnes.


Le risque de la contrainte. Ne pas pouvoir choisir. Risque connu des outils numériques. Le calcul n’est pas neutre. Les outils et les techniques utilisées ont une influence sur l’opération produite et sur son résultat. = Devoir se plier aux choix des autres.

Se plier à des standards mal adaptés aux objets numérisés. Perdre beaucoup de temps à apprendre des protocoles (ce qui peut ralentir considérablement le travail de numérisation).

Citer C. Boulaire.


Besoin de moyens. Et de mutualisations (y compris pour pallier le manque de moyens). Mais aussi besoin que celles et ceux qui travaillent aient le plus possible la maîtrise de leur travail. Formation, qualification, statut, rémunération. Et dans la manière de travailler et de faire travailler : qu’ils puissent s’approprier leur travail en y trouvant du sens.


Conclusion : quels usages des patrimoines numérisés par celles et ceux qui les produisent ? Si exécution d’une tâche très encadrée, avec forte division du travail, aucun sens. Isolement même dans un groupe ou un réseau.

Retour à l’exemple de Lakhdar, le personnage de Mathias Énard. Tâche en apparence la plus ingrate : fiches militaires. Devient chercheur : noms de lieux. Reconstitue des trajectoires. Lit. Trouve des échos poétiques. Redonne vie. Dans la fiction, c’est lui qui a fait l’usage le plus riche de ses fiches.

Dans la réalité, c’est Mathias Énard qui fait un usage inattendu et riche. Et cette richesse vient de ce qu’il ne prend pas l’information numérisée brute, mais qu’il s’intéresse à la manière dont elle a été produite. Suggère qu’il est intéressant de montrer ceux qui ont fait le patrimoine numérisé. Originalité et intérêt du site Testaments de Poilus.


---------

Projet de chapitre initial : Initiatives individuelles et/ou collectives ?[modifier | modifier le wikicode]

Une typologie des promoteurs des opérations de numérisation révèle actuellement leur grande diversité : initiatives publiques ou privées, grandes et petites organisations, institutions vouées à la recherche, à la conservation, à la valorisation, entreprises dédiées à la numérisation ou services d’archives d’entreprises qui se consacrent à d’autres activités, etc.

La numérisation peut être le fait d’institutions de tailles diverses mais aussi, aujourd’hui, de particuliers. L’accessibilité croissante des matériels et des logiciels a fait baisser les coûts des opérations de numérisation. Il arrive aussi aux institutions de prendre en charge des collections privées, qui sont ainsi valorisées avec un objectif (pas toujours atteint) de pérennisation (10). Les motivations peuvent être ainsi encore plus variées et, en particulier, les usages anticipés font l’objet de représentations plus ou moins claires et plus ou moins pertinentes.

Les numérisations à visée scientifique, de même, peuvent être assurées par des institutions ou des chercheurs individuels. Des organismes comme le CNRS, le TGIR Huma-Num, certains établissements d’enseignement supérieur mettent en place des dispositifs, humains et technologiques, qui permettent de recenser ces ressources, de les pérenniser et de faciliter leur mise à jour et leur consultation. Elles sont en effet souvent caractérisées par leur fragilité, des formats hétérogènes, un statut juridique incertain, leur faible accessibilité. Bien souvent, la question des usages ne se pose que dans le cadre d’un projet de recherche ponctuel, même si des organismes comme l’ANR mentionnent souvent, dans leurs appels à projets, la mise à disposition des données produites.

Ainsi, les institutions traditionnellement dédiées à la conservation et à la consultation des patrimoines ne sont plus les seules à assurer la numérisation et à conserver et diffuser le patrimoine sous sa forme numérique. Le premier effet est celui d’une expansion du territoire patrimonial, au regard à la fois des acteurs de la numérisation, de ses usagers et des objets ainsi patrimonialisés.

Initier des communautés de pratiques, des espaces de coopération autour d’outils, de plateformes, de workflows mutualisés, développés en partenariat, repérer des interlocuteurs, partenaires pour construire de nouvelles briques d’un logiciel, tels sont les objectifs de la plateforme NumaHOP (11). Un autre exemple qu’il convient de mentionner est celui de “Gallica marque blanche” : la BnF a souhaité mutualiser les moyens qui ont été alloués au développement de Gallica et faire ainsi bénéficier ses partenaires de son savoir-faire, en proposant une offre de bibliothèque numérique en marque blanche.


Pistes de réflexion :[modifier | modifier le wikicode]

● Qui numérise ? quel patrimoine ? Quels outils aujourd’hui pour un état des lieux et une cartographie des opérateurs ?

● Archives de chercheurs : numérique natif, numérisation. Comment en assurer la pérennisation ?

● Comment éviter le doublonnage des numérisations ?

● Quelle (in)formation, quels standards pour les opérateurs de numérisation indépendants ?


Suggestions bibliographiques[modifier | modifier le wikicode]

● Liévaux, Pascal, et Nathalie Heinich. 2016. Le tournant patrimonial: mutations contemporaines des métiers du patrimoine. Édité par Christian Hottin et Claudie Voisenat. Paris, France: Éditions de la Maison des sciences de l’homme.

● Bourdeloie, Hélène, et Christine Chevret-Castellani. 2019. L’impossible patrimoine numérique? mémoire & traces. Collection UDPN. Lormont, France: Le Bord de l’eau.

● Le Marec, Joëlle, François Mairesse, and Dominique Le Tirant. 2017. Enquête sur les pratiques savantes ordinaires: collectionnisme numérique et environnements matériels . Collection UDPN, Lormont, France: Le Bord de l’eau.

● Dodebei, V., & Tardy, C. (Eds.). (2015). Mémoire et nouveaux patrimoines . (S. Gorovitz, Trans.). Marseille: OpenEdition Press. Retrieved from http://books.openedition.org/oep/411


10 . Voir l’exemple de “La grande collecte”, organisée en 2014 : http://centenaire.org/fr/la-grande-collecte

11 NumaHOP est la plateforme de gestion des chantiers de numérisation mise en oeuvre par la bibliothèque Sainte-Geneviève, la bibliothèque de Sciences Po et la BULAC. Elle permet de gérer une chaîne de numérisation de documents de l’import des notices et du constat d’état des documents physiques à la diffusion et à l’archivage grâce à un interfaçage largement automatisé entre les différentes étapes de la numérisation impliquant les acteurs concernés (prestataires de numérisation, bibliothèques, diffuseurs, CINES). Le bénéfice de cette réalisation est triple : privilégier l’usage de formats normalisés ; favoriser la standardisation des méthodes de travail ; permettre la mutualisation et l’échange des savoir-faire entre les établissements qui utilisent cette plate-forme.