I-A-2

De UDPN wiki
Aller à la navigation Aller à la recherche

A- Qui numérise et pourquoi ?

Du local au global : le travail de la numérisation

Olivier Ritz / oritz(a)orange.fr

Avertissement

Vous trouverez ci-dessous une ébauche de chapitre. Ma connaissance des questions abordées est très empirique et par conséquent partielle et sans doute naïve (je suis spécialiste de littérature, pas d'organisation du travail....). Toutes vos suggestions seront donc les bienvenues, surtout si vous avez des références bibliographiques à me suggérer pour étayer ou renforcer mon propos. Merci !


Ébauche

[Nouveau titre] Du local au global : le travail de la numérisation

Introduction

Ouverture : la numérisation du patrimoine vue par Mathias Énard dans Rue des voleurs.

Lakhdar, le héros du roman, est embauché dans la Zone France de Tanger pour faire de la saisie kilométrique. Celui qui numérise ? Il veut gagner de l’argent. Usage imprévu : appropriation culturelle. Qui est à l’initiative ? Un patron, lui-même répond à une commande publique.

La situation romanesque met en évidence une distance entre celui qui veut la numérisation et celui qui la fait. Lui est au Maroc. Ne peut pas aller en France. Numérise un patrimoine qu’il voudrait faire sien, mais ce n’est pas ce qu’on lui demande et la frontière lui est fermée.


Introduction : qui fait quoi ? Décision de numériser ; production des données numériques ; traitement (OCR par exemple) ; stockage et archivages des données (serveurs), éditorialisation (métadonnées), publication, valorisation… (En note : remarquer les catégories utilisées par Huma-Num : https://www.huma-num.fr/services-et-outils).

Des tâches multiples, souvent complexes, mais aussi une part de tâches automatisables ou tâches d’exécution simple.

À quoi il faudrait ajouter, financer la numérisation et, dès lors que le travail implique plusieurs personnes, gérer les ressources humaines.


Paradoxalement, on peut tout faire tout seul. Outils et techniques courantes. Prendre des objets ou des textes en photo, les classer, les transmettre. Dans la recherche aussi, soit pratique savante ordinaire, soit projet ponctuel. Mais à l’inverse, des entreprises de numérisation très grandes, le cas extrême étant celui de Google Livres.


Intentions de ce chapitre : envisager la numérisation comme un travail et réfléchir à l’articulation entre le travail individuel et le travail collectif. (1) Questions d’échelle et de structure. (2) Organisation du travail. (3) Singulier et collectif : une articulation difficile.

1. De l’autoentreprise à la multinationale

Échelles et structures des programmes de numérisation.


L’individu. Celui ou celle qui numérise seul, pour son compte. Conservation. Photographies familiales (Référence : H. Bourdeloie et Ch. Chevret-Castellani, L’impossible patrimoine numérique). Chercheur qui numérise les objets sur lesquels il travaille, qui archive, classe. (Référence : J. Le Marec et F. Mairesse, Enquête sur les pratiques savantes ordinaires.)

Mais aussi les scientifiques qui travaillent seuls sur un projet de numérisation (Exemple à choisir).


L’atelier. Association, collectivité locale, institution patrimoniale, projet de recherche, cours. Petit groupe. Quelque chose d’artisanal au sens où empirique. Imite ce qui a été fait ailleurs. Invente des protocoles. Peu de moyens : infrastructures, compétences, matériel. Organisation souple, autour d’une ou plusieurs personnes qui dirigent / coordonnent.

Objectif : des projets spécifiques.

Imite souvent des projets antérieurs.


Le chantier. Question d’échelle. Gros projets, moyens importants. Et surtout participation de plusieurs institutions. Exemples : grande collecte et ENCCRE. Équipes plus structurées, s’appuyant sur des moyens humains et matériels importants, mais limités dans le temps. Quand le chantier est achevé l’équipe ne continue pas. Modèle encouragé par les modes de financement de la recherche actuel.


L’industrie. Structure permanente, grande force de travail. Capitaux (économique, humains, scientifiques). Et question d’organisation : protocoles de travail plus élaborés, hiérarchies. Des entreprises privées (Arkhênum), des départements dédiés dans des institutions (Gallica, Stanford, l’Obvil …)


Objectif : projets aussi, mais pas une fin en soi. Image de l’entreprise : preuve de son efficacité. Et aussi capacité à se présenter comme prestataire.


La multinationale. Google bien sûr, et en particulier Google Livres pour le patrimoine. Concentration et accumulation du patrimoine. Puissance extraordinaire. Mais aussi institutions publiques : Europeana. Et organisations non lucratives : bien sûr Wikipédia (éditorialisation) et Wikimédia Commons.


La métaphore de l’industrie traditionnelle suivie jusque-là empêche de prendre en considération un élément :


Le réseau. Des personnes, des équipes, des institutions qui travaillent en lien les uns avec les autres.

Origine de la puissance des géants de la numérisation, marchands ou non. ((D. Cardon, Culture numérique, p. 296) Mise en relation de contenus. Mis en commun d’un travail produit par des acteurs nombreux et divers, de toutes tailles d’ailleurs (Google : depuis la collaboration avec de très grandes bibliothèques patrimoniales jusqu’au captcha qui permet d’améliorer la reconnaissance de caractères).

Mais aussi manière de faire avec des moyens limités. Consortiums d’Huma-Num. UDPN. Entraide, mise en commun de questionnements et de solutions.


= Réseaux facilités par les outils numériques. Susceptible de modifier organisation du travail.

2. Quelle organisation du travail ?

Professionnels et amateurs. Degrés de savoir très divers. Mais grande diversité aussi des savoirs impliqués. Professionnels du patrimoine, de l’informatique, de la recherche, de l’édition…

Vision optimiste : personne ne pouvant être spécialiste de tout, chacun apprend des autres. La diversité des savoirs rend inévitable le travail collaboratif.

Poussé à l’extrême, c’est le modèle de Wikipédia : personne n’est spécialiste de rien.

Cardon, 131 : Wikipédia, l’encyclopédie des ignorants

« Les participants ne sont pas compétents, ils le deviennent parce qu’ils s’obligent mutuellement à respecter des procédures qui mobilisent leur intelligence. »

Vision pessimiste : on perd du temps à essayer de traiter des tâches pour lesquelles on n’a pas été formé et on a du mal à se comprendre entre spécialistes de différents domaines.

= La possibilité de travailler dépend beaucoup de l’organisation.

Organisation interne. Deux tendances : (1) division du travail, spécialisation et hiérarchies (2) collaboration, hybridation des compétences, apprentissage en faisant. (Voir peut-être le projet Corpus de la BNF.) Le plus souvent un mixte des deux, mais des degrés divers. Possibilités ouvertes par les outils collaboratifs (éditeur de texte, wiki…).

Attention cependant de se garder d’une illusion : on ne peut pas se passer de spécialistes. Et si l’on veut travailler de manière collaborative, il faut un support logistique très fort. Exemple : les projets du centre Seebacher et le rôle clé de l’ingénieure d’étude.


On est donc souvent amené à s’appuyer aussi sur des moyens externes.

Prestataires externes. Matériel, protocole et plus encore professionnels. Informaticiens qui travaillent sur devis (développeurs, graphistes). Externalisation contrainte, par manque de moyens, par le mode de financement des programmes de numérisation. Ou parce que besoins très spécifiques et limités dans le temps.


Institutions. Subventions, mais avec le système d’appel à projets, peu efficace. Services informatiques des organismes patrimoniaux ou de recherche (qui manquent souvent de moyens). Plus intéressant : des services d’aide à la numérisation. Des institutions qui numérisent et qui partagent leur savoir-faire (Gallica marque blanche). Services d’aide à la recherche, en particulier dans les BU. Et à plus grande échelle : TGIR HumaNum.


Sous-traitance. Des tâches d’exécution qui ne demandent que des compétences limitées ? Saisie, quand l’OCR n’est pas mieux (comme chez Mathias Énard). Numérisation des images (photographies des mains sur Google Livre). Recours à des entreprises qui elles-mêmes peuvent externaliser... Vacations, stagiaires.

Nécessité ? Plus grande efficacité ? Perte d’information ?


Production participative. (Crowdsourcing). Possibilité de signaler des erreurs. Atlasmuseum. Testaments de poilus. Wikimédia bien sûr.

La production participative n’est-elle qu’une sous-traitance déguisée ? (Faire référence aux débats sur le digital labor, par exemple en repartant de la synthèse de D. Cardon).

Différence : travail gratuit certes, mais usagers-producteurs. Intéressés au résultat, ou plus exactement, intéressés à l’élaboration du résultat.


3. Singulier et collectif : une articulation difficile

[Revoir le séminaire sur les risques.]


Le risque de l’isolement. Tout inventer soi-même ou réinventer. Faire les mauvais choix techniques. Ne pas réussir à évaluer le travail nécessaire pour mener à bien le projet. Faire ce qui a déjà été fait ailleurs. Produire des données obsolètes avant même leur publication complète… Se rendre compte qu’on aurait été plus rapidement au même résultat sans la numérisation.


Le risque de la dépendance. À des financements, à des logiciels, à des personnes.


Le risque de la contrainte. Ne pas pouvoir choisir. Risque connu des outils numériques. Le calcul n’est pas neutre. Les outils et les techniques utilisées ont une influence sur l’opération produite et sur son résultat. = Devoir se plier aux choix des autres.

Se plier à des standards mal adaptés aux objets numérisés. Perdre beaucoup de temps à apprendre des protocoles (ce qui peut ralentir considérablement le travail de numérisation).


Besoin de moyens. Et de mutualisations (y compris pour pallier le manque de moyens). Mais aussi besoin que celles et ceux qui travaillent aient le plus possible la maîtrise de leur travail. Formation, qualification, statut, rémunération. Et dans la manière de travailler et de faire travailler : qu’ils puissent s’approprier leur travail en y trouvant du sens.

Conclusion

Quels usages des patrimoines numérisés par celles et ceux qui les produisent ? Si exécution d’une tâche très encadrée, avec forte division du travail, aucun sens. Isolement même dans un groupe ou un réseau.

Retour à l’exemple de Lakhdar, le personnage de Mathias Énard. Tâche en apparence la plus ingrate : fiches militaires. Devient chercheur : noms de lieux. Reconstitue des trajectoires. Lit. Trouve des échos poétiques. Redonne vie. Dans la fiction, c’est lui qui a fait l’usage le plus riche de ses fiches.

Dans la réalité, c’est Mathias Énard qui fait un usage inattendu et riche. Et cette richesse vient de ce qu’il ne prend pas l’information numérisée brute, mais qu’il s’intéresse à la manière dont elle a été produite. Suggère qu’il est intéressant de montrer ceux qui ont fait le patrimoine numérisé. Originalité et intérêt du site Testaments de Poilus.


---------

Projet de chapitre initial

Une typologie des promoteurs des opérations de numérisation révèle actuellement leur grande diversité : initiatives publiques ou privées, grandes et petites organisations, institutions vouées à la recherche, à la conservation, à la valorisation, entreprises dédiées à la numérisation ou services d’archives d’entreprises qui se consacrent à d’autres activités, etc.

La numérisation peut être le fait d’institutions de tailles diverses mais aussi, aujourd’hui, de particuliers. L’accessibilité croissante des matériels et des logiciels a fait baisser les coûts des opérations de numérisation. Il arrive aussi aux institutions de prendre en charge des collections privées, qui sont ainsi valorisées avec un objectif (pas toujours atteint) de pérennisation (10). Les motivations peuvent être ainsi encore plus variées et, en particulier, les usages anticipés font l’objet de représentations plus ou moins claires et plus ou moins pertinentes.

Les numérisations à visée scientifique, de même, peuvent être assurées par des institutions ou des chercheurs individuels. Des organismes comme le CNRS, le TGIR Huma-Num, certains établissements d’enseignement supérieur mettent en place des dispositifs, humains et technologiques, qui permettent de recenser ces ressources, de les pérenniser et de faciliter leur mise à jour et leur consultation. Elles sont en effet souvent caractérisées par leur fragilité, des formats hétérogènes, un statut juridique incertain, leur faible accessibilité. Bien souvent, la question des usages ne se pose que dans le cadre d’un projet de recherche ponctuel, même si des organismes comme l’ANR mentionnent souvent, dans leurs appels à projets, la mise à disposition des données produites.

Ainsi, les institutions traditionnellement dédiées à la conservation et à la consultation des patrimoines ne sont plus les seules à assurer la numérisation et à conserver et diffuser le patrimoine sous sa forme numérique. Le premier effet est celui d’une expansion du territoire patrimonial, au regard à la fois des acteurs de la numérisation, de ses usagers et des objets ainsi patrimonialisés.

Initier des communautés de pratiques, des espaces de coopération autour d’outils, de plateformes, de workflows mutualisés, développés en partenariat, repérer des interlocuteurs, partenaires pour construire de nouvelles briques d’un logiciel, tels sont les objectifs de la plateforme NumaHOP (11). Un autre exemple qu’il convient de mentionner est celui de “Gallica marque blanche” : la BnF a souhaité mutualiser les moyens qui ont été alloués au développement de Gallica et faire ainsi bénéficier ses partenaires de son savoir-faire, en proposant une offre de bibliothèque numérique en marque blanche.


Pistes de réflexion :

● Qui numérise ? quel patrimoine ? Quels outils aujourd’hui pour un état des lieux et une cartographie des opérateurs ?

● Archives de chercheurs : numérique natif, numérisation. Comment en assurer la pérennisation ?

● Comment éviter le doublonnage des numérisations ?

● Quelle (in)formation, quels standards pour les opérateurs de numérisation indépendants ?


Suggestions bibliographiques

● Liévaux, Pascal, et Nathalie Heinich. 2016. Le tournant patrimonial: mutations contemporaines des métiers du patrimoine. Édité par Christian Hottin et Claudie Voisenat. Paris, France: Éditions de la Maison des sciences de l’homme.

● Bourdeloie, Hélène, et Christine Chevret-Castellani. 2019. L’impossible patrimoine numérique? mémoire & traces. Collection UDPN. Lormont, France: Le Bord de l’eau.

● Le Marec, Joëlle, François Mairesse, and Dominique Le Tirant. 2017. Enquête sur les pratiques savantes ordinaires: collectionnisme numérique et environnements matériels . Collection UDPN, Lormont, France: Le Bord de l’eau.

● Dodebei, V., & Tardy, C. (Eds.). (2015). Mémoire et nouveaux patrimoines . (S. Gorovitz, Trans.). Marseille: OpenEdition Press. Retrieved from http://books.openedition.org/oep/411


10 . Voir l’exemple de “La grande collecte”, organisée en 2014 : http://centenaire.org/fr/la-grande-collecte

11 NumaHOP est la plateforme de gestion des chantiers de numérisation mise en oeuvre par la bibliothèque Sainte-Geneviève, la bibliothèque de Sciences Po et la BULAC. Elle permet de gérer une chaîne de numérisation de documents de l’import des notices et du constat d’état des documents physiques à la diffusion et à l’archivage grâce à un interfaçage largement automatisé entre les différentes étapes de la numérisation impliquant les acteurs concernés (prestataires de numérisation, bibliothèques, diffuseurs, CINES). Le bénéfice de cette réalisation est triple : privilégier l’usage de formats normalisés ; favoriser la standardisation des méthodes de travail ; permettre la mutualisation et l’échange des savoir-faire entre les établissements qui utilisent cette plate-forme.