I-B-2

De UDPN wiki
Aller à la navigation Aller à la recherche

B- Numériser, c’est prévoir des usages[modifier | modifier le wikicode]

Archive/collection/corpus[modifier | modifier le wikicode]

Thomas Lebarbé/lebarbet(a)univ-grenoble-alpes.fr

Les trois termes doivent bien être distingués pour clarifier les usages prévus et la nature de la numérisation.

● Archive : c’est un ensemble documentaire constitué en vue de sa conservation et de son accessibilité

● Collection : c’est un ensemble documentaire choisi en fonction de critères d’homogénéité (par exemple : donation, série éditoriale, localisation, thématique, etc.)

● Corpus : c’est un ensemble documentaire rassemblé dans un objectif scientifique et destiné à une étude particulière

Les trois termes s’appliquent aussi bien aux originaux qu’à leur numérisation. La notion de corpus présuppose un usage scientifique, ce qui n’est pas le cas de celle de collection. Dans le cadre d’une opération de numérisation, la nécessaire coopération entre conservateurs et chercheurs peut se trouver affectée par cette différence de point de vue. De plus, le terme de corpus n’est pas forcément utilisé, et pas de la même manière, par les différentes communautés de la recherche et du patrimoine. En constituant un corpus, il s’agit de produire de nouveaux savoirs, et pas seulement de transmettre une archive. Diverses pratiques accompagnent cette transformation de l’archive matérielle en corpus numérique : annotation, balisage, indexation, ajout de métadonnées, et selon les cas transcription, traduction, sous-titrage, etc. Le document qui en résulte est donc à la fois, paradoxalement, appauvri en ce qu’il ne véhicule pas toute l’information de l’objet initial mais également enrichi de tout ce qui lui a été ajouté en vue de ses usages scientifiques. La numérisation est forcément assurée par des équipes interdisciplinaires et les documents numérisés sont ouverts aux usages de plusieurs disciplines ou catégories d’utilisateurs. Certains corpus prévus pour une étude particulière peuvent ainsi être réutilisés pour d’autres études très éloignées et pour d’autres usages. Il est aussi possible de réemployer seulement une partie du corpus initial, ou de le combiner avec d’autres.

Pistes de réflexion :[modifier | modifier le wikicode]

● De la collection au corpus : dialogue entre conservateurs et chercheurs

● Métadonnées de conservation et métadonnées de corpus numériques : convergence ou incompatibilité ? Interopérabilité ?

Suggestions bibliographiques :[modifier | modifier le wikicode]

● “Valorisation des corpus numérisés”. Les Cahiers du numérique 2012/3 (Vol. 8) [En ligne]. Disponible sur : <http://www.cairn.info/revue-les-cahiers-du-numerique-2012-3.htm > ISBN : 978-2-7462-3992-0.

● BERMÈS, E., MARTIN, F.. “Le concept de collection numérique” Bulletin des Bibliothèques de France , t. 55, n°3, 13-17. En ligne sur http://bbf.enssib.fr/consulter/bbf-2010-03-0013-002.pdf

● BERT J.-F., Qu’est-ce qu’une archive de chercheur ? OpenEdition Press, 2014, 78 p., ISBN : 978-2-8218-3462-0.

● BÜLOW A., AHMON J., SPENCER R., Preparing Collections for Digitization . Facet Publishing, 2011, 209 p., ISBN : 978-1-85604-711-1.

● JOHNSTON, Trevor. “From archive to corpus: Transcription and annotation in the creation of signed language corpora”. International journal of corpus linguistics , 2010, vol. 15, no 1, p. 106-131.

● Cécile MEYNARD et Thomas LEBARBÉ, « Au croisement des lettres, de la linguistique et de l’informatique : Les Manuscrits de Stendhal en ligne », Fabula-LhT , n° 8, « Le Partage des disciplines », mai 2011, URL : http://www.fabula.org/lht/8/lebarbe.html

● PASTORE, Graziella. Les coopérations entre chercheurs et bibliothécaires dans le cadre des projets de numérisation de corpus documentaires . 2017. Thèse de doctorat.

● STOCKINGER, Peter. Les archives audiovisuelles: description, indexation et publication . Lavoisier, 2011.