« III-A-3 » : différence entre les versions

De UDPN wiki
Aller à la navigation Aller à la recherche
Balise : Éditeur de wikicode 2017
Balise : Éditeur de wikicode 2017
Ligne 9 : Ligne 9 :
Le concept de documentarisation, développé au début des années 2000, propose une posture d’analyse du document fondée sur son architecture interne et externe et l’articulation de ses composantes sémiotiques. Il permet de penser le document numérisé nativement numérique ou construit dynamiquement en continuité avec le livre, l’article ou le périodique traditionnels. À la fin des années 2010, les grands projets de numérisation de documents patrimoniaux et plus généralement la disponibilité sur le Web d’une masse croissante de documents et de données favorisent de nouvelles pratiques. Des narrations originales, construites par la sélection, l’assemblage et l’enrichissement de ces sources, voient le jour en ligne. Nous envisageons ici l’élargissement de la notion de documentarisation afin d’englober ces formes composites dans la notion de document. Après avoir rappelé les notions de ''documentarisation'' et de ''redocumentarisation'', nous avançons que la documentarisation, dont l’approche traditionnelle considère les procédés donnant accès aux contenus, doit désormais prendre en compte et analyser les procédés d’enrichissement de ces contenus aboutissant à la production d’un supra-document composite. Puis nous montrons que cette nouvelle approche conduit à faire bouger les lignes méthodologiques et à reconsidérer, notamment, les notions d’originalité, d’intégrité et d’autorité.
Le concept de documentarisation, développé au début des années 2000, propose une posture d’analyse du document fondée sur son architecture interne et externe et l’articulation de ses composantes sémiotiques. Il permet de penser le document numérisé nativement numérique ou construit dynamiquement en continuité avec le livre, l’article ou le périodique traditionnels. À la fin des années 2010, les grands projets de numérisation de documents patrimoniaux et plus généralement la disponibilité sur le Web d’une masse croissante de documents et de données favorisent de nouvelles pratiques. Des narrations originales, construites par la sélection, l’assemblage et l’enrichissement de ces sources, voient le jour en ligne. Nous envisageons ici l’élargissement de la notion de documentarisation afin d’englober ces formes composites dans la notion de document. Après avoir rappelé les notions de ''documentarisation'' et de ''redocumentarisation'', nous avançons que la documentarisation, dont l’approche traditionnelle considère les procédés donnant accès aux contenus, doit désormais prendre en compte et analyser les procédés d’enrichissement de ces contenus aboutissant à la production d’un supra-document composite. Puis nous montrons que cette nouvelle approche conduit à faire bouger les lignes méthodologiques et à reconsidérer, notamment, les notions d’originalité, d’intégrité et d’autorité.


==== '''Qu’est-ce que la documentarisation ?''' ====
==== <u>Qu’est-ce que la documentarisation</u> ? ====


Les concepts de ''documentarisation'' et ''redocumentarisation'' ont été initialement théorisés entre 2003 et 2006 par le groupe de recherches collectif Roger T. Pédauque, pseudonyme collectif d’un réseau de scientifiques francophones travaillant dans divers domaines des sciences humaines et sociales ainsi que des sciences et techniques de l’information et de la communication<ref>Ce groupe de recherche a été réuni à partir de 2003 par Jean-Michel Salaün dans un réseau thématique pluridisciplinaire (RTP) « Documents et contenu : création, indexation, navigation » du CNRS ; c’est l’acronyme RTP-Doc qui lui a donné son nom. Voir notamment : Roger T. Pédauque, 2006, Le Document à la lumière du numérique, avec une introduction de Jean-Michel Salaün et une préface de Michel Melot, Caen, C & F Éditions. Voir aussi la présentation du projet par Frédéric Sultan et Jean-Michel Salaün sur http://base.d-p-h.info/fr/fiches/dph/fiche-dph-8220.html (mars 2010 ; consulté le 28 juillet 2020).</ref>. L’objectif commun était de repenser le document dans la période de généralisation du Web et des techniques numériques.
Les concepts de ''documentarisation'' et ''redocumentarisation'' ont été initialement théorisés entre 2003 et 2006 par le groupe de recherches collectif Roger T. Pédauque, pseudonyme collectif d’un réseau de scientifiques francophones travaillant dans divers domaines des sciences humaines et sociales ainsi que des sciences et techniques de l’information et de la communication<ref>Ce groupe de recherche a été réuni à partir de 2003 par Jean-Michel Salaün dans un réseau thématique pluridisciplinaire (RTP) « Documents et contenu : création, indexation, navigation » du CNRS ; c’est l’acronyme RTP-Doc qui lui a donné son nom. Voir notamment : Roger T. Pédauque, 2006, Le Document à la lumière du numérique, avec une introduction de Jean-Michel Salaün et une préface de Michel Melot, Caen, C & F Éditions. Voir aussi la présentation du projet par Frédéric Sultan et Jean-Michel Salaün sur http://base.d-p-h.info/fr/fiches/dph/fiche-dph-8220.html (mars 2010 ; consulté le 28 juillet 2020).</ref>. L’objectif commun était de repenser le document dans la période de généralisation du Web et des techniques numériques.
Ligne 35 : Ligne 35 :
# Les enrichissements résultent de traitements algorithmiques et s’appliquent à de gros volumes de données contenus dans des bases de données, ou ‘crawlés’ par des moteurs d’indexation. Des tris, des regroupements, des affichages sont opérés automatiquement, sans qu’aucun être humain ne maîtrise l’ensemble des données, ni les résultats des traitements. Marcello Vitali-Rosetti (2016) considère que « l’éditorialisation est une instance de mise en forme et de structuration d’un contenu dans un environnement numérique ». C’est-à-dire que pour lui, les plateformes techniques (moteurs de recherche), les structures textuelles (hypertexte, métadonnées), et les pratiques humaines réparties (les commentaires, les annotations, les ‘''like''’) sont de l’éditorialisation.
# Les enrichissements résultent de traitements algorithmiques et s’appliquent à de gros volumes de données contenus dans des bases de données, ou ‘crawlés’ par des moteurs d’indexation. Des tris, des regroupements, des affichages sont opérés automatiquement, sans qu’aucun être humain ne maîtrise l’ensemble des données, ni les résultats des traitements. Marcello Vitali-Rosetti (2016) considère que « l’éditorialisation est une instance de mise en forme et de structuration d’un contenu dans un environnement numérique ». C’est-à-dire que pour lui, les plateformes techniques (moteurs de recherche), les structures textuelles (hypertexte, métadonnées), et les pratiques humaines réparties (les commentaires, les annotations, les ‘''like''’) sont de l’éditorialisation.
On observe que le périmètre de définition du concept de documentarisation/éditorialisation évolue avec le contexte technologique et les usages émergents. Une gradation s’opère depuis le travail minutieux du passionné qui compose une anthologie en collectant et agençant sur le Web des documents d’archives, placés sur des pages et commentés pour construire une narration, jusqu’au moteur de recherche du Web qui sélectionne automatiquement et affiche côte à côte des documents issus du Web formant un lot pertinent pour l’algorithme de recherche.
On observe que le périmètre de définition du concept de documentarisation/éditorialisation évolue avec le contexte technologique et les usages émergents. Une gradation s’opère depuis le travail minutieux du passionné qui compose une anthologie en collectant et agençant sur le Web des documents d’archives, placés sur des pages et commentés pour construire une narration, jusqu’au moteur de recherche du Web qui sélectionne automatiquement et affiche côte à côte des documents issus du Web formant un lot pertinent pour l’algorithme de recherche.
==== <u>De l’accès à l’enrichissement</u> ====
Depuis l’époque du groupe Pédauque, le Web a beaucoup évolué et les pratiques des internautes ont considérablement changé. Désormais, l’objectif de la redocumentarisation n’est plus seulement l’optimisation de l’usage et l’amélioration de l’accès au document. Avec la multiplication des contenus produits ou publiés par les internautes, des archives ouvertes, des catalogues en ligne, etc. le travail de redocumentarisation produit de plus en plus de l’enrichissement, c’est-à-dire des informations et des liens entre documents qui produisent du sens. L’idée selon laquelle la redocumentarisation serait centrée sur les contenus des documents connus pour les gérer ou les contextualiser est donc très incomplète. Le passage des documents au numérique permet aussi de les réarranger, de les relier, et surtout de découvrir de nouveaux documents qui sont en relation.
Les exemples du projet ''PhotosNormandie'' et de l’application ''RetroNews'' permettent d’illustrer ce point de vue.


====Bibliographie====
====Bibliographie====

Version du 4 août 2020 à 22:09

A - Usages et pratiques des patrimoines numérisés : une approche comparative

Documentarisation et redocumentarisation : du document d’archive à la collection patrimoniale documentarisée

Claire Scopsi / claire.scopsi(a)lecnam.net 
Patrick Peccatte / peccatte(a)softexperience.com 

Le concept de documentarisation, développé au début des années 2000, propose une posture d’analyse du document fondée sur son architecture interne et externe et l’articulation de ses composantes sémiotiques. Il permet de penser le document numérisé nativement numérique ou construit dynamiquement en continuité avec le livre, l’article ou le périodique traditionnels. À la fin des années 2010, les grands projets de numérisation de documents patrimoniaux et plus généralement la disponibilité sur le Web d’une masse croissante de documents et de données favorisent de nouvelles pratiques. Des narrations originales, construites par la sélection, l’assemblage et l’enrichissement de ces sources, voient le jour en ligne. Nous envisageons ici l’élargissement de la notion de documentarisation afin d’englober ces formes composites dans la notion de document. Après avoir rappelé les notions de documentarisation et de redocumentarisation, nous avançons que la documentarisation, dont l’approche traditionnelle considère les procédés donnant accès aux contenus, doit désormais prendre en compte et analyser les procédés d’enrichissement de ces contenus aboutissant à la production d’un supra-document composite. Puis nous montrons que cette nouvelle approche conduit à faire bouger les lignes méthodologiques et à reconsidérer, notamment, les notions d’originalité, d’intégrité et d’autorité.

Qu’est-ce que la documentarisation ?

Les concepts de documentarisation et redocumentarisation ont été initialement théorisés entre 2003 et 2006 par le groupe de recherches collectif Roger T. Pédauque, pseudonyme collectif d’un réseau de scientifiques francophones travaillant dans divers domaines des sciences humaines et sociales ainsi que des sciences et techniques de l’information et de la communication[1]. L’objectif commun était de repenser le document dans la période de généralisation du Web et des techniques numériques.

Documentarisation

Le concept de documentarisation épouse l’évolution du document. À l’époque de Pédauque, Manuel Zacklad précise que, dans une logique collective, documentariser signifie doter un support d’attributs permettant de le gérer, de le manipuler, et de s’orienter à l’intérieur de son contenu sémiotique (Zacklad, 2004). Quels sont ces attributs ? Selon Jean-Michel Salaün, il s’agit de pratiques traditionnelles : cataloguer, indexer, découper, résumer, ‘renforcer’ (Salaün, 2007, p. 3). L’objectif annoncé s’applique à tous les types de support.

On peut distinguer deux types de procédés de documentarisation : interne ou externe. Les procédés de documentarisation internes (sommaire, pagination, ancre) visent à aider un lecteur à s’orienter à l’intérieur du document, à autoriser une lecture linéaire ou indexée des contenus, à en identifier les sous-éléments et la structure (chapitres, intertitres, etc.). Les procédés de documentarisation externes permettent, quant à eux, de relier les contenus à des éléments extérieurs (bibliographies, lien hypertextes), de les contextualiser, de donner des informations sur leur fiabilité ou leur provenance (notes), et enfin de rattacher le contenu et/ou le support à un ensemble (une série, une collection ou un assemblage sémantiquement pertinent).

Redocumentarisation – éditorialisation

L’année 2000 constitue un tournant avec l’accélération de la production de documents numériques, de la numérisation de documents préexistants, et de leur diffusion sur le Web. La gamme des attributs de la documentarisation s’enrichit d’attributs propres au numérique, et s’adapte aux nouvelles pratiques numériques : segmentation et identification de segments (URL, URI) en vue d’une recomposition sous forme de mash-up par exemple, mise en forme de données issues de bases de données et assemblées automatiquement pour composer un document doté de métadonnées de contexte (titre, date, auteurs, annotations, folksonomies, tags, notes, commentaires, etc.), enrichissements divers (réalité augmentée, liens hypertextes, géolocalisations, etc.). Manuel Zacklad parle alors d’éditorialisation, ce qui correspond à une documentarisation dans l’univers numérique.

On appelle parfois redocumentarisation, le traitement que l’on fait subir à un document déjà documentarisé sous sa forme analogique, lorsqu’il est numérisé et mis en ligne. S’il est “éclaté” pour être logé dans une base de données, la redocumentarisation vise à caractériser les différents éléments pour permettre la recomposition du document à la volée (Salaün, 2007).

La redocumentarisation de fonds photographiques numérisés ouvre d’autres voies ; elle peut permettre d’identifier d’autres documents en ligne, en relation avec chaque cliché, par exemple d’autres photos appartenant à une même série, des séquences filmées en relation directe, des photos prises par d’autres photographes au même moment, des exemplaires de la photo transmis par radio (radiophoto ou bélino[2]), des annotations et légende qui figurent sur le tirage d’origine, des versions recadrées ou colorisées utilisées sur différents supports, des versions censurées ou non censurées (selon le cas), des strates de légendes attribuées successivement au cliché, des utilisations de la photo à des fins publicitaires, sur des couvertures de livres, de disques, des affiches, sans oublier bien sûr les clichés récents réalisés au même endroit (pratique de la re-photographie – voir exemple ci-dessous). On peut ajouter à ces exemples, des documents textuels, articles, entretiens avec les photographes, ou notes personnelles qui apportent des informations sur les conditions dans lesquelles le cliché a été pris. Ce qui est notable dans ces procédés de redocumentarisation, c’est qu’ils ne visent pas uniquement à ménager l’accès au document, mais qu’ils l’enrichissent d’un sens nouveau en l’associant à d’autres documents.

Figure 1 – Un exemple de re-photographie dans le projet PhotosNormandie. Le 27 juin 1944, le capitaine Earl J. Topley de Saint Paul (Minnesota) regarde le cadavre d’un soldat allemand assis sur des marches devant un portail, rue Armand Levéel à Cherbourg. Celui-ci a été tué après avoir abattu trois de ses GI’s. Réf. p011628. CR de Basse-Normandie/National Archives USA – Recherche et photo moderne Claude Demeester pour PhotosNormandie.

Périmètre de la documentarisation/éditorialisation

Cet enrichissement d’un document par d’autres documents, s’apparente à ce que Gérard Genette (1987) nomme un épitexte[3] dans le contexte de l’édition de textes au 20e siècle. Ce qui change avec le numérique et le Web, ce sont les conditions dans lesquelles s’effectuent les opérations d’identification, de sélection et d’assemblage des éléments composant l’épitexte du texte (qu’il soit écriture, image ou son), et le choix des procédés d’enrichissements. Pour caractériser les formes de documentarisations numériques, il est nécessaire de prendre en compte les volumes traités, le type et le nombre d’acteurs impliqués, le degré d’automatisation du traitement, et enfin la finalité du traitement : produire des accès et/ou produire du sens. On distingue ainsi trois formes de documentarisation numérique :

  1. Les choix sont effectués, de façon raisonnée, par un auteur/éditeur qui crée du sens en contextualisant des documents, ou en mettant plusieurs documents en relation par des procédés éditoriaux. Cela procède d’une forme de curation, qui donne à voir un ensemble de documents peu nombreux et organisés manuellement. Cette forme d’éditorialisation, très orientée vers la production de sens, peut prendre la forme d’articles rédigés, d’expositions virtuelles ou de web-documentaire. Le site RetroNews[4], qui publie des articles thématiques fortement nourris et illustrés de documents issus de Gallica, en est un bon exemple. Nous y reviendrons dans la partie 2.
  2. Les enrichissements sont effectués collaborativement, par un groupe coordonné d’internautes, selon des règles partagées, et s’appliquent à des volumes importants de documents. La plateforme Testaments de poilus[5] qui organise la transcription collaborative, par des internautes, de lettres manuscrites de soldats, en est un exemple. PhotosNormandie[6], que nous détaillons plus loin, relève aussi de cette catégorie, qui parvient à produire du sens sur des volumes assez importants de documents, grâce au nombre des intervenants, à leur compétence, et à leur encadrement par des animateurs.
  3. Les enrichissements résultent de traitements algorithmiques et s’appliquent à de gros volumes de données contenus dans des bases de données, ou ‘crawlés’ par des moteurs d’indexation. Des tris, des regroupements, des affichages sont opérés automatiquement, sans qu’aucun être humain ne maîtrise l’ensemble des données, ni les résultats des traitements. Marcello Vitali-Rosetti (2016) considère que « l’éditorialisation est une instance de mise en forme et de structuration d’un contenu dans un environnement numérique ». C’est-à-dire que pour lui, les plateformes techniques (moteurs de recherche), les structures textuelles (hypertexte, métadonnées), et les pratiques humaines réparties (les commentaires, les annotations, les ‘like’) sont de l’éditorialisation.

On observe que le périmètre de définition du concept de documentarisation/éditorialisation évolue avec le contexte technologique et les usages émergents. Une gradation s’opère depuis le travail minutieux du passionné qui compose une anthologie en collectant et agençant sur le Web des documents d’archives, placés sur des pages et commentés pour construire une narration, jusqu’au moteur de recherche du Web qui sélectionne automatiquement et affiche côte à côte des documents issus du Web formant un lot pertinent pour l’algorithme de recherche.

De l’accès à l’enrichissement

Depuis l’époque du groupe Pédauque, le Web a beaucoup évolué et les pratiques des internautes ont considérablement changé. Désormais, l’objectif de la redocumentarisation n’est plus seulement l’optimisation de l’usage et l’amélioration de l’accès au document. Avec la multiplication des contenus produits ou publiés par les internautes, des archives ouvertes, des catalogues en ligne, etc. le travail de redocumentarisation produit de plus en plus de l’enrichissement, c’est-à-dire des informations et des liens entre documents qui produisent du sens. L’idée selon laquelle la redocumentarisation serait centrée sur les contenus des documents connus pour les gérer ou les contextualiser est donc très incomplète. Le passage des documents au numérique permet aussi de les réarranger, de les relier, et surtout de découvrir de nouveaux documents qui sont en relation. Les exemples du projet PhotosNormandie et de l’application RetroNews permettent d’illustrer ce point de vue.

Bibliographie

● Bachimont, Bruno, 2010, La présence de l’archive : Réinventer et justifier. Association pour la Recherche sur la Cognition, 53‑54, pp.281-309. https://doi.org/<hal-00769664>

● Chabin, Marie-Anne, 2011, Peut-on parler de diplomatique numérique ?, août 2011, publié dans l’ouvrage Vers un nouvel archiviste numérique, sous la direction de Valentine Frey et Matteo Treleani, Paris, Éditions L’Harmattan, 2013 http://www.marieannechabin.fr/diplomatique-numerique/

● Crozat, Stéphane, 2012, Chaînes éditoriales et rééditorialisation de contenus numériques. In Lisette Calderan, Pascale Laurent, Hélène Lowinger, Jacques Millet, Le document numérique à l’heure du web, ADBS, pp.179-220, 2012, Sciences et techniques de l’information, 978-2-84365-142-7. hal-00740268 https://hal.inria.fr/hal-00740268

● Doueihi, Milad, 2010, Vers une culture anthologique. Documentaliste-Sciences de l’Information, Volume 47 (n° 1,), pages 59-60.

● Doueihi, Milad, 2011, Pour un humanisme numérique, Paris, Le Seuil

● Genette, Gérard, 1987, Seuils, coll. « Poétique ». Paris, Le Seuil

● ICA-Req, 2008, Principles and functional requirements for records in electronic office environments, International Council on Archives / Conseil International des Archives, ISBN: 978-2-918004-00-4 http://www.sa-fvg.archivi.beniculturali.it/fileadmin/materiali/ICA__Principles_and_Functional_Requirements_for_Records_in_Electronic_Office_Environments.pdf

● Salaün, Jean-Michel, 2007, La redocumentarisation, un défi pour les sciences de l’information. Études de communication, 30, 13-23 https://doi.org/10.4000/edc.428

● Treleani Matteo, 2014, Les dispositifs de recontextualisation, in Mémoires audiovisuelles, collection « Parcours Numériques », Les Presses de l’Université de Montréal, Montréal, p. 109-131, ISBN: 978-2-7606-3368-1 http://www.parcoursnumeriques-pum.ca/les-dispositifs-de-recontextualisation

● Vitali Rosati, Marcello, 2016, Qu’est-ce que l’éditorialisation ?, Sens Public http://sens-public.org/article1184.html

● Zacklad, Manuel, 2004 (octobre 13), Processus de documentarisation dans les Documents pour l’Action (DopA) : Statut des annotations et technologies de la coopération associées. Numérique : impact sur le cycle de vie du document (Le), Montréal http://www.enssib.fr/bibliotheque-numerique/notices/1223-le-numerique-impact-sur-le-cycle-de-vie-du-document

  1. Ce groupe de recherche a été réuni à partir de 2003 par Jean-Michel Salaün dans un réseau thématique pluridisciplinaire (RTP) « Documents et contenu : création, indexation, navigation » du CNRS ; c’est l’acronyme RTP-Doc qui lui a donné son nom. Voir notamment : Roger T. Pédauque, 2006, Le Document à la lumière du numérique, avec une introduction de Jean-Michel Salaün et une préface de Michel Melot, Caen, C & F Éditions. Voir aussi la présentation du projet par Frédéric Sultan et Jean-Michel Salaün sur http://base.d-p-h.info/fr/fiches/dph/fiche-dph-8220.html (mars 2010 ; consulté le 28 juillet 2020).
  2. La radiophoto ou téléphotographie est l’envoi d’images par télégraphe, téléphone ou radio. Le bélinographe mis au point par Édouard Belin au début du 20ème siècle, est un exemple de ces systèmes
  3. Dans une forme éditée, le paratexte tel qu’il est défini par Genette est un « ensemble hétéroclite de pratiques et de discours » qui entourent un texte. On y distingue : – le péritexte, qui est intégré à la forme éditée : titre, sous-titre, préface, postface, prière d’insérer, avertissement, épigraphe, dédicace, notes, quatrième de couverture. – l’épitexte, qui tout en étant extérieur à la forme éditée, vient la compléter : critiques, entretiens avec l’auteur, correspondance, journaux intimes, etc.
  4. RetroNews : https://www.retronews.fr
  5. Testaments de poilus : https://testaments-de-poilus.huma-num.fr/#!/
  6. FAQ du projet PhotosNormandie : https://dejavu.hypotheses.org/2998