L’édition numérique et l’analyse de corpus dans les manuscrits de la Nouvelle-France

La période de la Nouvelle-France, longue de plus de deux siècles, est au cœur des identités canadienne, québécoise et autochtones (Carpin, 1995). Éloignés de nous par le temps comme par la langue, les documents de cette période sont non seulement des textes (porteurs d’informations ou d’idées), mais aussi des objets, dont la matérialité même (disposition du texte, graphies, encres, ratures, etc.) peut recéler des renseignements historiques importants. Ainsi, pour saisir la nature complexe de ces documents et bien interpréter leur signification, il faut les étudier simultanément dans leur textualité et dans leur matérialité (De Grazia et Stallybrass, 1993).

Or, jusqu’ici, l’analyse matérielle des documents était une discipline en marge de l’histoire et du littéraire (étude philologique, pour l’histoire des textes, critique génétique, pour l’analyse du processus créateur) et se trouvait confinée à des corpus modestes (en raison du temps que prend la comparaison manuelle des documents), alors que les textes sur la Nouvelle-France se répondent, s’entrecroisent, se contredisent, se réécrivent constamment : de la correspondance administrative aux relations missionnaires en passant par la correspondance privée, la production cartographique ou les documents judiciaires, une analyse matérielle tenant compte des ratures, des hésitations, des effacements peut mettre au jour des correspondances, des incohérences ou des ruptures entre les documents et donc éclairer les processus, les enjeux, les réseaux par lesquels ces documents circulent.

Aujourd’hui, l’intelligence artificielle et les possibilités de traitement offertes par le numérique permettent d’analyser de vastes corpus tout en tenant compte des caractéristiques matérielles et structurelles de l’archive même. Toutefois, l’étude globale de la production et de la circulation documentaire en Nouvelle-France nécessite que les données historiques (documents numérisés, transcriptions et métadonnées) soient gérées, stockées et traitées de façon uniforme et pérenne. Or, la mise en commun de telles données, fondamentale pour renouveler la recherche, soulève des enjeux cruciaux pour les institutions dépositaires de documents anciens dont elles doivent assurer l’intégrité, la conservation et la diffusion. Un tel projet exige donc la création d’un partenariat entre chercheurs et institutions d’archives, parmi lesquelles figurent des institutions majeures de la conservation des documents anciens au Québec et au Canada : Bibliothèque et Archives nationales du Québec (BAnQ), Bibliothèque et Archives du Canada (BAC), le Musée de la civilisation de Québec (MCQ), la Division de la gestion de documents et des archives et la Bibliothèque des livres rares de l’Université de Montréal.

Le projet Nouvelle-France poursuit les objectifs suivants :

  1. approfondir notre compréhension du processus de production documentaire en Nouvelle-France et des liens qu’entretiennent des documents de différentes natures – ou leurs auteurs – les uns avec les autres en interrogeant des ensembles documentaires et en tenant compte non seulement des textes, mais aussi de l’historicité de ces textes (liée au processus d’écriture et de réécriture) ;
  2. établir, en collaboration avec l’ensemble des cochercheurs et des centres d’archives partenaires, un protocole unifié de traitement et de gestion des images (fournies par les partenaires) et des données textuelles et métatextuelles (fournies par les chercheurs), afin de regrouper dans une plate-forme commune des corpus constitués d’images, de textes et de métadonnées, dans le but de permettre l’interrogation simultanée ou croisée de tous ces documents ;
  3. planifier les conditions de mise en ligne des données et métadonnées issues des recherches et établir des partenariats permettant d’assurer, à long terme, le partage et la pérennité des données, dans le respect du mandat de conservation des institutions partenaires ;
  4. diffuser nos protocoles et nos résultats de recherche au Canada et à l’international, d’une part, et les données générées (transcriptions à valeur ajoutée), d’autre part.