Donner le goût de l’archive à l’ère numérique: Production et partage de données historiques et archéologiques sur les peuples de Montréal au 17e siècle constitue une véritable révolution dans la manière d’effectuer la recherche historique, et partant, de comprendre notre passé. Ce projet de développement partenarial entend bâtir un modèle viable et ouvert de coopération de recherche, de production et de partage de données historiques et archéologiques. Le partenariat s’appuie sur des technologies de pointe dans le domaine des humanités numériques pour mettre en valeur et partager des ressources archivistiques négligées jusqu’ici parce que trop difficiles à lire et peu accessibles. Pour ces raisons, on connaît encore très mal la population de Montréal au 17e siècle, éminemment plus variée que ce que l’on pense et quand on s’y intéresse, on est frappé par la fragmentation et le dédoublement récurrents des données qui transforment de la recherche un véritable parcours du combattant. Pour associer l’ensemble des données existantes, les rendre accessibles et compatibles avec l’information contenue dans les archives notariales et judiciaires, nous développerons un partenariat d’envergure et une méthode de liaison des données afin d’offrir l’analyse historique, la description analytique, la transcription et l’accès en ligne des archives qui renseignent sur les différentes collectivités peuplant Montréal au 17e siècle.

Contexte et problématique

Au Québec, les archives judiciaires, notariales, paroissiales et les artéfacts archéologiques constituent un ensemble de fonds d’une profondeur historique et d’une continuité remarquables grâce auxquelles les chercheur-e-s reconstituent l’évolution de la société canadienne depuis ses débuts coloniaux jusqu’à nos jours et le fonctionnement du système judiciaire (Kolish, p. 5). C’est pourquoi Bibliothèque et Archives nationales du Québec (BAnQ), la Bibliothèque des livres rares et collections spéciales de l’Université de Montréal (BLRCS), la Division de la gestion de documents et des archives de l’Université de Montréal (DGDA) et le Musée Pointe-à-Callière (MPAC) se sont donné pour mission de rendre accessibles au plus grand nombre leurs archives et artéfacts indispensables à la compréhension du passé de notre pays. Puisant largement dans ces archives, le Programme de Recherches en Démographie Historique (PRDH) avec RPQA et la Société de recherche historique Archiv-Histo avec Parchemin, les chercheur-es Deslandres (Baillage de Montréal), Gohier (Nouvelle-France numérique), Robichaud (ADHEMAR) et les collaborateurs Laberge (Répertoire des seigneuries du Québec et Dictionnaire de Biographies du Canada DBC) et Gates-St-Pierre (Projet Tiohtià:ke)ont constitué des bases de données uniques au monde qui ont permis la production d’ouvrages, de  mémoires et de thèses de qualité sur des sujets aussi variés que, par exemple, les finances (Desbarats), la justice (Decroix, Gilles et Morin; Fyson 1995 et 2005, Garneau, Wenzel) la  délinquance et la marginalité (Lachance; Leclerc; Villeneuve), la pauvreté (Fecteau), la généalogie (DBC, Tanguay), les enfants (Cliche), les femmes (Clio; Deslandres; Dumont; Noel; Sleeper-Smith; Viau), l’honneur (Hubert; Moogk), l’expansion vers les pays d’en haut et la traite des fourrures (Dechêne; Havard), l’esclavage (Trudel; Rushforth; Viau), les procurations et le système seigneurial (Grenier), les relations des colons avec les autochtones (Deslandres; Dickinson; Grabowski; Viau), le genre (Berthelet; Deslandres; Gilles; Girault).

Dans cet ensemble, les archives du tout premier tribunal montréalais, dit Bailliage de Montréal, occupent une place essentielle. Elles constituent une source extraordinairement riche sur l’évolution de la société, l’économie, le droit, la religion, la criminalité, les relations franco-autochtones, etc. Ce tribunal enregistre tous les litiges criminels ou civils en première instance : ses documents attestent donc d’une très grande variété d’activités humaines qui ont fait l’histoire du Canada. En témoignent les  travaux renommés de Louise Dechêne, Roland Viau, Marcel Trudel et Léon Robichaud passant par Adhémar – Base de données du Groupe de recherche sur Montréal. Propriété, bâti et population, 1642-1805 (voir bibliographie), travaux qui se fondent sur les archives du Bailliage de Montréal pour reconstituer l’évolution historique non seulement de la ville, de l’île et sa région, mais aussi de toute l’Amérique française, sur une très longue durée. Or, le fonds du bailliage de Montréal demeure à peu près inexploité car il n’a jamais fait l’objet d’un inventaire, n’est pas doté d’un instrument de recherche efficace, n’est ni transcrit ni indexé et n’a pas encore été mis en ligne par BAnQ.

Cet état de fait pose un triple problème qui touche à la fois à la périodisation, à l’intelligibilité des données et au partage de la transcription des sources. Ainsi, comme les documents d’avant 1693 ne sont pas accessibles en ligne, l’attention des chercheur-es, étudiant-e-s et professeur-e-s, généalogistes, grand public, se tourne naturellement vers les archives judiciaires du 18e siècle qui, non seulement sont accessibles en ligne, mais  sont partiellement éditées, inventoriées et indexées. Or, passer sous silence le 17e siècle, période pourtant fondamentale pour le développement de la société canadienne entraîne une distorsion de la  recherche, de l’enseignement et des connaissances. Tout aussi grave, la capacité de lire les documents anciens est en train de se perdre par manque de transmission de savoir-faire paléographique (déchiffrement des textes) et historique: non seulement le déchiffrement des documents d’archives est devenu un acte solitaire qui n’est plus enseigné, mais le partage des transcriptions reste chose peu commune. Aussi à chaque nouvelle recherche, il faut recommencer à zéro et perdre temps et argent public pour trouver et déchiffrer à nouveau les documents lus par les prédécesseur-e-s.   

Cet état de fait pose un triple problème qui touche à la fois à la périodisation, à l’intelligibilité des données et au partage de la transcription des sources. Ainsi, comme les documents d’avant 1693 ne sont pas accessibles en ligne, l’attention des chercheur-es, étudiant-e-s et professeur-e-s, généalogistes, grand public, se tourne naturellement vers les archives judiciaires du 18e siècle qui, non seulement sont accessibles en ligne, mais  sont partiellement éditées, inventoriées et indexées. Or, passer sous silence le 17e siècle, période pourtant fondamentale pour le développement de la société canadienne entraîne une distorsion de la  recherche, de l’enseignement et des connaissances. Tout aussi grave, la capacité de lire les documents anciens est en train de se perdre par manque de transmission de savoir-faire paléographique (déchiffrement des textes) et historique: non seulement le déchiffrement des documents d’archives est devenu un acte solitaire qui n’est plus enseigné, mais le partage des transcriptions reste chose peu commune. Aussi à chaque nouvelle recherche, il faut recommencer à zéro et perdre temps et argent public pour trouver et déchiffrer à nouveau les documents lus par les prédécesseur-e-s.   

Objectifs principaux

Fort des succès de l’engagement partenarial UdeM-BAnQ 2018-2020, notre projet a pour objectifs principaux de mettre sur pied un modèle de coopération en matière de recherche, de production et de partage de données numériques, historiques et archéologiques sur Montréal au 17e siècle. Pour ce faire, la chercheure principale Dominique Deslandres a réuni une équipe de chercheur-es et de partenaires qui ont déjà tissé des liens et appris à travailler ensemble (voir preuves de partenariats antérieurs). L’équipe est composée des  trois co-chercheurs  Deslandres, Gohier et Robichaud; de quatre collaborateurs :Christian Gates-St-Pierre, archéologue de l’Université de Montréal (Projet Tiohtià:ke), Alain Laberge, historien de l’Université Laval (co-directeur Répertoire des seigneuries du Québec et directeur adjoint du Dictionnaire de Biographies du Canada), Philippe Langlais, professeur au département d’informatique de l’Université de Montréal Catherine Broué, cofondatrice de Nouvelle-France numérique  et de sept partenaires décrit dans le Partenariat. Au cours de 2021-2024, l’équipe déterminera les conditions de réalisation, le temps, le coût, les défis et le plan d’un partenariat ultérieur de très grande envergure qui convienne aux objectifs des co-chercheur-e-s, partenaires et collaborateurs, dans le but ultime d’appliquer ce modèle ainsi constitué aux archives et artefacts d’autres espaces et d’autres périodes historiques. Ainsi seront apportées des solutions viables, pérennes et interdisciplinaires aux enjeux urgents posés par la recherche à l’ère du numérique – tout cela afin de contrer l’érosion de la culture et de l’histoire de notre pays.

Objectifs particuliers, méthodologie et protocole

Le principal objectif de recherche des partenaires est de découvrir et valoriser le passé des collectivités autochtones et allochtones qui ont « fait » Montréal. Or les formidables ressources archivistiques, qui renseignent sur  leur histoire demeurent négligées car elles sont trop difficiles à lire,  peu accessibles et peu partagées. Pour pallier ces inconvénients, l’équipe se dote de puissants dispositifs de recherche, de partage et de diffusion des connaissances.

Il s’agit d’abord d’assurer la littératie des documents anciens, c’est-à-dire en constituant et en partageant l’expertise nécessaire à la compréhension des très difficiles graphies qui les caractérisent, comme le montre cet exemple d’écriture « un peu »  difficile à lire :

Il s’agira donc de former la relève à la gestion documentaire, fondée sur une technologie novatrice (Transkribus du partenaire READ-Coop) qui en permettant la transcription automatique Texte-Image, le balisage XML-TEI et le traitement massif des documents,  facilite l’analyse historique que l’équipe cherche à faire des peuples de Montréal. En effet, les co-chercheur-es et les collaborateurs les étudient pour des articles, capsules et conférences et les deux doctorantes Berthelet et Dupuis, employées par le projet,  leur consacrent leur thèse, l’une étudiant la violence, l’autre l’esclavage. De fait, selon un protocole qui a fait ses preuve dans le projet d’engagement partenarial UdeM-BAnQ, les assistant-es recruté-es aux trois cycles universitaires auront les tâches suivantes à accomplir : Dans un premier temps, les 20 boites d’archives (soit 5,04 mètres linéaires de documents textuels) du Bailliage de Montréal seront photographiées selon le protocole de numérisation de BAnQ et recomposées en respectant les dossiers d’origines (comme il a été fait pour les registres d’audience). Sachant que 10 % de leur contenu a été photographié, vérifié et assemblé, recto verso, en 80 heures, il faudra 600 heures sur trois ans pour réaliser ce même travail sur les 90 % restants. Les images du Baillage seront ensuite versées dans le logiciel d’intelligence artificielle Transkribus où s’effectuera le découpage des zones de texte et la transcription automatiques, la vérification des transcriptions et le balisage XML-TEI. Les modèles déjà développés pour ce faire serviront à segmenter et transcrire une partie des documents. À son tour, la nouvelle documentation traitée servira à raffiner ces modèles pour chacun des greffiers du baillage, ce qui permettra d’améliorer en continu l’efficacité des modèles existants. Il s’agira ensuite de procéder à l’indexation des documents en fonction des exigences des partenaires se fera dans les tableurs Excel (compatibles SPSS) déjà développés pour les registres du baillage, c’est-à-dire extraire des transcriptions, les prénoms,  noms, âge, et lieu d’habitation des individus repérés dans les archives judiciaires et les indexer dans la base de données Le Bailliage de Montréal avec leur identifiant PRDH (déjà créé ou à créer que les partenaires ont décidé de prendre comme unité fixe d’indexation) et les liens aux archives notariales qui les concernent, fournies par Parchemin et conservées à BAnQ numérique ainsi que les liens aux artéfacts mis en valeur par Archeolab.Québec, du partenaire Musée Pointe-à-Callières. 2280 heures d’assistanat de recherche sur trois ans seront nécessaires pour compléter ces tâches. L’expérience acquise rend l’équipe confiante de réussir à traiter en trois ans,  l’équivalent à 40 000 images puisque la transcription des documents associée à leurs images et métadonnées par Transkribus prend 3 minutes (!!) avec le modèle HTR de déchiffrement de l’écriture Les greffiers de Montréal  développé dans le cadre du projet UdeM-BAnQ, 2018-2020.

Il s’agira donc de former la relève à la gestion documentaire, fondée sur une technologie novatrice (Transkribus du partenaire READ-Coop) qui en permettant la transcription automatique Texte-Image, le balisage XML-TEI et le traitement massif des documents,  facilite l’analyse historique que l’équipe cherche à faire des peuples de Montréal. En effet, les co-chercheur-es et les collaborateurs les étudient pour des articles, capsules et conférences et les deux doctorantes Berthelet et Dupuis, employées par le projet,  leur consacrent leur thèse, l’une étudiant la violence, l’autre l’esclavage. De fait, selon un protocole qui a fait ses preuve dans le projet d’engagement partenarial UdeM-BAnQ, les assistant-es recruté-es aux trois cycles universitaires auront les tâches suivantes à accomplir : Dans un premier temps, les 20 boites d’archives (soit 5,04 mètres linéaires de documents textuels) du Bailliage de Montréal seront photographiées selon le protocole de numérisation de BAnQ et recomposées en respectant les dossiers d’origines (comme il a été fait pour les registres d’audience). Sachant que 10 % de leur contenu a été photographié, vérifié et assemblé, recto verso, en 80 heures, il faudra 600 heures sur trois ans pour réaliser ce même travail sur les 90 % restants. Les images du Baillage seront ensuite versées dans le logiciel d’intelligence artificielle Transkribus où s’effectuera le découpage des zones de texte et la transcription automatiques, la vérification des transcriptions et le balisage XML-TEI. Les modèles déjà développés pour ce faire serviront à segmenter et transcrire une partie des documents. À son tour, la nouvelle documentation traitée servira à raffiner ces modèles pour chacun des greffiers du baillage, ce qui permettra d’améliorer en continu l’efficacité des modèles existants. Il s’agira ensuite de procéder à l’indexation des documents en fonction des exigences des partenaires se fera dans les tableurs Excel (compatibles SPSS) déjà développés pour les registres du baillage, c’est-à-dire extraire des transcriptions, les prénoms,  noms, âge, et lieu d’habitation des individus repérés dans les archives judiciaires et les indexer dans la base de données Le Bailliage de Montréal avec leur identifiant PRDH (déjà créé ou à créer que les partenaires ont décidé de prendre comme unité fixe d’indexation) et les liens aux archives notariales qui les concernent, fournies par Parchemin et conservées à BAnQ numérique ainsi que les liens aux artéfacts mis en valeur par Archeolab.Québec, du partenaire Musée Pointe-à-Callières. 2280 heures d’assistanat de recherche sur trois ans seront nécessaires pour compléter ces tâches. L’expérience acquise rend l’équipe confiante de réussir à traiter en trois ans,  l’équivalent à 40 000 images puisque la transcription des documents associée à leurs images et métadonnées par Transkribus prend 3 minutes (!!) avec le modèle HTR de déchiffrement de l’écriture Les greffiers de Montréal  développé dans le cadre du projet UdeM-BAnQ, 2018-2020.

Pour diffuser ses résultats, le partenariat mise sur l’Atelier Permanent d’Analyse Documentaire module gratuit et en ligne, de formation continue théorique et pratique, ainsi que sur les capsules d’information diffusée en ligne, sur la production d’articles scientifiques et de conférences par les co-chercheurs, les collaborateurs et les étudiant-es impliqué-es dans le projet. (voir Plan de Mobilisation des connaissances). Ainsi les objectifs de recherche du partenariat répondent-ils aux besoins urgents des partenaires, mais aussi à la nécessité de la collectivité d’avoir accès aux archives et artéfacts de notre passé comme au savoir les concernant. Notons que les conséquences de la pandémie sur le télétravail rendent d’autant plus urgente la réalisation de ce projet-pilote qui se fera essentiellement en ligne en s’appuyant sur la grande expérience des participants.