Nouvelle-France numérique : Partenariat collaboratif de gestion des données de recherche

Nouvelle-France numérique propose une recherche originale et partenariale regroupant les principaux acteurs oeuvrant sur le patrimoine documentaire de la Nouvelle-France : chercheur.e.s, centres de recherche, institutions d’archives et représentant.e.s du public. Le projet ambitionne de développer un modèle de travail collaboratif et de gestion des données de recherche (GDR) tenant compte des contraintes et besoins des organismes et usagers, et d’adapter l’écosystème de recherche à la révolution numérique, particulièrement au développement de l’intelligence artificielle (IA). Il s’inscrit dans le contexte des transformations survenues récemment dans le domaine de la recherche sur le patrimoine documentaire, avec l’émergence notamment de la reconnaissance des écritures manuscrites (HTR), des larges modèles de langage (LLM) et de la généralisation des données ouvertes et liées (linked open data). 

En histoire de la Nouvelle-France, de nombreux manuscrits ont déjà fait l’objet de numérisation et d’indexation, mais les outils de repérage restent limités. Le partenariat Nouvelle-France numérique propose une révolution en facilitant la consultation et l’analyse de vastes corpus grâce au travail collaboratif et à l’utilisation de l’IA. Il lancera un chantier sans-précédent de transcription et de balisage de documents de la Nouvelle-France. L’éventail d’expertises qu’il mobilise et la synergie qu’il propose d’établir autour des besoins et enjeux de chacun lui confère une envergure inédite.

Le projet poursuit cinq grands objectifs : 

  1. valider et améliorer des protocoles de travail collaboratif (numérisation, transcription, balisage des métadonnées, interopérabilité des systèmes); 
  2. identifier des modalités de structuration, de mise en relation et de diffusion des données qui facilitent leur réutilisation; 
  3. adapter l’IA à l’analyse du patrimoine documentaire ancien, notamment aux collections manuscrites et iconographiques, au français moderne et aux langues autochtones;
  4. créer une communauté et élaborer un modèle efficace et pérenne de science participative; 
  5. mettre à profit l’intelligence artificielle pour amorcer un renouvellement de l’historiographie sur la Nouvelle-France.

Nouvelle-France numérique propose un partenariat d’une ampleur sans précédent dans le domaine de la recherche sur le patrimoine documentaire. Il associe à la fois les plus importantes institutions qui conservent le patrimoine documentaire de la Nouvelle-France, mais aussi des centres d’archives et musées de plus petite tailles, dont plusieurs sont privés et n’ont pas une longue tradition d’ouverture de leurs collections. Cette diversité vise à la fois à répondre aux besoins des chercheur.es quant à l’accès aux documents nécessaires à la réalisation de leurs projets, mais aussi à représenter la diversité des enjeux vécus par les institutions de conservation du patrimoine. Le partenariat intègre par ailleurs des organismes spécialisés dans la gestion des données de recherche sur le patrimoine documentaire de même que plusieurs centres de recherche spécialisés spécifiquement sur le patrimoine documentaire.

Nouvelle-France numérique table sur une approche de recherche-action. Ainsi, la recherche sera organisée selon deux grands axes transversaux : le premier, thématique, porte sur la Nouvelle-France et ses collections, et agit comme un catalyseur fédérant une grande variété de projets de recherche organisés en quatre chantiers. Le corpus généré par cette recherche constituera le matériel à partir duquel se déploiera le second axe transversal, méthodologique, qui s’intéressera aux enjeux liés à la gestion des données structuré en trois chantiers.

Nouvelle-France et ses collectionsGestion des données
1- État et administration5- Intelligence artificielle et traitement du langage appliqués aux corpus documentaires anciens
2- Société coloniale et Autochtonie6- Science participative et ses enjeux face à l’intelligence artificielle
3- Langues et cultures7- Modèles et référentiels de données patrimoniales.
4- Territoire et environnement