À propos

Le présent site a été réalisé dans le cadre du programme de recherche ANR PORTIC. Ce programme porte sur les dynamiques de navigation et du commerce extérieur au dix-huitième siècle, un commerce qui s’effectue largement par voie maritime. Outre la meilleure compréhension de ces dynamiques par le croisement de deux jeux de données, un enjeu fondamental du programme est de chercher des méthodes de qualification et d’appréhension de l’incertitude des données historiques, en expérimentant des modes de visualisation et d’écriture appropriés.

Dans ce cadre, le Working Package n°5 de ce programme de recherche consiste à effectuer une série d’études de cas tirant parti de deux corpus existants de sources historiques numérisées : Navigocorpus, une base de données portant sur l’histoire de la navigation pilotée par Silvia Marzagalli et Christine Plumejeaud ; et Toflit18, une base de données portant sur le commerce extérieur de la France, pilotée par Loïc Charles et Guillaume Daudin.

Ce site web s’inscrit dans un mouvement second faisant suite aux premières entreprises de numérisation pour chacune des deux bases, en tentant de valoriser le travail déjà accompli via l’étude approfondie de sous-ensembles signifiants dans les données. Ces études éclairent des questions disciplinaires existantes sous un nouveau jour grâce aux nouveaux matériaux et méthodes offerts par les bases de données mobilisées par le programme. Les questions soulevées par une telle initiative sont multiples :

  • Comment mobiliser ensemble deux sources dont certaines dimensions sont incommensurables ou difficiles à mettre en équivalence ? Comment croiser les données numérisées des deux bases avec des connaissances plus denses et qualitatives sur les phénomènes étudiés, apportées par des historiens spécialistes de la région étudiée ?
  • Comment prendre en compte, au moment de l’enquête et du raisonnement, l’importante stratification de transformations, de réductions et de décisions interprétatives constituant la chaîne qui relie les sources initiales avec les données qui en ont été tirées ?
  • Comment prendre en compte l’incertitude ou l’incomplétude des données tout en proposant une analyse scientifiquement solide des phénomènes étudiés ?
  • Comment faire dialoguer les formes classiques de l’écriture historique - le récit déployé phrase après phrase, l’argument déroulé paragraphe par paragraphe - avec les formes d’écriture diagrammatique et computationnelle qu’implique la réalisation d’un site web ?
  • Comment gérer la collaboration interdisciplinaire et la partition d’expertises qu’implique une telle écriture multimodale ?

Toutes ces questions ont été travaillées lors des six mois de collaboration qui ont mené à l’élaboration de ce site, dont voici un bref récit.

D’une série de questionnements à une semaine d’enquête

L’étude de cas dont ce site est l’aboutissement a été articulée autour d’un format de collaboration intensive que nous appelons datasprint et qui consiste à faire travailler ensemble des expert.e.s de plusieurs disciplines sur un temps court et avec des questions de recherche déterminées à l’avance, sur la base d’un ou plusieurs jeux de données préparés pour l’occasion.

En amont du datasprint, nous avons conduit pendant plusieurs mois un double travail de préparation des données, et de préparation des questions de recherche. Sur le plan des données, les équipes de Navigocorpus et de Toflit18 données ont dû effectuer un important travail de nettoyage et d’affinement concernant les régions et les périodes étudiées : le fait de projeter une étude de cas précise a fait émerger des problèmes qui étaient restés dans l’ombre faute de besoin d’un réexamen approfondi. Un travail très important a également été effectué pour « aligner » les deux bases, c’est-à-dire pour mettre en correspondance les lieux et les types de produits commercés ou transportés tels qu’ils sont décrits dans chacune des bases.

Sur le plan de la préparation des questions de recherche de départ, nous avons conduit une série de réunions préliminaires reliées par des documents en ligne rédigés collaborativement, qui nous ont aidé à identifier des questions à la fois pertinentes en regard de l’histoire de la région et de la littérature existante, mais aussi de ce que les données nous permettaient - ou pas - d’explorer et de visualiser. Ce travail d’ajustement et de mise en correspondance entre les questions et les données a ainsi couru d’octobre 2020 à avril 2021, et nous a permis à la fois d’identifier les activités d’exploration les plus pertinentes à proposer aux participants durant l’atelier, et d’éviter les chausses-trappes qui nous auraient conduit dans des questionnements impossibles à résoudre.

De ce travail de préparation est né un document de questionnement scientifique destiné à expliciter les questions de recherche à explorer partagé à tous les participant.e.s de la semaine de datasprint. Ainsi, au début du datasprint, l’étude de cas était structurée en deux groupes, correspondant à deux lignes d’enquête complémentaires mais aussi à la constitution de deux équipes équilibrées pour la collaboration :

  • la première équipe devait se consacrer à étudier le dynamisme de la région du Poitou par rapport à la France et au monde en général (avec l’hypothèse d’un déclin par rapport au reste de la France au cours du dix-huitième siècle)
  • la seconde équipe devait se consacrer à étudier les relations de complémentarité et de domination entre ports de la région, de manière notamment à distinguer les flux et circuits commerciaux qui y sont associés

Sur cette base, un « kit de bienvenue » a été conçu pour permettre à tou.te.s les expert.e.s de rapidement saisir les multiples dimensions de l’atelier, et nous avons conduit quelques enquêtes préliminaires permettant de résoudre les questions les plus évidentes pour tirer le meilleur parti possible de la concentration d’expertises multiples sur le temps court et très dense du datasprint.

Faire avec les conditions de recherche

La semaine du datasprint, qui a eu lieu début avril 2021, s’est avérée coïncider avec un moment de forte reprise de l’épidémie de covid-19 en France en général et à Paris en particulier. Cela nous a contraint à effectuer l’atelier en ligne. Conduire un datasprint en ligne revenait à se priver de l’incommensurable apport des échanges informels et autres possibilités d’affichage, de circulation et de spatialisation offerts par le travail dans un même lieu physique. À cette contrainte s’est ajoutée la subite fermeture des écoles maternelles et primaires ladite semaine, qui a occasionné une sérieuse charge extra-professionnelle pour une part substantielle des participant.e.s.

Le datasprint a néanmoins eu lieu, et nous avons décidé de considérer les conditions particulières dans lesquelles il s’est conduit non seulement comme des contraintes demandant de recalibrer drastiquement nos attentes, mais aussi comme des occasions d’invention et d’expérimentation appelant à adapter nos manières de procéder par rapport aux modalités initialement planifiées.

Improvisations et adaptations

Durant le datasprint, la diversité des compétences des participant.e.s a impliqué de remettre à plat la répartition des tâches. Ainsi, chacun a pu être amené à suggérer des pistes de recherche, manipuler les données, et se pencher sur l’analyse et la mise en forme des résultats. Cette semaine a notamment été l’occasion d’expérimenter avec un grand nombre de technologies utilisées durant les activités d’enquête, notamment jupyter notebook, kepler.gl, vega, ou encore matplotlib. Nous avons néanmoins également parfois touché aux limites de ce principe en condition « zoomifiée », certaines discussions spécialisées (sur le plan technique ou sur le plan historique par exemple) nécessitant parfois de réformer les corps disciplinaires et de prévoir des moments d’aparté transversaux.

Le format datasprint implique par ailleurs une dimension expérimentale, parfois chaotique, et les difficultés de communications impliquées par la conduite en ligne ont amplifié cette dimension. Nous avons donc construit nos journées de travail sur un canevas allégé en terme d’amplitude horaire, et sous une forme tentant de varier les rythmes et les échelles d’interaction : un point de plénière en matinée, suivi de travail en deux groupes, eux-mêmes rapidement re-divisés en binômes ou en moments de travail individuel.

Sur le plan technique, nous avons opté pour une salle zoom permanente ouverte durant toute la semaine et divisée en « breakout rooms » (salles de travail) permettant de travailler en plus petits ensembles ; nous avons également soutenu la semaine avec un dossier google drive très organisé dans lequel l’ensemble des activités ont été archivées et consignées.

Pour faciliter le processus d’intercompréhension, des procédures méthodologiques ont également été proposées aux participants. Ainsi, des personnes jouant le rôle de facilitateurs ont fait le lien entre les différents groupes en circulant continuellement entre les différentes salles zoom de travail. Nous avons par ailleurs insisté sur l’importance de la documentation en structurant les activités de chaque jour autour de l’écriture de « rapports » remplis au fur et à mesure de la journée, dont une personne « scribe » était chargée de prendre soin afin de garder un maximum de traces et de permettre les échanges d’information asynchrones. Ces rapports ont finalement été progressivement abandonnés, car trop lourds étant donné le poids des autres activités. Nous avons également progressivement réduit les temps de visioconférence pour minimiser la fatigue liée aux échanges en ligne.

Les séances de travail d’un datasprint provoquent parfois un « effet bulle » dans lequel chaque équipe peut rapidement se déconnecter du travail effectué par les autres, entraînant des blocages, des tâches effectuées en doublon ou des « angles morts ». Ce problème est amplifié par la conduite en ligne. Pour faire face à ce défi, nous avons rythmé les journées de points d’étapes effectuées à plusieurs échelles - par petits groupes, par équipes, ou en plénière - afin de partager les avancées. Par ailleurs, des visites informelles et autres « zoom surfing » ont permis de favoriser certaines circulations d’idées et de méthodes.

L’un des intérêts du format datasprint est enfin de favoriser une unité de temps pour le travail interdisciplinaire. L’intensité qu’implique cette unité de temps appelle cependant une valorisation à la hauteur des efforts fournis sur le temps court. Le temps du datasprint est, en temps normal, à la fois un temps d’exploration et d’enquête, et un temps de production de résultats. Cependant, ce principe a été confronté à deux spécificités dans notre cas : les conditions de travail en ligne ont demandé de revoir les attentes plus modestement, mais aussi le principe et les objectifs mêmes des datasprint de PORTIC qui, parce qu’ils visent la publication de sites web finalisés et contribuant de manière relativement précise à des études de cas très serrées (et non de rapports d’exploration des données comme c’est souvent le cas pour les autres datasprints). Face à ces spécificités, il nous a fallu articuler l’atelier avec un travail postérieur cadré par d’autres temporalités pour arriver à un résultat publiable.

La fabrication d’un site web comme pivot pour l’écriture multimodale : entretenir une infrastructure technique et méthodologique

À partir du travail effectué lors du datasprint, nous avons engagé une seconde phase d’approfondissement. Sur le fond, les axes de recherche initialement envisagés ont été progressivement remaniés. Cela a été fait dès la fin de la semaine de datasprint, au moment de la rédaction d’un document de synthèse mettant en regard les visualisations produites durant la semaine. Ce travail a été ensuite continué par Cécile Asselin qui a effectué un travail de synthèse et de nettoyage sur les productions de la semaine.

Une écriture multimodale

Afin de construire progressivement, à partir des explorations du datasprint, un document propre à être publié et à transmettre un récit et des arguments à partir des données des deux bases, nous avons tenté d’utiliser la perspective de la fabrication d’un site pour articuler trois types « d’écriture » : la confection de nouveaux fichiers de données correspondant aux enquêtes soulevées par les activités de la semaine (écriture computationnelle) ; la confection de visualisations d’informations (écriture diagrammatique) ; enfin, bien sûr, la mise en récit et en argument historique de l’étude de cas (écriture en prose).

Pour ce faire, nous avons décidé de structurer le site en une série de trois parties à la structure identique : une « visualisation principale » constituant l’argument principal de la partie, accompagné d’un texte se fondant d’abord sur elle puis suivant ses propres développements, accompagné de « visualisations secondaires ». Cette organisation visuelle et rhétorique a induit un mode de travail itératif sur le registre du « ping pong » qui s’est déployé en trois temps :

  • dans la foulée du datasprint, les historien.ne.s ont d’abord travaillé à préciser les arguments de chacune des trois parties (avril-mai 2021)
  • nous avons ensuite organisé deux jours intensifs de conception avec une équipe réduite d’ingénieur.e.s et de designers (Cécile Asselin, Robin de Mourat, Christine Plumejeaud, Paul Girard, Maxime Zoffoli) durant lesquels nous avons conçu des propositions de visualisations principales (fin mai 2021)
  • les historien.es ont, à la suite de ces deux jours, repris la main sur l’écriture, enrichie et structurée par les propositions constituées par les visualisations, en précisant leurs textes comme leurs besoins pour des visualisations complémentaires, qui ont été progressivement produites en fonction du texte (juin-septembre 2021)

Dans ce cadre, nous avons progressivement négocié une infrastructure de travail orientée vers le développement progressif du présent site web. Ce dernier a tout autant servi d’objectif que de moyen de rencontre entre les différentes activités qui ont suivi la semaine d’atelier datasprint.

La fabrication du site présenté au public a été articulée autour d’un protocole automatisé qui a permis de mettre le site à jour quotidiennement pendant sa phase d’écriture et de développement, et ainsi de faire progresser conjointement sa structure, son aspect graphique et les divers contenus qui le peuplent (voir son répertoire github pour plus d’informations). Plus précisément, ce protocole automatisé consistait à récupérer les contenus écrits dans un google documents écrit par les historien.ne.s, les données des bases Navigocorpus et Toflit18 sur leurs espaces numériques respectifs, et enfin à produire un ensemble de données optimisées pour le web avant de refabriquer le site.

Cette méthode de travail sur mesure, alternative à l’utilisation d’un CMS (type wordpress) ou d’une intégration des contenus entièrement « artisanale », nous a permis de multiplier les itérations sur les données, les visualisations et les textes, afin de développer itérativement un document ajusté et cohérent pour la lecture. Elle nous a également permis d’échapper à une approche qui voudrait formater la production du site de manière trop séquentielle, c’est-à-dire faisant suivre un premier temps de « conception » puis un deuxième temps « d’exécution », pour plutôt faire place à la découverte et au dialogue avec les différents matériaux en train de se développer.

Ainsi, la méthode de travail et de montage du site adoptée ici, outre la dimension d’optimisation qu’implique l’automatisation de certaines tâches, a été le moyen de favoriser un dialogue plus organique entre les différentes écritures en jeu dans ce document : en réalisant simultanément le design du site, celui des visualisations, et les textes qui les accompagnent, nous avons tenté de faire profiter chacune de ces activités l’une de l’autre, comme des sources d’invention ou de solidification mutuelle, plutôt que de les considérer comme des tâches spécialisées et/ou articulées selon un régime de subordination (de l’histoire à la technique, ou du visuel au textuel, ou de l’argument à son illustration, etc.).

Un site destiné à tisser des liens avec d’autres activités et d’autres publics

Ce site est pensé à la fois comme un objet autonome déroulant le récit scientifique de l’histoire de la région de La Rochelle au dix-huitième siècle, et comme la première pièce d’assemblages scientifiques et didactiques encore à venir. Nous l’avons conçu avec le projet de l’adresser à un public constitué d’étudiant.e.s en histoire, de professeur.e.s d’histoire du secondaire, ou d’amateur.ice.s avancés passionnés par le Poitou et les Charentes. Cependant, le site est également pensé pour pouvoir s’articuler avec deux publics complémentaires :

  • les personnes spécialisées dans la médiation et/ou la vulgarisation pourront utiliser certaines des visualisations pour des initiatives destinées à un plus grand public
  • les historien.ne.s spécialisés pourront citer ces visualisations dans des publications conventionnelles en revues ou monographies et ainsi s’appuyer sur ces dernières pour continuer nos enquêtes

Pour ce faire, nous avons notamment rendu chacune des visualisations « détachable » du récit proposé via la page atlas - et plus techniquement en dotant chacune des visualisations d‘une adresse URL propre.

Par ailleurs, le code source du site, partagé sous licence libre, a été construit et documenté de manière à pouvoir être dérivé - en tout ou partie - pour d’autres projets à venir : il pourra apporter des éléments utiles pour les prochaines études de cas du programme PORTIC mais aussi pour d’autres projets similaires. Il est enfin à noter que toutes les données utilisées - et les scripts qui les génèrent à partir des données complètes de Toflit18 et Navigocorpus, accessibles toutes les deux librement - sont également inclus dans le code source du site, rendant nos visualisations et résultats entièrement reproductibles.

Une écriture collective

Ce site est le résultat d’un processus d’enquête et d’écriture collective qui a mobilisé des personnes issues de plusieurs disciplines : histoire, économie, informatique, géomatique, design.

Les textes de cette publication ont été écrits par Silvia Marzagalli (professeur d’histoire moderne, Université Côte d’Azur - CMMC, coordinatrice et co-responsable scientifique du programme PORTIC), Loïc Charles (professeur d’économie, INED, Université Paris 8 Vincennes - LED), Guillaume Daudin (professeur d’économie, Université Paris-Dauphine - LEDa-DIAL), et Thierry Sauzeau (professeur d’histoire moderne, Université de Poitiers - Criham).

L’ensemble du processus de médiation et d’articulation de la collaboration a été mené par l’ingénieure stagiaire Cécile Asselin, qui s’est consacrée à plein temps pendant six mois à la conduite méthodologique et technique de l’ensemble de l’étude de cas, accompagnée par Robin de Mourat (designer de recherche, médialab Sciences Po - co-responsable scientifique du programme PORTIC en charge des études de cas).

Les visualisations ont été conçues et développées par Cécile Asselin, Robin de Mourat, Christine Plumejeaud (géomaticienne, laboratoire LIENSs - co-responsable scientifique du programme PORTIC), Paul Girard (ingénieur expert en humanités numériques - entreprise Ouestware), Maxime Zoffoli (designer expert en visualisation d’information), Géraldine Geoffroy (data librarian, Université Côte d’Azur).

Les fonds de carte d’époque ont été constitués par Christine Plumejeaud.

La préparation et la vérification des données ont été effectuée par les équipes de Navigocorpus (Christine Plumejeaud, Silvia Marzagalli), de Toflit18 (Guillaume Daudin, Loïc Charles) et du médialab (Cécile Asselin et Robin de Mourat).

Le site a été développé par Cécile Asselin et Robin de Mourat.

À ces personnes s’ajoutent celles ayant participé au datasprint qui a conduit à cette publication : les ingénieurs en méthodes numériques et designers du laboratoire médialab de Sciences Po Béatrice Mazoyer, Benjamin Ooghe-Tabanou, Guillaume Plique, Héloïse Théro, et Pauline Gourlet ; les chercheurs Pierrick Pourchasse (professeur émérite d’histoire moderne, Université de Bretagne Occidentale), et Alain Bouju (maître de conférence HDR en informatique, Université de La Rochelle).