Un outil pour la Cliodynamique : Les bases de données

La Cliodynamique est un domaine de recherche transdisciplinaire étudiant l’histoire sur le temps long et cherchant à comprendre comment les sociétés évoluent et se transforment au cours du temps. Proposer de telles explications n’est bien entendu pas une chose aisée et la cliodynamique n’est pas la première a y être confronté.  Elle le fait cependant avec de nouveaux outils tels que des bases de données massives permises par l’avènement de l’informatique, des outils statistiques sophistiqués et des modèles mathématiques développés récemment avec l’émergence des systèmes complexes.

Dans cet article, nous allons nous intéresser à l’un des piliers de la Cliodynamique : les bases de données. Nous adresserons les problèmes majeurs liés à leur utilisation et les conditions que celles-ci doivent remplir afin de permettre l’étude massive des sociétés sur le temps long, puis nous verrons quelles solutions les cliodynamiciens et cliodynamiciennes ont apporté à ces problèmes.

Des bases de données

L’idée de développer des bases de données massives pour rassembler le savoir sur les sociétés n’est pas neuve. Les anthropologues ont par exemple depuis plusieurs décennies mis en place de telles bases de données dont on peut citer deux fameux exemples :l’Ethnographic Atlas et le Standard Cross Cultural Sample (SCCS).

Ces deux bases de données ont eu un effet important sur leur discipline et ont été utilisées au-delà de leur cadre initial. Cependant elles ne permettent pas l’étude des transformations sociales sur le temps long pour plusieurs raisons. Comprendre ces raisons va nous permettre de comprendre les principales barrières de l’étude des sociétés sur le temps long.

L’Ethnographic Atlas code plusieurs variables économiques, politiques et culturelles pour 1167 sociétés. Cependant ce sont des données ponctuelles, c’est-à-dire qu’elles ne sont enregistrées que pour un point dans le temps.  Elles ne permettent pas non plus de différencier la diffusion de l’évolution de traits culturels : les unités ne sont pas indépendantes ! Ce dernier problème est connu en statistique sous le nom du problème de Galton, c’est un problème très limitant en évolution culturelle ou les sociétés interagissent entre elles et descendent les unes des autres.

Le SCCS est une tentative de résoudre ce problème en sélectionnant des échantillons de 186 cultures étroitement liées au sein de l’Ethnographic Atlas afin constituer plusieurs groupes relativement indépendants entre eux. Malheureusement si cette tentative permet en effet de réduire le problème, elle ne l’élimine pas pour autant et il est nécessaire d’ajouter des traitements statistiques faisant intervenir un poid pour rendre compte du lien plus ou moins fort entre certaines cultures ainsi que des délais pour rendre compte de la transmission dans le temps (phylogénie).

A ces problèmes, s’ajoutent le problème plus épistémologique de savoir si l’on peut ou non comparer les sociétés entre elles.

Et bien si l’on en croît les économistes et les politistes étudiant les conditions de vie dans les sociétés contemporaines, on peut adopter cette démarche avec une certaine pertinence. Peut-on cependant comparer les sociétés passées entre elles ? Au regard de l’argument précédent cela ne semble pas tout à fait absurde . La question épineuse est de savoir si l’on peut comparer les sociétés passées aux sociétés présentes. A moins de considérer qu’une société est définie uniquement « de l’extérieur » par son environnement géopolitique, ce qui interdit de fait toutes comparaisons anachroniques, les sociétés doivent alors être prises « dans leur ensemble ». Nous pouvons noter que les sociétés évoluent et se transforment et qu’à ce titre elles jouissent d’une certaine continuité. C’est une entreprise qui nécessite toutefois des précautions et une grande expertise pour accomplir le travail de standardisation qui consiste à trouver des mesures communes pertinentes et qui est nécessaire pour la comparaison systématique des sociétés.

En résumé, une base de données adaptée à la Cliodynamique devrait avoir au moins ces trois caractéristiques :

1) Des unités définis dont on peut suivre l’évolution sur le temps long, 

2) Des unités en nombre suffisant résoudre le problème de Galton, 

3) Des données standardisées sur ces unités. 

Logo du projet Seshat

C’est dans cette optique que la communauté des cliodynamiciens a lancé le projet Seshat : Global History Databank.

Le projet Seshat est une base de données historiques, centralisant des données quantitatives et qualitatives standardisées de -10000 ans av JC jusqu’à aujourd’hui avec pour but de permettre de tester différentes hypothèses sur l’évolution des sociétés. Voici quelques hypothèses présentées à titre d’exemple : 

  • Les sociétés plus égalitaires sont plus stables
  • Les sociétés plus égalitaires sont plus performantes dans la compétition inter-groupes
  • La présence de rituels permet l’émergence de plus grandes sociétés
  • La compétition militaire provoque l’apparence et la diffusion de normes d’équités et de coopération au sein des sociétés

Actuellement limitée à quatre jeux de données sur l’agriculture, les religions morales, l’âge axial et la complexité sociale, Seshat a pour objectif de s’étendre et de permettre de tester des hypothèses au-delà de celles pour lesquelles elle a été conçue. Dans le futur, l’équipe de Seshat prévoit également d’ouvrir la possibilité à des chercheurs extérieurs au projet de proposer des données et de mettre à disposition des outils d’analyse et de tri des données en ligne pour une meilleure ergonomie. 

Logo du Clioscope

En dehors de Seshat, d’autres initiatives commencent à voir le jour comme le Clioscope, qui est une base de données parrainée par la SFC. Encore embryonnaire, le Clioscope vise dans un premier temps à permettre l’étude sur la longue-durée des processus économiques, politiques et sociaux et en particulier, ceux en jeu dans la théorie structurelle-démographique. A terme, la base de données vise à étendre son corpus de données plus largement, dans l’optique de pouvoir tester plus librement des hypothèses.

Conclusion

Les bases de données sont devenues un outil incontournable des Cliodynamiciens mais restent aujourd’hui largement complémentées dans certains champs d’études par des statistiques diverses, notamment lorsque celles-ci concernent des entités politiques plus « récentes » comme les nations et des périodes de quelques dizaines ou centaines d’années. L’émergence de nouvelles bases de données dédiées est à anticiper, on peut d’ailleurs déjà en voir les premiers signaux avec le Clioscope ou l’ouverture d’un nouveau dataset sur les crises socio-politiques par Seshat qui est actuellement en construction.

Dans les prochains articles de cette série, nous intéresserons dans le détail aux données proposées Seshat, comment elles sont organisées, proposerons un exemple d’utilisation sur la complexité sociale.

Remerciement à Capucine, Avel, Emilie et Pascal pour leurs conseilles et leur relecture,

Nicolas Salerno & Ilona Astoul, 2022