par A. Accary
L'idée dresser des tables de données relationnelles pour gérer des listes de généalogie est assez largement répandue. Cependant, l'utilisation des requêtes des langages de traitement des données comme MySQL pour extraire les informations de plusieurs tables : calcul des âges des individus de nom et prénom donnés à la naissance et au décès et comparaison avec l'âge évoqué par le Prêtre (ou l'officier d'Etat-Civil) est encore peu en usage dans les cercles de généalogie. Cette possibilité devrait grandement faciliter le choix du bon ancêtre, parmi tous les homonymes souvent rencontrés dans les registres paroissiaux et de trouver les antécédents d'un ancêtre donné. Il resterait, bien-sûr à affiner la recherche dans le cas où des solutions multiples seraient fournies par le programme d'identification.
Par ailleurs de tels programmes, bien construits, devraient également permettre de mesurer la fiabilité d'un site généalogique informatisé.
Ne disposant pas d'outil de mesure de qualité des relevés BMS, comme nous avons dépassé l'âge du Fer et atteint celui de l'Informatique (et des mathématiques), nous nous en sommes forgé un... et allons, avec lui, tenter de caractériser les relevés des registres paroissiaux et de l'état civil de deux communes : Mussy-sous-Dun et Chauffailles, en utilisant des méthodes de la logique.
Le but de cet article est de rendre compte de la qualité des résultats que l'on peut obtenir des tables de Baptêmes et Sépultures. Nous espérons à terme disposer d'un outil de fiabilité connue, permettant de débuter une recherche dans quelques communes de notre région de l'Est-Brionnais.... où l'on disposerait déjà d'une base de données relationnelle.
Notre travail a commencé par la photographie numérique des registres, beaucoup de fichiers numérisés sont maintenant disponibles pour une somme modique, sous forme de CD ROM1. L'étape suivante consista à trouver des lecteurs-traducteurs qui furent chargés d'établir la saisie, selon une grille précise, des informations (nom, prénom, date de l'évènement, ... , témoins à l'établissement de l'acte).
Nous avons utilisé une grille de saisie largement diffusée dans la région : Nimègue-version 2. Le travail fastidieux de traduction des actes est fait par ces nombreux collaborateurs qui se forment à la lecture (au déchiffrement) des actes manuscrits anciens. Les erreurs de transcription restent assez nombreuses, mais elles peuvent être corrigées a postériori par qui vient consulter nos listes.
Afin de faciliter des opérations de correction ultérieures, nous avons choisi d'une part de donner l'accès à l'acte original, depuis son extraction de la table et, d'autre part, de rajouter des colonnes de noms de familles, avec une forme orthographique normalisée unique et actuelle, qui jouxtent la colonne des noms fournis dans les actes avec l'orthographe incertaine des Prêtres des XVII et XVIIIè siècles2. Le recadrage des noms devrait faciliter la première opération de recherche.
Les tables ainsi saisies sont tout d'abord vérifiées et enregistrées dans une base de donnée relationnelle qui permet d'aller effectuer des opérations de tri sélectifs, selon des critères multiples choisis, reliés entre-eux par des opérateurs logiques.
Nous avons cherché à estimer la qualité de nos bases de données. Un premier travail consiste à comparer les nombres d'évènements relevés par nos traducteurs et ceux donnés par l'instituteur Jean Nesly dans son ouvrage célèbre :Livre de M. Nesly
Au XVIIIè siècle, Jean Nesly a regroupé les naissances sur deux périodes de 50 ans, les valeurs indiquées par Nesly sont voisines de celles que nous avons relevé.
| Périodes | Jean Nesly | Nos relevés |
| 1700-1750 | 1919 | 1919 |
| 1750-1800 | 2390 | 2333 |
Il apparaît une différence assez peu significative.
L'analyse comparative des nombres de décès, classés cette fois par tranches de dix années, donne encore des différences qui peuvent être plus significatives:
| Périodes | Jean Nesly | Nos relevés |
| 1700-1709 | 316 | 341 |
| 1710-1719 | 142 | 151 |
| 1720-1729 | 123 | 183 |
| 1730-1739 | 284 | 303 |
| 1740-1749 | 243 | 250 |
| 1750-1759 | 237 | 248 |
| 1760-1769 | 326 | 308 |
| 1770-1779 | 285 | 309 |
| 1780-1789 | 400 | 413 |
| 1790-1799 | 406 | 415 |
Les valeurs indiquées par Jean Nesly sont toujours légèrement inférieures aux notres, à l'exception des années vingt où il y a un décalage trop important !
Passons maintenant à la mise en place des relations d'identification des individus que l'on peut établir à partir des enregistrements de nos tables de données.
Un individu est identifié par une variable
s'il est né
à Mussy ou
, si il est décédé à Mussy. Il est
aussi identifié dans la base des Naissances
ou des
Décès
par une ligne de trente à quarante champs3. Afin de mettre en place une étude significative portant sur tous
les individus, ayant pour but d'attribuer à l'un quelconque d'entre
eux ses dates de naissance et de décès, il est nécessaire d'utiliser
les informations essentielles qui figurent dans nos tables : l'âge
au décès, le sexe, les noms, prénoms.
Soit
un élément caractérisé dans la table de décès et
un
autre dans celle des naissances.
Chercher à identifier un individu précis d'une manière unique
revient donc à chercher les correspondances d'un certain nombre de
champs de
avec ceux de
tels que la relation :
| (4.1) |
renvoit de la table des naissances dans celle des décès4.
On cherchera à identifier un individu par la fonction
construite
à partir de l'égalité des nom, prénom, sexe, et de l'appartenance
de l'âge calculé (
) à un voisinage de l'âge indiqué
par le prêtre au moment du décès.
Cette relation (eq:
) est calculée dans une requête SQL5.
Une relation de correspondance devrait vérifier:
Cette relation implique donc que :
Auberger Benoite née le 7 Octobre 1751, décèda le 18 Juin 1771 à l'âge de 19 ans et huit mois.
Nota bene: La table des naissances peut encore donner les parents et on peut poursuivre l'identification des parents.
Le classement que nous avons choisi d'appliquer repose sur le regroupement des individus de la table des décès en sous-ensembles de noms obtenus à partir des critères d'analyse des âges de ces individus, au moment de leur décès7.
Si l'âge n'est pas connu, on le range dans
.
La démarche suivie est la suivante:
on utilise l'âge au moment du décès :
Une sélection minimale vérifie
,
,
et renvoit
de
à
.
si
aucune des conditions n'est vérifiée.
Il en va de même avec la fonction
qui renvoit une partie de
dans une partie de la base des décès où l'âge du mort n'a pas été
dopnnée par le Prêtre
, mais la condition
n'existe
pas !
Ceux qui sont classés appartiennent à
(âge au décès connu)
ou à
(âge au décès non donné).
et
sont inclus dans
ce complément de
dans
représenterait donc l'ensemble
des individus décédés dans la paroisse sur la période donnée, mais
nés en dehors d'icelle.
La figure ci-dessous (fig :
) donne un graphe de
correspondances
Nota bene: Le nombre d'élémentspouvant correspondre à un élément
varie de zéro (inconnu à la naissance) à plusieurs unités (attribution impossible par le test).
|
On définit la sélection minimale comme il a été dit ci-dessus (sans le prénom):
Un individu né à Mussy avant
peut être vivant après
,
il y a probablement plus de
de chances qu'il décède à Mussy.
Un individu qui serait mort à l'âge estimé de
ans (espérance
de vie milieu du XVIIIè siècle) verrait son âge réel situé entre
et
ans dans la détermination à
et entre
et
ans dans le second cas.
Le faible recouvrement des décès par les naissances (nombre d'éléments
en correspondance avec
) pourrait-être dû aux erreurs d'orthographe
dans l'écriture des prénoms, au changement du prénom donné au décès,
à une approximation trop grande de l'âge du défunt relevé par le prêtre
au décès ?
La correspondance obtenue en augmentant
s'améliore faiblement....
Nous pouvons regrouper ultérieurement les individus par nom et prénom (altéré ou modifié).
La figure (fig: fig: evpr ) donne l'évolution du taux d'identification
des individus avec une sélection maximale (resp: minimale). On voit
que pour atteindre une bonne précision dans nos estimations, il faut
fixer
Au delà de cette valeur, le taux n'augmente que
faiblement et la marge d'erreur sur l'âge augmente énormément.
Le tableau suivant donne une liste des sépultures attibuées (colonne 2) ainsi que celles restant à résoudre (colonne 3), pour les familles les mieux représentées à Mussy sous Dun. La colonne 5 donne le pourcentage de sépultures expliquées par famille ; le chiffre indiqué est le quotient du nombre en colonne 2 par la somme des nombres en colonnes 2 et 3 (colonne 4).
| Nom | cas résolus | restant à préciser | Total | Qualité de |
| col 2+3 | l'estimation % | |||
| Auberger | 26 | 16 | 42 | 62 |
| Augagneur | 6 | 5 | 11 | 55 |
| Bajard | 27 | 26 | 53 | 51 |
| Ballandras | 8 | 6 | 14 | 57 |
| Bidaud | 44 | 13 | 57 | 77 |
| Chemier | 28 | 8 | 36 | 78 |
| Chizelle | 42 | 17 | 59 | 71 |
| Corneloup | 15 | 7 | 22 | 68 |
| Desmurger | 21 | 5 | 26 | 80 |
| Duris | 15 | 6 | 21 | 71 |
| Jolivet | 1 | 6 | 7 | 14 |
| Labrosse | 23 | 19 | 42 | 55 |
| Lachize | 11 | 18 | 29 | 38 |
| Lacombe | 27 | 5 | 32 | 84 |
| Laroche | 18 | 13 | 31 | 58 |
| Lathuillière | 10 | 7 | 17 | 59 |
| Livet | 17 | 14 | 31 | 55 |
| Martin | 38 | 10 | 48 | 79 |
| Millet | 30 | 6 | 36 | 83 |
| Troncy | 11 | 8 | 19 | 58 |
| Trouillet | 27 | 7 | 34 | 79 |
| Verchère | 20 | 8 | 28 | 71 |
| Total : | 465 | 230 | 695 |
On remarque que certaines familles ont été bien suivies par le Prêtre, lorsqu'elles ont plus de 75 % de sépultures décelées
:
Nous avons donc repris la recherche des noms dans la liste de
décès survenus dans la période test :
, en fixant la valeur
du test
afin d'identifier environ
de
la population.
Les valeurs obtenues sont reportées dans le tableau suivant (tab :tab:2).
Les résultats sont assez satisfaisants puisqu'environ
de la
population décédée dans cette tranche est identifiée , (
)
si l'on suppose que les prénoms peuvent changer entre l'acte de naissance
et celui de décès !
| Sous-espace |
|
|
non classés | ||
| Sélection nom, prénom | 884 | 140 | 1693 | 669 | |
| Sélection nom seul | 1069 | 424 | 30 | 1693 | 170 |
| Total classé (%) : | 63% | 25% | 1.7% | 100% | 10.3% |
Le recouvrement des tables de naissance - décès reste faible
,
on s'attendait à trouver beaucoup plus.
Faut-il conclure que les prénoms des individus pouvaient varier entre la naissance et le décès ?
Il est a peu près certain que de nombreuses erreurs ou des défauts d'attribution peuvent être commis par les généalogistes amateurs, lorsqu'ils cherchent à suivre leurs ancêtres dans une lecture hâtive des archives !
Nous poursuivrons ce travail sur les périodes
,
,
.
Les relations d'équivalence
à
seront appliquées à
partir de la base des Naissances survenues dans le village entre 1700
et 1749 et celle des décès de 1700 à 1849, car un seul individu est
mort à plus de 100 ans ! Ce dernier travail devrait nous donner une
certaine image de la démographie locale.
Nous tenons à disposition des personnes intéressées le tableau des derniers résultats que nous jugeons les plus aptes à être exploités pour relever correctement nos ancêtres à Mussy sous Dun9.
This document was generated using the LaTeX2HTML translator Version 2002-2-1 (1.71)
Copyright © 1993, 1994, 1995, 1996,
Nikos Drakos,
Computer Based Learning Unit, University of Leeds.
Copyright © 1997, 1998, 1999,
Ross Moore,
Mathematics Department, Macquarie University, Sydney.
The command line arguments were:
latex2html -html_version 4.01 -no_math -split 2 qualite.tex
The translation was initiated by Armand on 2006-07-18