Forums » Puck Software

Création de liste des familles isolées

Author Message
Benjamin Acloque
 Création de liste des familles isolées
28/07/2016 12:19  
Bonjour à tous,

j'achève le traitement des arbres généalogiques de l'inquisition qui me permettent de raccorder les 10.000 individus issus des registres paroissiaux de Xuertas. Cela m'a permit de supprimer de nombreux doublons. Mais, en dehors de l'arbre principal, il reste, semble-t-il, de nombreux individus ou familles non raccordés à l'arbre principal.

Comme il y a de nombreuses variantes dans les prénoms, sur les noms rares j'ai pu identifier des doublons restants, mais cela s'annonce fastidieux pour les noms plus communs.

Aussi, y a-t-il moyen de sortir la liste des couples ou familles nucléaires, voire 3 générations, qui ne sont pas raccordées à l'arbre principal ? Cela me permettrait de vérifier au cas par cas s'il ne s'agit pas de doublon.

En vous remerciant,

Benjamin
Isabelle Daillant
28/07/2016 20:23  
Bonjour,
Je ne sais pas si ça donne exactement le résultat souhaité, mais ça ne doit pas en être très loin :

- Faire une partition simple ("Raw") des individus par "ID". Ça crée une partition où il y a autant de segments que d'individus.

- Aller au segment d'un individu qui est clairement dans l'arbre (le mieux est d'aller sur cette personne avant de faire la partition ; comme ça, on y est déjà).

- Là : Menu Transform > Expand Current Segment > Universal
Ça va produire 2 choses :
1. une nouvelle fenêtre s'ouvre où est extrait le segment demandé, i.e. le segment qui regroupe toutes les personnes liées d'une façon ou d'une autre à l'individu dont on est parti. Cette fenêtre là, on n'en a pas besoin, on peut la refermer tout de suite.
2. dans la fenêtre du corpus complet, ça a créé une partition avec un nom barbare (commençant par STEP_Ind.ID...) où le segment "null" regroupe tous les gens qui ne sont liés d'aucune façon à l'individu de départ. Pour y accéder :

- Dans la fenêtre du corpus complet : sortir de la partition "ID" (= remonter au niveau du corpus non partitionné)

- Faire une nouvelle partition des individus selon ce nouveau critère qui est apparu (le "STEP_Ind.ID...etc."
Dans cette partition : le paquet appelé "null" corrrespond à l'ensemble des gens qui ne sont liés d'aucune façon à l'individu de départ.
Les autres paquets regroupent les gens en fonction du nombre de "pas" vers l'individu de départ. Il y a donc un paquet "0" avec seulement l'individu de départ lui-même ; un paquet "1", "2", "3", etc.

En principe, le paquet "null" correspondrait à l'objectif visé (non ?)
Si ensuite on veut regrouper les autres pour avoir, face aux "poussières", l'arbre en un seul morceau plutôt qu'en tranches, il faut faire une partition binarisée (au lieu de "Raw") selon ce même critère (le "STEP_Ind.ID...").
Dans la fenêtre des partitions : ne rien inscrire dans la case qui s'ouvre à côté du mot "binarisé" quand on le coche.

Ça marche ?
Isabelle Daillant
28/07/2016 20:59  
PS je ne sais pas combien la commande "Transform > Expand Current Segment > Universal" est vraiment universelle, i.e. si elle prend en compte seulement les liens généalogiques ou aussi d'autres relations.
Par ex., si quelqu'un n'est lié à l'arbre qu'en tant que parrain de l'une des feuilles, je ne sais pas si avec cette commende il se retrouve dans l'arbre ou non.
Si il y a d'autres relations que généalogiques codées dans le corpus, faut explorer le résultat pour voir...
Benjamin Acloque
29/07/2016 11:29  
Bonjour,
merci beaucoup pour cette réponse. Je suis malheureusement un peu perdu. Je ne parviens pas à suivre ton pas-à-pas.
Je ne suis pas familier des partitions (c'est un euphémisme). D'autre part, je n'utilise pas les dernières versions de PUCK qui semblent dépasser ma capacité mémoire dès que je fais un "Reduce>Marked doubles". Ma version est donc le PUCK 2.3.1.

Tout va bien jusqu'à "Menu Transform > Expand Current Segment > Universal".
Le point 2, n'est pas conforme chez moi : les deux partitions sont "ALL" et "1 IND. ID some:"avec le n° de ID de l'individu sur lequel j'étais. Je n'ai pas ton "STEP_Ind.ID..." ni de segment "null"...

Merci pour tes lumières.
B

PS: la question des parrains ou autres relations non généalogiques ne se pose pas chez moi. Je n'aurai donc pas d'expérience à proposer à ce sujet.
Isabelle Daillant
02/08/2016 08:49  
Bonjour Benjamin,
Le problème n'est pas lié à la version de Puck, ces fonctions ne sont pas récentes, et je viens de resuivre la procédure sur la 2.3.1, ça donne exactement la même chose.

Par contre, j'ai du mal à capter où ça coince exactement.
Reprenons :
> Tout va bien jusqu'à "Menu Transform > Expand Current Segment > Universal".
Ensuite :

- Est-ce que tu as bien refermé la nouvelle fenêtre qui s'est ouverte avec le segment extrait ?

- Si oui, dans la fenêtre du corpus entier qui était restée dessous et qui redevient visible, est-ce que tu as bien quitté la partition par ID en remontant au corpus complet ?

- Puis redemandé une partition en cliquant sur le "+" en haut à droite ?
Là, dans le même menu déroulant où on avait demandé "ID" précédemment, même sur la 2.3.1, j'ai bien la ligne suivante qui est apparue :
"STEP_Ind._ID_some_:_xxx_ALL" (avec, à la place du xxx, le n° de l'individu qui a servi de point de départ pour le "expand" juste avant)

Par contre, ça ne m'offre pas de partition "ALL". "ALL", ce n'est pas une partition...
Benjamin Acloque
14/08/2016 21:52  
Merci, ça fonctionne. Je m'étais emmêlé les pinceaux sur la seconde partition.
Le résultat n'est malheureusement pas un fichier facilement exploitable, puisque j'ai encore 5000 individus...
Enfin, on s'en débrouillera.

back
© Développement : DEVINSY
© Webdesign : Aurélie Martial

ANR
Huma-Num
CNRS
EHESS
Collège de France
Université de Paris Sorbonne
Université Paris Ouest Nanterre La Défense
CSAC Kent University