Rispondi

Export Gedcom et structure des lieux

boyeuxhaas
male
Messaggi: 22
Albero : Grafico
Vedere il suo albero genealogico
La norme Gedcom 5.5 est très claire à ce sujet : La structure des lieux doit être renseignée dans l'entête HEAD du fichier. Par exemple (fichier Heredis) :

Codice: Seleziona tutto

0 HEAD
1 PLAC 
2 FORM Town, Area code, County, Region, Country, Subdivision
Chacun mettra ce qu'il veut sous ces vocables : "County" désignera "Département" en France, "Subdivision" (champ libre) sera suivant les cas l'ancienne commune, la paroisse, le quartier, le lieu-dit ... L'essentiel est que tous les lieux soient structurés de la même façon, et surtout qu'on retrouve ses petits entre un import et un export Gedcom.
Or tel n'est pas le cas dans un export à partir de Geneanet :
1- Aucune structure de lieux PLAC.FORM n'est placée dans l'entête, en particulier pas celle qui y était à l'import
2- Un lieu importé du genre : "Tunis,,,,TUNISIE, paroisse Sainte-Jeanne d'Arc"
revient à l'export sous la forme : "[paroisse Sainte-Jeanne d'Arc] - Tunis, TUNISIE"
La subdivision entre crochets est une aberration, et les virgules entre "Tunis" et "Tunisie" ont disparu !
J'ai trouvé sur d'autres fils de discussion des arguties rendant responsable de ce fait :
- l'imprécision de norme Gedcom (alors que c'est un force, qui permet de s'adapter à tous les contextes),
- le fait qu'une "Subdivision" n'est pas "juridictional" (qu'on peut traduire par "de la compétence de, du ressort de") pour reprendre le terme de Gedcom. Et alors ? Du reste une paroisse ou une ancienne commune ont été le ressort à l'époque ...
- le fonctionnement interne de Geneweb. Mais ce n'est pas mon problème !
Pourrait-on donc à l'avenir avoir un export Gedcom simplement respectant la norme, c'est-à-dire :
1- La structure des lieux indiquée dans l'entête
2- Dans la suite du fichier tous les lieux respectant cette structure ?
Merci !

dominique95880
dominique95880
Messaggi: 5571
Albero : Non grafico
Vedere il suo albero genealogico
Bonjour boyeuxhaas

Tout ceci est bien beau, mais n'est pas implémenté dans les divers logiciels de généalogie

Dominique

P.S. Pour ma part, je n'ai jamais utilisé de fichier gedcom, utilisant GeneWeb en local et donc les fichiers gw pour mettre à jour mon arbre en ligne.
D'autres n'utilisent aucun fichier et font leurs MAJ directement sur le site.
Alors, pour reprendre vos propos (en les inversant ) la norme gedcom concernant les lieux, ce n'est pas mon problème.

boyeuxhaas
male
Messaggi: 22
Albero : Grafico
Vedere il suo albero genealogico
Pour ma part, à part Geneanet, je ne connais qu'Heredis, où ceci est parfaitement mis en œuvre.

thetienne
thetienne
Messaggi: 947
Albero : Non grafico
Vedere il suo albero genealogico
Bonjour à tous,
En attendant la réponse de Geneanet, juste quelques précisions par rapport au post de boyeuxhaas :
boyeuxhaas ha scritto:
22 febbraio 2020, 16:37
La norme Gedcom 5.5 est très claire à ce sujet : La structure des lieux doit être renseignée dans l'entête HEAD du fichier. Par exemple (fichier Heredis) ...
Or tel n'est pas le cas dans un export à partir de Geneanet :
1- Aucune structure de lieux PLAC.FORM n'est placée dans l'entête, en particulier pas celle qui y était à l'import
Oui, HEREDIS fait comme cela (**), mais d'autre codent cette hierachie des lieux autrement ou ne la codent pas.
Non, l'assertion "la structure des lieux doit être renseignée" est erronée. (cf https://www.familysearch.org/developers/docs/gedcom/ )

En fait il n'y a pas définition claire dans la norme de cette hiérachie ; la norme indique juste que la hierachie est "from the lowest to the highest jurisdiction" et que c'est optionnel "When a PLAC.FORM structure is included in the HEADER of a GEDCOM transmission, it implies that all place names follow this jurisdictional format and each jurisdiction is accounted for by a comma, whether the name is known or not."
Cette hiérachie est fortement dépendante des pays d'où son faible niveau d'implémentation dans les logiciels de généalogie (certains le font, d'autres pas, d'autres préférent se baser uniquement sur la detection des lieux sans rien supposer sur la hiérachie)
boyeuxhaas ha scritto:
22 febbraio 2020, 16:37
2- Un lieu importé du genre : "Tunis,,,,TUNISIE, paroisse Sainte-Jeanne d'Arc"
revient à l'export sous la forme : "[paroisse Sainte-Jeanne d'Arc] - Tunis, TUNISIE"
La subdivision entre crochets est une aberration, et les virgules entre "Tunis" et "Tunisie" ont disparu !
Sur la subdivision (au sens lieu-dit), je suis d'accord avec vous, cela vient du choix de geneweb qui a inventé une spécificité (c'est le seul logiciel à faire comme cela) et qui doit vivre avec. On pourrait débattre à l'infini si c'est conforme à la norme ou pas mais cela ne résoudra pas le problème (***). Il sera souhaitable que geneweb évolue en import/export GEDCOM mais apparemment pas de volonté des développeurs (ce serait possible)
Sur les virgules manquantes, ce n'est pas un problème d'export mais d'import. (cf votre arbre en ligne)
En fait, c'est le programme d'import de geneanet qui filtre les lieux comme cela en supprimant les virgules "inutiles". Le contenu des lieux est donc altéré. Le problème n'est pas à l'export.

boyeuxhaas ha scritto:
22 febbraio 2020, 16:37
Pourrait-on donc à l'avenir avoir un export Gedcom simplement respectant la norme
Probablement jamais car geneweb 7 n'est pas conforme à la norme sur bien d'autres aspects (témoins dans les événements, etc...), HEREDIS et d'autres ne le sont pas plus. Ce n'est pas l'ajout d'un HEAD.PLAC.FORM qui résoudra le problème (mais ce serait une autre discussion).

Donc il y a bien un petit bug (*) Geneanet sur l'import (qui altère les lieux importés et leur hiérachie). J'ai l'impression que c'est le programme gednotes.pl de Geneanet mais je ne suis pas sûr. Pour la conformité de l'export je pense connaitre la réponse de geneanet (mais attendons).

Cordialement
Thierry
(*) car geneanet/geneweb revendique une hiérarchie des lieux avec des niveaux optionnels. Neanmoins c'est mineur et ce peut etre vu comme utile pour la presentation des fiches. Il faudrait neanmoins respecter cette hiérarchie implicite. Vu de l'export, en l'état c'est néanmoins cohérent vu qu'il n'y a pas de hiérarchie exprimée dans le fichier…
(**) et HEREDIS n'est pas conforme à la norme GEDCOM car le standard 5.5/5.5.1 implique que le subdivision devrait être au début ( "from the lowest to the highest jurisdiction") et non après le pays.
(***) personnellement je pense que c'est conforme à la norme car l'idée de départ est un lieu-dit et non une subdivision. Donc pourquoi pas c'est un formattage non interdit par la norme pas plus stupide qu'un autre. Mais il faudrait faire autrement.
Ultima modifica di thetienne il 24 febbraio 2020, 06:49, modificato 1 volta in totale.
Geneweb, Heredis 2020 Pro, Géneatique MX à 2020 sans limites
PC Windows 10 - Version 1909 _____________________________________________________________________________
Ne postez pas de messages sur un fil sans rapport direct avec le sujet discuté; Dans ce cas, créez un autre sujet de discussion.

boyeuxhaas
male
Messaggi: 22
Albero : Grafico
Vedere il suo albero genealogico
Merci thetienne pour ces précision très complètes.
Je ne suis pas un maniaque des normes, mais ce qui devrait nous guider est le bon sens.
thetienne ha scritto:
22 febbraio 2020, 19:50
Oui, HEREDIS fait comme cela (**), mais d'autre codent cette hierachie des lieux autrement ou ne la codent pas.
Aucun problème avec ceux qui codent la hiérarchie des lieux différemment, à partir du moment où ils disent ce qu'ils font via la balise PLAC.FORM. En revanche, j'ai un gros problème avec ceux qui ne la codent pas ...
boyeuxhaas ha scritto:
22 febbraio 2020, 19:07
(**) et HEREDIS n'est pas conforme à la norme GEDCOM car le standard 5.5/5.5.1 implique que le subdivision devrait être au début ( "from the lowest to the highest jurisdiction") et non après le pays.
Exact. Mais il faut voir la "subdivision" comme un champ libre et optionnel (souvent vide), qui n'appartient pas vraiment à la "hiérarchie" administrative du lieu. Commencer par ce champ serait curieux.
thetienne ha scritto:
22 febbraio 2020, 19:50
la norme indique juste que [la balise PLAC.FORM dans l'entête], c'est optionnel
Certes, mais dans l'esprit la norme dit qu'on peut alternativement mettre une balise pour chaque lieu. Soit l'un, soit l'autre, du moins c'est ce que je comprends.
thetienne ha scritto:
22 febbraio 2020, 19:50
Cette hiérachie est fortement dépendante des pays d'où son faible niveau d'implémentation dans les logiciels de généalogie
Tout à fait d'accord sur la première partie de votre affirmation, d'où la nécessité de cette balise qui donne la clef de lecture. De là à ce que certains logiciels ne la mettent pas en œuvre, c'est pour moi incompréhensible.
thetienne ha scritto:
22 febbraio 2020, 19:50
Sur les virgules manquantes, ce n'est pas un problème d'export mais d'import. (cf votre arbre en ligne)
En fait, c'est le programme d'import de Geneanet qui filtre les lieux comme cela en supprimant les virgules "inutiles"
C'est un problème d'import, dont acte. Quant aux virgules inutiles, merci d'avoir mis des guillemets à "inutile" ! :)
Merci pour cette utile discussion.

forhanp
forhanp
Messaggi: 2855
Albero : Non grafico
Vedere il suo albero genealogico
Bonjour,
boyeuxhaas ha scritto:
22 febbraio 2020, 22:42
boyeuxhaas ha scritto:
22 febbraio 2020, 19:07
(**) et HEREDIS n'est pas conforme à la norme GEDCOM car le standard 5.5/5.5.1 implique que le subdivision devrait être au début ( "from the lowest to the highest jurisdiction") et non après le pays.
Exact. Mais il faut voir la "subdivision" comme un champ libre et optionnel (souvent vide), qui n'appartient pas vraiment à la "hiérarchie" administrative du lieu. Commencer par ce champ serait curieux.
Votre explication est étrange :
- Soit c'est une juridiction et donc comme c'est la plus petite elle doit être en tête
- Soit ce n'est pas une juridiction et Heredis a tort de mettre une virgule pour séparer le pays de la subdivision.

Dans les deux cas, Heredis ne respecte pas les recommandations de la norme GEDCOM.

De plus, pourquoi serait-il moins curieux de mettre une virgule derrière le pays plutôt qu'en tête de champ ?
Si Heredis ne mets pas systématiquement une virgule en fin de champ, même lorsqu'il n'y a pas de Subdivision, alors pour le coup, Heredis ne respecte absolument pas la norme, car tous les lieux d'un fichier doivent respecter le format précisé par le tag PLAC.FORM

Le choix de Geneweb de mettre la subdivision en tant que terme accessoire de la commune via l'utilisation de crochet et de tiret, est conforme à la norme (la subdivision n'étant pas une juridiction en tant que telle).
Heredis ne l'est pas.

Cordialement,
Pascal Forhan

boyeuxhaas
male
Messaggi: 22
Albero : Grafico
Vedere il suo albero genealogico
1- Heredis met systématiquement une virgule après le pays, qu'il y ait une subdivision ou pas, et respecte donc son entête PLAC.FORM.
2- Que la subdivision soit en tête ou en queue est un détail, l'essentiel est que l'on puisse correctement décoder les lieux afin d'avoir accès aux registres. J'ai expliqué plus haut que je trouverais curieux de commencer la description du lieu par un champ optionnel et souvent vide, contrairement à celui de la commune. Mais on peut ne pas être d'accord pour une histoire de "respect de norme", je n'y vois aucun inconvénient. Personnellement, si j'avais rédigé la norme Gedcom, j'aurais choisi pour les lieux de lister les champs du plus grand (le pays) au plus petit, ce qui me semble plus cartésien. Mais on ne m'a pas consulté !
forhanp ha scritto:
23 febbraio 2020, 13:37
Le choix de Geneweb de mettre la subdivision en tant que terme accessoire de la commune via l'utilisation de crochet et de tiret, est conforme à la norme (la subdivision n'étant pas une juridiction en tant que telle).
3- Ce que vous dites n'est pas exact. La subdivision dans la grande majorité des cas, que ce soit la paroisse, le hameau alors autonome ou l'arrondissement, étaient le ressort (mot plus adéquate à mon avis que "juridiction" pour traduire "juridictional" ) de la tenue des registres à l'époque. La paroisse n'est pas un terme accessoire à la commune, c'est un élément capital !
4- Je n'ai pas d'actions chez Heredis, et franchement savoir s'ils ont tord ou raison n'est pas le sujet.

forhanp
forhanp
Messaggi: 2855
Albero : Non grafico
Vedere il suo albero genealogico
Bonjour,
boyeuxhaas ha scritto:
23 febbraio 2020, 21:33
3- Ce que vous dites n'est pas exact. La subdivision dans la grande majorité des cas, que ce soit la paroisse, le hameau alors autonome ou l'arrondissement, étaient le ressort (mot plus adéquate à mon avis que "juridiction" pour traduire "juridictional" ) de la tenue des registres à l'époque. La paroisse n'est pas un terme accessoire à la commune, c'est un élément capital !
Ce que vous dites n'est pas exact.
Il est courant dans les registres paroissiaux Français d'avoir la mention d'un hameau qui est tout sauf autonome par rapport à la paroisse.
Cela reste vrai après la révolution Française.
Ce lieu-dit n'est en aucun cas une juridiction indépendante de la paroisse.
Et les paroisses campagnardes ont souvent donné lieu à la création de la commune.
Donc tout dépend ce que vous mettez dans la subdivision.
Arrondissement, Hameau, Annexe, paroisse pour une grande ville, lieu-dit.

J'ai personnellement de nombreux hameaux qui apparaissent dans mes lieux-dits (plus petite "juridiction" défini dans mon fichier GEDCOM). cela permet souvent de différencier des homonymes en fonction de leur lieu d'habitation.
Et je vous avoue que commencer mes lieux par une virgule ne me choque pas.
Les finir par une virgule sans rien derrière, en revanche.....

Cordialement,
Pascal Forhan

jackchipier
jackchipier
Messaggi: 9447
Albero : Non grafico
Vedere il suo albero genealogico
boyeuxhaas ha scritto:
22 febbraio 2020, 19:07
Pour ma part, à part Geneanet, je ne connais qu'Heredis, où ceci est parfaitement mis en œuvre.
Bonsoir,

C'est également parfaitement mis en œuvre sur le logiciel Geneweb utilisé par Geneanet ... le gros problème c'est qu'il y a entre les deux (Heredis et Geneweb), une chose plutôt médiocre intitulée Gedcom ... et ceci est valable pour tout transfert entre deux logiciels.

On a choisi un logiciel donné, on l'apprécie, on est satisfait de sa présentation, vous c'est Heredis, moi c'est Geneweb (j'utilise la saisie en ligne, on peut l'utiliser en local comme Dominique) ... mais ensuite il ne faut pas s'étonner, ni trop se plaindre, si la présentation n'est pas conforme à ses désirs après un transfert utilisant ce fameux gedcom ...

Et ce n'est ni de la faute à Geneanet , ni de la faute à Heredis ou à tout autre logiciel digne de ce nom ... un seul responsable ... le gedcom ...

Pour ce qui est de la norme Geneanet :

[Subdivision] - Commune, Département, Pays

1 - L'ordre est tout à fait normal, on liste dans l'ordre progressif, la subdivision est dans la commune, elle même dans le département, lui-même dans le pays.

2 - Pour la mise entre crochets, Geneanet n'est pas seulement un site où l'on peut présenter son arbre, mais également un outil permettant de faire des comparaisons et des recherches, et il faut pour cela que les lieux soient clairement édités afin d'être reconnus.
La subdivision permet d'ajouter un complément d'informations (lieu-dit, rue, hôpital ...) et ne doit pas interférer la définition du lieu ... la présence de crochets permet au logiciel d'ignorer cette information dans la dite définition.
Cordialement,
Jack

boyeuxhaas
male
Messaggi: 22
Albero : Grafico
Vedere il suo albero genealogico
Chacun est content de son logiciel, j'en suis fort aise.
Mais le sujet, c'est l'échange de données de lieux entre logiciels via Gedcom . J'aimerais quant à moi avoir l'avis de Geneanet sur le problème résumé par thetienne :
thetienne ha scritto:
22 febbraio 2020, 19:50
Donc il y a bien un petit bug (*) Geneanet sur l'import (qui altère les lieux importés et leur hiérachie).
C'est le programme d'import de geneanet qui filtre les lieux comme cela en supprimant les virgules "inutiles"

Exemple (désolé de me citer moi-même !) :
boyeuxhaas ha scritto:
22 febbraio 2020, 16:37
Un lieu importé du genre : "Tunis,,,,TUNISIE, paroisse Sainte-Jeanne d'Arc"
revient à l'export sous la forme : "[paroisse Sainte-Jeanne d'Arc] - Tunis, TUNISIE"

Dit autrement, "Tunisie" se retrouve à l'export dans la zone "Code postal" ...
Merci !

jackchipier
jackchipier
Messaggi: 9447
Albero : Non grafico
Vedere il suo albero genealogico
Bonsoir,

- Votre lieu sur Heredis :

Tunis,,,,TUNISIE, paroisse Sainte-Jeanne d'Arc

En premier lieu des virgules totalement inutiles et de plus pas des plus esthétiques ...

En second lieu, je savais que Tunis était en TUNISIE ... mais je ne savais pas que la TUNISIE faisait parti de la paroisse Sainte-Jeanne d'Arc ... :lol: :lol: :lol:

Pour un logiciel à ce prix ... c'est pas des plus fort ... ma foi, si ça vous convient ...

- Votre lieu sur Geneanet après le transfert :

[paroisse Sainte-Jeanne d'Arc] - Tunis, TUNISIE

Parfait pour moi, la paroisse Sainte-Jeanne d'Arc fait parti de la commune de Tunis, qui elle même fait parti de la TUNISIE.

Geneanet a fait sauté les virgules ... pas plus mal ... pour la présence de crochets, j'ai donné la raison plus haut (pas de prise en compte de cette partie entre crochets pour la définition du lieu).
Ces crochets n'apparaissent pas sur la fiche -> paroisse Sainte-Jeanne d'Arc - Tunis, TUNISIE

Nota : je ne vois pas ce que vient faire le code postal la dedans ... :o :o

La norme Geneanet complète :

[Subdivision] - Code Insee, Commune, Département, Région, Pays

La saisie du code Insee et de la région (en France) est facultative, si non saisie, on se retrouve :

[Subdivision] - Commune, Département, Pays

N'ayant pas saisi de département ou de région pour Tunis dans votre exemple, on se retrouve :

[Subdivision] - Commune, Pays
Cordialement,
Jack

jlm
male
Administrateur
Messaggi: 2611
Bonjour,

Voici quelques clarification pour Geneanet & Geneweb :

- Il n'y a un seul champ pour stocker un lieu dans un gedcom et dans geneweb.
- Il est important d'aller du plus petit au plus grand avec séparateurs "," ou "(". C'est important pour la géolocalisation et pour l'affichage par lieux. Pour la géolocalisation il part de droite à gauche pour trouver les subdivisions géographiques. Ensuite pour les longitudes, latitudes, il fait de gauche à droite.
- ce que l'on veut faire sauter à l'indexation (moteur de recherche Geneanet) il faut le mettre entre "[Lieu-dit] - ". On peut mettre "Lieu-dit, Commune" dans ce cas cela le lieu-dit va être indexé et recherchable.
- il faut éviter de mettre entre [ ] les anciennes communes car elles ne seront pas indexées et non trouvable par les généalogistes.
- les retraitements sont dans un but esthétique et de faciliter l'indexation.

Le cas [Subdivision] - Code Insee, Commune, Département, Région, Pays (et les options d'affichage) concerne ceux qui saisissent en ligne avec un dictionnaire de lieux. On peut désactiver certains champs dans le dictionnaire de lieu ou le désactiver complètement et utiliser le dictionnaire du navigateur. La niveau région n'a plus vraiment de sens et alourdit l'affichage.

Pour ma part je participe à des arbres collaboratifs où la norme choisie est "Commune (numéro du département)" ou Paroisse, Commune (numéro de département) (ex pour Paris).

Bien cordialement,

Jacques
Geneanet

boyeuxhaas
male
Messaggi: 22
Albero : Grafico
Vedere il suo albero genealogico
Bonjour,
Merci pour ces précisions. Mais :
jlm ha scritto:
03 marzo 2020, 14:43
Il est important d'aller du plus petit au plus grand avec séparateurs ","
Justement le problème est que, à l'importation d'un fichier Gedcom, les virgules-séparateurs disparaissent lorsqu'il y a un champ vide, ce qui modifie la structure hiérarchique du lieu.
C'est l'exemple que je donne depuis le début de ce fil :
Un lieu importé en Gedcom du genre : "Tunis,,,,TUNISIE"
se retrouve sur Geneanet sous la forme : "Tunis, TUNISIE"
et de même au ré-export en Gedcom.
N'y aurait-il pas moyen de garder ces virgules de façon sous-jacente, quitte à ne pas les afficher pour des raisons esthétiques ? Des virgules invisibles, en somme ...
jlm ha scritto:
03 marzo 2020, 14:43
Donc il y a bien un petit bug (*) Geneanet sur l'import (qui altère les lieux importés et leur hiérachie). J'ai l'impression que c'est le programme gednotes.pl de Geneanet mais je ne suis pas sûr.
Comme thetienne, je considère ce problème comme un bogue (pas si "petit" que ça ...) ?
Cordiales salutations

Jean-François

jlm
male
Administrateur
Messaggi: 2611

boyeuxhaas
male
Messaggi: 22
Albero : Grafico
Vedere il suo albero genealogico
Cela ne pose effectivement aucun problème dans le fonctionnement interne de Geneanet, qui sait très bien retrouver ses petits !
En revanche cela pose un sérieux problème lors de l'export en Gedcom.
Prenons deux adresses importées de Gedcom, structurées de la façon suivante :
a) Nancy, Meurthe-et-Moselle, Grand Est, France
b) Tunis,,,Tunisie
Au ré-exort en Gedcom, on retrouve :
a) Nancy, Meurthe-et-Moselle, Grand Est, France
b) Tunis,Tunisie
Tunisie est désormais dans la section "département" !

Rispondi

Torna a “Questions techniques diverses”