Aller au contenu
Renaud @ruralsmart

Bibliostratus : mettre en correspondance ses notices avec celles de la BnF

Messages recommandés

Lully

Bonjour @Fred. Avant que j'aille explorer le code : quelle est la version téléchargée (je pense que le formulaire affichera "version 1.25", mais quelle est le nom du zip récupéré) ?

Partager ce message


Lien à poster
Partager sur d’autres sites
Lully
7 hours ago, -Fred- said:

Bonjour,

 

Je suis en train de travailler avec l'outil à l'importation des notices bib et des autorités associées (le module rouge).

 

J'ai rencontré plusieurs problèmes et pour que ce soit plus simple, j'ai copié/collé les traces ic et mis les fichiers contenant quelques alignements en PJ.

....

 

 

Merci beaucoup pour tous ces retours très détaillés et précieux.

Logiquement la version 1.25 en cours de finalisation devrait résoudre tous ces problèmes

Certaines corrections étaient déjà implémentées pour cette version à paraître, les 2 autres corrections apportées le sont désormais (j'espère !) dans la 1.24.11RC

https://github.com/Transition-bibliographique/bibliostratus/tree/master/bin/RC

Sauf pour les cas où vous avez récupéré, dans le résultat des alignements, des identifiants sans préfixe :  ce sont en réalité des PPN, mais où le préfixe "PPN" n'a pas été ajouté. Logiquement, il est désormais systématiquement présent dans les rapports d'alignements, mais pour ceux que vous avez déjà fait tourner il faudra les ajouter "à la main" (en mode chercher-remplacer, ce sera plus rapide). Pour ensuite les faire passer dans le module rouge, version 1.24.11RC, ou dans la future version 1.25

Partager ce message


Lien à poster
Partager sur d’autres sites
-Fred-

Bonjour,

 

Il y a 17 heures, Lully a dit :

Bonjour @Fred. Avant que j'aille explorer le code : quelle est la version téléchargée (je pense que le formulaire affichera "version 1.25", mais quelle est le nom du zip récupéré) ?

 

J'ai effectué mes premiers essais avec une version pas à jour (1.24 datant de début novembre), ce qui n'était pas représentatif de la version actuelle.

 

Avant de poster mon message précédent,  j'ai donc récupéré la dernière version du projet (1.24.10 RC sur github) directement avec une commande "git clone https://github.com/Transition-bibliographique/bibligraphique.git" hier puis j'ai refait les essais.

 

Il y a 14 heures, Lully a dit :

 

Merci beaucoup pour tous ces retours très détaillés et précieux.

Logiquement la version 1.25 en cours de finalisation devrait résoudre tous ces problèmes

Certaines corrections étaient déjà implémentées pour cette version à paraître, les 2 autres corrections apportées le sont désormais (j'espère !) dans la 1.24.11RC

https://github.com/Transition-bibliographique/bibliostratus/tree/master/bin/RC

Sauf pour les cas où vous avez récupéré, dans le résultat des alignements, des identifiants sans préfixe :  ce sont en réalité des PPN, mais où le préfixe "PPN" n'a pas été ajouté. Logiquement, il est désormais systématiquement présent dans les rapports d'alignements, mais pour ceux que vous avez déjà fait tourner il faudra les ajouter "à la main" (en mode chercher-remplacer, ce sera plus rapide). Pour ensuite les faire passer dans le module rouge, version 1.24.11RC, ou dans la future version 1.25

 

Ok, je vais tester ça rapidement avec la version version 1.24.11RC et confirmer que les problèmes remontés n'apparaissent plus.

Concernant les identifiants sans préfixes, ce sera effectivement plus simple de les renommer manuellement car c'est un cas assez peu fréquent.

 

Merci pour ces informations.

Modifié par -Fred-

Partager ce message


Lien à poster
Partager sur d’autres sites
-Fred-

Bonjour,

 

Je viens de recharger les sources du projet avec un "git clone https://github.com/Transition-bibliographique/bibligraphique.git" mais ça ne change rien concernant mes divers problèmes.

A tout hasard, j'ai quand même téléchargé le fichier zip pour windows 64 de la version 1.24.11RC de bibliostratus mais j'ai les mêmes résultats.

 

Partager ce message


Lien à poster
Partager sur d’autres sites
Lully
24 minutes ago, -Fred- said:

Bonjour,

 

Je viens de recharger les sources du projet avec un "git clone https://github.com/Transition-bibliographique/bibligraphique.git" mais ça ne change rien concernant mes divers problèmes.

A tout hasard, j'ai quand même téléchargé le fichier zip pour windows 64 de la version 1.24.11RC de bibliostratus mais j'ai les mêmes résultats.

 

OK, donc je me replonge dans les erreurs signalées en détail

 

Problème 1 :

le code s'exécute pour essayer de réécrire la notice (le message d'erreur indique que le programme veut utiliser la fonction correct_record, qui réécrit la zone 001

Or vous indiquez que c'est dans le cas de fichiers à 1 colonne --> incohérence : vous mettez en entrée un fichier à 1 colonne, mais vous avez coché l'option "Fichier à 2 colonnes"

Bon, par ailleurs j'avais une erreur de typographie dans mon code : la variable agency_uri devenait à un moment agence_uri

 

Problème 2 : ce sont des PPN, il faut ajouter l'info, effectivement (et au passage, comme vous les avez passés dans Excel, 2 d'entre eux ont perdu leur 0 initial)

 

Problème 3 : fichier XML Autorités liées n'est pas correctement formé (manque une balise </collection> finale)

Sur mon poste, c'est correct en tout cas ! Je ne reproduis pas l'erreur

 

Problème 4  :  après ajout des préfixes PPN, le problème n'est-il pas résolu ?

 

Bon, suite à ma correction sur la variable agency_uri, voici une version 1.24.12RC https://github.com/Transition-bibliographique/bibliostratus/blob/master/bin/RC/bibliostratus_1.24.12RC_win64_py3.6.zip

Partager ce message


Lien à poster
Partager sur d’autres sites
-Fred-

 

Pour le 1er problème, je constate une erreur lorsque je veux passer mon fichier à deux colonnes et que je coche l'option "2 colonnes" dans le module rouge.

Le traitement s'arrête alors sur la ligne contenant l' ark:/12148/cb35089640s .

Je ne constate pas d'erreur lorsque je travaille avec un fichier contenant uniquement l'identifiant unique et que je sélectionne l'option "1 colonne".

 

Pour le 2nd problème je vais regarder si effectivement je n'ai pas perdu de données en passant par mon tableur.

La solution est peut-être là. Il n'est pas impossible non plus que cela soit à l'origine de mon premier problème.

 

Pour le 3ème problème, cela ne concerne que les notices autorité. Les notices bib sont OK.

Je confirme qu'il manque toujours la balise finale.

 

Pour le 4ème problème, il me semble que ce n'est pas encore résolu.

 

Je vais refaire des tests avec le version 1.24.12RC dès que possible.

Partager ce message


Lien à poster
Partager sur d’autres sites
Tredok

Coucou ! J'ai eu le même soucis que toi Fred (problème 1, mais uniquement lors de la récupération des autorités sujets. J'ai update (à priori en 1.24.12RC) et tout roule ^^

 

 

Partager ce message


Lien à poster
Partager sur d’autres sites
Lully
5 hours ago, Tredok said:

Coucou ! J'ai eu le même soucis que toi Fred (problème 1, mais uniquement lors de la récupération des autorités sujets. J'ai update (à priori en 1.24.12RC) et tout roule ^^

 

 

Ouf ! Merci Tredok !

Partager ce message


Lien à poster
Partager sur d’autres sites

Créer un compte ou se connecter pour commenter

Vous devez être membre afin de pouvoir déposer un commentaire

Créer un compte

Créez un compte sur notre communauté. C’est facile !

Créer un nouveau compte

Se connecter

Vous avez déjà un compte ? Connectez-vous ici.

Connectez-vous maintenant

×