Topic on User talk:Nono314

Jump to navigation Jump to search

Au sujet de la mise à jour de Q115621575

5
Jcmoissinac (talkcontribs)

Merci pour cette mise à jour. Je serais intéressé par des compléments d'informations.

Pour 'described by URL', j'avais mis l'URL POP correspondant à l'œuvre, ce qui me paraissait être une référence correspondant bien aux donnée qui m'ont servi de base (données de la base Joconde converties en CIDOC-CRM dans le graphe de connaissances SemJoconde). La référence que tu as mise est assurément plus riche. Je regrette cependant que la référence POP ait disparue. Est-ce une règle de Wikidata de n'indiquer qu'une valeur pour 'described by URL'? Y a-t-il un moyen de récupérer pour d'autres œuvres une URL telle que celle que tu as fournies (une API ou autre)? j'ai généralement un titre et un créateur, éventuellement une date plus ou moins précise.

J'ai vu qu'en ajoutant json à l'url que tu as fournie, je peux récupérer une structure JSON. Je vais voir comment enrichir Wikidata et SemJoconde à partir de ce json.

Pour 'instance of', c'est très utile d'avoir 'print'; en effet, quand je n'est pas cette précision dans les données SemJoconde, je met 'creative work' comme valeur par défaut; je n'ai pas pour l'instant de méthode fiable pour être plus précis quand les données d'origine ne contiennent pas cette information (une idée serait, par exemple, si on a une image, de faire une analyse d'image pour deviner le type d'objet). Avec le json ci-dessus, je peux récupérer la dénomination estampe.

Pour le numéro d'inventaire, il semble que je ne l'ai pas dans SemJoconde; du coup, je vais pouvoir le récupérer dans le json et ton exemple me montre comment il faudrait le renseigner dans Wikidata.

En tâtonnant, j'ai pu trouver l'image suivante https://collections.mba.rennes.fr/flora_mba/ark:/10946/00327552/doc/816901/BEST.jpg que j'ai insérée dans Wikimedia Commons puis référencée dans Q115621575. Le json référence plutôt http://collections.mba.rennes.fr/flora_mba/ark:/10946/00327552/doc/816901 qui donne une redirection vers https://collections.mba.rennes.fr/flora_mba/ark:/10946/00327552/doc/816901. As-tu des recommandations concernant l'insertion des images dans Wikidata? (je pense qu'avec l'ajout de valeurs pour le champ 'depict', les images sont un vrai plus pour les œuvres).

Derrière ces questions, il y a l'idée d'insérer dans Wikidata de nombreuses œuvres à partir de SemJoconde, en commençant par petites salves (ex: une dizaine à chaque fois), puis, une fois des précautions mises en place, faire une insertion assez massive. J'ai 8301 œuvres du Musée des Beaux-Arts de Rennes dans SemJoconde. J'ai trouvé seulement 171 entités de Wikidata situées au Musée des Beaux-Arts de Rennes.

Nono314 (talkcontribs)

Bonjour @Jcmoissinac

Il n'y a pas de règle définitive pour le nombre de valeurs de décrit à l'URL (P973), même si on se limite gébéralement à 2-3 valeurs pertinentes. En revanche, il est de règle de ne pas doublonner des liens déjà présent via un identifiant (ici identifiant Joconde d'une œuvre (P347)). L'identifiant offre en effet le même en apportant un aspect sémantique et limite l'obsolescence grâce au formateur.

Pour ce qui est du site du musée de Rennes, je suis loin d'être un expert, l'ayant découvert récemment. Je peux toutefois te signaler cette api qui permet de récupérer une liste d'œuvres dans un format json proche de celui que tu as observé sur les entrées individuelles. Malheureusement, il y manque des informations capitales comme les dimensions, espérons que les données seront complétées à l'avenir.

Je ne connaissais pas le projet SemJoconde que je découvre grâce à toi. Je suis un peu surpris par ta remarque sur nature de l’élément (P31) car le champ domaine (DOMN) de Joconde permet généralement une bonne identification du type d'oeuvre, sans se lancer dans une analyse d'image hasardeuse.

Sur Wikidata on travaille surtout sur les peintures. Je te suggère de regarder le projet Wikidata:WikiProject sum of all paintings auquel je contribue pour les peintres et musées français, et aussi plus généralement Wikidata:WikiProject_Visual_arts.

Je travaille moi-même pas mal à partir des données Joconde, je regarderai donc avec intérêt ce qui existe dans SemJoconde. Je vois que dans le repo git, il y a des extracts des catalogues M'n'M des différents thésauri Joconde. Avez-vous réussi à les exploiter ? Je me souviens avoir été très déçu par ces thésauri lors de leur publication, et par leur non-usage dans l'interface POP.

Mais là encore, je m'étonne que tu n'aies pas le champ inventaire qui est à mon sens un des plus aisément exploitables dans Joconde (je l'utilise massivement pour des pré-matchings avec les éléments Wikidata).

Je fais moi-même régulièrement des imports de taille plutôt moyennes (de plusieurs dizaines à quelques centaines d'éléments) car je pratique un workflow semi-manuel : je dispose dans une base d'entrées de nombreuses sources (Joconde, sites des musées, etc...) que je pré-traite avant de les consolider et de les enrichir par exemple avec les images disponibles sur Commons.

J'imagine qu'on aura l'occasion d'échanger sur nos expériences respectives :) Et je te recommande également @Shonagon si tu as des questions : il a beaucoup travaillé sur l'enrichissement des données sur Wikidata à partir de JocondeLab la version sémantique "historique" de Joconde.

Jcmoissinac (talkcontribs)

Bonjour @Nono314

Désolé pour l'histoire des duplicatas. Je pense que c'était lié à des cas où un même numéro d'inventaire apparaissait dans plusieurs entités. Je vais faire une revue approfondie de code pour éviter ça, quitte à ajouter beaucoup moins de contributions en filtrant intensivement les données dont je dispose.

Pour SemJoconde et mes autres contributions envisagées à Wikidata, c'est volontiers que j'échangerais directement avec toi. On pourrait faire une visio ou une rencontre si tu as l'occasion d'être sur Paris. Je suis joignable sur jcmoissinac at gmail.com.

J'ai eu plusieurs fois des contacts avec @Shonagon; dans le plus récent, il m'a recommandé de regarder Omeka-S pour faire des interfaces sur les données sur lesquelles je travaille. J'ai eu aussi des contacts avec Nicolas Vigneron (je ne connais pas son pseudo)

Nono314 (talkcontribs)

Bonjour @Jcmoissinac,

Ce sont des choses qui peuvent arriver...

Idéalement, sur des imports d'un tel volume, il faudrait pouvoir surveiller de près, pour repérer les problèmes suffisamment tôt et pouvoir rectifier le tir. Dans le cas présent c'est arrivé malheureusement assez tard, et j'ai pensé au départ qu'on avait surtout des doublons avec des éléments existants, avant de découvrir les répétitions multiples au sein des éléments créés eux-mêmes.

Je viens d'ailleurs de découvrir un autre souci : les identifiants Joconde que tu as positionné sur les éléments sont souvent sans rapport. J'ai pu identifier les cas lorsqu'il y avait deux identifiants après fusion et retirer celui qui était en trop, mais il y a aussi des cas à un seul identifiant qu'il va falloir repérer. A priori ce sont des entrées dans Joconde dont le numéro d'inventaire contient celui de l'œuvre de Rennes, mais qui appartiennent souvent à d'autres collections en fait (par exemple ici, tu avais associé le Joconde du 2006.4.17 du musée Flaubert de Rouen au 2006.4.1 de Rennes). Encore un point à revoir, j'en suis désolé.

Jcmoissinac (talkcontribs)

Bonjour @Nono314

Je vais lancer un test systématique sur toutes mes créations concernant le Joconde ID

Reply to "Au sujet de la mise à jour de Q115621575"