Wikidata:WikiProjet Raisonnement

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:WikiProject Reasoning and the translation is 100% complete.

Purpose

Ce projet vise à explorer la possibilité de déduire des choses à partir du contenu de Wikidata. Comment la communauté peut définir ce qui doit être inféré ? Comment ces déduction peuvent-elles être calculées par des outils ? Comment ces déductions pourraient-elles être utilisées ?


Participants

[+] Add yourself to the list

The participants listed below can be notified using the following template in discussions:
{{Ping project|Reasoning}}

Motivation

La spouse (P26) de Douglas Adams (Q42) était Jane Belson (Q14623681). Clairement, ça signifie en miroir que la spouse (P26) de Jane Belson (Q14623681) était Douglas Adams (Q42). Voici un exemple simple d'un cas ou une déclaration (sur Jane Belson (Q14623681)) peut être déduite (inférée) d'une autre déclaration (sur Douglas Adams (Q42)). Ce serait une bonne chose si nous pouvions écrire des outils qui calculent ces déductions, par exemple pour nous alerter quand une information est manquante ou contradictoire.

Cela peut marcher uniquement si nous (la communauté Wikidata) documentons quelque part les conclusions qui doivent être tirées. Nous savons que spouse (P26) donne naissance à l'exemple de déduction ci-dessus, mais y a t'il un endroit ou cela est décrit sur Wikidata? En fait, dans le cas de spouse (P26), nous trouvons l'information que la propriété est symétrique dans la déclaration sur la page Property:P26 que c'est un <instance of (P31):symmetric property (Q18647518)>. Cette information est aussi disponible sur sa page de discussion sous la forme du modèle de contrainte qui exprime la symétrie. Malheureusement, ce modèle ne nous dit rien sur les qualificateur. Par exemple, la déclaration spouse (P26) de Douglas Adams (Q42) a les qualificatifs start time (P580) et end time (P582). Évidemment, la déclaration spouse (P26) de Jane Belson (Q14623681) devrait utiliser les mêmes qualificateurs avec les mêmes valeurs. Ce n'est exprimé nulle part. De plus, il y a des cas ou les relations sont symétriques mais certains qualificatifs ne le sont pas (c'est à dire qu'ils ne devraient pas être copiés), comme dans le cas de diplomatic relation (P530), qui utilise un qualificateur non-symétrique diplomatic mission sent (P531) pour spécifier l'embassade de l'élément source dans le pays de l'élément cible. Il est clair que simplement copier tous les qualificatifs des propriétés symétrique ne marcherait pas non plus.

Par conséquent, nous devons trouver un moyen de clarifier tout ça et de définir plus précisément les inférences valides. Ce ne sera pas uniquement un bénéfice pour les utilisateurs externe ("par une machine") mais ça nous aidera aussi à documenter nos supposition sur l'utilisation de nos propriétés.

Approche proposée

C'est un problème complexe qui ne peut être résolu en une seule étape. Les solution proposées devraient être raffinées en plusieurs étapes jusqu'à ce que tout fonctionne comme attendu. Cependant, une idée générale peut être donnée comme suit:

  1. La communauté devrait spécifier les règles d'inférences depuis le wiki.
  2. Chaque règle devrait être sur sa propre page, avec une explication détaillée et une discussion.
  3. Les règles elle mêmes devraient être définie dans un format précis, par ex. en utilisant des modèles, de manière à ce que les outils puissent les extraire et les utiliser. (Il ne sera probablement pas possible de spécifier toutes les règles sur des déclarations dans les pages des propriétés, donc il est sans doute préférable de toutes les avoir sous format unifié dans d'autres pages wiki; il est toujours possible de les lier depuis les pages de propriétés).
  4. Les outils externes liront les règles depuis le wiki, vont calculer les inférences, et les utiliseront en fonction de leur objectifs. Quelques règles serviront peut être au contrôle qualité, tandis que d'autres serviraient pour enrichir les données d'applications comme Reasonator, d'autres encore pourraient être utilisées pour calculer des inférences à ajouter en retour à Wikidata à l'aide de robots.

Quelles "règles d'inférences" ?

La première grande question est de déterminer la meilleure manière d'écrire les règles d'inférences qui peuvent servir de cas d'utilisation basiques de Wikidata. Nous commençons par compiler des cas d'utilisation:

Comment exprimer/stocker/gérer les règles d’inférence ?

Nous devons travailler avec des règles sur (et depuis) le wiki. Il y a de nombreuses possibilités pour réaliser ce but au mieux. Ceci peut déjà être discuté sans connaître les possibilités exacted offertes par les règles voulues.