Wikidata:Données lexicographiques/Développement/Propositions/2013-02

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Lexicographical data/Development/Proposals/2013-02 and the translation is 100% complete.

Voici quelques notes au sujet de la prise en charge par Wikidata des Wiktionnaires.

Phase 1 - interwiki

  • Les Wiktionnaires ont un style spécifique de liens interwikis. Tandis que les Wikipédias ont connecté en:Dog avec de:Hund et cs:Pes, les Wiktionnaires ont une connexion entre de:dog - en:dog - cs:dog / en:Hund - de:Hund - cs:Hund, etc dans le même espace de nom. Les autres espaces de noms (catégories, pages de projet) utilisent des liens interwikis normaux.
  • Dans le Wiktionnaire, il y aune différence entre les wikt:most et wikt:Most : les mots sont sensibles à la casse et les liens interwikis ne sont pas pris en charge ou restreints.
  • Les autres projets - Commons, Species, Wikiquote, Wikisource, Wikibooks - sont habituellement liés aux mêmes articles dans différents Wikipédias, comme par exemple q:en:William Shakespeare sera lié à en:William Shakespeare, q:cs:William Shakespeare sera lié à cs:William Shakespeare - tous correspondant à Q692. Mais les Wiktionnaires sont spécifiques à une langue. wikt:de:Most sera lié à de:Most (Getränk), wikt:cs:Most sera lié à cs:Most (město).

Une approche possible pour organiser cette information sur Wikidata pourrait être de « créer un nouvel espace de nom », où le nom de l'élément n'aurait pas la forme « Q123 » mais « wikt:nom_de_l_element » (il n'y aurait pas besoin d'utiliser des nombres puisque les titres seraient tous les mêmes).

Il serait également possible d'utiliser cette fonction pour aider avec les liens interwikis dans les tables de traduction. Par exemple, voici une partie de la table de traduction pour dog sur le Wiktionnaire anglophone :

French: chien m (fr)

Il serait intéressant d'utiliser les données de Wikidata pour montrer le lien « (fr) » en rouge/bleu suivant que le Wiktionnaire francophone a une page appelée « chien » ou pas. Actuellement, des robots font ce travail.

Deux problèmes à cela

  • Que devient l'espace de projet ? Supposément, nous voudrions liés ensemble tous les portails communautaires, etc, de sorte qu'on puisse se débarrasser des bots interwiki. Cela ressemblerait la phase I originale de Wikidata.
  • Ne serait-il pas possible de peupler automatiquement cela depuis les bases de données, en se passant complétement de Wikidata ?
    • Qu'en est-il des wikis avec des conventions de nommage/typographie différentes (par exemple le Wiktionnaire francophone utilise des apostrophes typographiques) ?

Phase 2

  • les wikt:éléments propre à une langue devraient être liés aux éléments Wikipédias correspondant.
  • Pour les wikt:éléments, des propriétés spéciales seront nécessaires — prononciation dans diverses langues, déclinaison, type, etc., qui n'auraient aucune utilité pour des éléments propre à Wikipédia.
  • Il existe quelques — heureusement — propriétés qui seront faciles à faire avant même de penser à la prononciation et équivalent (ce qui signifierait changer la structure complète des Wiktionnaires et unifier les diverses communautés linguistiques ...). En particulier :
    • Clés de tri, par exemple le mot « espérer » en langue « fr » a une clé de tri « esperer » (simplifié, c'est un peu plus complique que cela). Il en serait de même pour toutes les catégories dans une langue donnée.
    • Voir aussi, par exemple les article « mere », « mère », « Mere » qui doivent avoir un lien entre eux. (Sur certains wikis, c'est parfois déjà le cas, en utilisant des modèles tel que en:wikt:Template:also.)
  • Des informations de langues. À présent toutes les langues sont identifiées par un code (par exemple « en » pour l'anglais) qui est stocké dans un modèle, par exemple wikt:en:Template:en (et d'autres informations sont stockées dans d'autres modèles) dans la plupart des versions du Wiktionnaire. Nous pourrions centraliser chaque information dans Wikidata : les noms de langues dans chaque langue, le code de langue, l'alphabet utilisé, le code Wikimédia, etc. À présent, la meilleure alternative aux modèles isolés est un module Lua (par exemple wikt:en:Module:languages).

Exemple

élément nommé Wiktionary:Most

Déclarations
  • IPA-de: mɔst
  • pronounc-de:
  • IPA-cs: mɔst
  • pronounc-cs: Cs-most.ogg
Liste des pages liées à cet élément
[[cs:Most]]
[[de:Most]]
[[en:Most]]
[[fr:Most]]
[[hu:Most]]
[[ko:Most]]
[[pl:Most]]
[[ru:Most]]
[[sv:Most]]

élément nommé Wiktionary:most

Déclarations
  • IPA-de: mɔst
  • IPA-cs: mɔst
  • IPA-en-uk: məʊst
  • IPA-en-us: moʊst
  • IPA-hu: moʃt
  • IPA-pl: mɔst
  • IPA-sh: môːst
Liste des pages liées à cet élément
[[cs:most]]
[[de:most]]
[[en:most]]
...

Voir aussi