
From Wikidata
Jump to navigation Jump to search

In Wiktionary there are very wide system of categories and supporting templates. It is important that these categories would be represented and interlinked correctly at Wikidata.

Russian Wiktionary has a complex but logic system. In briefly there are 4 big sets for lexemes: semantic - field category (Q54662266), grammatic, lexical and etimological categories.

Parts of speech categories[edit]

part of speech (POS) Containing words of such POS Words with information about POS
  POS words POS words by language About POS About POS by language
noun (Q1084) Category:Nouns (Q61945932) Category:Nouns by language (Q30431819) Category:Noun-related terms (Q9557799) Category:Noun by language (Q7773966)
adjective (Q34698) Category:Adjectives (Q10249514) Category:Adjectives by language (Q30424621) Category:Adjectives (Q9427615) Q32777813
verb (Q24905) Category:Verbs (Q61761533) Category:Verbs by language (Q61761575) Category:Verbs (Q8225370) Category:Verbs by language (Q7702937)
adverb (Q380057) Category:Adverbs (Q62100965) Category:Adverbs by language (Q10250511) Q9402839 Q62101610
interjection (Q83034) Category:Interjections (Q8550243) Category:Interjections by language (Q30566065) - -
numeral (Q63116) Category:Numerals (Q5656164) Category:Numerals by language (Q13396916) Q62099050 Q62101750
pronoun (Q36224) Category:Pronouns (Q31102165) Category:Pronouns by language (Q8797476) Category:Pronouns (Q8797484) Q62101851
article (Q103184) Category:Word class article (Q59420974) Category:Articles by language (Q30566597) Category:Article (grammar) (Q6189125) -
preposition (Q4833830) Category:Prepositions (Q30702371) Category:Prepositions by languages (Q10243359) ? ?
conjunction (Q36484) Category:Conjunctions (Q21539811) Category:Conjunctions by language (Q13395049) ? ?

Semantic categories[edit]

⟨ should have ⟩ category combines topics (P971) View with SQID ⟨ field category (Q54662266)  View with Reasonator View with SQID ⟩

All semantic categories (32979 at 15.07.19):

SELECT ?cat ?catLabel ?langLabel WHERE {
  ?cat wdt:P971 wd:Q54662266.
  OPTIONAL {?cat wdt:P971 ?lang.
            ?lang wdt:P31/wdt:P279* wd:Q315.}
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],fr,en". }
Try it!

There are many of them (and should be more), by all languages:

SELECT  ?langLabel (COUNT(?cat) AS ?cnt) WHERE {
  ?cat wdt:P971 wd:Q54662266.
  OPTIONAL {?cat wdt:P971 ?lang.
            ?lang wdt:P31/wdt:P279* wd:Q315.}
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],fr,en". }
GROUP BY ?langLabel
Try it!

Lexical categories[edit]

Grammatical categories[edit]

⟨ should have ⟩ category combines topics (P971) View with SQID ⟨ grammatical category (Q980357)  View with Reasonator View with SQID ⟩

All (3075 at 15.07.19):

SELECT ?cat ?catLabel WHERE {
  ?cat wdt:P971 wd:Q980357.
  OPTIONAL {?cat wdt:P971 ?lang.
            ?lang wdt:P31/wdt:P279* wd:Q315.}
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],fr,en". }
Try it!

Not to mix[edit]

QLever approximation - Orb is better

Language Grammatical categories "Grammar" (semcat) Words by POS Parts of speech (semcat)
Afrikaans (Q14196) Q31832102 Category:af:Grammar (Q30524943) Q65568340 Category:af:Parts of speech (Q65568447)
English (Q1860) Q31156736 Category:en:Grammar (Q30578969) Category:English lemmas by word class (Q65576801) Category:en:Parts of speech (Q33531088)
Russian (Q7737) Q64778582 Category:ru:Grammar (Q31156892) Q65579409 Category:ru:Parts of speech (Q33531945)

and so on...

SELECT distinct ?langLabel ?cat1 ?cat1Label ?cods1 ?cat2 ?cat2Label ?cods2 ?cat3 ?cat3Label ?cods3 ?cat4 ?cat4Label ?cods4 WHERE {
  ?lang wdt:P31/wdt:P279* wd:Q20162172.
#  VALUES ?lang {wd:Q9292}
  OPTIONAL {?cat1 wdt:P971 wd:Q980357.
  ?cat1 wdt:P971 ?lang.
  OPTIONAL {SELECT ?cat1 (GROUP_CONCAT(distinct ?cod1; separator=', ') as ?cods1) WHERE {
    ?wiktSitelink schema:isPartOf [ wikibase:wikiGroup "wiktionary" ];
                      schema:inLanguage ?cod1;
                      schema:about ?cat1. } GROUP BY ?cat1 ORDER BY ?cod1 }
  OPTIONAL {?cat2 wdt:P971 wd:Q8091; wdt:P971 wd:Q54662266; wdt:P971 ?lang.
  OPTIONAL {SELECT ?cat2 (GROUP_CONCAT(distinct ?cod2; separator=', ') as ?cods2) WHERE {
    ?wiktSitelink schema:isPartOf [ wikibase:wikiGroup "wiktionary" ];
                      schema:inLanguage ?cod2;
                      schema:about ?cat2. } GROUP BY ?cat2 ORDER BY ?cod2 }

  OPTIONAL {?cat3 wdt:P971 wd:Q30434250; wdt:P971 wd:Q54734643; wdt:P971 ?lang.
  OPTIONAL {SELECT ?cat3 (GROUP_CONCAT(distinct ?cod3; separator=', ') as ?cods3) WHERE {
    ?wiktSitelink schema:isPartOf [ wikibase:wikiGroup "wiktionary" ];
                      schema:inLanguage ?cod3;
                      schema:about ?cat3. } GROUP BY ?cat3 ORDER BY ?cod3 }

  OPTIONAL {?cat4 wdt:P971 wd:Q82042; wdt:P971 wd:Q54662266; wdt:P971 ?lang.
  OPTIONAL {SELECT ?cat4 (GROUP_CONCAT(distinct ?cod4; separator=', ') as ?cods4) WHERE {
    ?wiktSitelink schema:isPartOf [ wikibase:wikiGroup "wiktionary" ];
                      schema:inLanguage ?cod4;
                      schema:about ?cat4. } GROUP BY ?cat4 ORDER BY ?cod4 }
  FILTER (STR(?cat1)!="" || STR (?cat2) != "" || STR(?cat3) != "" || STR(?cat4)!="")
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],fr,en". }
ORDER BY ?langLabel
Try it!

This list is periodically updated by a bot. Manual changes to the list will be removed on the next update!

WDQS | PetScan | TABernacle | Find images | Recent changes
number Language Grammar categories Grammar lexique Words by part of speech Words about parts of speech
1 Azerbaijani Catégorie:Grammaire en azéri Category:az:Grammar Kategorija:Azerske vrste riječi Category:az:Parts of speech
2 English Catégorie:Grammaire en anglais Category:en:Grammar Category:English lemmas by word class Category:en:Parts of speech
3 Arabic Catégorie:Grammaire en arabe Category:ar:Grammar Kategorija:Arapske vrste riječi Category:ar:Parts of speech
4 Armenian Catégorie:Grammaire en arménien Category:hy:Grammar Category:Armenian lemmas by word class Category:hy:Parts of speech
5 Asturian Catégorie:Grammaire en asturien Category:ast:Grammar Категория:Астурийские слова по частям речи Category:ast:Parts of speech
6 Afrikaans Catégorie:Grammaire en afrikaans Category:af:Grammar Категория:Слова по частям речи/af Category:af:Parts of speech
7 Basque Catégorie:Grammaire en basque Category:eu:Grammar Kategorie:Basksch Woortaarten Category:eu:Parts of speech
8 Bashkir Catégorie:Grammaire en bachkir Catégorie:Lexique en bachkir de la grammaire Kategorija:Baškirske vrste riječi Category:ba:Parts of speech
9 Belarusian Catégorie:Grammaire en biélorusse Category:be:Grammar Kategorija:Bjeloruske vrste riječi Категория:Части речи/be
10 Bangla Catégorie:Grammaire en bengali Category:bn:Grammar Category:Bengali lemmas by word class Category:bn:Parts of speech
11 Bulgarian Catégorie:Grammaire en bulgare Category:bg:Grammar Category:Bulgarian lemmas by word class Категория:Части речи/bg
12 Breton Catégorie:Grammaire en breton Category:br:Grammar Kategorija:Bretonske vrste riječi Category:br:Parts of speech
13 Welsh Catégorie:Grammaire en gallois Category:cy:Grammar Kategorija:Velške vrste riječi Категория:Части речи/cy
14 Hungarian Catégorie:Grammaire en hongrois Category:hu:Grammar Kategorija:Mađarske vrste riječi Category:hu:Parts of speech
15 Upper Sorbian Catégorie:Grammaire en haut-sorabe Категория:Грамматика/hsb Kategorija:Kalbos dalys/Aukštutinių sorbų kalba Category:hsb:Grammar
16 Guarani Catégorie:Grammaire en guarani Category:gn:Grammar Kategorija:Kalbos dalys/Gvaranių kalba Категория:Части речи/gn
17 Gujarati Catégorie:Grammaire en gujarati Category:gu:Grammar Kategorija:Kalbos dalys/Gudžaratų kalba Category:gu:Parts of speech
18 Danish Catégorie:Grammaire en danois Category:da:Grammar Kategorija:Danske vrste riječi Category:da:Parts of speech
19 Ancient Greek Catégorie:Grammaire en grec ancien Category:grc:Grammar Kategorija:Starogrčke vrste riječi Category:grc:Parts of speech
20 Samogitian Catégorie:Grammaire en samogitien Category:sgs:Grammar Kategorija:Žemaitske vrste riječi Category:sgs:Parts of speech
21 Zazaki Catégorie:Grammaire en zazaki Category:zza:Grammar Kategorija:Zazakijske vrste riječi
22 West Frisian Catégorie:Grammaire en frison Category:fy:Grammar Rummad:Yezhadur frizek Category:fy:Parts of speech
23 Zulu Catégorie:Grammaire en zoulou Category:zu:Grammar Kategorija:Kalbos dalys/Zulų kalba Категория:Части речи/zu
24 Indonesian Catégorie:Grammaire en indonésien Category:id:Grammar Category:Indonesian lemmas by word class Category:id:Parts of speech
25 Spanish Catégorie:Grammaire en espagnol Category:es:Grammar تصنيف:أجزاء الكلام (إسبانية) Категория:Части речи/es
26 Catalan Catégorie:Grammaire en catalan Category:ca:Grammar Kategorija:Katalonske vrste riječi Category:ca:Parts of speech
27 Kashubian Catégorie:Grammaire en kachoube Category:csb:Grammar Kategorija:Kalbos dalys/Kašubų kalba Category:csb:Parts of speech
28 Chinese Catégorie:Grammaire en chinois Category:zh:Grammar تصنيف:أجزاء الكلام (صينية) Category:zh:Parts of speech
29 Korean Catégorie:Grammaire en coréen Category:ko:Grammar تصنيف:أجزاء الكلام (كورية) Category:ko:Parts of speech
30 Crimean Tatar Catégorie:Grammaire en tatar de Crimée Category:crh:Grammar Kategorija:Krimskotatarske vrste riječi Категория:Части речи/crh
31 Latin Category:Latin words by grammar details Category:la:Grammar Category:Latin lemmas by word class Category:la:Parts of speech
32 Latvian Catégorie:Grammaire en letton Category:lv:Grammar Kategorija:Letonske vrste riječi Category:lv:Parts of speech
33 Livonian Catégorie:Grammaire en livonien Category:liv:Grammar Category:liv:Parts of speech
34 Lithuanian Catégorie:Grammaire en lituanien Category:lt:Grammar Kategorija:Litavske vrste riječi Category:lt:Parts of speech
35 Luxembourgish Catégorie:Grammaire en luxembourgeois Category:lb:Grammar Category:Luxembourgish lemmas by word class
36 Macedonian Catégorie:Grammaire en macédonien Category:mk:Grammar Kategorija:Makedonske vrste riječi Категория:Части речи/mk
37 Marathi Catégorie:Grammaire en marathe Category:mr:Grammar Kategorija:Marati vrste riječi Категория:Части речи/mr
38 Mari Catégorie:Grammaire en mari Category:chm:Grammar Kategorija:Marijske vrste riječi Category:chm:Parts of speech
39 German Catégorie:Grammaire en allemand Category:de:Grammar تصنيف:أجزاء الكلام (ألمانية) Category:de:Parts of speech
40 Dutch Catégorie:Grammaire en néerlandais Category:nl:Grammar Category:Dutch lemmas by word class Category:nl:Parts of speech
41 Modern Greek Category:Grammar and word classes in Greek Category:el:Grammar Category:Greek lemmas by word class Category:el:Parts of speech
42 Norwegian Catégorie:Grammaire en norvégien Category:no:Grammar Kategorija:Norveške vrste riječi Category:no:Parts of speech
43 Nynorsk Category:Nynorsk words by grammar categories Category:nn:Grammar
44 Occitan Catégorie:Grammaire en occitan Category:oc:Grammar Kategorija:Okcitanske vrste riječi Категория:Части речи/oc
45 Persian Catégorie:Grammaire en persan Category:fa:Grammar Kategorija:Perzijske vrste riječi Category:fa:Parts of speech
46 Polish Catégorie:Grammaire en polonais Category:pl:Grammar تصنيف:أجزاء الكلام (بولندية) Category:pl:Parts of speech
47 Portuguese Catégorie:Grammaire en portugais Category:pt:Grammar تصنيف:أجزاء الكلام (برتغالية) Category:pt:Parts of speech
48 Romanian Catégorie:Grammaire en roumain Category:ro:Grammar Kategorija:Romanš vrste riječi Category:ro:Parts of speech
49 Russian Catégorie:Grammaire en russe Category:ru:Grammar Kategorija:Ruske vrste riječi Category:ru:Parts of speech
50 Sicilian Категория:Грамматические категории/scn Category:scn:Grammar Kategorija:Kalbos dalys/Siciliečių kalba Category:scn:Parts of speech
51 Slovak Catégorie:Grammaire en slovaque Category:sk:Grammar Kategorija:Slovačke vrste riječi Category:sk:Parts of speech
52 Old French Catégorie:Grammaire en ancien français Категория:Грамматика/fro Kategorija:Kalbos dalys/Senoji prancūzų kalba Category:fro:Parts of speech
53 Tagalog Catégorie:Grammaire en tagalog Category:tl:Grammar Kategorija:Tagaloške vrste riječi Category:tl:Parts of speech
54 Tajik Catégorie:Grammaire en tadjik Category:tg:Grammar تصنيف:أجزاء الكلام (طاجيكية) Category:tg:Parts of speech
55 Tongan Κατηγορία:Γραμματικές κατηγορίες (τόνγκα)
56 Turkish Catégorie:Grammaire en turc Category:tr:Grammar Kategorija:Turske vrste riječi Category:tr:Parts of speech
57 Uyghur Κατηγορία:Γραμματικές κατηγορίες (ουιγουρικά) Category:ug:Grammar Kategorija:Ujgurske vrste riječi Category:ug:Parts of speech
58 Faroese Catégorie:Grammaire en féroïen Category:fo:Grammar Kategorija:Kalbos dalys/Farerų kalba Category:fo:Parts of speech
59 French Catégorie:Grammaire en français Category:fr:Grammar Category:French lemmas by word class Category:fr:Parts of speech
60 Friulian Catégorie:Grammaire en frioulan Category:fur:Grammar Kategorija:Kalbos dalys/Furilų kalba Category:fur:Parts of speech
61 Croatian Категория:Грамматические категории/hr Catégorie:Lexique en croate de la grammaire Κατηγορία:Γραμματικές κατηγορίες (κροατικά) Категория:Части речи/hr
62 Romani Catégorie:Grammaire en romani Category:rom:Grammar Kategorija:Romske vrste riječi
63 Chechen Catégorie:Grammaire en tchétchène Категория:Грамматика/ce Kategorija:Čečenske vrste riječi Категория:Части речи/ce
64 Czech Catégorie:Grammaire en tchèque Category:cs:Grammar Kategorija:Češke vrste riječi Category:cs:Parts of speech
65 Swedish Catégorie:Grammaire en suédois Category:sv:Grammar Category:Swedish lemmas by word class Category:sv:Parts of speech
66 Scottish Gaelic Catégorie:Grammaire en gaélique écossais Category:gd:Grammar Kategorija:Kalbos dalys/Škotų gėlų kalba Category:gd:Parts of speech
67 Scots Catégorie:Grammaire en scots Category:sco:Grammar Kategorija:Kalbos dalys/Škotų kalba
68 Esperanto Catégorie:Grammaire en espéranto Category:eo:Grammar Category:Esperanto lemmas by word class Category:eo:Parts of speech
69 Estonian Catégorie:Grammaire en estonien Category:et:Grammar Kategorija:Estonske vrste riječi Category:et:Parts of speech
70 Japanese Catégorie:Grammaire en japonais Category:ja:Grammar Kategorija:Japanske vrste riječi Категория:Части речи/ja

∑ 70 items.

End of automatically generated list.