Shortcut: WD:Gloss

Wikidata:Dades lexicogràfiques/Glossari

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Lexicographical data/Glossary and the translation is 28% complete.
Outdated translations are marked like this.

  • Forma: la realització gramatical d'un lexema, incloent inflexions i declinacions. Per exemple, el verb "escriure" esdevé "escrivint" en gerundi i "escriu" en 3a persona singular. El paper de cada forma queda indicat per les funcions gramaticals. Una forma és una subentitat; inclou un identificador, una representació, una llista no ordenada (possiblement buida) de funcions gramaticals i una llista de declaracions de forma. Els identificadors de les formes comencen amb el del lexema a què pertanyen seguit d'un guió ("-") i una "F" seguida d'un nombre natural en notació decimal. Per exemple, L123-F7. Això evita confusions de diferents formes en diferents lexemes.
  • Declaració de forma: una declaració que descriu la [[[#Form|forma]] o les seves relacions amb altres formes o elements (per exemple, AFI, àudio de pronunciació).
  • Una glossa (sentit ampli) és la definició natural d'una accepció (vegeu gloss (Q1132324)). És un conjunt no ordenat, que no pot estar buit, de cadenes o parelles d'idioma de glossa, cadascuna de les quals o part de les quals, es pot anomenar glossa (sentit restringit). Ofereix una definició en diversos idiomes totalment diferents. Per exemple, una paraula en francès pot tenir una glossa en francès a més d'una glossa en alemany.
  • L'Idioma de la glossa es representa com a codi d'idioma.
  • La funció gramatical indica sota quines condicions, o amb quin rol sintàctic, s'utilitza la forma. Està representada com a conjunt no ordenat (posiblement buit) d'elements.
  • Idioma: vegeu idioma de la glossa i idioma del lexema.
  • El codi d'idioma és un codi que assigna lletres o nombres com a identificadors o classificadors dels idiomes (vegeu language identifier (Q2092812)). Els codis d'idioma vàlids en les dades lexicogràfiques son majoritàriament un subconjunt de (BCP 47) IETF language tag (Q1059900) vàlid, pero també un superconjunt de les etiquetes d'idioma. Es tracta d'una etiqueta d'idioma i una subetiqueta, opcional i d'ús privat, amb el format -x-Q######.
  • Lemma: The canonical, dictionary, or citation form of a word (see lemma (Q18514)). For example, "run", "runs", "ran", and "running" are forms of the same lexeme, with "run" as the lemma. Lemmas are not simple strings, but a non-empty unordered set of strings with optional spelling variant pairs, and each of the pairs or the string parts thereof may also be called a Lemma (narrow sense). Therefore, a lemma can include words in multiple orthographies. For example, the Lemma for the English noun color would include "colour" for British English as well as "color" for American English.
  • Lexeme: A lexical element of a language, such as a word, a phrase, or a prefix (see lexeme (Q111352)). It consists of a set of forms taken by a single word in one language, and words in any variant orthographies thereof. For example, the English nouns "color" and "colour" and their plural forms "colors" and "colours" are considered as one lexeme, while English noun "color" and verb "color" are two lexemes. Every lexeme is an entity and is stored in a page in the "Lexeme" namespace. A lexeme includes a prefixed id (like L123), a lemma, a lexeme language, a lexical category, a list of lexeme statements, a list of forms, and a list of senses.
  • Lexeme language or Language of Lexeme: The language to which a lexeme belongs. Denoted by an item.
  • Lexeme statement: A statement not specific to a Form or Sense (e.g. derived from grammatical gender or syntactic function)
  • Lexical category: A classification of lexemes into categories which have similar grammatical properties (see part of speech (Q82042)), also known as part of speech in grammar. It is denoted by an item, e.g. noun (Q1084) and verb (Q24905).
  • Representation: The text of a form. Like lemmas, representations are not simple strings, but a non-empty unordered set of string/spelling variant pairs, each of the pairs or string part thereof may also be called a Representation (narrow sense).
  • Sense: A meaning of a lexeme which it may represent in a text. Any number of senses may be defined, although every lexeme should have at least one. A sense is a subentity. It includes an ID, a gloss and a list of sense statements. Senses have IDs starting with the ID of the lexeme they belong to, followed by a hyphen ("-") and an "S", followed by a natural number in decimal notation: e.g. L123-S4.
  • Sense statement: A statement describing the sense and its relations to senses and items (e.g. translation, synonym, antonym, connotation).
  • Spelling variant: The specific orthography of a lemma or representation, for example British English (en-gb) and American English (en-us) are different spelling variants. A spelling variant is represented as a language code.
  • Subentity: A form or a sense. They are a special kind of an entity and may be used in statements, but they do not have their own pages. Instead, all the information of a subentity is stored in the page of the lexeme that a subentity belongs to. Each subentity functionally depends on a single lexeme.