Adjuta: re le datos

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Help:About data and the translation is 75% complete.
Outdated translations are marked like this.

Wikidata es un Base de Cognoscentia libere que pote esser redigite, modificate e legite sia per le humanos que per le machinas. Illo es justo uno del multe projectos, basate sur le Wiki, hospite e mantenite per le Fundation Wikimedia, un organisation a contento libere nonprofit probabilemente melio note como Wikipedia. Cata projecto del Fundation Wikimedia ha su proprie focus - per exemplo, Wikipedia es pro le contento encyclopedic, Wikimedia Commons supporta files multimedial (imagine e altero), e Wiktionary provide informationes lexical re le parolas como le definitiones e le synonymos. Le focus de Wikidata es le datos structurate.

Iste pagina es designate como un panorama re le datos structurate. Si tu es ja familiar con le datos structurate, ma tu desira apprender plus re lor specific uso in Wikidata, quomodo acceder le datos, o quomodo contribuer al datos de tu proprie projectos a Wikidata, per favor salta al testa al section re le ligamines al datos.

Comprender Wikidata

Le datos structurate se refere al datos que esseva organisate e immagazinate in un maniera definite, saepe con le intention de significato de codificar e retener le relationes inter differente punctos de dato intra un Dataset.

Sed quod es le datos, in omne caso? E proque tu deberea interessar te re le datos structurate in particular?

Definir le datos

Grande datos, datos experimental, datos aperte, metadatos — tu pote haber ja incontrate nonnulle terminos de istos.

Cata termino significa alicun cosa un poc differente sed omnes es construite sur un intendimento commun de datos e lor potential pro describer a affinar nostre intelligentia del mundo circum nos.

Como concepto abstracte, le datos pote esser pensate qual precursores al information, in le significato que le information pote esser arguite o derivate ex le datos.

Isto es perque le datos quando es restringite a lor essentia es simplemente un collection de valores re cosas. iste valores pote esser numeric o quantitative como un mensuration o un quantitate. Illos pote esser etiam qualitative, como un description o un comparation. Per exemplo, nos pote dicer que "8,848 m (29,029 ft)" es un valor de dato re le altitude del monte Everest e que "rubee" es un valor de dato re le color de un automobile.

Como antea mentionate, le informationes non es le mesme cosas que le datos, ma es in vice un producto del collection e analyse del datos. Per exemplo, le (dato) 8,848 es un numero aliquanto insignificante per se ipse, etiam si nos sape que illo es le altitude de un montania; nos sol pote dicer que le (information) Monte Everest es le maxime montania in le mundo a 8,848 m, si nos es al currente del mensurationes standard de altitude e un vice que nos sape le altitude del altere montanias. Es multo plus facile deducer isto , ganiar nove intuitiones e cognoscentias, e eriger le factos quando le datos es structurate — nos retornara sur iste idea plus tarde.

Ubi es le datos?

Le datos es toto circum nos. Il ha multe typos de fonte de datos, includente datos financiari, biologic, e social. Mesmo iste pagina ha datos! Per exemplo, illo ha un conto total del parolas, le datas que illa esseva create e del ultime revision, un materia topic e subjecte, un numero visiones del pagina, e le linguas in le qual le contento es disponibile.

Tamen, dum toto es potentialmente un fonte de datos, le datos que non es registrate e organisate pote esser como non exister del toto. Sin un structura substante, le datos appare insignificante e falle a provider informationes utile.

Con 'organisate' nos intende: categorisate in un maniera standard e inambigue. Le datos organisate e categorisate es lo que nos referer ubi nos dice datos structurate.

Wikidata provide modellos de immissione basate sur formas pro adder le datos al elementos

Ubi es le structura?

Sur le web, le structura es rege. Le major parte del sitos web es create per le HTML, a lingua markup que supple le trabatura basic, o le structura, de un pagina web.

Le linguas markup es alsi usate pro taggar e describer le contento del paginas pro le motores de recerca, le bots, e le applicationes como RSS feeds pote facilemente processar e "comprender" los. Per exemplo le tags , <title> dice al machinas qual es le nomine de un sito web.

In loco de supportar le structura e le elementos commun de un pagina web, Wikidata supple le structuras pro omne le cognoscentia immagazinate in Wikipedia e sur le altere projectos Wikimedia. Isto es facite per Wikibase, le software que potentia Wikidata. Le structuras non es addite directemente al contento de Wikipedia o de altere paginas del sito Wikimedia, ni illos require ulle cognoscentia de linguas markup, schemas de datos, notation de objectos, o altere syntaxe special per le usatores de Wikidata; in vice, le datos es addite e redigite in Wikidata formas de immission facile pro le usatores.

All data stored on Wikidata can be used to generate all kinds of automated and up to date lists or tables or other structured pages in any Wikimedia site or elsewhere.

Tabella 1
Data pro le montanias
Montania Proprietate Valor
Mount Everest height 8,848 m
K2 hauteur 8,611 m
Kanchenjunga height 8,586 m
Lhotse height 27940 ft

Le datos structurate

Per exemplo del importantia del structura, que nos regarda al Tabella 1. In iste tabella nos pote vider datos pro le quatro montanias summe. If we wanted to know a particular piece of information, such as the height of the second highest mountain in the world, we should be able to look at the provided data and find out the correct value. However, only three of the four mountains have their data categorized as a height value, and only two of the three have values in metres. While we know that height and hauteur (french for height) can be understood as equal to each other, and that metres and feet can both serve as measurements of height, a machine, such as a bot or a computer program may not.

Il esserea multo plus facile pro ambe humanos e machinas processar le informationes e responder al question original re le secunde montania plus alte quando tote le datos substante es registrate in un maniera simile etiam si le presentation differe.

Modellar le datos

Le collectiones de datos structurate, como Wikidata, es organisate secundo un modello de datos. Le modello de datos es legibile per le machinas, significa que illos pote esser "comprendite" per un computator. dum le computatores es potente, Illos es sovente non tam argute quam nos quando illos veni a un rationamento simple. per exemplo, in le exemplo precedente, un machina non poterea essr habile a cognoscer que ille able to know that height and hauteur are the same unless they were explicitly told somehow that was the case.

Tabella 2
Datos pro le montanias
Montania Proprietate Valor
Mount Everest continent Asia
K2 continent Asia
Kanchenjunga continent Asia
Lhotse continent Asia

Le modellos de datos varia basate super le necessitates analysis, le scopos e le inquadramento conceptual del dataset, e le requirimentos technic del systema. Comocunque, omne modello de datos specificara typicamente qual genere de datos pote esser supportate per un systema e qual relationes inter le valores pote esser comprendite e representate. Per exemplo, un modello de datos poterea specificar que height e hauteur es interconnectite le unes le alteres assi que tote le duo terminos representa un concepto, o que le mesurationes il pedes es automaticamente convertite in metros. Le modello de datos Wikidata configura pro le usatores, le maniera pro adder e rediger le datos al systema. It is also a work in progress, with new data types being added to the model over time.

The data model also essentially translates human natural language patterns into something that can be processed by machines. Per exemplo, in anglese nos pote dicer:

"Le monte Everest es Le plus alte montania in le mundo"

This is also the raw, unstructured format of content currently on Wikipedia and all other Wikimedia sites.

Sur Wikidata, isto essera representate per un declaration, que consiste in un copula proprietate-valor re un elemento, in iste caso le Terra:

Earth (Q2) (item)highest point (P610) (property)Mount Everest (Q513) (value)

In addition, Wikidata detenera alsi un declaration re le elemento pro le monte Everest (indicante la es un montania):

Mount Everest (Q513) (item)instance of (P31) (property)mountain (Q8502) (value)

Nota que pois que pote esser usate altere elementos como valores pro le declarationes, e omne le elementos ha lor proprie unic pagina sur Wikidata, isto significa que omne le elementos in le systema pote esser ligate per un serie de declarationes. Pois que Wikidata usa un formato legibile per le machinas, iste ligamines de datos permitte nove relation e connexiones a discoperir e processar con le machinas. Per exemplo, in le Taballa 2 nos vide le datos pro nostre montanias, iste vice re lor location geographic per continente, sed nihil re lor altitudes. supponente iste continente le datos esseva "ligate' al datos del altitude del montanias, nos sentira plus confidente pro facer predictiones o designar certe conclusiones re illo, como dicer que le Asia is le casa pro le montanias plus alte del mundo.

Ligar le datos

Ultra a esser un collection de datos structurate, Wikidata alsi supporta le datos ligate. Le datos ligate se refere al practica de rediger datos structurate a fin que illos pote esser interligate.

Pro Wikidata isto significa que le datos contribute per le voluntaries pote alsi esser ligate a altere datasets, base3 de datos, e fontes de datos ex omnia cirum le Web e ex initiatives varia extra le familia Wikimedia. Per exemplo, Wikidata permitte actualmente ligamines con Datasets e base de datos assi diverse quam Google Books, Canmore (uno del base de datos del Royal Commission on the Ancient and Historical Monuments of Scotland), le Vatican Library, OmegaWiki, Freebase, e MusicBrainz.

exemplo de un simple declaration consistente in un copula proprietate-valor
exemplo de un declaration plus complicate consistente de un copula proprietate=valor, qualificatores, e un referentia

Con le uso del principios e del practicas del datos ligate, Wikidata es alsi capace a supportar e esser usate per altere projectos.

Principios de datos ligate

Wikidata usa le identificatores unic, or uniform resource identifiers (URIs), pro omne su elementos as per linked data standards.

Etiam si Wikidata usa un modello de datos unic, su contentos pote esser exportate in RDF, un formato pro datos ligate largemente usate e standard. In le terminos de Wikidata, un declaration es composite de un elemento e un copula Proprietate-Valor. pro illes qui es familiar conle conceptos de datos ligate, un elemento pote esser viste como le subjecto parte de un tripletto; le proprietate representa un predicato del tripletto; e un valor es usate pro exprimer le objecto del tripletto.

Tamen, le declarationes Wikidata pote alsi continer elementos ultra le subjecto-predicate-objecto, qual le referentias e le qualificatores (pro plus de informationes, vider Help:Statements). Isto rende complicate representar le contentos de Wikidata per le linguage de RDF— plus informationes re iste defias pote esser trovate in le documento "Introducing Wikidata to the Linked Data Web".

Contribuer al datos

Si tu ha collectiones de datos tu poterea agradar de contribuer a Wikidata, per favor adde tu projecto a Wikidata:Data collaborators.

Acceder al datos

Le datos in Wikidata es publicate sub le Creative Commons Public Domain Dedication 1.0, que permitte de reusar le datos liberemente. Tu pote copiar, modificar, distribuer e perform le datos, etiam pro propositos commercial, toto sin demandar licentia.

See Data access for details about the different ways to programmatically access Wikidata's data.

Vide etiam

Pro le paginas pertinente, vider:

Pro informationes additional e guida, vider:

  • Project chat, for discussing all and any aspects of Wikidata
  • Wikidata:Glossary, the glossary of terms used in this and other Help pages
  • Help:FAQ, frequently asked questions asked and answered by the Wikidata community
  • Help:Contents, the Help portal featuring all the documentation available for Wikidata