Wikidata:Nedladdning av databasen

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Database download and the translation is 60% complete.
Outdated translations are marked like this.

Wikidata erbjuder kopior av innehållet för alla att ladda ner.

Observera att det också finns åtskilliga andra metoder för åtkomst till strukturerat innehåll från Wikidata, vilka kanske inte kräver en fullständig databasdump.

Databasdumpar

Det finns flera olika typer av datapumpar tillgängliga. Observera att även om JSON och RDF-dumpar anses vara "stabila gränssnitt", är XML-dumpar det inte. Ändringar av de dataformat som används av stabila gränssnitt är föremål för Stable Interface Policy.

<span id="JSON_dumps_(recommended)_">

JSON-dumpar (rekommenderas)

JSON-dumper som innehåller alla Wikidata-entiteter i en enda JSON-array finns på https://dumps.wikimedia.org/wikidatawiki/entities/. Entiteterna i matrisen är inte i någon särskild ordning, exempelvis kommer Q2 inte nödvändigtvis efter Q1. Dumparna skapas varje vecka.

Detta är det rekommenderade dumpformatet. Vänligen se JSON-strukturdokumentationen för information om hur Wikidata-entiteter representeras.

Tips: Varje entitetsobjekt (dataobjekt eller egenskap) är placerad på en separat rad i JSON-filen, så filen kan läsas rad för rad, och varje rad kan avkodas separat som ett enskilt JSON-objekt.

Observera att filerna använder parallellkomprimering, vilket innebär att vissa dekompressorer inte kan packa upp filerna på ett tillförlitligt sätt. Om du använder Windows kan du använda t.ex. Bzip2 eller 7-Zip.

You can currently download a fairly recent dump using a torrent. wikidata-20240101-all.json.gz (130.53 GiB) on academictorrents.com ( magnet)

JsonDumpReader är ett PHP-bibliotek för att läsa dumparna.

RDF-dumpar

Canonical RDF dumps using the Turtle format can be found under https://dumps.wikimedia.org/wikidatawiki/entities/. The mapping is described here.

Secondly, so called truthy dumps are provided. They use the nt format. They are in the same format as the full dumps, but limited to direct, truthy statements. Therefore, they do not contain meta data such as qualifiers and references.

De kompletta dumparna innehåller tillsammans all information om entiteten i Wikidata förutom ordning (av alias, uttalanden etc.), som inte är naturligt representerad i RDF. Förenklade dumpar kodar uttalanden som inte har några kvalifikatorer som enskilda RDF-tripplar (referenser utelämnas).

The dumps of Wikidata Lexeme namespace in Turtle and NTriples formats can be found in the same place with lexemes suffix.

For details on the RDF dump format please see the page RDF Dump Format.

Partial RDF dumps

WDumper is a third-party tool to create custom Wikidata RDF dumps. Entities and statements may be filtered.

XML-dumpar

Fullständiga XML-dumpar av Wikidata finns på https://dumps.wikimedia.org/wikidatawiki/.

Varning: Formatet för JSON-data inbäddade i XML-dumparna kan komma att ändras utan föregående meddelande och kan vara inkonsekvent mellan revisioner. Det bör behandlas som opak binär data. Det rekommenderas starkt att använda JSON eller RDF-dumparna istället, som använder kanoniska representationer av data!

Inkrementella dumpar (eller dumpar av tillägg/ändringar ) för Wikidata finns också att ladda ner. Dessa dumpar innehåller saker som har lagts till under de senaste 24 timmarna, vilket minskar behovet av att ladda ner hela databasdumpen. Dessa dumpar är betydligt mindre än de fullständiga databasdumparna

De finns på https://dumps.wikimedia.org/other/incr/wikidatawiki/.

Gamla JSON- och RDF-dumpar

Gamla RDF- och JSON-dumpar finns på Internet Archive (Q461):

Datamodell

Datamodellen kan ses här. Datamodellen beskriver de grundläggande byggstenarna i Wikidata data.

Databasschema

En översikt över schemat för databasen finns på den här sidan. (Detta är inte schemat för data i Wikidata.)

Licens

Dessa databaser kan användas för personlig eller kommersiell användning, säkerhetskopiering eller offline användning. Alla strukturerade data från huvud- och egenskapsnamnrymden är tillgängliga under [Creative Commons CC0-licens för //creativecommons.org/publicdomain/zero/1.0/]. Text i de andra namnrymderna är tillgänglig under licensen Creative Commons Attribution/Share-Alike License; ytterligare villkor kan gälla. Medieobjekt och annat innehåll finns tillgängliga under andra licenser, som beskrivs på deras beskrivningssidor.

See also