تحميل قاعدة البيانات

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Database download and the translation is 77% complete.
Outdated translations are marked like this.

تقدم ويكي بيانات نسخًا من المحتوى المتاح لأي شخص تحميله

لاحظ أن هناك أيضا عدة طرق أخرى للوصول لمحتوى منظم من ويكي بيانات، والتي قد لا تتطلب تفريغ قاعدة بيانات كاملة،

= تفريغ قاعدة البيانات

هناك عدة أنواع مختلفة من تفريغات البيانات المتاحة، لاحظ أنه بينما تُعتبَر تفريغات JSON وRDF واجهات مستقرة، فإن تفريغات XML ليست كذلك، تخضع التغييرات التي يتم إجراؤها على تنسيقات البيانات المستخدمة بواسطة واجهات مستقرة لسياسة الواجهة المستقرة.

<span id="JSON_dumps_(recommended)_">

تخفيضات JSON (توصى بها) $ مُرسم

يمكن العثور على تفريغات JSON التي تحتوي على جميع كيانات ويكي بيانات في مصفوفة JSON واحدة تحت https://dumps.wikimedia.org/wikidatawiki/entities/. الكيانات في المصفوفة ليست بالضرورة بأي ترتيب معين، على سبيل المثال، Q2 لا يتبع بالضرورة Q1. يتم إنشاء التفريغات على أساس أسبوعي.

هذا هو شكل التفريغ الموصى به، يُرجَى الرجوع إلى بنية توثيق JSON للحصول على معلومات حول كيفية تمثيل كيانات ويكي بيانات.

تلميح: كل كائن كيان (بند بيانات أو خاصية) يُوضَع على سطر منفصل في ملف JSON، وبالتالي فإن الملف يمكن أن يُقرَأ سطرًا سطرًا، وكل سطر يمكن فكه بشكل منفصل ككائن JSON فردي.

لاحظ أن الملفات تستخدم ضغطًا موازيًا: مما يعني أن بعض إلغاء الضغط لا يمكن أن يُعتمَد عليه في فك الملفات. إذا كنت تستخدم ويندوز يمكنك استخدامه على سبيل المثال ببرنامج Bzip2.

يمكنك تحميل قمامة حديثة باستخدام التورينت wikidata-20240101-all.json.gz (109.04 GiB) على academictorrents.com ( magnet)

  • JsonDumpReader is a PHP library for reading the dumps.
  • gitlab.com/tozd/go/mediawiki is a Go library for processing Wikipedia and Wikidata dumps.
  • WDSub is a Scala library that processes JSON Wikibase dumps and can generate subsets using entity schemas as inputs
  • simple-wikidata-db is a JSON dump parser written in Python
  • qwikidata supports JSON dumps and is written in Python

تفريغات RDF

أولًا، العنوان الأساسي لتفريغات RDF يستخدم صيغة السلحفاة التي يمكن العثور عليها تحت https://dumps.wikimedia.org/wikidatawiki/entities/، تم تعيين الوصف هنا. هذه البيانات الكاملة يُشَار إليها بأنها كلها.

ثانيا، ما يسمى truthy التفريغات تم توفيرها، وهي تستخدم الصيغة nt، وهي بنفس صيغة التفريغات الكاملة، ولكن تقتصر على البيانات المباشرة، والحقيقية; لذلك فإنها لا تحتوي على بيانات وصفية مثل التصفيات والمراجع.

تحتوي التفريغات الكاملة مع بعضها على جميع معلومات الكيان في Wikidata باستثناء ترتيب (الأسماء المستعارة، البيانات، إلخ)، والتي لا يتم تمثيلها بشكل طبيعي في RDF، ترميز مبسط يقوم بترميز بيانات ليست لها أية مؤهلات مثل ثلاثية RDF مفردة (يتم حذف المراجع).

The dumps of Wikidata Lexeme namespace in Turtle and NTriples formats can be found in the same place with lexemes suffix.

For details on the RDF dump format please see the page RDF Dump Format.

Partial RDF dumps

WDumper is a third-party tool to create custom Wikidata RDF dumps. Entities and statements may be filtered.

تفريغات XML

تفريغات XML الكاملة من ويكي بيانات يمكن الاطلاع عليها في https://dumps.wikimedia.org/wikidatawiki/.

تنسيق بيانات JSON المضمن في تفريغات XML عرضة للتغيير دون إشعار، وقد يكون غير متناسق بين المراجعات، يجب أن تُعامَل على أنها بيانات ثنائية غير شفافة، يُوصَى بشدة باستخدام مقذوفات JSON أو RDF بدلا من ذلك، والتي تستخدم تمثيلات أساسية للبيانات!

التفريغات الإضافية (أو إضافة/تغيير التفريغات) لويكي بيانات متوفرة أيضا للتحميل، هذه التفريغات تحتوي على الأشياء التي تمت إضافتها في ال24 ساعة الماضية، مما يقلل من الحاجة إلى تحميل تفريغ قاعدة بيانات كاملة، هذه التفريغات أصغر بكثير من تفريغات قاعدة البيانات الكاملة

يمكن العثور عليها في https://dumps.wikimedia.org/other/incr/wikidatawiki/.

تفريغات JSON وRDF القديمة

تفريغات JSON وRDF القديمة يمكن العثور عليها في Internet Archive (Q461):

نموذج بيانات

نموذج البيانات يمكن البحث عنه هنا. يصف نموذج البيانات اللبنات الأساسية لبيانات ويكي بيانات.

مخطط قاعدة بيانات

يمكن الاطلاع على ظرة عامة على مخطط قاعدة البيانات في هذه الصفحة. (هذا ليس مخطط بيانات في ويكي بيانات.)

الترخيص

يمكن استخدام قواعد البيانات هذه للاستخدام الشخصي أو التجاري أو النسخ الاحتياطي أو الاستخدام في وضع عدم الاتصال، جميع البيانات المنظمة من النطاق الرئيس ونطاق الخواص متاحة تحت رخصة المشاع الإبداعي صفر، يتوفر النص في النطاقات الأخرى تحت رخصة المشاع الإبداعي: النسبة-الترخيص بالمثل، قد تنطبق شروط إضافية، تتوفر عناصر الوسائط والمحتويات الأخرى تحت تراخيص أخرى، كما هو مفصل في صفحات وصفها.

See also