Shortcut: WD:OR

Wikidata:Tools/OpenRefine

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Tools/OpenRefine and the translation is 33% complete.
Outdated translations are marked like this.

WikidataCon Award 2019
Coolest Tool Award 2022 logo

Open Refine

2022 Coolest Tool
Award Winner

in the category
Eggbeater

โลโก้ OpenRefine
โลโก้ OpenRefine
Get started with a video tutorial
OpenRefine Beginners Tutorial by Emma Carroll

OpenRefine เป็นเครื่องมือการถกเถียงข้อมูลเสรีที่สามารถใช้ล้างข้อมูลตารางและเชื่อมต่อกับฐานความรู้รวมถึง Wikidata ก่อนหน้านี้ได้รับการพัฒนาโดย Google (ภายใต้ชื่อ Google Refine ) และตอนนี้ได้เปลี่ยนเป็นโครงการที่สนับสนุนชุมชน

หน้านี้รวบรวมสูตร OpenRefine ที่มีประโยชน์ในการนำเข้าชุดข้อมูลไปยัง Wikidata หรือเพิ่มชุดข้อมูลด้วยข้อมูลเพิ่มเติมที่แยกจาก Wikidata อย่าลังเลที่จะ ใช้หน้าพูดคุย เพื่อขอความช่วยเหลือเกี่ยวกับซอฟต์แวร์ หากคุณสนุกกับการใช้เครื่องมือนี้คุณสามารถกระจายคำด้วยช่องผู้ใช้ {{User loves OpenRefine}}

OpenRefine currently only supports reconciling items. Lexemes are not supported as of September 2022.

OpenRefine can be downloaded as an application. It works on desktop and laptop computers with Windows, Mac and Linux operating systems. It runs a small server on your computer and you then use a web browser to interact with it. It works best with browsers based on Webkit, such as Google Chrome, Chromium, Opera and Microsoft Edge, and is also supported on Firefox.

OpenRefine has a graphical user interface which is available in more than 15 languages.

Install OpenRefine on your own desktop or laptop computer

You can find and download the latest stable release of OpenRefine here.

Run OpenRefine on PAWS

Since May 2021, everyone with a registered Wikimedia account can run OpenRefine in PAWS on Wikimedia's Cloud Services. Please note that this is an experimental feature which is not supported by the OpenRefine team itself, and which may break or malfunction. It is however an interesting option for people who can't install software on their local computer.

PAWS is a Wikimedia Cloud tool that provides hosted access to Jupyter notebooks and other tools without needing any local installation.

You can access your own installation of OpenRefine with this link: https://hub-paws.wmcloud.org/hub/user-redirect/openrefine. You'll have to login with your wiki credentials, but don't tick Remember me box: as all files written on PAWS are publicly available, you don't want to let your credentials accessible. It is also possible that you will get an error message; if that is the case, then refresh the page and it should work.

Please contact YuviPanda with questions about OpenRefine via PAWS.

คุณสมบัติหลัก

การปรับยอด Wikidata

ในคำศัพท์ของ OpenRefine reconciliation เป็นกระบวนการเชื่อมโยงเซลล์ตารางแบบข้อความอิสระกับตัวระบุในฐานความรู้ ความสามารถในการปรับยอดในตัวของ OpenRefine ทำให้เป็นเครื่องมืออเนกประสงค์ในการปรับยอดข้อมูลแบบตารางไปยังฐานข้อมูลที่หลากหลายรวมถึง Wikidata

การปรองดองแบบกึ่งอัตโนมัติของมหาวิทยาลัยใน OpenRefine

OpenRefine's wiki ประกอบด้วย [1]. นี่เป็นคุณสมบัติหลัก:

  • จำกัด การกระทบยอดกับคลาส Wikidata เฉพาะไอเท็มจากคลาสย่อยของคลาส Wikidata นี้เท่านั้นที่จะถูกพิจารณา
  • ใช้หลายคอลัมน์ในชุดข้อมูลของคุณและจับคู่กับค่าของคุณสมบัติใน Wikidata ซึ่งปรับแต่งคะแนนการกระทบยอดและทำหน้าที่เป็นตัวแบ่งระหว่างชื่อ
  • ใช้ตัวระบุภายนอกที่แชร์โดยชุดข้อมูลและ Wikidata ของคุณเพื่อกระทบยอดรายการของคุณ
  • ใช้ Sitelink ที่ให้ไว้ในชุดข้อมูลของคุณเป็นตัวระบุภายนอก - หากหน้า Wikimedia เหล่านี้เชื่อมโยงกับรายการ Wikidata พวกเขาจะได้รับการคืนดีโดยอัตโนมัติ

If you want to use the reconciliation features, consider engaging with the following instruction materials:

APIs can be, for instance a search on frlabels with wikidata thanks to this link https://wikidata.reconci.link/fr/api.

การเสริมข้อมูล

หน้าจอนี้แสดงให้เห็นถึงวิธีการเพิ่มคอลัมน์ใหม่ตามคอลัมน์ที่ได้รับการปรับยอดใน OpenRefine 2.8

คุณสมบัตินี้มีให้ตั้งแต่ OpenRefine 2.8 เป็นต้นไป

เมื่อคอลัมน์ในตารางของคุณถูกปรับให้เป็น Wikidata คุณสามารถดึงข้อมูลจาก Wikidata สร้างคอลัมน์อื่น ๆ ในชุดข้อมูลของคุณ หากมีการเรียกร้องหลายครั้งสำหรับคุณสมบัติที่กำหนดค่าจะถูกจัดกลุ่มเป็น บันทึก ใน OpenRefine: พวกเขาจะถูกเก็บไว้ในแถวเพิ่มเติมที่คอลัมน์คืนดีเดิมจะว่างเปล่า 'โหมดบันทึก' ของ OpenRefine อาจเหมาะสำหรับการแปลงในภายหลังที่คุณต้องการจะทำบนโต๊ะของคุณ

คุณสามารถใช้ฟังก์ชั่นนี้ซ้ำในคอลัมน์ที่สร้างขึ้นใหม่หากพวกเขาสอดคล้องกับรายการ Wikidata สิ่งนี้ช่วยให้คุณสำรวจกราฟ Wikidata ตามคุณสมบัติที่เลือก นอกจากนี้ยังเป็นไปได้ที่จะกำหนดค่าวิธีที่คุณเรียกคืนคุณสมบัติได้หลายวิธี (ตัวอย่างเช่นการกรองตามลำดับหรือการอ้างอิง)

การแก้ไข Wikidata

คุณสมบัตินี้มีให้ตั้งแต่ OpenRefine 3.0 เป็นต้นไป

OpenRefine can help you transform tabular data into Wikidata statements. This works by creating a schema - a template of Wikidata edit that is applied to each row of your table. Once you have created a schema, you can:

  • preview the Wikidata edits and inspect them manually;
  • analyze and fix any issues raised automatically by the tool;
  • upload your changes to Wikidata by logging in with your own account;
  • export the changes to the QuickStatements v1 format.

Recipes

OpenRefine workflows can be shared by copying the JSON representation of the edit history. This represents the operations you have made in OpenRefine, and can be reused by others on similar datasets. This section lists some recipes that can be useful when working with Wikidata. See also OpenRefine Recipes.

  • Obtaining Wikidata Q numbers. Once you have reconciled a column to Wikidata, you can obtain the Qids in a new column, by using the Add column based on this column operation with the following GREL expression: cell.recon.match.id
  • More variables. You can access many different variables for the reconciled cell. See the reference page for variables.
  • Share your recipe here!

Help OpenRefine

OpenRefine needs your help! There are many things you can do:

We have a Phabricator project to track activity around OpenRefine within Wikimedia; feel free to tag any related task with it.

Over 2021-22, OpenRefine is being extended with Structured Data on Wikimedia Commons (SDC) support. This project is funded by a Wikimedia Foundation Project Grant.