Shortcut: WD:OR

Wikidata:Herramientas/OpenRefine

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Tools/OpenRefine and the translation is 62% complete.
Outdated translations are marked like this.

WikidataCon Award 2019
Coolest Tool Award 2022 logo

Open Refine

2022 Coolest Tool
Award Winner

in the category
Eggbeater

Logotipo de OpenRefine
Logotipo de OpenRefine
Comienza con un videotutorial
Tutorial de OpenRefine para principiantes por Emma Carroll

OpenRefine es una herramienta libre de manejo de datos que se puede utilizar para limpiar tablas de datos y conectarlas con bases de conocimiento tales como Wikidata. Fue desarrollada anteriormente por Google (bajo el nombre Google Refine), pero en la actualidad ha pasado a ser un proyecto sostenido por la comunidad.

Esta página recopila recetas para OpenRefine que pueden servir para importar conjuntos de datos a Wikidata, o para enriquecer conjuntos de datos con datos adicionales extraídos de Wikidata. No dudes en usar la página de discusión para pedir que te echen una mano con este software. Si te gusta usar esta herramienta, puedes hacer correr la voz mediante la userbox {{User loves OpenRefine}}.

OpenRefine currently only supports reconciling items. Lexemes are not supported as of September 2022.

OpenRefine can be downloaded as an application. It works on desktop and laptop computers with Windows, Mac and Linux operating systems. It runs a small server on your computer and you then use a web browser to interact with it. It works best with browsers based on Webkit, such as Google Chrome, Chromium, Opera and Microsoft Edge, and is also supported on Firefox.

OpenRefine has a graphical user interface which is available in more than 15 languages.

Install OpenRefine on your own desktop or laptop computer

You can find and download the latest stable release of OpenRefine here.

Run OpenRefine on PAWS

Since May 2021, everyone with a registered Wikimedia account can run OpenRefine in PAWS on Wikimedia's Cloud Services. Please note that this is an experimental feature which is not supported by the OpenRefine team itself, and which may break or malfunction. It is however an interesting option for people who can't install software on their local computer.

PAWS is a Wikimedia Cloud tool that provides hosted access to Jupyter notebooks and other tools without needing any local installation.

You can access your own installation of OpenRefine with this link: https://hub-paws.wmcloud.org/hub/user-redirect/openrefine. You'll have to login with your wiki credentials, but don't tick Remember me box: as all files written on PAWS are publicly available, you don't want to let your credentials accessible. It is also possible that you will get an error message; if that is the case, then refresh the page and it should work.

Please contact YuviPanda with questions about OpenRefine via PAWS.

Características principales

Cotejo con Wikidata

En la terminología de OpenRefine, el cotejo es el proceso en el que se enlazan datos tabulares brutos con identificadores de bases de conocimiento. Las funcionalidades nativas de OpenRefine lo convierten en una herramienta versátil para cotejar datos tabulares con una amplia gama de bases de datos, entre las cuales se encuentra Wikidata.

Cotejo semiautomático de universidades en OpenRefine

El wiki de OpenRefine cuenta con una guía detallada del proceso de cotejo. Aquí se muestran las características principales:

  • Restricción del cotejo a una clase de Wikidata. Solo se tomarán en consideración los elementos de subclases de esta clase de Wikidata;
  • Uso de varias columnas del conjunto de datos para corresponderlas a valores de propiedades de Wikidata, lo cual refina la puntuación de reconciliación y sirve para discriminar entre elementos homónimos;
  • Uso de identificadores externos compartidos por el conjunto de datos y Wikidata para cotejar los elementos;
  • Uso de los enlaces de sitio proporcionados por el conjunto de datos como identificadores externos: si estas páginas de Wikimedia están enlazadas a un elemento de Wikidata, se cotejarán directamente con este.

Si deseas usar las funcionalidades de cotejo, plantéate ver los siguientes materiales instructivos:

APIs can be, for instance a search on frlabels with wikidata thanks to this link https://wikidata.reconci.link/fr/api.

Enriquecimiento de datos

Esta grabación de pantalla muestra cómo añadir columnas a partir de una columna cotejada en OpenRefine 2.8.

Esta funcionalidad está disponible a partir de OpenRefine 2.8.

Cuando una columna de tu tabla esté cotejada con Wikidata, podrás sacar datos de Wikidata para crear columnas nuevas en tu conjunto de datos. Si hay varias afirmaciones para una propiedad dada, los valores se agruparán como «registros»: se almacenarán en filas adicionales donde la columna reconciliada original está vacía. El «modo registro» de OpenRefine podrá por tanto ser más apropiado para transformar esos valores a posteriori.

Puedes usar esta funcionalidad de forma recursiva sobre las columnas recién creadas si corresponden a elementos de Wikidata. Esto permite explorar el grafo de Wikidata siguiendo las propiedades elegidas. También es posible configurar la forma de recuperación de propiedades (por ejemplo, filtrar por rango o por referencia).

Edición de Wikidata

Esta funcionalidad está disponible a partir de OpenRefine 3.0.

OpenRefine permite transformar datos tabulares en declaraciones de Wikidata. La transformación está regida por un «esquema» (schema) - un patrón de modificación de Wikidata que se aplicará a cada una de las filas de tu tabla. Una vez creado el esquema, podrás:

  • previsualizar las ediciones de Wikidata edits e inspeccionarlas manualmente;
  • analizar y corregir cualquier asunto planteado automáticamente por la herramienta;
  • subir tus cambios a Wikidata iniciando sesión en tu cuenta;
  • exportar los cambios en formato QuickStatements v1.

Véase la subpágina de edición para más información. Hay muchos tutoriales para comenzar.

Recetas

Es posible compartir flujos de trabajo de OpenRefine copiando la representación en JSON del historial de ediciones. Esto representa las operaciones que has realizado en OpenRefine, y puede ser reutilizado por otros sobre conjuntos de datos similares. Esta sección muestra algunas recetas que pueden ser útiles al trabajar con Wikidata. Véase también Recetas de OpenRefine.

  • Obtener identificadores Q de Wikidata. Una vez hayas cotejado una columna con Wikidata, podrás obtener los Q en una columna nueva. Para ello, tendrás que utilizar la operación «Añadir columna basada en esta columna» con la siguiente expresión de GREL: cell.recon.match.id
  • Más variables. Puedes acceder a varias variables diferentes para la celda cotejada. Consulta la página de referencia sobre variables.
  • ¡Comparte aquí tu receta!

Ayuda a OpenRefine

¡OpenRefine necesita tu ayuda! Hay muchas cosas que puedes hacer:

Tenemos un proyecto de Phabricator para hacer seguimiento a la actividad relacionada a OpenRefine dentro de Wikimedia. Siéntete libre de etiquetar cualquier tarea relacionada.

Over 2021-22, OpenRefine is being extended with Structured Data on Wikimedia Commons (SDC) support. This project is funded by a Wikimedia Foundation Project Grant.