Wikidata:Tools/OpenRefine/Editing/Tutorials/Basic editing/nl

From Wikidata
Jump to navigation Jump to search
This page is a translated version of the page Wikidata:Tools/OpenRefine/Editing/Tutorials/Basic editing and the translation is 100% complete.

OpenRefine bevat een Wikidata-extensie waarmee u tabelgegevens kunt omzetten in Wikidata-verklaringen. Deze tutorial geeft een breed overzicht van hoe dit werkt.

Om te beginnen

In deze tutorial gaan we gegevens importeren over universiteiten in het Verenigd Koninkrijk. Onze bron is een portaal beheerd door de Britse regering waarmee we de gegevens kunnen downloaden als [https//archive.org/download/uk_universities_201803/results.csv een CSV-bestand]. Open dit bestand met OpenRefine (u kunt het linkadres kopiëren en OpenRefines zal het bestand voor u downloaden).

Schermafbeelding van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Beginstand van het project.
Schermafbeelding van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Beginstand van het project.

De eerste stap is het afstemmen van de kolom EstablishmentName op Wikidata. Klik op het menu voor deze kolom en kies ReconcileStart reconciling, en kies de optie voor Wikidata.

OpenRefine probeert het type van de entiteiten in deze kolom te raden en stelt university (Q3918) voor: in de praktijk is dit te specifiek omdat sommige van onze rijen gaan over colleges of academisch. Kies daarom voor de optie Type en selecteer in dit veld een breder type, zoals educational organization (Q5341295).

In het paneel aan de rechterkant heeft u de mogelijkheid om andere kolommen te gebruiken om het proces te verfijnen. In ons geval bevat de URN-kolom identifiers die in Wikidata zijn opgeslagen als DfE URN (P2253). Vink dus Include aan voor deze kolom, typ DfE URN in het vak aan de rechterkant en valideer uw keuze in het vervolgkeuzemenu met een gegeven suggestie.

Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Venster voor de eerste afstemmingsstap.
Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Venster voor de eerste afstemmingsstap.

Ten slotte moet u het proces beginnen en wachten tot het is voltooid. De meeste cellen zouden automatisch moeten zijn samengesteld dankzij de unieke identificatie die wij hebben verstrekt, maar in het algemeen is het belangrijk om de kwaliteit van deze overeenkomsten te controleren.

Sommige cellen zijn niet automatisch op elkaar afgestemd, vanwege verschillen tussen onze tabel en Wikidata. U kunt ze isoleren door te klikken op none/geen in het beoordelingsfacet aan de linkerkant. Als u tijd heeft, kunt u ze handmatig matchen - maar dit is niet vereist om door te gaan met deze tutorial: niet-afgestemde cellen worden genegeerd in de volgende stappen.

Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Project na eerste afstemming.
Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Project na eerste afstemming.

Het importeren plannen

Scroll horizontaal door de kolommen om de gegevens in deze tabel te bekijken. Velen van hen kunnen worden geïmporteerd in Wikidata: het adres van het hoofdkantoor (inclusief de postcode), de URL van de officiële website, het telefoonnummer en zelfs de naam en titel van het hoofd van de instelling.[1]We moeten eerst begrijpen hoe dit soort gegevens nu worden gemodelleerd in Wikidata. Klik op een paar afgestemde cellen en kijk welke verklaringen ze al hebben.

Neem bijvoorbeeld University of Birmingham (Q223429). Dit item heeft al de volgende verklaringen:

official website
Normal rank http://www.birmingham.ac.uk/
search formatter URL https://www.birmingham.ac.uk/search.aspx?q=$1
country United Kingdom
0 references
add reference


add value
headquarters location
Normal rank Birmingham
street address Edgbaston
postal code B15 2TT
country United Kingdom
0 references
add reference


add value

Dat laat ons zien welke Wikidata-eigenschappen worden gebruikt voor dit soort gegevens. Om een beter idee te krijgen van hun huidige dekking voor de items die we bij de hand hebben, gaan we de dataverrijkingsmogelijkheden van OpenRefine gebruiken om de bestaande Wikidata-verklaringen in ons OpenRefine-project op te halen. Klik op de afgestemde kolom en kies Kolom bewerkenKolommen toevoegen van afgestemde waarden. Selecteer de eigenschappen waarin we geïnteresseerd zijn, zoals official website (P856), headquarters location (P159), located in the administrative territorial entity (P131) en phone number (P1329). Valideer en wacht tot het proces is voltooid.

Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Gegevensuitbreiding.
Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Gegevensuitbreiding.

We kunnen nu facetten op deze kolommen gebruiken om hun dekking in onze dataset te evalueren en hun waarden te vergelijken met de waarden die we in onze bron hebben. Klik bijvoorbeeld op de kolom officiële website die we zojuist hebben gemaakt. Selecteer FacetCustomized facetsFacet by blank. Dit creëert aan de linkerkant een nieuw facet. De false waarde komt overeen met de cellen die niet leeg zijn, dus de rijen waarvoor Wikidata al een official website (P856) heeft.

Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Facet van een kolom door spatie.
Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Facet van een kolom door spatie.

Op het moment van schrijven hebben al deze universiteiten al een website op Wikidata (goed gedaan Wikidatans!). De overige twee rijen komen niet overeen met een universiteit. Dit kan voor u anders zijn als u niet alle cellen hebt afgestemd. We kunnen hetzelfde facet op andere rijen gebruiken, en we ontdekken dat geen van deze items al een phone number (P1329) heeft. Laten we die dan importeren!

Een schema aanmaken

We moeten OpenRefine nu instrueren hoe we onze tabel moeten vertalen naar Wikidata-verklaringen. Dit wordt gedaan door een schema te maken: dit is een sjabloon (of patroon) van verklaringen die op elke rij worden toegepast. Klik op de knop Wikidata in de rechterbovenhoek van uw scherm. Klik op Edit Wikidata schema om de schema-editor te openen. U kunt de schema-editor zien als een ruimte waar u nieuwe verklaringen kunt maken, ongeveer zoals u ze rechtstreeks op Wikidata zou maken. Het belangrijkste verschil is dat u kolommen kunt gebruiken als tijdelijke aanduidingen voor waarden in deze verklaringen. Voor elke rij worden deze tijdelijke aanduidingen (of variabelen) vervangen door de werkelijke inhoud van de kolom in die rij. Dit is in ons geval handig, omdat de verklaringen die we willen toevoegen een eenvoudig patroon volgen:

EstablishmentName 1329 TelephoneNum

Laten we eerst aangeven dat de kolom EstablishmentName de items bevat waaraan we verklaringen willen toevoegen. Klik op de knop add item om een nieuw item in het schema toe te voegen. Sleep vervolgens de kolom EstablishmentName naar het onderwerp van het item.

Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Het onderwerpitem opgeven dat moet worden gewijzigd.
Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Het onderwerpitem opgeven dat moet worden gewijzigd.

Vervolgens kunnen we een verklaring toevoegen aan dit itemsjabloon. Vul de eigenschap in (met phone number (P1329)) en sleep de kolom TelephoneNum als waarde voor de verklaring. Op dezelfde manier kunnen we andere verklaringen over hetzelfde item toevoegen, evenals labels, beschrijvingen of aliassen (waarvoor u de knop add term moet gebruiken).

Problemen vinden en oplossen

In dit stadium kunt u zien dat het tabblad Issues 238 problemen met onze kandidaatverklaringen rapporteert.[2]Open het tabblad om de problemen te onderzoeken:

Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Problemen gemeld door OpenRefine na onze eerste schema-versie.
Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Problemen gemeld door OpenRefine na onze eerste schema-versie.

OpenRefine meldt dat het formaat van de telefoonnummers dat we proberen toe te voegen niet overeenkomt met het verwachte formaat op Wikidata. Hoewel de reguliere expressie die het biedt een beetje cryptisch is, kunnen we op de eigenschap klikken en ontdekken dat het een formaat verwacht waar de internationale nummercode wordt geleverd: in plaats van 01784434455, moeten we +44-1784434455 toevoegen.

Gelukkig kunnen we dat oplossen: we weten dat al deze instellingen uit het Verenigd Koninkrijk komen en dus hetzelfde internationale netnummer "+44" hebben. Het enige wat we nodig hebben is om het voor onze waarden toe te voegen, met de eerste 0 verwijderd. Ga terug naar de tabel. Zoek de kolom TelephoneNum, open het menu en selecteer Cellen bewerkenTransformeren. We kunnen nu een eenvoudige expressie invoeren in GREL[3]Om de waarden om te zetten:

Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Vaststellen van het formaat van de telefoonnummers.
Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Vaststellen van het formaat van de telefoonnummers.

Voer de omzetting uit en open de schema-editor opnieuw. De waarschuwing over het formaat is verdwenen, maar OpenRefine klaagt nog steeds over het feit dat we geen enkele verwijzing naar onze verklaringen hebben toegevoegd. We willen de bron van deze informatie aangeven en het voor anderen gemakkelijk maken om deze te verifiëren. In ons geval is de website waar we de informatie vandaan hebben gehaald de website waarnaar DfE URN (P2253) linkt. We kunnen deze identifier dus gewoon als referentie opnemen. De waarde van de identifier verandert voor elke verklaring, dus moeten we de kolom met de identifier opnieuw slepen en neerzetten:

Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Definitief schema.
Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Definitief schema.

We kunnen ook een opgehaalde datum toevoegen, omdat de gegevens op deze website in de toekomst kunnen worden bijgewerkt. We hebben nu alle door OpenRefine gemelde problemen opgelost en we kunnen de bewerkingen ie door ons schema worden gegenereerd voorzichtig bekijken.

OpenRefine Wikidata basis bewerkingshandleiding, voorbeeld van bewerkingen
OpenRefine Wikidata basis bewerkingshandleiding, voorbeeld van bewerkingen

De wijzigingen uploaden in Wikidata

Nu we tevreden zijn met onze verklaringen, kunnen we ze uploaden naar Wikidata. Klik op de Wikidata-knop in de rechterbovenhoek en selecteer Push to Wikidata. U moet inloggen met uw Wikidata-account: de verklaringen worden via dit account toegevoegd. Dit is een vrij kleine bewerkingsbatch, dus we kunnen het alleen doen, maar voor grotere groepen is het beter om de wijzigingen op Wikidata te bespreken en een bot-vlag aan te vragen om de bewerkingen uit te voeren.

Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Laatste dialoogvenster waar bewerkingen kunnen worden uitgevoerd.
Schermafdruk van een OpenRefine-project als onderdeel van een tutorial over het importeren van Wikidata. Laatste dialoogvenster waar bewerkingen kunnen worden uitgevoerd.

Voeg een beschrijvende samenvatting toe aan uw bewerkingen: die opmerking verschijnt in de geschiedenisweergave van het item dat is bewerkt. Als u klaar bent, klikt u op Bewerkingen uitvoeren. Het uploaden duurt even en u kunt de voortgang bekijken door uw eigen bijdragen aan te vinken. Als u de bewerking in OpenRefine annuleert, wordt het uploaden gestopt, maar worden bestaande bewerkingen niet ongedaan gemaakt. Als u een fout heeft gemaakt en de hele bewerkingsgroep ongedaan wilt maken, kunt u het hulpmiddel EditGroups gebruiken.

Conclusie

Goed gedaan, u heeft meer dan 100 goede verklaringen met een bron toegevoegd aan Wikidata, slechts in een paar klikken! Waarom probeert u dit niet op een andere dataset? Als u het leuk vindt om OpenRefine te gebruiken, voel u dan vrij om de {{User loves OpenRefine}} gebruikersbox op uw gebruikerspagina te zetten. Wilt u iets uitdagender proberen? Ga dan naar de volgende tutorial in deze serie, Inverse Listeria.

Opmerkingen

  1. We zouden het hoofd van de instelling kunnen toevoegen met verklaringen als University of Birmingham (Q223429)director / manager (P1037)Michael Sterling (Q6834612), maar na het bekijken van de bijbehorende Wikipedia-pagina realiseren we ons dat deze informatie al een paar jaar verouderd is, dus dat zou ook van de import moeten worden uitgesloten.
  2. Als OpenRefine geen indelingsschending rapporteert, hebt u mogelijk de verkeerde kolom geselecteerd. We hebben twee kolommen met telefoonnummers in ons project: de originele van onze bron (TelephoneNum) en degene die we uit Wikidata hebben gehaald (phone number). In de schema-editor willen we de TelephoneNum gebruiken, omdat daar onze verse waarden staan.
  3. Ga voor meer informatie over deze expressietaal naar OpenRefine's wiki (u kunt ook Python of Clojure gebruiken als u meer bekend bent met deze talen).