Wikidata:Events/DINI AG KIM 2018

From Wikidata
Jump to navigation Jump to search

This page summarizes the Wikidata Workshop at DINI AG KIM Meeting April 10 2018 in Mannheim.

Zeit und Ort

[edit]
  • 10. April, 13:45-15:30 und 16:00-17:30
  • Universität Mannheim

Grundlagen

[edit]

Einige Tools zur Suche nach Klassen und Help:Properties:

Daten-Beispiel

[edit]

Daten der Bibliographie des Musikschrifttums mit geographischem Bezug (siehe http://www.sim.spk-berlin.de/topographie_des_berliner_konzertlebens_1758.html). Veröffentlicht unter https://doi.org/10.5281/zenodo.1211912.

Vorbereitung: Grundlegende Items anlegen und erweitern (Bibliographie, Herausgeber, Datensatz-Publikation...)

Analyse der Beispieldaten

[edit]

Die Daten enthalten unter Anderem:

  • Aufführungsstätten
  • Ausbildungsstätten
  • Berufsverbände
  • Rundfunkanstalten
  • Musikinstrumentenbauer
  • Musikvereine
  • Musikverlag
  • Schallplattenfirmen
  • Tonstudios
  • Musikbibliotheken
  • Quellen (Berliner Adreßbücher, Hesses Musikerkalender...)
  • ...

Nicht alle dieser Entitätstypen haben direkte Entsprechungen in Wikidata.

Aufteilung in drei Gruppen nach Inhaltstyp

  • Datenmodellierung
    • Abgleich von Entitätstypen
    • Sammlung sinnvoller Properties
  • Datenabgleich
    • Erweiterung vorhandener Items
    • Eintragung fehlender Items

Gruppen-Ergebnisse: Wikidata:DINI_AG_KIM/Ergebnisse und/oder http://etherpad.wikimedia.org/

Abfrage von Entitäten mir geographischem Bezug

[edit]

Eine Karte von Aufführungsstätten lässt sich folgendermaßen aus Wikidata abfragen:

#defaultView:Map
SELECT DISTINCT ?item ?itemLabel ?location WHERE {
  {
    { ?item wdt:P31*/wdt:P279* wd:Q746369 } # Tonstudio
    UNION
    { ?item wdt:P31*/wdt:P279* wd:Q2442401 } # Tonträgerunternehmen
    UNION
    { ?item wdt:P31*/wdt:P279* wd:Q1955150 } # Musikinstrumentebauer
  }

  # mit Koordinaten 20km um Berlin
  wd:Q64 wdt:P625 ?berlinLocation .
  SERVICE wikibase:around { 
      ?item wdt:P625 ?location . 
      bd:serviceParam wikibase:center ?berlinLocation . 
      bd:serviceParam wikibase:radius "20" . 
      bd:serviceParam wikibase:distance ?dist.
  } 

  # mit Namen
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
} LIMIT 1000
Try it!

PAUSE

[edit]
[edit]

Sektionen der Seite

[edit]
  • manually matched - erledigt
auch: manually sync catalog!
  • automatically matched - Vorschläge
  • Grundfunktion: Confirm/Remove
  • Eintrag ID
  • Links zur Verifizierung beider Einträge
ÜBUNG
  • unmatched
  • Entry-Seite
  • Links / Navigation zeigen
  • Mehrfachmatches
ggf. ÜBUNG

Import

[edit]
  • Import-Formular - jeder kann selbst importieren, aber ggf. Magnus Manske fragen
essentiell:
  • Wikidata Property
  • URL Pattern
  • Aufbereitung Input-Datei
  • Identifier (im eigenen Bestand- hier: GND)
  • Name (Trefferwahrscheinlichkeit optimieren - hier: Vorname Nachname)
  • Description - alles was zur Disambiquierung hilfreich sein könnte (hier: Lebendaten, Beruf, Infofeld)
  • Sortierung (nach Relevanz) (ggf. auch Beschränkung des Sets - hier: mehr als 30 Publikationen)
  • Domain-Einschränkung (hier: Q5 human)
  • ID - eigenes WD-Property STW-ID
ggf. neue Property beantragen (Beispiel STW-ID)
  • Name (deutsch ODER englisch)
ungelöstes Problem Mehrsprachigkeit
  • Synonyme ins Description-Feld (Scopenotes dito)
ungelöstes Problem: keine Einbeziehung von Synonymen ins automatische Matching
Feldlängenlimit 255 (128?) - wird ggf. trunkiert
  • Auswahl nach Subthesaurus (z.B. Wirtschaftszweige)
  • Sortierung nach Notation

Properties und Items erstellen - Quickstatements

[edit]
Hilfe
  • Voraussetzung: QID ist bekannt
a) durch vorheriges M-n-m, Join WD mit eigenen Daten (z.B. durch federated Query)
b) Beispiel Excel-Sheet, ohne eigene ID in WD - vorherige Recherche
  • Exkurs: Open Refine
DEMO
  • kann WD-ID in eigene Tabelle übernehmen
  • weitere Felder (z.B. WD location)
  • Quickstatements: Item - Property - Value
Zufügung von Properties nur dort, wo bisher kein WD-Property (persönliche Policy)
   # coordinate location WGS84 Zirkus Busch-Roland
   Q1092946|P625|@52.52193/13.39926
  • Quelle
   |S854|"https://zenodo.org/record/1211912"
   # besser:
   |S248|Q51714821
  • Neuerfassung Item
 CREATE
 LAST|Lde|"Choralion-Saal"
 LAST|P31|Q1060829
 LAST|P580|+1909-00-00T00:00:00Z/9
bis mindestens 1920 - wie ausdrücken?
-> Project chat
  • Input per Script generieren
    • Batches mit mehreren tausend Statements möglich
    • Vor große Batches
  • Auch über URL ansteuerbar, kann Datenerfassung mit intellektueller Auswahl komfortabler machen
Lookup und Eintrag GND zu Top-Repec-Ökonomen (z.B. William Poole)
  • Input per Tools generieren
    • Zotero

Weitere Tools zum Eintragen in Wikidata

[edit]

Ausblick

[edit]
z.B. Wikiproject Economics, WikiProject Performing arts