Wikidata:Events/DINI AG KIM 2018
This page summarizes the Wikidata Workshop at DINI AG KIM Meeting April 10 2018 in Mannheim.
Zeit und Ort
[edit]- 10. April, 13:45-15:30 und 16:00-17:30
- Universität Mannheim
Grundlagen
[edit]Einige Tools zur Suche nach Klassen und Help:Properties:
Daten-Beispiel
[edit]Daten der Bibliographie des Musikschrifttums mit geographischem Bezug (siehe http://www.sim.spk-berlin.de/topographie_des_berliner_konzertlebens_1758.html). Veröffentlicht unter https://doi.org/10.5281/zenodo.1211912.
Vorbereitung: Grundlegende Items anlegen und erweitern (Bibliographie, Herausgeber, Datensatz-Publikation...)
Analyse der Beispieldaten
[edit]Die Daten enthalten unter Anderem:
- Aufführungsstätten
- Ausbildungsstätten
- Berufsverbände
- Rundfunkanstalten
- Musikinstrumentenbauer
- Musikvereine
- Musikverlag
- Schallplattenfirmen
- Tonstudios
- Musikbibliotheken
- Quellen (Berliner Adreßbücher, Hesses Musikerkalender...)
- ...
Nicht alle dieser Entitätstypen haben direkte Entsprechungen in Wikidata.
Aufteilung in drei Gruppen nach Inhaltstyp
- Datenmodellierung
- Abgleich von Entitätstypen
- Sammlung sinnvoller Properties
- Datenabgleich
- Erweiterung vorhandener Items
- Eintragung fehlender Items
Gruppen-Ergebnisse: Wikidata:DINI_AG_KIM/Ergebnisse und/oder http://etherpad.wikimedia.org/
Abfrage von Entitäten mir geographischem Bezug
[edit]Eine Karte von Aufführungsstätten lässt sich folgendermaßen aus Wikidata abfragen:
#defaultView:Map
SELECT DISTINCT ?item ?itemLabel ?location WHERE {
{
{ ?item wdt:P31*/wdt:P279* wd:Q746369 } # Tonstudio
UNION
{ ?item wdt:P31*/wdt:P279* wd:Q2442401 } # Tonträgerunternehmen
UNION
{ ?item wdt:P31*/wdt:P279* wd:Q1955150 } # Musikinstrumentebauer
}
# mit Koordinaten 20km um Berlin
wd:Q64 wdt:P625 ?berlinLocation .
SERVICE wikibase:around {
?item wdt:P625 ?location .
bd:serviceParam wikibase:center ?berlinLocation .
bd:serviceParam wikibase:radius "20" .
bd:serviceParam wikibase:distance ?dist.
}
# mit Namen
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
} LIMIT 1000
PAUSE
[edit]Links erstellen - Mix'n'Match
[edit]Sektionen der Seite
[edit]- manually matched - erledigt
- auch: manually sync catalog!
- automatically matched - Vorschläge
- Grundfunktion: Confirm/Remove
- Eintrag ID
- Links zur Verifizierung beider Einträge
- ÜBUNG
- unmatched
- Entry-Seite
- Links / Navigation zeigen
- Mehrfachmatches
- ggf. ÜBUNG
Import
[edit]- Import-Formular - jeder kann selbst importieren, aber ggf. Magnus Manske fragen
- essentiell:
- Wikidata Property
- URL Pattern
- Aufbereitung Input-Datei
- Identifier (im eigenen Bestand- hier: GND)
- Name (Trefferwahrscheinlichkeit optimieren - hier: Vorname Nachname)
- Description - alles was zur Disambiquierung hilfreich sein könnte (hier: Lebendaten, Beruf, Infofeld)
- Sortierung (nach Relevanz) (ggf. auch Beschränkung des Sets - hier: mehr als 30 Publikationen)
- Domain-Einschränkung (hier: Q5 human)
- ID - eigenes WD-Property STW-ID
- ggf. neue Property beantragen (Beispiel STW-ID)
- Name (deutsch ODER englisch)
- ungelöstes Problem Mehrsprachigkeit
- Synonyme ins Description-Feld (Scopenotes dito)
- ungelöstes Problem: keine Einbeziehung von Synonymen ins automatische Matching
- Feldlängenlimit 255 (128?) - wird ggf. trunkiert
- Auswahl nach Subthesaurus (z.B. Wirtschaftszweige)
- Sortierung nach Notation
Properties und Items erstellen - Quickstatements
[edit]- Voraussetzung: QID ist bekannt
- a) durch vorheriges M-n-m, Join WD mit eigenen Daten (z.B. durch federated Query)
- b) Beispiel Excel-Sheet, ohne eigene ID in WD - vorherige Recherche
- Exkurs: Open Refine
- DEMO
- kann WD-ID in eigene Tabelle übernehmen
- weitere Felder (z.B. WD location)
- Quickstatements: Item - Property - Value
- Zufügung von Properties nur dort, wo bisher kein WD-Property (persönliche Policy)
# coordinate location WGS84 Zirkus Busch-Roland Q1092946|P625|@52.52193/13.39926
- Quelle
|S854|"https://zenodo.org/record/1211912" # besser: |S248|Q51714821
- Neuerfassung Item
CREATE LAST|Lde|"Choralion-Saal" LAST|P31|Q1060829 LAST|P580|+1909-00-00T00:00:00Z/9
- bis mindestens 1920 - wie ausdrücken?
- -> Project chat
- Input per Script generieren
- Batches mit mehreren tausend Statements möglich
- Vor große Batches
- mit einigen wenigen Records testen!
- Bot Approval einholen
- Auch über URL ansteuerbar, kann Datenerfassung mit intellektueller Auswahl komfortabler machen
- Lookup und Eintrag GND zu Top-Repec-Ökonomen (z.B. William Poole)
- Input per Tools generieren
- Zotero
Weitere Tools zum Eintragen in Wikidata
[edit]- MediaWiki-API
- Clients/Programmbibliotheken
Ausblick
[edit]- Wikidata-Community
- Weekly Summary (Archiv - aktuelle Summaries auch auf Mailingliste und im Project Chat)
- Project Chat, Mailing list
- Wikidata Wikiprojects
- eigene Anwendungen mit Wikidata als Datenbasis