Topic on User talk:M2k~dewiki

Jump to navigation Jump to search

Bitte vermeide das Anlegen von Duplikaten

23
Herzi Pinki (talkcontribs)
Herzi Pinki (talkcontribs)
M2k~dewiki (talkcontribs)

Hallo @Herzi Pinki:: bitte die Ersteller der betreffenden Artikel kontaktieren und diese dabei unterstützen, dass sie künftig die Vorarbeiten (z.B. Anlage bzw. Pflege eines Wikidata-Objekt) bzw. Nacharbeiten (Verbindung mit dem bestehenden Wikidata-Objekt, Personendaten, Normdaten, Kategorien, Commonscat, Verlinkungen, Eintragung in die Begriffsklärung, uvam.) künftig selbständig übernehmen können. Vielen Dank!

Herzi Pinki (talkcontribs)

Wie geht das, den Ersteller kontaktieren? Ich schnalle es nicht. Vielleicht schaust du mal in die Versionsgeschichte? lg --Herzi Pinki (Diskussion) 17:08, 20 August 2023 (UTC)

M2k~dewiki (talkcontribs)
Herzi Pinki (talkcontribs)
M2k~dewiki (talkcontribs)

Hallo @Herzi Pinki: für die Anlage der Dublette möchte ich mich in aller Form entschuldigen. Selbstverständlich bemühe ich mich, Anlagen von Dubletten grundsätzlich zu vermeiden.

Laut

wurden von meinen rund 415.479 Neuanlagen rund drei Prozent Dubletten erkannt, wobei etliche davon von mir selbst zusammengefügt wurden. Leider ist die Vermeidung von Dubletten bei 300 Projektsprachen und über 100 Millionen bestehenden Datenobjekten alles andere als trivial, insbesondere aufgrund von mehreren hunderten täglich neu eingestellter oder in den Benutzernamensraum verschobener Artikel, siehe beispielsweise auch

Leider ist es mir in den acht Jahren meiner Tätigkeit auf Wikidata nur wenig gelungen, Autoren der deutschsprachigen Wikipedia davon zu überzeugen, selbst Verantwortung für die Vorarbeiten (z.B. Anlage bzw. Pflege eines Wikidata-Objekt im Zuge einer gründlichen Recherche und damit verbundenen Prüfen der andersprachigen Artikel, der dort verwendeten Quellen, der im Wikidata-Objekt hinterlegten Lexika- und Datenbank-Einträge, der mit dem Objekt eventuell verbunden Commonscat, Anlage und Kategorisierung einer Commonscat, usw.) bzw. Nacharbeiten (Verbindung mit dem bestehenden Wikidata-Objekt, Formatierung des Artikels, Hinzufügen von Personendaten, Hinzufügen von Normdaten, Hinzufügen von Kategorien, Angabe einer gültigen, nicht defekten Commonscat im Artikel, Verlinkungen von anderen Artikeln, z.B. in Filmografien, Navigationsleisten, etc., Eintragung in die Begriffsklärung, uvam.) zu übernehmen.

Aufrufe, mit der Bitte um Unterstützung, weil das für mich leider nicht immer in der von vielen anderen Benutzern stets von mir geforderten Qualität, insbesondere hinsichtlich Redundanz, Umfang und Vollständigkeit, für die mehreren hunderten täglich neu eingestellten oder in den BNR verschobenen Artikel zu schaffen ist, blieben leider ungehört oder führten zur Kritik an meiner Tätigkeit, eine konkrete diesbezügliche Verbesserung, also entweder konkrete Verbesserungsvorschläge hinsichtlich Abläufe oder Werkzeuge oder Verbreiterung der Benutzerbasis, beispielsweise durch Information, Untersützung und Schulung, oder die Bereitschaft, selbst etwas beizutragen und regelmäßig mitzuarbeiten, konnte ich bisher leider eher wenig wahrnehmen, siehe beispielsweise

Ich bitte daher für mein Versagen vielmals um Entschuldigung! Für konkrete Vorschläge, was ich künftig besser machen könnte unter Berücksichtigung von mehreren hunderten neuen Artikeln täglich, wäre ich äußert dankbar. Vielen Dank!

M2k~dewiki (talkcontribs)

Bei von mir selbst erstellten Artikeln ist das (bereits vorhandenen oder sofern noch nicht vorhanden neu angelegte) Wikidata-Objekt für mich Ausgangspunkt für weitere Recherchen (Links zu verschiedenen Lexika- und Datenbank-Einträgen, Artikel und Quellen in anderen Sprachen, ...), das Objekt wird im Zuge der Recherchen ergänzt, parallel dazu wird der Artikel geschrieben. Zum Zeitpunkt des Einstellens des Artikels in den Artikelsnamensraum muss das bereits vorhandene Objekt dann nur mehr mit dem neuen Artikel verbunden werden.

M2k~dewiki (talkcontribs)
M2k~dewiki (talkcontribs)

Bei der Suche nach Wikidata-Objekten zu georeferenzierten Wikipedia-Artikel hatte ich in lezter Zeit ''Special:Nearby'' verwendet. Beispiel:

*  https://www.wikidata.org/wiki/Special:Nearby#/coord/48.650833,16.679444

Allerdings unterstützt Special:Nearby bislang nur eine Koordinate pro Wikidata-Objekt (und nicht zwei, wie beispielsweise bei Flüssen - Mündung und Quelle)

* https://phabricator.wikimedia.org/T337200 Feature request: Support multiple primary coordinates in articles for Special:Nearby

Die Suche/Anzeige von Wikidata-Objekten mit '' WikiShootMe!'' ist insbesondere bei sehr dicht bebautem Gebiet eher unübersichtlich.

Herzi Pinki (talkcontribs)

Ich finde das Ergebnis des ersten Links unübersichtlich und meine Darstellung auf der Karte leichter zu verstehen. lg --Herzi Pinki (Diskussion) 19:50, 20 August 2023 (UTC)

Herzi Pinki (talkcontribs)

Du hättest auch mergen können. Stattdessen eskaliert das da mehr und mehr. Es gibt vier Möglichkeiten:

  1. wir schulen alle User auf allen WPs entsprechend, dass sie die parallele Arbeit in WD korrekt und unter Vermeidung von Duplikaten machen. Wir wehren uns standhaft dagegen einzusehen, dass die Prozesse im Zusammenhang mit WD weder einfach vermittelbar, noch von allen verstehbar, noch ohne Wartung auskommen und dass die Prozesse (unter Berücksichtigung der Tools und Ressourcen) skalieren und die Datenqualität etwas zum Wohle der Welt beiträgt. Bis das gelungen ist, kopieren wir weiter Daten aus der WP (die keine Quelle ist) und erzeugen weiteren Wartungsbedarf. Ich halte das für einen eher mühsamen Weg, den ich nicht auch noch gehen möchte.
  2. ich hätte Ciciban ansprechen können, aber der hat das Objekt auf WD gar nicht angelegt. Keine Ahnung ob er in Bezug auf WD willig ist, jedenfalls Potential auf elendlange und ev. ergebnislose Disk. Wahrscheinlich hätte das zu 4) geführt.
  3. du hättest meinen Hinweis als Input zur Verbesserung deiner Prozesse nehmen können. 3% von 415000 Objekten sind immerhin 12450 und das ist eine Menge. Du hättest nach dem Verursacherprinzip einfach den Merge machen können.
  4. ich mache jetzt den merge, danke für deine Entschuldigungen und Ausführungen.

lg --~~~~

M2k~dewiki (talkcontribs)

Entschuldigung, ich hatte fälschlicherweise angenommen, dass der Merge zu Beginn der Diskussion bereits durchgeführt wurde, weil ich entdeckte Dubletten einfach zusammenführe, beispielsweise:

* https://www.wikidata.org/w/index.php?title=Q121697743&action=history

* https://www.wikidata.org/w/index.php?title=Q121433101&action=history

* https://www.wikidata.org/w/index.php?title=Q121503364&action=history

* https://www.wikidata.org/w/index.php?title=Q121080415&action=history

* https://www.wikidata.org/w/index.php?title=Q121009272&action=history

* https://www.wikidata.org/w/index.php?title=Q104551483&action=history

uvam.

Leider ist mir weiterhin unklar, wie dieser eine konkrete Fall zur Verbesserung der Prozesse beitragen könnte.

Herzi Pinki (talkcontribs)

Ich wollte dir nicht auf den Schlips treten. Du brauchst dich nicht rechtzufertigen. Du machst wertvolle Arbeit hier. Manchmal wünschte ich mir mehr als nur rudimentär angelegte Objekte.

Zweiter Versuch. Gibt es eine Möglichkeit, meinen Wunsch wertschätzend zu formulieren, so dass du ihn annehmen kannst und nicht eingeschnappt reagierst (mein Eindruck)? Ich arbeite seit Jahren den Scheiss ab, den Ljsbot aus geonames.org über WP:ceb und EmmausBot nach WD gerotzt hat, einfach weil hier in WD (aus Prinzip) und auf WP:ceb (mangels admins) nix gelöscht wird und lieber falsche Daten in alle Ewigkeit zur Freude aller externen Meshups mitgeschleppt werden. Ich weiß also dass es nicht lustig ist. Vielleicht erwarte ich mir deshalb von erfahrenen Usern wie dir größtmögliche Genauigkeit.

Mir passiert das genauso, dass ich versehentlich Duplikate anlege, ist mir dann peinlich und ich merge sie dann halt. gut, du hast angenommen, der Merge sei schon passiert. Sorry für die unklare Formulierung. Deine Antworten waren entsprechend wenig hilfreich. lg --Herzi Pinki (Diskussion) 20:27, 20 August 2023 (UTC)

M2k~dewiki (talkcontribs)

Hallo @Herzi Pinki: ich wünsche mir, dass sich irgendwann möglichst jede(r) Artikelersteller(in) (oder zumindest möglicht viele) selbst um die Vor- und Nacharbeiten zu dem von ihm/ihr erstellten Artikel kümmern kann, sodass die Arbeitslast nach dem Wiki-Prinzip auf viele verschieden Personen verteilt wird und nicht nur an einzelnen Benutzern hängt. Mein Zugang ist daher, das dafür notwendige Wissen auf möglichst viele Personen zu verteilen, sodass die Vor- und Nacharbeiten in der geforderten Qualität und auch Quantität auch dann vorgenommen werden können, wenn ich dazu nicht mehr in der Lage oder Willens bin. Und deshalb wäre mir

ein besonderes Anliegen.

Herzi Pinki (talkcontribs)

ich verstehe das. Und ja, es geht nur so. Wenn ich mir andererseits ansehe, was user im Wikiversum so antreibt, dann lasse ich da alle Hoffnung fahren. Eine Möglichkeit wäre es, Artikel in allen WPs nur dann anlegen zu können, wenn es bereits ein ausreichend gefülltes Datenobjekt gibt. Das kann erreicht werden, indem die Infoboxen zwingend auf WD zugreifen, ohne WD-Eintrag keine Infobox, keine Koordinaten, etc. lg --Herzi Pinki (Diskussion) 20:46, 20 August 2023 (UTC)

M2k~dewiki (talkcontribs)

Hallo @Herzi Pinki: diesbezüglich gibt es folgende zwei Bestrebungen:

Ziel könnte es sein, die beiden Helferlein standardmäßig für alle Benutzer der deutschsprachigen Wikipedia zu aktivieren. Ich verwende beide Helferleins seit einem halben Jahr, wenngleich noch einzelne bekannte Fehler vorhanden sind, an einer Verbesserung wird teilweise gearbeitet. Beim AutoSuggest-Helferlein wird der Benutzer informiert, dass der Artikel noch nicht mit einem WD-Objekt verbunden ist, eventuell passende Objekte werden vorgeschlagen.

M2k~dewiki (talkcontribs)
Herzi Pinki (talkcontribs)

zur Info, ich weiß nicht ob du zählst: https://quarry.wmcloud.org/query/75986 liefert snapshot 4130315:104992736 redirects zu richtigen Qids, oder knapp 3.8%.

Von Q10001000 bis Q10002000 habe ich 289:536 oder 35% redirects gezählt, ich gehe davon aus, dass die fehlenden 175 gelöscht worden sind.

M2k~dewiki (talkcontribs)

@Herzi Pinki: zahlreiche Dubletten gab und gibt es auch bei Baudenkmälern zumindest in Bayern und Hessen, wo (in Bayern rund 160.000) Objekte angelegt wurden, ohne diese mit den bestehenden Commonscats zu verbinden. Stattdessen wurden die Commonscats mit den Artikeln verbunden, ohne die bestehenden Wikidata-Objekte zu berücksichtigen, sodass es pro Denmkmal unter Umständen zwei Wikidata-Objekte gibt.

In Bayern und Hessen wurden jeweils zumindest meherere hunderte Dubletten zusammengefügt, zumindest in Hessen sind aber vermutlich noch viele weitere Dubletten vorhanden. In Hessen wurden beim Massenimport der Denkmäler im Jänner 2023 nur auf die DenkXWeb-ID geprüft, nicht jedoch auf allfällige bestehende Artikel, Commonscats und Objekte ohne DenkXWeb-ID.

Herzi Pinki (talkcontribs)

Das Grundproblem scheint mir zu sein, dass Objekte per Bot oder Skript angelegt werden und dabei wenig darauf geschaut wird (wie denn auch?), ob es das idente Objekt schon gibt. Wenn ich mit quickstatements ein Objekt anlege und beim Sitelink auf Commonscat eine Fehlermeldung bekomme, ist das Objekt trotzdem schon angelegt (wenn ich mich recht entsinne). Das Anlegen ist um Größenordnungen einfacher als das Finden von Duplikaten und das Mergen. Solange das so ist, ist das Zusammenfügen von Duplikaten ein Kampf gegen Windmühlen. Wenn die Prozesse im backend nicht skalieren, muss man wohl im Frontend drosseln. lg --Herzi Pinki (Diskussion) 11:56, 21 August 2023 (UTC)

Reply to "Bitte vermeide das Anlegen von Duplikaten"