User talk:Pere prlpz

From Wikidata
Jump to navigation Jump to search
Logo of Wikidata

Welcome to Wikidata, Pere prlpz!

Wikidata is a free knowledge base that you can edit! It can be read and edited by humans and machines alike and you can go to any item page now and add to this ever-growing database!

Need some help getting started? Here are some pages you can familiarize yourself with:

  • Introduction – An introduction to the project.
  • Wikidata tours – Interactive tutorials to show you how Wikidata works.
  • Community portal – The portal for community members.
  • User options – including the 'Babel' extension, to set your language preferences.
  • Contents – The main help page for editing and using the site.
  • Project chat – Discussions about the project.
  • Tools – A collection of user-developed tools to allow for easier completion of some tasks.

Please remember to sign your messages on talk pages by typing four tildes (~~~~); this will automatically insert your username and the date.

If you have any questions, don't hesitate to ask on Project chat. If you want to try out editing, you can use the sandbox to try. Once again, welcome, and I hope you quickly feel comfortable here, and become an active editor for Wikidata.

Best regards!

--Ymblanter (talk) 12:09, 20 February 2013 (UTC)[reply]

Requests for deletion[edit]

It would be very helpful if you could include the item you merged something to when requesting deletion of the now-empty item -- admins are supposed to verify that the merger was correct before deleting something and being able to easily see where something was merged to is the best way to do this. Thanks. Courcelles (talk) 15:52, 18 April 2013 (UTC)[reply]

Commons category[edit]

Hi, one small note: if simple remove invalid value of Property:P373, then bot will create it again. No value marker is better way to say, that there is no corresponding category on Commons. — Ivan A. Krestinin (talk) 19:39, 9 May 2013 (UTC)[reply]

Merging items[edit]

Hallo Pere prlpz,

When you are merging items, please use the Merge.js gadget. It helps you nominating, gives the option to always keep the lower number (which is older, so preferable) and makes it a lot easier for the admins to process the requests.

With regards, - User:CycnUser:CycnUser:CycnUser:Cycn - (Cycn/talk) 15:32, 16 December 2013 (UTC)[reply]

Editing speed[edit]

If you keep editing on this speed, please request a flood flag. Sjoerd de Bruin (talk) 12:42, 23 July 2015 (UTC)[reply]

re[edit]

They are updated only manually. You can you the links or script in Module:Statistical data/by project/classes to do so.--GZWDer (talk) 13:45, 25 July 2015 (UTC)[reply]

Estadístiques actualitzades[edit]

He actualitzat manualment les nostres estadístiques a Wikidata. Com ho veus?

  • Hem passat de 100 000 a 60 000 ítems sense P31/P279 (diria que jo almanco he fet net de categories)
  • Hem superat dels 100 000 articles de geografia (etiquetats)
  • Hem passat de 42 000 a 57 000 categories etiquetades com a tals
  • Hem passat de 8 000 a 22 000 edificis
  • Tenim mil objectes artificials menys dels que teníem fa dos mesos.

L'anterior gràfic. Paucabot (talk) 11:48, 19 September 2015 (UTC)[reply]

@Paucabot: Bona feina. Si els altres estan actualitzats tenim un dels percentatges de no identificats més baixos de totes les viquipèdies que no són botopèdies.--Pere prlpz (talk) 14:07, 19 September 2015 (UTC)[reply]
La majoria de les altres Viquipèdies no tenen les dades actualitzades. Posa la data just a baix del gràfic autogenerat. Paucabot (talk) 15:03, 19 September 2015 (UTC)[reply]
Una darrera cosa: hem passat de 513 000 a 537 000 ítems a Wikidata. Paucabot (talk) 09:38, 20 September 2015 (UTC)[reply]
@Paucabot: Si de l'1 de juliol a l'1 de setembre la Viquipèdia ha autgmentat en 7000 articles, vol dir que el nombre d'articles per pujar a Wikidata ha d'haver baixat en uns 17.000 (en realitat alguns menys, perquè no estic tenint en compte les categories). Anem pel bon camí.
Ara, amb els monuments importats amb bot, suposo que tornem a tenir una colla d'edificis que els podem posar la propietat P31. O ara, o quan estiguin ben categoritzats com a edificis.--Pere prlpz (talk) 20:17, 20 September 2015 (UTC)[reply]

Commons[edit]

The problems are still there [1], [2]. - Brya (talk) 05:00, 7 October 2015 (UTC)[reply]

@Brya: What is the problem here? Both categories exist in Commons, they aren't redirects and as far as I can see they are about the same species than the articles in Wikipedias. Why have you removed the claims?--Pere prlpz (talk) 23:50, 8 October 2015 (UTC)[reply]
Wikidata has a page Mico melanurus and Commons has a page Mico melanurus: these go together. You put it in the page Callithrix melanurus, just because the sitelink of cawiki is there. - Brya (talk) 04:46, 9 October 2015 (UTC)[reply]
@Brya: According to Wikipedias and commons:Category:Mico melanurus, Mico melanurus, Callithrix melanurus and Callithrix melanurus are synonyms. Different projects prefer different names, but all them are about the same monkeys - that's the reason for the link in Catalan and others to be there, and it's OK to link. commons:Category:Callithrix melanura is a redirect and wouldn't be OK to link it. commons:Category:Callithrix melanurus doesn't even exist.
Furthermore, when there is an interwiki conflict - although I can't see any interwiki conflict here - the solution is to resolve the interwiki conflict. As long as a a Wikidata item has links about different unrelated subjects, people will add statements about any of these subjects.--Pere prlpz (talk) 07:26, 9 October 2015 (UTC)[reply]
Well, I am glad you noticed that Mico melanurus is regarded as a synonym of Callithrix melanurus (and that others regard that relationship should be the reverse). Obviously there would not be much point in adding commons:Category:Callithrix melanura to the item Callithrix melanurus as it indeed is a redirect. But I should hope that it is equally clear that there is no point in adding commons:Category:Mico melanurus to the item Callithrix melanurus. It has already been added to the item Mico melanurus, where it clearly belongs. Why add it to two items? I don't see what is so hard to adding a commons category with a scientific name to a Wikidata with the same scientific name and not to items with different scientific names? - 10:54, 9 October 2015 (UTC)
@Brya: I'm sorry, but I'm afraid I'm missing something, because I still don't see the problem.
In Wikidata the item Callithrix melanurus is the same as the item Mico melanurus , isn't it? And its Commonscat property links to the right Commons category, doesn't it?--Pere prlpz (talk) 20:59, 9 October 2015 (UTC)[reply]
In Wikidata the item Callithrix melanurus (Q1202585) is not the same as the item Mico melanurus (Q16718009). - Brya (talk) 03:33, 10 October 2015 (UTC)[reply]
@Brya: As far as I know, Wikipedias and Wikidata don't have articles or items about words, as they have articles about subjects. Both items should be merged, and Q16718009 is just a derelict of an item linked to a ruwiki article that you moved to the other one. You did it right, but using the merge button would have merged both items. Please notice that all links are in Q1202585, whatever name they have, and they should be linked via Commonscat to the commons category with media about its subject.--Pere prlpz (talk) 08:00, 10 October 2015 (UTC)[reply]
Well, that is a line of reasoning that one could be adopt. However, in practice it proves that merging such items works very poorly (better for some items than for others), leading to errors and confusion (and these will increase as complexity increases). As to sitelinks, there is indeed only one practical course, namely to put them all together (in one item or another), and put in enough statements (preferably properly referenced) so that it is possible to navigate the joint items. - Brya (talk) 08:15, 10 October 2015 (UTC)[reply]
Then your proposed action is to put all sitelinks about the same species in the same item (whichever synonym scientific name they use) but not to put in that item the commonscat property which link to the Commons category with media about the same species if it doesn't use the same synonim as some (which ones?) of the linked sitelinks about the same species. Am I understanding well your proposal?--Pere prlpz (talk) 09:53, 10 October 2015 (UTC)[reply]
I think you understood it well, all the sitelinks are to be put together in one item or another. It will depend on circumstance if this is the item that also has the Commons link (or any of a number or other links that somebody feels is particularly important). BTW I remember seeing cases where the Commons category uses one name, but the Commons gallery uses another link. - Brya (talk) 10:35, 10 October 2015 (UTC)[reply]
I don't disagree about having different items about different names to store information related to the name (not to the species), but there should be a single item for the species with all information about the species. That's what you are doing with sitelinks (and it's OK), but it should be done for the information used in articles, and commonscat property is among the information most used by articles. Since we put together all sitelinks, we should put commonscat property together with them.
Please notice that Commonscat templates in several Wikipedias use the Commonscat property in Wikidata, and that Wikipedia articles and Commons categories are about species and not about their names. All species related information should be in the species item, even if name related information is in other items.--Pere prlpz (talk) 12:01, 10 October 2015 (UTC)[reply]
I see what you mean and will think about it. Some problems are that by putting all sitelinks always in the item with the Commons link we will in effect always be following whatever taxonomy Commons is adopting, thus reinforcing the misconception that there is One Right Taxonomy. Putting all 'species-related information' in that same item may well cross the No Original Research barrier. If this about the idea to have all information for a Wikipedia page in one Wikidata item, we are past that stage. Quite a few Wikipedias have a page about "apple" as well as a page about the species (Malus pumila). So it makes sense that one day the Wikidata item about the apple will have, say, a table with nutritional values. But some Wikipedias have only one page for both apple and species and these Wikipedias will have to go across items to get their data. So this is nothing new. - Brya (talk) 18:14, 10 October 2015 (UTC)[reply]
@Brya: Yes, this problem is quite similar to the common problem of some Wikipedias having an article on a monotypic genus and other Wikipedias having an article on its single species, although this one is a little easier to deal with. There are similar non taxonomy related problems in Wikidata; for example every time one Wikipedia has an article on a subject about which another Wikipedia has two articles. Often, from a Wikidata-only point of view having different items seems more logical, but to be useful to Wikipedias (and other Wikimedia projects) it's much better to have all the information about a subject about a subject in the same item - e.g. to let interwikis and Commonscat templates work.
Wikipedias and Commons favour the "one right taxonomy" because every article or category has a single name, and because taxoboxes just display a single taxonomy. In Wikidata it's easier to deal with several taxonomies, because there can be more than one value for scientific names and upper taxons, and because different sitelinks with different names and different labels and alias can be linked in the same item.--Pere prlpz (talk) 18:30, 10 October 2015 (UTC)[reply]
I don't know about policies in Commons, but in Wikipedias this pretending that there is One Right Taxononmy is a violation of the NPoV policy, the cornerstone of Wikipedia. - Brya (talk) 06:51, 11 October 2015 (UTC)[reply]
@Brya: Of course. As far as I understand, you are concerned about the technical needs that sometimes favour one taxonomy over other ones, as the fact of articles and categories should have just one name (one name in each project), and that in Wikidata items have just one label in each language. I also agree that this problem is only partially solved by redirects and aliases. Anyway, the existence of several valid taxonomies shouldn't obscure the still more important fact that several names refer to the same subject. Furthermore, putting in the same item sitelinks and labels that use different synonyms makes clear to readers that there isn't just one right taxonomy.--Pere prlpz (talk) 20:23, 11 October 2015 (UTC)[reply]
Well, yes, ideally users should be able to rely on references, rather than be left to whatever links happen to have been made. It has proved that aliases are not part of the solution, but are a persistent cause of problems.
        Whether or not "several names refer to the same subject" will depend: a set of names that sometimes can refer to the same subject, may at other times refer to different subjects. This will vary with the kind of organism we are dealing with, if we are dealing with species of insects, these names are very likely to apply to the same subject. If we are dealing with species of plants, that is a lot more uncertain.
        The only clearcut method to avoid undue confusion is to organize things on a "one name-one item" basis. There is no guarantee that this one name will always refer to the same subject, but (at least for the foreseeable future) this is unavoidable. - Brya (talk) 04:46, 12 October 2015 (UTC)[reply]
I agree that sometimes different names refer to different subjects (they are not exactly synonyms, then), and such names usually deserve an special treatment. Anyway, a common case is when several names are strictly synonyms and I still think that the Wikipedia articles linked together need an item with the information about their common subject. This is specially important for information the articles gather from Commons like Commonscat, and -less importantly- taxonomic information used by {{:ca:BDT}} and similar templates. Please remember that the first goal of Wikidata is to store information (like sitelinks) to be used by Wikimedia pages. The "one name-one item" might be a good approach with an individual item for each name, different from the item that holds together all sitelinks about the species.
Anyway, I would suggest trying to put all information about all different names in the species item. I think it would be simpler to achieve and put to work, because creating and maintaining one item per name could be an enormous task not very likely to be completed to any useful point, and I think the information about each name could be stored in qualifiers instead a separate item. However, it's mainly a practical choice and I let it to the people interested in uploading information about names.--Pere prlpz (talk) 08:14, 12 October 2015 (UTC)[reply]
In taxonomy, the general definition of a synonym is any name that applies to a taxon, besides the correct name. The taxon that a synonym applies to when it would be correct may vary hugely from the taxon that the correct name applies to: the difference may easily be more than a million to one. It is not easy to tell when synonyms apply to exactly the same taxon.
        Creating (or restoring) and maintaining one item per name is relatively easy, at least when limited to those names that are used in some Wikipedia as correct (creating an item for every name ever published would indeed be a daunting task). - Brya (talk) 11:17, 12 October 2015 (UTC)[reply]


Merge of Genes and Proteins[edit]

You merged 5 Gene items to protein items (Q7390805, Q7390812, Q17913210, Q18037084, Q18040031). Your action destroyed the Wikidata community approved data model for genes and proteins which is maintained by ProteinBoxBot. Please, avoid doing this in the future. Sebotic (talk) 01:57, 10 December 2015 (UTC)[reply]

Oh, sorry, I just realized that you only merged some old protein relicts to the gene items. If you do that, please remove the 'subclass of' protein. But I will do these merges in the coming days anyway, so you would not need to invest time in them. Thanks! Sebotic (talk) 02:09, 10 December 2015 (UTC)[reply]
@Sebotic: I must admit that I didn't notice that I was merging proteins with genes. I was just trying to connect lonely items in cawiki and after checking wikipedia articles in Catalan and English I was convinced that both were about the same subject, but I didn't check if Wikidata properties fit the articles subjects. Probably I should have just moved sitelinks instead of merging items. Thank you.--Pere prlpz (talk) 08:37, 10 December 2015 (UTC)[reply]

Categoria de Commons[edit]

A partir de Wikidata:Properties for deletion#Property:P373 vaig refer la plantilla Commonscat amb el criteri que explica ca:Module:WikidataCommonsCat. La conclusió que en trec és que, tot i que no s'esborri, la P373 és inestable. En ser un string no s'actualitza si es reanomena o s'esborra i per això passa a ser la darrera opció. És preferible posar-ho com a enllaç de lloc a commonswiki, criteri que utilitza el bot de Commons. A més d'aquesta forma surt en "altres projectes" de la barra lateral encara que no tingui la plantilla Commonscat. Ho dic perquè he vist Special:Diff/1081674236. --Vriullop (talk) 08:57, 23 December 2019 (UTC)[reply]

@Vriullop: Més o menys hi comptava, però encara estic escrivint el programa i he començat per les coses fàcils. La idea és acabar posant la categoria de Commons tant a la Commons category (P373) com al sitelink.--Pere prlpz (talk) 11:01, 23 December 2019 (UTC)[reply]
@Vriullop: He començat a afegir el sitelink de la categoria de commons però molt sovint em trobo que la categoria de commons està enllaçada a un item de Wikidata per la categoria principal per aquell monument (per exemple Category:Tortosa train station (Q24035470)). Pels monuments que sembla improbable que mai tinguin cap categoria en cap projecte fora de Commons, al principi em pensava que era un error i traslladava manualment l'enllaç a l'item del monument, però em fa dubtar que algú ho ha fet sistemàticament i que a més, veient els interviquis del marge a Commons, sembla que el Mediawiki té en compte la relació entre l'item del monument i l'item de la categoria.
Aleshores, saps si hi ha alguna norma o una pràctica habitual sobre on ha d'anar el sitelink de la categoria de Commons? Mentre no ho aclarim m'agafo el camí de no llençar-m'hi i enllaçaré les categories de Commons als articles dels monuments només quan no estiguin enllaçats a un altre item, i segueixo actualitzant la Commons category (P373) que no té aquests problemes.--Pere prlpz (talk) 22:13, 25 December 2019 (UTC)[reply]
Doncs no havia vist aquest problema. El bot de Commons que he vist actuant és JarektBot, pots preguntar al seu operador si hi ha criteris al respecte. --Vriullop (talk) 10:05, 26 December 2019 (UTC)[reply]

Adreces[edit]

Hi ha un bot que ha fet un desgavell movent de P969 (P969) a street address (P6375) assumint que totes són en espanyol quan la majoria provenen de les nostres llistes de monuments. Pots veure Special:Contributions/PLbot del dia 17-1-2020. Pots fer-hi alguna cosa? --Vriullop (talk) 12:16, 4 February 2020 (UTC)[reply]

@Vriullop: Entenc que el problema és que ha posat adreces més o menys correctes però les ha marcat com a adreces en castellà quan són en català. Un altre tema és que algunes d'aquestes localitzacions no són ben bé adreces, però aquestes ja hi eren (de fet, és un dels motius pels que jo no estic pujant adreces des de les llistes de monuments).
La solució depèn de com de bold vulguem ser i com de greus siguin els falsos positius. Si no hi ha una manera de revertir en massa el bot aquest i no ens volem embrancar a demanar-ho, ha de ser possible mirar de baixar les adreces de monuments (o no monuments) de Catalunya i tornar-les a pujar marcant-les com a adreces en català tot esborrant l'adreça marcada en castellà. Això es pot fer amb una consulta i un script de R per analitzar-la i generar instruccions per al quickstatements. El dubte principal és el grau de boldness per filtrar l'idioma en que realment està l'adreça.
Una solució alternativa és pujar de nou les adreces des de les llistes de monuments, canviant l'idioma del que coincideixi.
L'altre problema és el temps per fer-ho.--Pere prlpz (talk) 13:33, 4 February 2020 (UTC)[reply]
Me n'he adonat perquè a les infotaules surt marcat amb un span lang="es", i perquè a w:Usuari:Vriullop/vector.css tinc marcat en verd aquests span de llengua. No és greu, però fa lleig i emprenya. No es pot demanar revertir perquè no tots són catalans encara que la majoria. Vols que ho comenti a l'Amador? --Vriullop (talk) 13:56, 4 February 2020 (UTC)[reply]
@Vriullop: "No tots són catalans" vols dir que al mateix lot ha fet correctament adreces de fora de Catalunya? O vols dir que hi ha adreces de Catalunya realment escrites en castellà?--Pere prlpz (talk) 15:07, 4 February 2020 (UTC)[reply]
En el mateix lot ha mogut les declaracions de tota Espanya. N'hi ha de llocs castellans correctes Special:Diff/1100226793, de llocs bascos incorrectes Special:Diff/1100224986, de balears incorrectes Special:Diff/1100225535, i la gran majoria són de monuments catalans incorrectes Special:Diff/1100224369. Algunes poden ser indistintes en català o castellà Special:Diff/1100224213, però per coherència calia haver assumit totes les adreces de Catalunya en català, no n'he vist cap en castellà ni seria oficial. --Vriullop (talk) 18:19, 4 February 2020 (UTC)[reply]
@Vriullop: Quan pugui m'ho miro.
I em deixo aquí l'autorecordatori de vigilar de no fer amb les adreces araneses el mateix que aquest botaire ha fet amb les catalanes i basques.--Pere prlpz (talk) 19:15, 4 February 2020 (UTC)[reply]
# Adreces de llocs de Catalunya, amb l'etiqueta de llengua de l'adreça i el codi IPAC si n'hi ha
SELECT ?item ?itemLabel ?adr ?codi ?llengua 
WHERE {
  ?item wdt:P131* wd:Q5705.
  ?item wdt:P6375 ?adr.
  OPTIONAL {?item wdt:P1600 ?codi}
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ca,oc,en,es,fr". }
  BIND (LANG(?adr) AS ?llengua).
}
Try it!
# Adreces de llocs de l'Aran, amb l'etiqueta de llengua de l'adreça i el codi IPAC si n'hi ha
SELECT ?item ?itemLabel ?adr ?codi ?llengua 
WHERE {
  ?item wdt:P131* wd:Q12602.
  ?item wdt:P6375 ?adr.
  OPTIONAL {?item wdt:P1600 ?codi}
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ca,oc,en,es,fr". }
  BIND (LANG(?adr) AS ?llengua).
}
Try it!

@Vriullop: Deixant de banda un espectacular "A2 Autovía del Nordeste, 697, 17410 Sils, Girona, Spain" només apte per trilingües, el que surt a Catalunya lliga força amb l'anàlisi que en feies i crec que podré tirar més aviat pel dret. On no ho tinc tan clar és a la Vall d'Aran, perquè hi ha una barreja de llengües a les adreces que tampoc lliga amb les etiquetes. No ho faré automàticament, però com que només són 34 adreces es pot fer a mà, però no sé la solució per adreces (o localitzacions que no són adreces) que estan en català o en una barreja de català i aranès, amb etiqueta ca o es.--Pere prlpz (talk) 22:19, 4 February 2020 (UTC)[reply]

Ja vaig mirant les de l'Aran. Si no són realment adreces potser es pot moure a directions (P2795). --Vriullop (talk) 11:13, 5 February 2020 (UTC)[reply]

Casos curiosos per arreglar a mà (tots els que em surten que no són ca, es, oc):

                                         item                  itemLabel                                  adr  codi llengua
1135 http://www.wikidata.org/entity/Q62382685                 Casa Cádiz                 Sardinia Street, 277  <NA>      en
1168    http://www.wikidata.org/entity/Q31609         Galeries Laietanes Gran Via de les Corts Catalanes, 613  <NA>      it
1918  http://www.wikidata.org/entity/Q1146645                Via Domícia                        chemin Romain  <NA>      fr
2422 http://www.wikidata.org/entity/Q22968645                 El Bruguer                           Vilalleons 23687      fr
2780 http://www.wikidata.org/entity/Q27652194           Rajola inv 21949           Carrer Arquímedes, 179-181  <NA>      ar
3297 http://www.wikidata.org/entity/Q60405147 Estadi Municipal la Bòbila      Ptge. Elisenda de Montcada, s/n  <NA>      uk
3928 http://www.wikidata.org/entity/Q21077250                can Prunera              carrer de les Garrigues 19384     kab
4501 http://www.wikidata.org/entity/Q58819459                 el Molinet      Ctra. BV-2121, km 5,1, a 2,3 km  2935      ar

--Pere prlpz (talk) 22:53, 4 February 2020 (UTC)[reply]

I uns quants castellans autèntics que també s'haurien d'arreglar a mà:

                                         item                       itemLabel                                                     adr codi llengua
417  http://www.wikidata.org/entity/Q16249980                            ABaC                                  Avenida del Tibidabo 1 <NA>      ca
499   http://www.wikidata.org/entity/Q1630272            Museu Frederic Marès                                      Plaza de Sant Iu 5 <NA>      es
551  http://www.wikidata.org/entity/Q11913822          Cine Avenida de la Luz Avenida de la Luz 12 / Carrer de Pelai, 08196 Barcelona <NA>      es
1050 http://www.wikidata.org/entity/Q37490509                Cines Maremagnum                   Calle Moll d'Espanya, 08039 Barcelona <NA>      es
1107 http://www.wikidata.org/entity/Q50895561      Editorial Montaner i Simón                             Calle Aragón 255, Barcelona <NA>      es
3039 http://www.wikidata.org/entity/Q55429233            Hotel Torre Vermella                               Calle Santa Marcelina, 13 <NA>      es
4364 http://www.wikidata.org/entity/Q37462067              OCine Les Gavarres                           Avenida Tarragona, 43006 Reus <NA>      es
6122 http://www.wikidata.org/entity/Q15634244 Jardins de Jaume Vicens i Vives                                   Avenida Diagonal, 639 <NA>      es

--Pere prlpz (talk) 23:02, 4 February 2020 (UTC)[reply]

Engegat el primer centenar com a prova pilot. Si surt bé, demà més.--Pere prlpz (talk) 23:38, 4 February 2020 (UTC)[reply]

S'està complicant. Fent-ho així em carrego les referències.[3]--Pere prlpz (talk) 10:14, 5 February 2020 (UTC)[reply]

Revisats a mà els aranesos, els de llengües estranyes i en castellà. --Vriullop (talk) 12:26, 6 February 2020 (UTC)[reply]

Perfecte. Jo miro d'aprendre a llegir referències amb una query per tal de poder seguir treballant amb els que no en tinguin i després mirar els que quedin. Podria ser que això fos més fàcil llegint i editant Wikidata amb pywikibot en comptes del meu sistema query+quickstatements, però miro fins on puc arribar amb el meu mètode actual.--Pere prlpz (talk) 14:09, 6 February 2020 (UTC)[reply]

Si ho he fet bé, les que tenen referències a l'adreça són les següents 1000 i pico:

# Llocs de Catalunya amb referències a l'adreça
SELECT ?item ?itemLabel ?adr ?codi ?llengua 
WHERE {
  ?item wdt:P131* wd:Q5705.
  ?item p:P6375 ?sadr.
  ?sadr prov:wasDerivedFrom [].
  ?item wdt:P6375 ?adr.
  OPTIONAL {?item wdt:P1600 ?codi}
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ca,oc,en,es,fr". }
  BIND (LANG(?adr) AS ?llengua).
}
Try it!

Les excloc i em poso amb les altres. Després el següent pas podria ser trobar quines d'aquestes tenen només "importat de cawiki" com a referència i arreglar-les. Les que quedin (que segur que són centenars) em temo que em superaran.--Pere prlpz (talk) 19:45, 6 February 2020 (UTC)[reply]

@Vriullop: Més excepcions per resoldre manualment: 16 amb qualificador codi postal i 11 amb número del carrer:

# Llocs de Catalunya amb qualificador codi postal a l'adreça
SELECT ?item ?itemLabel ?adr ?codi ?llengua 
WHERE {
  ?item wdt:P131* wd:Q5705.
  ?item p:P6375 ?sadr.
  ?sadr pq:P281 [].
  ?item wdt:P6375 ?adr.
  OPTIONAL {?item wdt:P1600 ?codi}
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ca,oc,en,es,fr". }
  BIND (LANG(?adr) AS ?llengua).
}
Try it!
# Llocs de Catalunya amb qualificador número del carrer a l'adreça
SELECT ?item ?itemLabel ?adr ?codi ?llengua 
WHERE {
  ?item wdt:P131* wd:Q5705.
  ?item p:P6375 ?sadr.
  ?sadr pq:P670 [].
  ?item wdt:P6375 ?adr.
  OPTIONAL {?item wdt:P1600 ?codi}
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ca,oc,en,es,fr". }
  BIND (LANG(?adr) AS ?llengua).
}
Try it!

--Pere prlpz (talk) 20:45, 6 February 2020 (UTC)[reply]

Estic trobant més qualificadors, el més abundant end time (P582) amb més d'un centenar. Potser val més que esperem a resoldre'ls a mà quan sapiguem quants són tots plegats.--Pere prlpz (talk) 21:47, 6 February 2020 (UTC)[reply]

Revisats els dos casos amb qualificadors. El codi postal el dono per bo, alguns els he afegit jo traslladant-ho de l'adreça o de propietat a qualificador. Aquests els pots ignorar. El número de carrer l'he eliminat i traslladat a l'adreça per les explicacions de house number (P670). No n'hauria de quedar cap. N'he trobat un parell amb adreça vella i nova que s'havia quedat penjat a mitges a P969 (P969). Sembla que si hi havia dues adreces el bot només n'ha traslladat una: exemple. Pots comprovar quins tenen encara la P969? --Vriullop (talk) 08:05, 7 February 2020 (UTC)[reply]

53 amb adreces a les dues propietats, amb casuística força diversa:

# Llocs de Catalunya amb una adreça a la P969 (deprecated) i una altra a la P6375
SELECT ?item ?itemLabel ?adrvella ?adr ?codi ?llengua
WHERE {
  ?item wdt:P131* wd:Q5705.
  ?item wdt:P6375 ?adr.
  ?item wdt:P969 ?adrvella.
  OPTIONAL {?item wdt:P1600 ?codi}
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ca,oc,en,es,fr". }
  BIND (LANG(?adr) AS ?llengua).
}
Try it!

--Pere prlpz (talk) 09:54, 7 February 2020 (UTC) @Vriullop:--Pere prlpz (talk) 09:55, 7 February 2020 (UTC)[reply]

Revisats. Aquests han donat més feina per analitzar cas a cas. --Vriullop (talk) 13:35, 7 February 2020 (UTC)[reply]
M'ha trobat un parell de casos estranys, amb el municipi posat de manera atípica: [4][5] Entenc que ja està bé haver-lo eliminat, però els deixo aquí per si de cas.--Pere prlpz (talk) 22:22, 7 February 2020 (UTC)[reply]
Fets els fàcils, o sigui, els que no tenen referències ni qualificadors a l'adreça. En queden menys d'un miler que miro què hi puc fer.--Pere prlpz (talk) 11:19, 9 February 2020 (UTC)[reply]

@Vriullop: Sembla que els de Catalunya ja ens els hem ventilat tots excepte els vitralls de la referència de la tesi, que s'hauran d'arreglar a mà:

# Llocs de Catalunya amb l'adreça en castellà
SELECT ?item ?itemLabel ?adr
WHERE {
  ?item wdt:P131* wd:Q5705.
  ?item wdt:P6375 ?adr.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ca,oc,en,es,fr". }
  FILTER (LANG(?adr) = "es").
}
Try it!

Se'm poden haver escapat els que no tinguin located in the administrative territorial entity (P131) de cap part de Catalunya, però dubto que n'hi hagi gaires perquè a final d'estiu vaig estar posant municipi o comarca a tot el que tingués coordenades a Catalunya.--Pere prlpz (talk) 20:30, 9 February 2020 (UTC)[reply]

Segona part: les Illes.

# Llocs de les Illes amb l'adreça en castellà
SELECT ?item ?itemLabel ?adr
WHERE {
  ?item wdt:P131* wd:Q5765.
  ?item wdt:P6375 ?adr.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ca,oc,en,es,fr". }
  FILTER (LANG(?adr) = "es").
}
Try it!

Només n'hi ha 271, però l'idioma només és un dels problemes que tenen. Fent-hi un cop d'ull hi veig:

  • Mitja dotzena realment en castellà (pots buscar "calle" amb ctrl+F).
  • Una pila d'enllaços interns que entenc que no hi han de ser.
  • Una pila que no són adreces (en part, les mateixes dels enllaços interns). De fet, les adreces de veritat són minoria.

No tinc gaire clar si canviar l'idioma i prou o si val la pena fer-hi més coses.--Pere prlpz (talk) 20:45, 9 February 2020 (UTC)[reply]

Bona feina. A Mallorca i Menorca usen molts noms populars que no sé exactament a què es refereixen, si partides, possessions, finques, tancats. Fora d'àrees urbanes no hi ha adreces. En aquest cas els aniré traslladant a location (P276) i alguns a directions (P2795). Quedaran poques adreces reals. --Vriullop (talk) 07:58, 10 February 2020 (UTC)[reply]
Nop. Ubicació ha de ser un element i no el puc crear perquè com deia no sé què és. Començaré per les indicacions i caldrà consultar què fer amb les possessions/finques. --Vriullop (talk) 08:03, 10 February 2020 (UTC)[reply]
Els estic revisant a mà. N'hi ha un bon paquet de Llucmajor i d'Eivissa que sí que existeixen com a elements i els trasllado a ubicació. D'altres a indicacions de localització, si tenen article pot ser que ho detalli més. Les adreces també cal netejar-les i al final no sé si en quedarà cap. --Vriullop (talk) 09:22, 11 February 2020 (UTC)[reply]
@Vriullop: Si al final en queda un grapat que només s'hagi de canviar l'idioma, ho faig amb l'script.
Si de les catalanes també vols netejar les que no siguin adreces, suposo que amb un script també puc separar les que tinguin estructura d'adreça de les que no. Potser es pot fer fent servir només la query.--Pere prlpz (talk) 10:32, 11 February 2020 (UTC)[reply]
Fet. En queden una quaretena, quan es refresqui el dump de query.wikidata, on els pots passar l'script. --Vriullop (talk) 18:56, 14 February 2020 (UTC)[reply]
✓ Done. @Vriullop: Per si després de tot això t'ha quedat ganes de continuar amb les adreces et deixo una altra query, que probablement és incompleta (només hi surten els llocs que tinguin municipi amb municipi que tingui posat el predomini lingüístic com a idioma oficial) i té algun fals positius (com a mínim a Oriola, amb dos predominis lingüístics diferents). No sé que hauríem de fer però m'imagino que als que estan clarament en català ("carrer", "plaça", etc.) els puc canviar l'etiqueta automàticament. Per futura referència, a la query ara hi surten 143 adreces.
# Adreces en castellà de municipis amb predomini lingüístic valencià.
SELECT ?item ?itemLabel ?adr ?mun ?munLabel
WHERE {
  ?mun wdt:P131* wd:Q5720.
  ?item wdt:P131+ ?mun.
  ?mun wdt:P31 wd:Q2074737.
  ?item wdt:P6375 ?adr.
  ?mun wdt:P37 wd:Q32641.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ca,oc,en,es,fr". }
  FILTER (LANG(?adr) = "es").
}
Try it!

--Pere prlpz (talk) 20:54, 14 February 2020 (UTC)[reply]

Aquí ja es veu que no són importades de cawiki, a banda d'alguna que és clarament en català. El més prudent serà deixar-ho estar i en tot cas afegir-ho en català si afecta a infotaules. De totes formes en 10 dies no m'ho puc mirar. --Vriullop (talk) 22:46, 14 February 2020 (UTC)[reply]
@Vriullop: Crec que els que eren importats de cawiki estaven entre les deu que complien "^([Cc]arrer|[Pp]laça)" i que vaig tractar ahir més o menys automàticament.--Pere prlpz (talk) 11:35, 15 February 2020 (UTC)[reply]

València i districtes municipals[edit]

Hola. Estic amb el tema dels monuments. En el cas de València, les taules les tinc organitzades per districte municipal. Vaig parlar amb Amador i em va dir que funcionen bé com entitats administratives (P131). Recentment vàrem fer un experiment i també agarra per a P131 els barris.

La cosa és que veig que voleu que queden amb el P131 del municipi de València. No hi ha cap problema, perque podem ficar dos valors. Una altra solució (quan sàpiga més de Sparql) és fer els queries de manera que incloga els monuments de les particions (és a dir, que si demane un districte també done els que porten al P131 el valor d'algú dels barris del districte, i de la mateixa manera que si tenen el valor d'un districte també apareguen quan cerques per el municipi.

De moment estic centrant-me a la comarca dels Ports, perque el 25 de juliol hi ha un acte (que no podrè anar-hi). Deixe d'esborrar el P131 = Q8818, que no estava de guerra d'edicions, només era desconeixement.

Sort! B25es (talk) 15:43, 17 July 2020 (UTC)[reply]

@B25es: Hauria de saber de quines edicions parlem per poder dir alguna cosa amb trellat. Ara bé, la intenció no és duplicar l'entitat administrativa; de fet, jo mateix he tret entitats administratives redundants quan les he vist. Si hi ha el districte no cal el municipi. Si he estat posant-lo (que no ho sé) deu ser perquè alguna cosa se li ha escapat al bot. A banda d'un mal funcionament, la causa més probable és que el districte que hi hagués a l'element no tingués el located in the administrative territorial entity (P131) del municipi o d'una altra subdivisió del municipi (o sigui, que no hi ha una cadena de located in the administrative territorial entity (P131) des del monument fins al municipi).
Com deia, també pot ser mal funcionament del bot, però no crec perquè diria que amb els districtes de Barcelona ha funcionat bé. I si vaig repetint la mateixa edició és perquè si torno a passar el bot pel mateix lloc i les circumstàncies són les mateixes, el bot arriba a la mateixa conclusió encara que sigui equivocada.
En tens algun exemple?--Pere prlpz (talk) 15:55, 17 July 2020 (UTC)[reply]
@B25es: M'he mirat les teves contribucions. Si el problema és per uns quants monuments de Campanar, el problema venia de que Campanar (Q10860052) no tenia located in the administrative territorial entity (P131). Aleshores, la query detectava que els monuments de Campanar no estaven en cap municipi ni en cap subdivisió d'un municipi i per això el bot hi afegia València. Em va cridar l'atenció que el bot estigués posant municipi a un grapat de monuments, m'ho vaig mirar i ho vaig arreglar [6] per que no tornés a passar. El que no vaig fer va se treure el municipi redundant de tots els monuments, però si el treus, ara el bot ja no l'hauria de tornar a posar.--Pere prlpz (talk) 16:10, 17 July 2020 (UTC)[reply]
@B25es: I recuperar el municipi encara que hi hagi el districte es pot fer:
#Monuments de València per entitat administrativa
SELECT DISTINCT ?item ?itemLabel ?adm ?admLabel
WHERE {
  ?item wdt:P131 ?adm.
  ?adm wdt:P131* wd:Q8818.
  ?item wdt:P1435 [].
SERVICE wikibase:label {
bd:serviceParam wikibase:language "[AUTO_LANGUAGE],ca,en,es,an,eu,pl,sv,ceb" .
}
}
Try it!
A la meva pàgina d'usuari hi ha unes quantes. Algunes estan relacionades amb els monuments i moltes amb la geografia i potser et poden fer servei.--Pere prlpz (talk) 16:19, 17 July 2020 (UTC)[reply]
  • Per a provar, he canviat Q2343754 i li he ficat el P131 de Ciutat Vella (llevant el de València).
    He provat el teu qwery i a més l'he fet còrrer amb P131 = Q5720. Molts bons resultats. I ja hi han inclosos més de 6600 monuments! B25es (talk) 07:28, 18 July 2020 (UTC)[reply]

Why merging 2 different churches in Cadalen ?[edit]

Hello @Pere prlpz:
Why did you merge remains of old church Notre-Dame of Cadalen and the new Notre-Dame-de-l'Assomption ? Thanks in advance to check again, --FHd (talk) 06:23, 6 August 2020 (UTC)[reply]

@FHd: J'ai des-fait mes éditions sur les deux items. Je pense que l'origine de mon erreur est en cawiki et je l'ai corrigé. Je vais élever autrefois les données de ca:llista de monuments del districte d'Albi sur l'église qu'est un monument historique - je espéré que a l'item correcte.
Je vois que les deux églises an le mémé label en anglais et aussi que je ne suis le premier a mettre des informations sur le mauvaise église. Ce peut être a l'origine de plusieurs erreurs. Il pot être bon de les donner labels différents.--Pere prlpz (talk) 09:17, 6 August 2020 (UTC)[reply]
@FHd: Furthermore, the new church had the commonscat claim pointing to the category of the old one. I think that that lead me to mistakenly confirm that both elements were about the old church.--Pere prlpz (talk) 09:25, 6 August 2020 (UTC)[reply]
Merci beaucoup d'avoir corrigé si rapidement, en effet, l'erreur n'est pas nouvelle et je n'ai pas pris la peine de renommer la category de Common. Gràcies, --FHd (talk) 09:44, 6 August 2020 (UTC)[reply]

Hotel[edit]

Hi! You set hotel (Q27686) as a subclass of "building" (Special:Diff/1279151360). Hotel as business and hotel as building however are different and shouldn't be mixed (see also Talk:Q27686). Different properties and property constraints apply to these. Item about building class is hotel building (Q63099748) and individual hotel buildings should be set as an instance of that item. 2001:7D0:81F7:B580:4868:30E6:F5AF:F4D0 17:49, 22 September 2020 (UTC)[reply]

We sent you an e-mail[edit]

Hello Pere prlpz,

Really sorry for the inconvenience. This is a gentle note to request that you check your email. We sent you a message titled "The Community Insights survey is coming!". If you have questions, email surveys@wikimedia.org.

You can see my explanation here.

MediaWiki message delivery (talk) 18:46, 25 September 2020 (UTC)[reply]

Alacant (província d') i les seues coordenades[edit]

Hola. He modificat les coordenades de Q71678672. Estic fent més monuments -normalment Bens Immobles d'Etnologia- i mire els que n'hi ha. A la província d'Alacant (he trobat el mateix problema a moltíssims municipis, no sé si algú se'n salvarà) l' encarregat de la Generalitat ha ficat les mateixes coordenades per a tots els monuments, unes dades que corresponen al centre de la ciutat d'Alacant. Òbviament estàn malament (no sé si realment hi ha alguna cosa on les coordenadas marquen). Així que vaig esborrant-les o -si hi ha sort- canviant-les. B25es (talk) 08:46, 17 January 2021 (UTC)[reply]

@B25es: Mirant el que hi ha a les coordenades on abans hi havia Water supply system in Partida de Ferriol, Elx (Q71678672) sembla que com a molt en queden dos per arreglar.--Pere prlpz (talk) 09:46, 17 January 2021 (UTC)[reply]
Gràcies. Pensava que'n serien dotzenes o més. Quan trobe eixes coordenades, directament me les bote. B25es (talk) 10:04, 17 January 2021 (UTC)[reply]

masias and their P31 values[edit]

Hi there! I noticed that there are are 14,485 items on Wikidata with instance of (P31) building (Q41176) and instance of (P31) masia (Q585956) (which is subclass of (P279) house (Q3947), which is subclass of (P279) residential building (Q11755880), which is itself subclass of (P279) building (Q41176)). I was thus wondering if you would find it safe or not to remove the "instance of (P31) building (Q41176)" statements on those items on account of this subclass relationship. Mahir256 (talk) 03:43, 3 February 2021 (UTC)[reply]

I'm unsure about what is Wikidata policy about this issue, but it's clear that all masies are buildings.
However, I see two reasons to keep the redundant instance of (P31):
In summary, I know the facts but I'm unsure about how Wikidata policies deal with them.--Pere prlpz (talk) 09:50, 3 February 2021 (UTC)[reply]

coordinate replacements[edit]

Why are you striking any existing coordinates on an item before adding a new one? Mahir256 (talk) 21:30, 13 February 2021 (UTC)[reply]

@Mahir256: Items should have just one value of coordinate location (P625) - in fact, that's a restriction on coordinate location (P625). Anyway, if an item had more than one value of coordinates, I think Quickstatements would remove just one.
I'm comparing the coordinates of items in Wikidata and its article in cawiki with the coordinates of items with located in the administrative territorial entity (P131) (or equivalent properties) set to the item. When the coordinates in cawiki are placed more among the coordinates of items in the item, I replace coordinates in Wikidata. If coordinates in Wikidata are more central, then I just strip the template coord in the article in cawiki for it to use Wikidata coordinates.
Anyway, if you check old and new coordinates of an item, and you think that the old ones are better, please feel free to revert.--Pere prlpz (talk) 21:38, 13 February 2021 (UTC)[reply]
The issue I have is not so much that you're trying to satisfy the single value constraint (I've also gone through items with duplicate coordinates manually), but rather that, on an item like Montpelier (Q26426), you've struck coordinates cited to the United States Board on Geographic Names (Q1148422), a government agency (and thus an external source), and replaced them with those from your own-language Wikipedia (which is not an external source, and as far as new information goes shouldn't be used where external sources are appropriate). Your replacement criteria should have taken into account the likelihood that the existing coordinates on the Wikidata item were sufficiently correct to begin with, rather than using some rigid notion of "centrality" between the two. Mahir256 (talk) 21:43, 13 February 2021 (UTC)[reply]
@Mahir256: Then, what course of action do you suggest? Leaving both sets of coordinates? Not removing coordinates if they have a non-Wikipedia reference?
My main concern here are French cantons, some of which have very bad coordinates in Wikidata, with no references. Here I'm quite sure that comparing canton coordinates with coordinates of the comunes in the canton is the best way to decide between different sets of coordinates. However, for other kinds of items, different criteria could be used.
And it should be noted that a lot of official sources contain inaccurate or even plainly wrong coordinates. I know because I've uploaded thousands of coordinates from official sources. Keeping them when they contradict what we can see in any map isn't very useful, unless Wikidata had a policy to keep them as deprecated.--Pere prlpz (talk) 22:01, 13 February 2021 (UTC)[reply]
@Mahir256: I revert the change in Montpellier. It wasn't a great improvement.
For now, I stick to uploading only French cantons until deciding what to do with other kinds of items - whether referenced coordinates should be kept and when single value requirement should be fulfilled or not.--Pere prlpz (talk) 22:22, 13 February 2021 (UTC)[reply]
You could of course leave both provided that you returned later to actually check whether the added coordinate was necessary. Here's a query that shows items on a map based on the maximum distances between any two P625 values on each item (place your list of items for your QS batch, for example, in the VALUES block like so):
#defaultView:Map
SELECT ?i ?iLabel (SAMPLE(?c) as ?cs) (MAX(?dist) as ?layer) { 
  VALUES ?i { wd:Q26426 wd:Q984372 wd:Q2610570 }
  ?i p:P625 ?a ; p:P625 ?b. FILTER(STR(?a) < STR(?b))
  ?a ps:P625 ?c . ?b ps:P625 ?d.
  BIND(geof:distance(?c,?d) as ?dist)
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
GROUP BY ?i ?iLabel
Try it!
I'm not suggesting that the externally sourced coordinate must be kept always, but rather that if it is correct to begin with, changing it isn't necessary. I've noticed large differences in coordinates for French arrondissements (I too have compared commune coordinates with those of their corresponding arrondissement in verifying these), so I understand your concern for verifying the correctness of cantonal coordinates. The single value constraint should of course be fulfilled (noting that if uniquely qualified appropriately, multiple coordinates could be present), and while personally I remove entirely incorrect externally sourced coordinates, if someone else happens to harass you about it, you may wish to just deprecate the bad ones. Mahir256 (talk) 22:32, 13 February 2021 (UTC)[reply]
@Mahir256: If I'm understanding well, you suggest to upload the new set of coordinates without removing the previous one and use the query to decide which to keep. I think I already have done that work - although I might have been too bold when extrapolating the situation from French cantons to other kinds of places like American cities, and I should check further.
I have already checked distance between coordinates in cawiki and Wikidata for all articles that had both - that were over 18000 articles some days ago. After taking in account the kind of each geographical object and its available dimensions, in over 14000 of them the distance were small enough to see both sets of coordinates as equivalent and I just discarded coordinates from articles. A lot of the remaining ones will need to be checked by hand, but now I'm trying to find for which administrative divisions the coordinates in Wikidata are placed outside of the item area or too near their edges. After having sampled a lot of items (mostly French cantons, but also London districts and other items), when the coordenates in cawiki are more central among items in the administrative unit than those in Wikidata, changing the coordinates is an improvement - that is, they become closer to where anybody would place them when looking at a map. Of course, not for all cantons coordinates in cawiki are more central than coordinates in Wikidata, and for a lot of them coordinates in articles are just dropped without uploading them to Wikidata.
If you are interested in the details, you can see for the latest version of the code https://github.com/pere-prlpz/viquipedia/blob/master/treucoord.py (which includes computing distances between both coordinates), ca:Usuari:PereBot/coordenades duplicades for reports on the coordinates that (still) haven't been dropped from articles (probably more interesting https://ca.wikipedia.org/w/index.php?title=Usuari:PereBot/coordenades_duplicades&action=history since it's a dynamic process) and ca:Especial:Contribucions/PereBot for the coordinates that have been dropped in previous several days.--Pere prlpz (talk) 23:24, 13 February 2021 (UTC)[reply]

Pregunta sobre descripció als ítems de wikidata[edit]

Estic aprenenent a fer servir wikidata, i tinc (al menys) una pregunta. Per exemple, sobre les platges de la costa catalana. Fent una consulta senzilla, hi observo que hi ha dos tipus d'incoherència a la descripció de cada element: en català, pot ser "Platja de Cambrils", "Platja de la Costa Brava", "Platja a Lloret", "Platja catalana", "platja espanyola", etc. I les definicions de diferents llengües no són les mateixes. No caldria que hi hagués una coherència descriptiva en tots dos casos? – The preceding unsigned comment was added by Quelet (talk • contribs).

@Quelet: Sí i no, però diria que més aviat no gaire.
La funció de la descripció és desambiguar. A les viquipèdies es desambigua per títol, però a Wikidata els labels van sense desambiguar i l'única desambiguació és per la descripció. Aleshores, la descripció ha de servir sobretot per distingir entre homònims i per, quan busques, saber si allò que estàs trobant és allò que busques, sobretot si hi ha molts elements amb noms semblants. Si poses Can Duran o Mas Duran a la casella de cerca veuràs què vull dir.
Per diferents usuaris pot ser útil diferent nivell de detall i de context. Per exemple, per un usuari alemany "Strand in Spanien" li pot semblar context suficient, però per nosaltres és és més útil que en una platja de la Costa Brava ens donin el municipi i com a molt la comarca, i afegir-hi Catalunya o Espanya no ens aporta més informació. A més, per diferents elements pot ser necessari un nivell diferent de desambiguació. Per exemple, per les cases sol anar molt bé el municipi, però de vegades tenim dues cases amb el mateix nom al mateix municipi, i fins i tot al mateix nucli o el mateix carrer, i aquestes hauran de portar una desambiguació a mida.
A més, moltes descripcions són fetes automàticament, que és l'única manera de portar més o menys al dia 93 milions de descripcions, i aquí el nivell de detall depèn de les ganes i la perícia de qui les està fent, però solen ser molt genèriques (com les d'un bot neerlandès que em posava "gebouw in Spanije" a cada masia que creo), o equivocades (com una pila de "building in Lleida province, Spain" que en realitat són a Osona). A això cal afegir-hi que el software Wikidata no admet (o intenta evitar) dos elements amb el mateix label i la mateixa descripció, cosa que per mi és un problema quan intento copiar labels d'edificis del català a l'anglès i sovint no em deixa perquè ja hi ha un altre edifici amb la mateixa etiqueta (sigui perquè és l'etiqueta buida o perquè és l'etiqueta estàndard que diu la província).
Un tema a banda és que de vegades es fan servir les descripcions per altres coses, com ara posar-les en llistes automàtiques, però això entenc que m'és un mal ús, si més no en llistes adreçades al lector. Si volem mostrar una descripció a la llista, la podem fer a mida a partir de les propietats que ens semblin més adients.
En resum, necessitat d'homogeneitzar no n'hi veig cap. Conveniència de millorar, potser sí, tot i que no em sembla una feina gens prioritària. De fet, em sembla que només és factible en conjunts petits, com ara les plateges de la Costa Brava, però com vulguis anar gaire més enllà tens milers o milions d'items amb moltes llengües. Jo com a molt em dedico a omplir descripcions absents, corregir-ne d'equivocades i de vegades tocar-ne alguna que no desambigua prou bé o que m'impedeix crear un element, però no faria gaire més. És més, si faig això és perquè em ve més o menys de pas fent altres coses (com ara pujar edificis a Wikidata).--Pere prlpz (talk) 10:34, 3 May 2021 (UTC)[reply]
Moltes gràcies, crec que m'ha quedat força clar. Tal com dius, en el cas de conjunts com aquest, "platges de Catalunya", que és possible que sigui consultat com a llista, no estaria pas malament homgeneïtzar la descripció en català. És clar que, "platja" vol dir dues coses al menys: accident geogràfic (tangible), i espai turístic on es va a gaudir del bon temps l'estiu (o a passejar el gos, o a caminar...). Tinc una mica d'embolic mental amb el tema de subclasses, instàncies, etc etc... em caldria un curs de wikidata. En saps algun? (pot ser en anglès). Quelet
@Quelet: Sobre l'ajuda o el curs, m'imagino que Wikidata:Tours deu ser un bon lloc per començar, però no l'he fet servir mai. Potser en Amadalvarez té algun recurs més.
Sobre les platges de Catalunya, si els lectors les consulten com a llistes, aquestes llistes no haurien d'incloure les descripcions de Wikidata. Fora d'això, tu mateix. Entenc que mentre no es perdi informació ni desambiguació no crec que hi hagi problema, especialment si substitueixes una descripció automàtica estereotipada per una de millor feta a mà, encara que això sigui el contrari d'estandarditzar.
I amb les platges hi ha el mateix problema que amb rius, mars, badies i unes quantes coses més: que parts d'una platja es poden considerar també una platja, amb l'afegit que diferents divisions (totes amb referències) poden donar un abast diferent al mateix nom.--Pere prlpz (talk) 11:37, 3 May 2021 (UTC)[reply]
@Quelet, Pere prlpz: No He fet mai cap dels tours i no tinc opinió, però segur que per algú molt novell, sempre serà útil. Sóc més partidari de Wikidata:Glossari i de Help:Ajuda, on per exemple, hi ha un capítol dedicat a les descripcions. Altra opció és preguntar com has fet ara, als frikis que correm més per aquí que per la VP. Quan estiguis una mica familiaritzat, avisa que et passaré un parell d'enllaços del següent nivell. Salut !. Amadalvarez (talk) 12:28, 3 May 2021 (UTC)[reply]
@Quelet, Pere prlpz: Em deixava una cosa. Tal com ha explicat el Pere les descripcions són un complement al label que és el que val. A més d'ajudar a desambiguar quan estàs veient l'item, apareixen com si fos un sot-títol del label quan estàs entrant un valor en un altre item, quan lògicament, no tens més elements per distingir. Un altre dada, els àlies. No tenen cap funció descriptiva ni de desambiguació, Però les cerques es fan pels labels i pels àlies. De fet, actuen com les redireccions que es fan a VP per tenir sinònims d'un concepte. Apalis ! Amadalvarez (talk) 14:54, 3 May 2021 (UTC)[reply]

Russian category[edit]

It's OK, that's removed to another. AndrzejBełżyński (talk) 11:15, 13 May 2021 (UTC)[reply]

@AndrzejBełżyński: Please say why it is OK. At least some of the links haven't been moved to another item, and they seem to have been right where they were. Why wasn't OK to leave they where they were?
Is it OK to just revert your edits?--Pere prlpz (talk) 11:19, 13 May 2021 (UTC)[reply]

IPAC duplicats[edit]

Hi ha tres codis IPAC que són a dos articles cada un: El Ingenio (Q11918354) i El Ingenio (Q44698596); Fabra i Coats (Q11921473) i Fabra i Coats (Q104392918); i Museu d'Art Modern de Tarragona (Q9046976) i Casa Martí (Q103821078). El segon element de cada parell es refereix a l'edifici en si i el primer a l'organització que l'ocupa. Així doncs, vaig esborrar fa un temps l'IPAC dels primers. Però veig que els vas reafegir amb un quickstatements, suposo que comparant-ho amb algun lloc com la Viquipèdia. Et sembla bé que els torni a esborrar? El que també he pensat és que podríem fusionar cada parell, si consideréssim que l'organització només és notable per l'edifici que ocupa. Però no crec que sigui cert en els tres casos. --FogueraC (talk) 16:44, 16 July 2021 (UTC)[reply]

@FogueraC: Si l'estic afegint amb quickstatements on no toca deu ser que en una llista de monuments el camp wikidata està enllaçat a l'item de l'organització en comptes de l'item de l'edifici. Si es corregeix a la llista, el proper cop que el robot hi passi pujarà a Wikidata les dades de la llista que faltin a l'item enllaçat i no a l'altre.--Pere prlpz (talk) 17:10, 16 July 2021 (UTC)[reply]
D'acord, doncs provo de corregir-ho. Gràcies! --FogueraC (talk) 17:18, 16 July 2021 (UTC)[reply]

Creus de terme gòtiques[edit]

En les creus de terme, pots canviar Gothic architecture (Q176483) per Gothic sculpture (Q1277524)? Tot i que estiguin classificades com a patrimoni arquitectònic, la part rellevant és l'escultòrica. --Vriullop (talk) 09:32, 26 August 2021 (UTC)[reply]

@Vriullop: He modificat el programa perquè ho faci amb els monuments nous, però no ho acabo de veure clar. La propietat que comprovo i faig servir és architectural style (P149) i em grinyola una mica que l'estil arquitectònic sigui Gothic sculpture (Q1277524). Per altra banda, una creu de terme és un element arquitectònic, i tampoc em convenç no posar-li architectural style (P149) i fer servir només una altra propietat com ara movement (P135). Potser, com a elements arquitectònics amb escultura se'ls podria posar Gothic architecture (Q176483) a architectural style (P149) i Gothic sculpture (Q1277524) a movement (P135). La primera és el que feia el meu programa fins ara. La segona es podria fer amb diferents eines.
De fet, amb els estils no hi ha massa consistència a Wikidata, i com passar de l'estil que diu a la llista a un element de Wikidata m'ha generat dubtes des del principi (Wikidata:La_taverna#Modernisme_/_modernisme_català).--Pere prlpz (talk) 17:21, 26 August 2021 (UTC)[reply]
Tens raó, doncs deixar-ho córrer, no té gaire importància. --Vriullop (talk) 07:01, 27 August 2021 (UTC)[reply]

Call for participation in a task-based online experiment[edit]

Dear Pere prlpz,

I hope you are doing good,

I am Kholoud, a researcher at King's College London, and I work on a project as part of my PhD research, in which I have developed a personalised recommender system that suggests Wikidata items for the editors based on their past edits. I am collaborating on this project with Elena Simperl and Miaojing Shi.

I am inviting you to a task-based study that will ask you to provide your judgments about the relevance of the items suggested by our system based on your previous edits. Participation is completely voluntary, and your cooperation will enable us to evaluate the accuracy of the recommender system in suggesting relevant items to you. We will analyse the results anonymised, and they will be published to a research venue.

The study will start in late January 2022 or early February 2022, and it should take no more than 30 minutes.

If you agree to participate in this study, please either contact me at kholoud.alghamdi@kcl.ac.uk or use this form https://docs.google.com/forms/d/e/1FAIpQLSees9WzFXR0Vl3mHLkZCaByeFHRrBy51kBca53euq9nt3XWog/viewform?usp=sf_link I will contact you with the link to start the study.

For more information about the study, please read this post: https://www.wikidata.org/wiki/User:Kholoudsaa In case you have further questions or require more information, don't hesitate to contact me through my mentioned email.

Thank you for considering taking part in this research.

Regards

Kholoudsaa (talk) 19:06, 8 January 2022 (UTC)[reply]

WD i WP de centres docents[edit]

Pere, per aprendre a programar en Python i anar-me sentint més còmode en l'ús de crides a diferents APIs i paquets de Python, he fet un script per posar (de forma individual) l'etiqueta wikidata i la name:etymology:wikidata als centres docents de Catalunya (+PV+IB). Afortunadament, les persones que editen nodes, vies i relacions d'OSM de centres docents hi posen la referència de les dades obertes de la Gencat, igual que vam fer nosaltres amb la importació a WD a Cat i d'altres persones a IB i PV.

Tenim com a possible projecte promoure que els centres docents vagin millorant les entrades a WD del seu centre. Tu mateix estàs posant-hi fotos, seria fantàstic que tots els centres tinguessin fotos, dada de fundació, epònim, etc... Tres preguntes, aquí:

(1) Quina informació podríem suggerir a cada centre docent que hi posés (per exemple, les tres coses que he esmentat). Ara mateix a cada entrada WD ja hi ha número d'estudiants, i si escau: número d'estudiants de BAT i número d'estudiants finançats amb fons públics (per a centres concertats). No sé si podrien importar alguna altra dada oberta.

(2) Seria interessant i adient crear de forma automatitzada una pàgina a Viquipèdia amb les dades actuals de cada centre docent (via WD), perquè així ja la tinguin creada, una mica com si fos una plantilla? Amb les categories que es decidís, és clar. Molts de centres docents tenen ja una pàgina d'història al seu web, segurament que podria ser un bon treball per fer a classe o per la pròpia direcció del centre. O és millor que se la creï cadascú?

(3) OSM proporciona la geometria (excepte si ha estat declarat com a node només) del centre docent. Quina seria la millor manera de fer-la aparèixer a la possible pàgina de Viquipèdia, més enllà de la localització (lon, lat) que ja hi ha per a cada centre docent a WD?

Per anar-hi pensant, gràcies a l'avenç! @Amadalvarez: Quelet (talk) 13:56, 28 July 2022 (UTC)[reply]

@Quelet: Abans d'afegir més dades, crec que l'urgent és arreglar la pujada que s'ha fet. Particularment hi veig dues coses importants:
  • Els duplicats: No sé quin sistema de control vau fer servir per detectar duplicats però sembla que no ha funcionat gaire. Entenc que és llaminer posar-se a pujar escoles sense buscar duplicats perquè és la tasca més lenta, i fer-ho bé vol dir passar-s'hi setmanes en comptes de fer-ho tot en uns minuts o poques hores, però si no es va fer quan es va pujar s'hauria de fer ara. Crec que en alguns llocs com Sarrià totes les escoles que ja hi havia es van duplica4. Això es pot fer amb Python o fins i tot amb una query o amb Wikishootme (jo ho feia amb R), fent un mapa clicable dels centres educatius i comprovant manualment totes les parelles de punts massa propers si són el mateix centre o no, i fusionant-los. Amb altres topònims jo ho feia amb R (abans de la pujada) representant en dos colors els centres pujats i els que ja hi eren, però es pot fer amb moltes eines ara que ja són a Wikidata. Naturalment, fent servir el nom (sense la part genèrica), el municipi i les coordenades hauria de ser fàcil trobar automàticament la majoria de duplicats, de manera que el mapa només caldria per acabar de fer net.
  • Els noms: Entenc que noms com "Centre educatiu privat Escola Pia de Sarrià-Calassanç" és com deu sortir a la llista del departament perquè algú ha decidit posar la classificació al camp del nom, i segurament seria útil tenir això com a àlies, però això no és el nom de l'escola, que es diu "Escola Pia de Sarrià-Calassanç", i em temo que passa el mateix amb totes les escoles privades (les públiques no me les he mirades). Deu haver-hi casos que s'hagin de revisar a mà, però hauria de ser fàcil treure automàticament el nom de l'escola en la majoria de caos.
De la resta crec que en podríem parlar quan s'hagi arreglat això, però:
  • Crear automàticament articles de totes les escoles em sembla una molt mala idea, per començar perquè la immensa majoria no són notables. Fer-ne una llista automàtica no sé si es podria perquè no recordo que mai s'hagi plantejat fer llistes automàtiques de temes tan poc notables i no sé com s'ho prendria la comunitat.
  • Tot i que la neutralitat sembla més robusta a Wikidata que a la Viquipèdia, convidar les escoles a omplir-se les seves dades a Wikidata pot ser complicat i ens podem trobar amb edicions sense referències o sense canviar les referències i amb un cert biaix. Ara bé, és cert que algunes dades les podrien posar les escoles, com la pàgina web i la foto. L'any de creació potser també. No m'he mirat quines propietats més hi ha que siguin aplicables a escoles.
  • Per relacionar un item amb un objecte d'OSM crec que es fa amb OpenStreetMap relation ID (P402).--Pere prlpz (talk) 21:42, 28 July 2022 (UTC)[reply]
Pere, moltes gràcies per la resposta.
  • M'adono que no he tingut en compte gaire el conflicte d'interès en el cas de pàgines VP d'un centre docent, ni tampoc el criteri de notabilitat. Em fa l'efecte que el valor de tenir tots els centres docents a wikidata és precisament que hi siguin tots, amb dades referenciables. I tal com dius, una cosa és la base de dades, i una altra la viquipèdia. Les propietats que es podrien afegir a una entrada (foto, data de creació, url, ...) són objectives, però potser hi ha alguna manera indirecta de fer-ho on no hi hagi cap conflicte d'interès.
  • Del tema dels noms de les escoles, hi estic d'acord. Als centres públics, és més fàcil en general: o són instituts o són escoles (encara que a la retolació i a la parla popular se'n pugui dir encara IES, CEIP, etc.). Als centres privats, certament els noms no són "centre educatiu privat..." Potser es podria posar a l'alias. En tot cas sembla un tema relativament fàcil.
  • Pel que fa a la pròpia importació, és lògic que hi hagi casos de duplicats, especialment en escoles públiques i centres educatius privtats de Barcelona i poblacions grans. Jo també vaig mirant de corregir-ho. En el cas d'Instituts, sí que vaig esmerçar una colla de dies via OpenRefine a què no hi hagués duplicats. Però semblava que a nivell de centres de primària o privats hi hauria pocs casos. Lògicament les escoles privades amb més tradició són les que poden haver quedat amb duplicat, i més en una zona tan rellevant com Sarrià. Destinaré temps d'aquest mes d'agost a anar-ho corregint i fer neteja abans de continuar, tal com suggereixes. Quelet (talk) 06:08, 29 July 2022 (UTC)[reply]
@Quelet:
  • Si hi ha pocs duplicats pot ser més fàcil trobar-los, perquè només cal buscar les escoles amb un Q més baix que els teus i comprovar si també les vas pujar (essent pocs no ha de costar gaire comprovar-los tots). Buscar les escoles sense les referències que tu posaves pot ser encara més efectiu perquè no sortiran les escoles que ja s'hagin fusionat.
  • Involucrar les escoles en actualitzar les seves dades pot ser menys perillós que fer el mateix a la Viquipèdia (no se m'ocorre com una escola podria pujar unes dades esbiaixades) però sí que em sembla més complicat, especialment perquè les dades no tenen una aplicació directa que ho faci atractiu per les escoles (a menys que sí que tingueu pensada una aplicació atractiva).
  • Donant-li voltes al tema de les llistes automàtiques, potser es pot fer, i de fet les escoles ja estan sortint a la llista de topònims dels municipis. Ara bé, jo preguntaria a la Taverna per si de cas. Les llistes de ponts o de masies poden servir de mostra.--Pere prlpz (talk) 09:35, 29 July 2022 (UTC)[reply]
Pere
  • Fer llistes automàtiques és fàcil. No era pas una qüestió que plantegés, però.
  • El problema és construir una consulta SPARQL que detecti les escoles de primària i centres privats duplicats... perquè cadascú hi posa el P31 que li sembla bé. Ho analitzaré una mica a veure si en trec l'entrellat. O potser es pot buscar pel propi nom, i mirar quin no té referència, i per tant no pertany a la importació, en la línia que proposes.
  • Pel que fa aplicació atractiva, més enllà dels mapes, hi ha la geolocalització d'escoles amb epònim femení, epònim de persona de ciència, etc. També mapes amb la mida del centre docent, el seu caràcter, etc. Tens raó, una cosa és el valor intrínsec d'un sol Q de WD, i un altre el valor de disposar del conjunt de centres docents amb dades com número d'estudiants, etc.
Hi seguiré treballant, gràcies! Quelet (talk) 11:22, 29 July 2022 (UTC)[reply]
@Quelet: Obtenir els centres educatius encara que tinguin instance of (P31) diferents no és problema:
# centres educatius de Catalunya per tipus
SELECT DISTINCT ?centre ?centreLabel ?coordinate ?layer ?layerLabel
WITH {
  SELECT ?centre 
WHERE {
  ?centre wdt:P131* wd:Q5705.
 } } AS %1
WHERE {
  INCLUDE %1.
  ?centre wdt:P31/wdt:P279* wd:Q5341295.
  ?centre wdt:P625 ?coordinate.
  ?centre wdt:P31 ?layer
SERVICE wikibase:label {
bd:serviceParam wikibase:language "ca,en,es" .
}
}
#defaultView:Map
Try it!
Només cal que el P31 de cada centre sigui subclass of (P279) de educational organization (Q5341295) o d'una subclasse seva.
Si vols mostres de consultes semblants de trobar topònims, a la meva pàgina d'usuari n'he anat guardant unes quantes.
Per cert, mirant el mapa em sorprèn que no hi hagi cap centre educatiu a la Conca d'Àger i voltants. O realment no n'hi ha cap, o tenim centres amb una P31 que no és subclasse de educational organization (Q5341295), o és que hi ha centres sense coordenades (que aquesta query no trobaria).--Pere prlpz (talk) 11:41, 29 July 2022 (UTC)[reply]
Naturalment es pot buscar P279*. Jo tenia el problema que la consulta se'm tallava per temps excedit... amb aquest sistema teu, no (no acabo de veure per què, però és un fet). Gràcies! Molt útil! Quelet (talk) 12:10, 29 July 2022 (UTC)[reply]
L'Escola Andreu Farran d'Àger hi és... amb coordenades de Solsona! realment em vaig sorprendre de la manca de qualitat de les dades d'ubicació, a llistat de la GenCat. No m'estran que la gent d'OSM no se'n refiï pas gaire, de les dades de WD... Ja n'he trobat d'altres, d'errors manifestos com aquest. Què hi farem! Feina de formigueta. Quelet (talk) 12:13, 29 July 2022 (UTC)[reply]
@Quelet: Per que no es pengi cal fer servir una subquery (d'aquí que hi surti un %1 a l'expressió). Optimitzar queries és un art que no domino però em temo que és més complicat que fer les queries en sí. Si t'interessa: Wikidata:SPARQL query service/query optimization.
La manca de qualitat amb les coordenades me l'he trobat en altres llocs, fins i tot en fonts de l'ICGC que se suposa que són professionals d'això. Aquí em temo que l'única solució (sobretot per als errors grollers com aquest) és el que diuen els estadístics: fes el que vulguis però, a més, representa les teves dades. Representar al mapa totes les escoles d'una comarca o un municipi per trobar els punts perduts per altres llocs sense motiu pot ser útil per trobar aquestes coses.
El problema d'OSM amb WD crec que és sobretot de llicències: aquestes dades dels institut que pugem a Wikidata com si fossin de domini públic, són probablement de domini públic a gairebé tot el món però no al Regne Unit, on hi ha l'OSM.--Pere prlpz (talk) 12:29, 29 July 2022 (UTC)[reply]
@Quelet: Em sap greu ser aixafaguitarres un altre cop, però mirant el mapa estic trobant instituts que no estan duplicats però tenen les coordenades duplicades,[7] i un element no hauria de tenir més que unes coordenades (si no és que porten qualificador perquè són coses diferents).--Pere prlpz (talk) 11:47, 29 July 2022 (UTC)[reply]
Pere, aquí sí que tens tota la raó... en treballar via OpenRefine, les coordenades velles no van ser substituïdes per les noves (noves a vegades incorrectes, del llistat GenCat!)... hi he d'anar treballant per polir-ho. És una feina una mica detectivesca :-) Quelet (talk) 12:08, 29 July 2022 (UTC)[reply]
@Quelet: Sí, als que m'he mirat, les coordenades que hi havia (sovint pujades de la Viquipèdia) estaven una mica millor que les de la Generalitat. Pel que m'he trobat, això sol passar amb les fonts oficials, que deuen treballar amb menys precisió que els viquipedistes mirant un mapa. De fet, quan estic netejant coordenades duplicades i les dues són molt properes, de vegades me n'afarto de coprovar-les totes per arribar sempre al mateix resultat i esborro les que tenen referències per deixar les de la Viquipèdia (si no són molt properes aleshores me les miro perquè errors grollers n'hi pot haver a tot arreu).--Pere prlpz (talk) 12:18, 29 July 2022 (UTC)[reply]
Pere, has esmentat que no acabares de veure bé crear articles a la Viquipèdia a partir de les dades de cada centre educatiu a Wikidata. Ho entec. Ara bé, em pregunto per què s'ha fet, per exemple, amb muntanyes: https://ca.wikipedia.org/wiki/Puig_de_les_Àguiles total... per dir el que ja diu wikidata... Bona tarda! Quelet (talk) 14:58, 5 August 2022 (UTC)[reply]
@Quelet: Em deixes una mica parat. Necessites que et busqui jo els enllaços als criteris d'admissibilitat de centres educatius (i al debat que van portar) i a les darreres propostes d'esborrat de muntanyes i escoles? Cal que et busqui la pàgina de "com el meu n'hi ha d'altres"? O m'estàs dient una altra cosa?--Pere prlpz (talk) 14:40, 6 August 2022 (UTC)[reply]
Pere, com ja saps no tinc la vostra experiència en aquests temes. Després de preguntar-te això ja he vist alguna de les llargues discussions sobre el tema. Així i tot, si fossis tan amable de donar-me'n alguna d'especialment rellevant, t'ho agraïria, per entendre-ho millor. Moltes gràcies! Per cert... ja estic aconseguint entrar els districtes als centres educatius de Barcelona, amb el meu primer pywikibot :-) Quelet (talk) 14:49, 6 August 2022 (UTC)[reply]
@Quelet: El motiu principal pel que crec que els articles de la majoria d'escoles durarien menys que el proverbial pastís a la porta de la mateixa escola és que és fàcil veure que no han rebut cobertura significativa per part de fonts fiables independents del subjecte (els directoris no són cobertura significativa i el Departament no és una font independent del subjecte). Les muntanyes tendeixen a ser un cas límit i per això se n'ha redirigit un bon grapat a les llistes, però n'hi ha moltes que com a mínim tenen article a l'Enciclopèdia Catalana i aquestes tendeixen a salvar-se (sovint pels pèls) a les discussions d'esborrat. Amb les masies crec que vam ser una mica més estrictes que amb les muntanyes perquè tenien el problema afegit de ser microesborranys. Per altra banda, comparades amb les escoles, les muntanyes tenen l'avantatge de no ser susceptibles ni sospitoses de conflicte d'interès.--Pere prlpz (talk) 15:09, 6 August 2022 (UTC)[reply]

@Quelet: Tafanejant el mapa buscant duplicats, hi estic trobant també escoles i edificis escolars que haurien d'estar relacionat (els que he trobat ara són un parell de Terrassa que l'edifici escolar també tenia instància d'escola). Potser convindria buscar els edificis escolars que no tenen occupant (P466).--Pere prlpz (talk) 12:59, 29 July 2022 (UTC)[reply]

Un mica és com el que hi ha en aquesta pàgina de discussió, sobre hotel (business) i hotel (edifici), i el que jo he dit algun cop mercat (edifici) i mercat (retrobament de comerciants de forma regular). I d'altres, és clar. Crec que es va dir que era bo separar edifici i escola, posant-hi "localització de la seu" a l'escola/centre docent... Les escoles van evolucionants, ara per exemple se n'amplien, es fusionen per fer-ne instituts-escola, etc. Quelet (talk) 13:22, 29 July 2022 (UTC)[reply]
@Quelet: Sí, [8] i [9], però falta fer-ho.--Pere prlpz (talk) 13:26, 29 July 2022 (UTC)[reply]
Veus... això, ben explicat, cada centre docent hauria de poder-ho fer a WD... és objectiu i neutral. Somniar és de franc :-) . Quelet (talk) 13:32, 29 July 2022 (UTC)[reply]
@Quelet: Els meus somnis són menys ambiciosos. Si una dotzena d'escoles pugessin a Wikidata el seu web i el seu twitter ho consideraria un gran èxit.--Pere prlpz (talk) 13:40, 29 July 2022 (UTC)[reply]
Una pregunta: tu creus que "biblioteca universitària" hauria de ser una subclasse P279* de centre educatiu? Perquè n'és, en aquest moment. Part d'una universiat, sí. Centre educatiu com a tal, no ho sé... Quelet (talk) 13:30, 29 July 2022 (UTC)[reply]
@Quelet: Suposo que en algun lloc s'ha parlat i s'ha arribat a una conclusió, però jo crec que una biblioteca universitària o escolar no és un centre educatiu, sinó que en tot cas és part d'un centre educatiu.[10] Seria el mateix per la sala d'actes, les aules o els gimnasos de les escoles.--Pere prlpz (talk) 13:40, 29 July 2022 (UTC)[reply]
Pere, quines altres dades seria interessant afegir a les entrades WD de cada centres docent? Per exemple l'adreça d'e-mail, el telèfon i l'adreça del seu web, que són dades proporcionades pel llistat de dades obertes de la Gencat. La quantitat de professorat assignat seria interessant? He vist en algunes escoles americanes que s'hi dona aquesta data. I l'afiliació en el cas d'escoles privades de caràcter religiós? (jesuïta, escola pia, maristes, la salle, etc.) Gràcies! Quelet (talk) 06:55, 4 August 2022 (UTC)[reply]
@Quelet: Què és interessant depèn de l'aplicació i a la Viquipèdia ara mateix no estem fent servir aquestes dades perquè estem excloent les institucions (com els centres educatius) de les llistes de topònims i perquè la gran majoria d'escoles no tenen articles on posar una infotaula. De les dades que no tenim, diria que la més important per qualsevol aplicació és el nom. Suposo que si mai fem una llista d'escoles el nombre de professors (si és de fiar i raonablement actualitzat) és informació enciclopèdica. L'afiliació també és interessant. Web, mail i telèfon són progressivament menys enciclopèdics però suposo que si hi ha propietats on posar-les no fan cap mal. L'any de fundació no sé si el tens però també estaria bé. Com deia al principi, tot depèn de què vulguis fer amb aquestes dades. Si vols fer-ne tu llistes automàtiques un bon sistema pot ser anar fent un prototipus de la llista i així veus quines dades et convenen.
Ara bé, si volem demanar ajuda per les fotos (estava pensant en fer un missatge a la Taverna sobre Wikishootme) diria que el més important és endreçar el que ja tenim:
  • Arreglar els duplicats.
  • Relacionar centres educatius i edificis escolars que ja tinguem.
  • Buscar les fotos d'escoles que ja són a Commons i afegir-les a Wikidata (ahir, només mirant de manera no sistemàtica la categoria d'escoles de Barcelona a Commons vaig poder il·lustrar-ne un grapat). Categoritzar les fotos per escola i relacionar-les amb l'item a Wikidata estaria bé però és menys important.--Pere prlpz (talk) 10:07, 4 August 2022 (UTC)[reply]
@Quelet: I les categories de fotos d'escoles no enllaçades a Wikidata deuen estar entre les que surten a https://petscan.wmflabs.org/?psid=22579251 --Pere prlpz (talk) 10:57, 4 August 2022 (UTC)[reply]
Pere, molt interessant aquesta colla de categories de fotos (categories una mica desendreçades, per cert, com sol passar sovint), sense vinculació a vegades amb cap pàgina ni element de wd.
Crec que ja s'han arreglat força duplicats, però suposo que se n'aniran trobant.
Per cert, a les llistes de topònims que en @isidre_blanc ha posat a tots els municipis, sí que hi surten els centres docents. Hi surten (ara mateix) agrupats sota el seu P31.
Posar la quantitat de professorat és molt fàcil, a partir de les dades obertes gencat.
Web, e-mail i telèfon tenen interès social, però no sé pas si en tenen d'enciclopèdic, ja que poden canviar en qualsevol moment. Seria més lògic agafar-los del proveïdor original (gencat) via API o SPARQL. Així i tot els webs dels centres docents solen contenir un apartat d'història, que moltes vegades és l'única font a internet que dóna la informació sobre la fundació, l'epònim, els canvis d'edifici, etc. Quelet (talk) 17:00, 4 August 2022 (UTC)[reply]
@Quelet: Tens raó que els centres educatius surten en algunes llistes de topònims però en d'altres com la ca:Llista de topònims de l'Hospitalet de Llobregat estan excloses les organitzacions (que m'imagino que és el que fa que no hi surtin escoles). Vas pujar les escoles quan bona part de les llistes ja estaven fetes i pot ser que en algunes s'hi colessin els centres educatius.
@Isidre blanc: Teníem el dubte amb en Quelet sobre si els centres educatius (no els edificis escolars) surten a les llistes de topònims. He vist que a Agramunt i a Sabadell sí però a l'Hospitalet de Llobregat no. La intenció era que no sortissin a cap llista? O que sortissin a totes? O només si pel nombre d'elements hi cabien?--Pere prlpz (talk) 19:55, 4 August 2022 (UTC)[reply]
La consulta sparql de l'hospitalet té vàries exclusions, la de Sabadell no. Això fa que en un cas hi surtin els centres docents i en l'altre no. No acabo d'entendre la raó de fer llistes de caire diferent, no seria més lògic un tractament homogeni de les llistes de topònims? (una altra discussió és què han de contenir, és clar). Quelet (talk) 21:07, 4 August 2022 (UTC)[reply]
@Quelet: Ja ens aclarirà l'Isidre la intenció, però hi veig uns quants motius possibles:
  • En llistes de topònims les organitzacions hi sobren, però per la manera que s'han de construir les consultes no es pot incloure els topònims sinó que s'ha d'incloure tot i després anar excloent el que no hi va. L'Isidre va començar per llocs petits, on els no topònims eren escassos, i va anar adaptant les consultes amb l'experiència de mesos d'estar fent llistes i endreçant topònims a Commons, Wikidata i la Viquipèdia. Una pila d'escoles, associacions i més coses no són un problema a Agramunt perquè si n'hi ha són poques, però són un problema a l'Hospitalet. La llista de l'Hospitalet, que deu ser de les darreres, pot ser el model de com es podrien ajustar les altres.
  • Tu vas fer la pujada dels centres educatius quan bona part de les llistes no estaven fetes, ni les consultes estaven previstes per impedir que s'hi colessin una pila de centres educatius, perquè quan es van fer no hi eren.
  • Si en una llista automàtica hi ha més d'uns 800 elements (amb coordenades) no funciona. Diria que l'Hospitalet s'hi queda lluny, però podria ser un bon motiu per alleugerir què va a la llista.--Pere prlpz (talk) 21:34, 4 August 2022 (UTC)[reply]
Gràcies! Òbviament, quan es fa una llista de qualsevol cosa hi ha d'haver un motiu i un objectiu. Això ha de portar a inclusions i a exclusions, i que la llargada de la llista la faci útil en la pràctica. Quelet (talk) 04:37, 5 August 2022 (UTC)[reply]
Des de fa uns mesos estic fent la segona repassada de les llistes de topònims i ho faig per ordre alfabètic de comarca i municipi. Actualment estic acabant els últims municipis del Berguedà. Una de les edicions que faig és indicar (Minus) les coses que no vull que surtin a les llistes, entre les quals hi ha els "centres educatius". Per tant, és normal que ja no surtin a l'Hospitalet (Barcelonès) i encara hi figurin a Agramunt (Urgell) i a Sabadell (Vallès). D'aquí set o vuit mesos ja hi arribaré. Isidre blanc (talk) 21:42, 4 August 2022 (UTC)[reply]
Gràcies Isidre blanc. Ja veig que m'hauria d'haver mirat Alcover en comptes d'Agramunt.--Pere prlpz (talk) 21:57, 4 August 2022 (UTC)[reply]
Entesos @Isidre blanc, gràcies. Quina feinada! No sé si seria possible automatitzar aquest procés. Una pregunta: la consulta sparql pot ser diferent entre municipis (dels que ha s'han repassat) o són totes iguals? Quelet (talk) 04:39, 5 August 2022 (UTC)[reply]
@Quelet: Són totes idèntiques. Mès d'una vegada m'he plantejat la possibilitat d'automatitzar alguna de les coses que faig, però la casuística és tan variada que ho he descartat. Gràcies pel teu comentari. Isidre blanc (talk) 05:22, 5 August 2022 (UTC)[reply]
De totes formes, en aquesta llista de topònims d'un municipi, veig que s'hi inclouen elements que no són ben bé topònims: per exemple, edificis, esglésies, obra escultòrica, etc., que són més aviat elements artificials georeferenciats. Veig que s'hi inclouen "centres culturals"... però no escoles. S'hi inclouen també hodònims, però d'aquests n'hi ha entrats pocs. El problema és que d'hodònims n'hi ha moltíssims, i alguns tenen rellevància patrimonial, però la majoria no. Potser a wd només hi haura d'haver hodònims que tinguessin protecció. Suposo que és complicat. I m'he adonat que es contraposa l'estructuració racional de wikidata amb una certa desestructuració de commons. Quelet (talk) 06:29, 5 August 2022 (UTC)[reply]
@Quelet: Que els hodònims són topònims fins i tot ho diu la Viquipèdia, i sobre si han de ser a Wikidata, a més de la notabilitat que tinguin per si mateixos, són útils per altres propietats i no sembla que hi hagi cap impediment a pujar-los. Només cal veure que s'han pujat sistemàticament tots els carrers de Brussel·les.
Que les esglésies i altres edificis també són topònims (noms propis de lloc) sembla força clar. A més, diria que estan entre els topònims més interessants. De tota manera, es poden fer les llistes que es vulgui i si estan ben mantingudes no passa res si es trepitgen una mica el tema. Només cal veure que els elements de les llistes de masies, ponts i fars surten també a les llistes de topònims. Si et ve de gust fer la llista d'elements de geografia física del Gironès, endavant.--Pere prlpz (talk) 08:23, 5 August 2022 (UTC)[reply]
Molt interessant aquest teu comentari. L'interès de geolocalitzar les cases de pagès no és tan sols perquè són un element patrimonial, sinó perquè també són un indicador de lloc. Pel que fa als hodònims, la qüestió és si paga la pena d'entrar-los a wd. No té cap dificultat, ja que es pot fer automàticament. La reflexió és la mateixa que em vaig fer per als centres docents: a wd, el que té valor és tenir el conjunt de tot un tipus d'element. Hi ha carrers amb protecció, i la majoria no en tenen. Però molts tenen epònim, tenen llargada, tenen amplada, etc etc. Una cosa és un carrer des del punt de vista d'OSM que respon a "què hi ha aquí?", i una altra des del punt de vista d'un graf de coneixement com wd, que respon a "on és això"? (ho dic com a aprenent del tema). Quelet (talk) 09:08, 5 August 2022 (UTC)[reply]
Pere, on puc veure això de la pujada sistemàtica dels carreres de Brussel·les? Gràcies. Quelet (talk) 10:11, 5 August 2022 (UTC)[reply]
@Quelet: Ara veig que no et vaig respondre això dels carrers de Brussel·les. La manera més ràpida és anar al Wikishootme en un barri de Brussel·les amb carrers curts https://wikishootme.toolforge.org/#lat=50.847305289115624&lng=4.349201917648316&zoom=17 i veure que hi ha l'item de cada carrer, que és com ho vaig trobar mentre donava un volt pel centre de la ciutat. L'altra manera és una consulta https://w.wiki/5b4G --Pere prlpz (talk) 10:54, 19 August 2022 (UTC)[reply]
@Quelet: I sobre variables interessants: crec que una d'interessant, als centres educatius de Barcelona, seria trobar el barri o com a mínim el districte. Si no surt a les llistes del Departament, una gran part de la feina es pot automatitzar (o com a mínim donar una ajuda) a partir de les coordenades.--Pere prlpz (talk) 08:44, 5 August 2022 (UTC)[reply]
Pere, segurament perquè no soc de Barcelona... en el seu moment no vaig adonar-me de la importància d'incloure el districte/barri als claims d'un centre educatiu de la capital de Catalunya. Com que és especificat al fitxer de dades obertes de la GenCat, és ben fàcil posar-l'hi. I una altra cosa encara: l'operador és interessant? GenCat, consorci educ. bcn, maristes, la salle, etc.? Aquestes coses que no canvien d'un any per l'altre suposo que són rellevants, perquè descriuen un centre educatiu. Quelet (talk) 09:05, 5 August 2022 (UTC)[reply]
@Quelet: El barri el veig interessant per poder dividir. Per algunes aplicacions pot ser que hi hagi massa escoles a Barcelona i calgui desagregar-les.
L'operador em sembla interessant. Només cal veure per exemple commons:Category:Piarist schools, que té quatre interviquis.
I com sempre, l'interès depèn de l'aplicació, que no sé quina serà però suposo consultar coses com quins ministres del país que sigui que hagin estudiat en escoles de La Salle entra dins de les aplicacions normals de Wikidata. Això, sí, caldria anar posant als items de les persones a quina escola han estudiat si té referències. Això no sé si ho heu començat.--Pere prlpz (talk) 09:12, 5 August 2022 (UTC)[reply]
Jo vaig anar 12 anys als Maristes de Girona :-) Pel que fa a les llistes, entenc que fer una llista automàtica de fet equival a "consulta freqüent a Wikidata". Perquè amb consultes sparql a wd es pot aconseguir moltes coses, per exemple qui va estudiar a una escola... sempre que això, tal com dius, estigui degudament especificat. També penso en correlacions: tipus d'escoles per població i resultat electoral, gènere del professorat i tipus d'escola (per a això podríem entrar a wd el número de professorat, desagregat per gènere, disponible al llistat gencat), i segurament d'altres coses. Gràcies! Quelet (talk) 09:26, 5 August 2022 (UTC)[reply]
@Quelet He fet una lectura en diagonal i veig que estàs i tens entretinguts al Pere i l'Isidre. No sé si t'hi volies posar amb les coordinades duplicades, però a https://w.wiki/5YFJ t'he preparat una query que detecta items (de centres) amb +1 coordenada diferent. Salut ! Amadalvarez (talk) 11:45, 5 August 2022 (UTC)[reply]
Gràcies, Amador! Precisament et volia demanar si em podies tornar a passar aquest tipus de consulta, però t'hi has avançat. Doncs res... a fer neteja, ara. Quelet (talk) 13:18, 5 August 2022 (UTC)[reply]

@Quelet: Sobre la manca de qualitat de les coordenades que comentàvem fa unes setmanes, ahir vaig estar al Prat de Llobregat. Un institut no el vaig trobar perquè les coordenades estaven unes travessies més enllà, i un altre me'l vaig trobar de morros però no em sortia al Wikishootme perquè les coordenades estaven posades a Santa Perpètua de la Mogoda.--Pere prlpz (talk) 19:52, 18 August 2022 (UTC)[reply]

Gràcies! Ja t'ho vaig comentar, que hi havia coordenades incorrectes... caldrà pensar en una acció comuntària per comprovar-les, o també mirar OSM per veure on hi ha discrepàncies substancials. El problema és que a OSM hi falten centres educatius. Però pot ser una ajuda. Miraré d'escriure un programet, així practicaré. Quelet (talk) 07:12, 19 August 2022 (UTC)[reply]
@Quelet: Els errors petits costen de trobar, però pels grossos hi ha dreceres. Per exemple, que fent el mapa dels centres educatius del Segrià aparegui un punt a Tarragona fa sospitar que alguna cosa no va bé. Provant-ho amb totes les comarques o províncies segur que en surten alguns més.
Una altra manera és calcular les distàncies entre el municipi i el centre educatiu i mirar-se els valors atípics. Crec que això es pot fer amb SPARQL tot i que potser jo trigaria menys amb R o Python.--Pere prlpz (talk) 10:33, 19 August 2022 (UTC)[reply]

Monuments in the Land of Valencia[edit]

Hola Pere:

Cap al 28 de juny vaig acabar la primera tongada de curació de les fitxes. Es tractava de reduïr els vora 32000 Qs que resultaren d'afegir-ne als 7000 que ja hi havia els 25000 o així creats de nous. Vaig eliminar-ne duplicats fins deixar 26342 "només". Hi havia duplicats normals (estaven i els tornèrem a crear), però també de menys normals (fins i tot una ermita que tenia dues fitxes de la Generalitat i tres de Wikidata, quintuplicada!). Eixa part ja està resolta ("salvo error u omisión").

Ara estic omplint la propietat P973 descrit a l'URL. Hi ha algunes coses que tot i que hi són a les llistes de la Generalitat no en tenen, de fitxa; normalment són jaciments d'art rupestre. Però l'amplíssima majoria del que tenim té fitxa (i ja t'he explicat que a voltes més d'una).

Estic omplint coordenades si soc capaç de trobar els xismes al GoogleMaps; no em refie de les coordenades de la Gene perquè, tot i que han millorat molt (hi havia un temps quan qualsevol cosa de la província d'Alacant estava al mateix punt de la Ciutat de les Fogueres), encara hi ha moltes ubicacions aproximades. Per exemple, l'escorxador de Burjassot el fiquen a Godella, i l'antic mercat municipal a l'ajuntament. Comque de Burjassot no necessite cap guia, vaig adonar-me ràpidament. Però ara estic amb tres edificis del terme d'Orxeta, i estan molt desplaçats d'on diu la Gene. I si cal anar-hi, qui té que fer-se els quilòmetres soc jo. I fa molta calor a Orxeta.

Estic omplint també P131 instància de perquè l'omplírem per defecta amb construcció. N'hi ha coses millors. També tracte d'omplir P18 i P373 (imàgens i categories de Commons). L'origen de tota esta faena és tenir una base de dades senzilla per eixir a fer fotos amb la meua dona. Aleshores, si vas a un lloc on ja hi ha anat tothom... és tonteria. Per això que la P18 importa.

Hi ha més coses a fer, com ficar els noms en la llengua que pertoque, fer descripcions i segur que més coses. Però deixe de donar-te la vara, que ja t'he parlat massa. B25es (talk) 17:36, 2 July 2023 (UTC)[reply]

@B25es: Bona feina.
Espero que d'aquests duplicats no n'hi hagués gaires de meus.
Per trobar coses sense haver d'anar als llocs darrerament em va molt bé el Google Earth, sobretot on ja tenen els edificis en tres dimensions, com per exemple Orxeta.[11]
Crec que la base de dades la fem servir pel mateix, per sortir a fer fotos. El que passa és que a Catalunya, a més dels monuments, he pujat bona part del fitxer de NGCat (Q98463667) i unes quantes coses més, i no me'ls acabaré ni que visqui dos-cents anys i em compri un cotxe. Enciclopèdicament, la gràcia és que això permet tenir llistes de topònims, llistes de masies, llistes de ponts i llistes de més coses, totes automàtiques.
La described at URL (P973) normalment no la faig servir (tot i que seria una millora interessant), però potser es podria treure automàticament, sobretot on ja es fa servir de referència, i encara més si es pogués construir a partir del número de registre, quan n'hi ha.
Per qualsevol cosa que necessitis ajuda ja saps on sóc.--Pere prlpz (talk) 20:51, 2 July 2023 (UTC)[reply]

Instal·lacions Olímpiques de Tir amb Arc (Q115922912)[edit]

Hola Pere, crec que l'element Instal·lacions Olímpiques de Tir amb Arc (Q115922912) coincideix amb Camp Olímpic de Tir amb Arc (Q5027478) i caldria eliminar el primer, doncs el segon ja té pàgina de Viquipèdia. Joandrés (talk) 19:42, 16 October 2023 (UTC)[reply]

@Joandrés: He fusionat els dos elements a Camp Olímpic de Tir amb Arc (Q5027478) però les coordenades eren lleugerament diferents. Si coneixes on era, pots mirar quina de les dues que hi ha són més representatives i esborrar les altres?--Pere prlpz (talk) 20:14, 16 October 2023 (UTC)[reply]
Fet! L'edifici que encara queda està localitzat més o menys enmig de les dues localitzacions. Ja l'he centrat. Gràcies! Joandrés (talk) 20:27, 16 October 2023 (UTC)[reply]

Llanars[edit]

Hola, Pere. Estic carregant imatges de masies de Santa Pau i m'he trobat Llanars (Q107093294) que només existeix a WD. Segons les coordenades WD i mirant-lo al vissir, sembla que formaria part del conjunt del Santuari dels Arcs (Q28711146), però no l'he trobat ni a l'inventari del topogràfic, ni al cercador dels "noms geogràfics de Catalunya" que és la referència que hi ha a l'item. T'ho pots mirar?. Merci, Amadalvarez (talk) 06:36, 24 October 2023 (UTC)[reply]

@Amadalvarez: De tant en tant passen aquestes coses amb el fitxer de noms geogràfics. Passa sobretot quan hi ha edificis homònims en municipis veïns, que es fa un embolic, però en aquest cas no trobo cap Llanars a prop. Reciclo l'element per l'entitat singular de població, que és més curt que esborrar-lo.--Pere prlpz (talk) 18:43, 24 October 2023 (UTC)[reply]

P12385[edit]

Jo m'encarrego d'afegirGran Enciclopèdia Catalana ID (P12385) a tots els articles que tenien Gran Enciclopèdia Catalana ID (former scheme) (P1296), però a canvi hauries de copiar les metadades de P1296 que apliquin a P12385. KRLS (talk) 21:51, 3 February 2024 (UTC)[reply]

@KRLS: Et diria que encantat, però no entenc quines metadades s'han de copiar. A Gran Enciclopèdia Catalana ID (P12385) diria que ja hi ha el que hi hauria d'haver (i alguna cosa és discutible si hi sobra) i a la discussió també.
Et referies a una altra cosa?--Pere prlpz (talk) 22:05, 3 February 2024 (UTC)[reply]