Hoppa till innehållet

Wikipediadiskussion:Projekt Wikipedias användning av Wikidata

Sidans innehåll stöds inte på andra språk.
Från Wikipedia


Status inför jul och nyårsuppehåll

[redigera wikitext]

Det hela har gått över förväntan. Alla Wikipediaartiklar har nu Wikidataposter. Flera erfararna har börjat skapa Wikidataposter (Mkallgren, Fdely, Annika64 mfl) och det har dykt upp användare som Spisen, som liksom jag skapar WD poster för ny alster när dessa saknas. Och jag har inte sett något gnäll, och jag upplever att förstörande dumredigeringar i Wikidata har minskat betydligt. Jag har lärt mig att för en stor del av sortimentet ger (och kan inte ge) WD posten inget mervärde förutom iw-kopplingen. Och nog blir det mer effekt att jobba med detta sortimentvis där också införandet av WD faktamall ingår. Detta sker just nu primärt när det gäller biografier, där jag också kan se större aktivitet när det gäller fixa trubbigheter, typ saknad svensk benämning på etiketter.Yger (diskussion) 18 december 2019 kl. 12.32 (CET)[svara]

@Yger: Kan du ge några exempel på artiklar som du har stött på där motsvarande Wikidataobjekt varken kan ges något värde på egenskapen instans av (P31) eller egenskapen underklass till (P279). Jag lever i tron att det ska vara möjligt för alla objekt (på samma sätt som att alla artiklar kan och bör placeras i någon kategori). Om det inte finns något objekt eller någon klass/typ som kan anges som värde beror det bara på att det inte skapats ännu. --Larske (diskussion) 18 december 2019 kl. 13.42 (CET)[svara]
Det svåra är nog att hantera ämnen man inte behärskar. Varje ämnesområde har ju sin riktlinje eller praxis. Och skilja ut när man ska använda P279 eller P31 är inte simpelt för en nybörjare. (Eller ens en erfaren ibland.) 62 osv (diskussion) 18 december 2019 kl. 13.52 (CET)[svara]
Några exempel:
vikigare än att ge instans är dock att för de flesta av dessa finns det ingen meningsfull info att tillföra WD objektet.Yger (diskussion) 18 december 2019 kl. 14.13 (CET)[svara]
"Uppehållstillstånd inom Europeiska unionen" skulle jag välja att ange som "Underklass till:Uppehållstillstånd". Annat tänkbart påstående där är "Tillhör jurisdiktion:EU". 62 osv (diskussion) 18 december 2019 kl. 15.30 (CET)[svara]
Håller helt med Sextvåetc om att det är klurigt att hitta "rätt" instans av (P31) eller underklass till (P279), men det är en nyttig övning.
För exemplet med Systemet för anmälan av djursjukdomar (Q547281) som Yger tog upp och som nu är klassat som instans av (P31) register (Q19386377), kan man ju fundera på om den är just "registret" som är det som ger relevans till artikeln/objektet. Eller är det det bakomliggande "EU-direktivet" (som är en instans av (P31) EU-direktiv (Q326124))? Det finns redan 227 sådana objekt i Wikidata varav 39 är kopplade till svwp-artiklar, se denna lista. Kanske Systemet för anmälan av djursjukdomar (Q547281) är ett 228:e sådant objekt och artikeln bör då kanske döpas om till "Direktiv om anmälan av djursjukdomar inom EU" eller nåt i den stilen.
Listan visar också hur många språkversioner som har artiklar om vart och ett av direktiven och man kan se att det EU-direktiv som har artiklar på flest språk (13) men ännu ej på svenska är (Q899329). Det direktivet har visserligen ersatts av en annan "förordning", men det är kanske ändå relevant.
--Larske (diskussion) 18 december 2019 kl. 16.20 (CET)[svara]
Nu är det inte omedelbart automatiskt så att det är det som ger relevans, som man ska basera beslutet om P31/P279 på. En biografi har ju alltid P31:människa (Q5), och att vara människa ger ju inte relevans, utan snarare andra påståenden. Det kan tex vara vad som länkar till ett objekt som ger relevans, tex att en person är författare till ett uppmärksammat verk. 62 osv (diskussion) 18 december 2019 kl. 17.21 (CET)[svara]
Antal redigeringar i Wikidata för användare med minst 50 redigeringar i Wikipedia (under de senaste 30 dagarna)
Användare Wikipedia (sv) Wikidata
Voyager85 4 792 142
Kitayama 4 579 3 034
Maundwiki 3 051 2 855
Boberger 2 986 227
Cilidus 2 909 2 177
Kubelsky 2 860 0
Yger 2 853 7 788
Aciram 2 152 166
EPIC 2 104 41
Thoasp 2 003 132
Fredde 99 1 889 174
Bruno Rosta 1 652 261
Holger.Ellgaard 1 646 3
Dubbeltänk 1 564 13
Tostarpadius 1 485 83
ListeriaBot 1 448 0
Deryni 1 434 2 481
Anhn 1 226 12
Spisen 1 221 3 891
Paracel63 1 164 218
DenSportgladeSkåningen 1 070 31
Disembodied Soul 1 011 42
Tournesol 1 007 11
Tegel 930 8
DIEXEL 906 61
Skivsamlare 879 20
Tomastvivlaren 802 123
Perfect 785 0
LRönnberg 756 23
Silltruten 718 2
Larske 676 36 741
Adville 649 30
Prematureburial 647 4
Mjälten 629 68
Annika64 627 327
Sjunnesson 578 14
Roufu 560 27
Dan Koehl 551 17
Riggwelter 548 11
Murmeldjuret 547 172
Salgo60 538 153 433
Esquilo 525 84 360
Gotogo 493 88
YesDi 489 40
Plumbum208 480 5
37KZ 476 6
Sextvåetc 474 1 387
Svensson1 443 4
SiberianJay 442 181
Stigfinnare 438 4
Marcus.linneberg 411 0
Ternarius 383 14
Nordelch 364 22
Stalverk80 357 13
Andejons 351 9
CommonsDelinker 332 0
Simiha 329 1
Kyllo 327 0
Allexim 320 4
Erik gbg 307 27
Ascilto 274 19
Nirmos 271 12
Makenzis 253 92
Ariam 247 34
Mirela63 244 97
Vattav 244 29
Astomic 243 0
Papper 233 1
Machatjkala 231 2
Silent Sam1 230 0
Grey ghost 229 0
Slånbär 228 121
Tomas e 226 7
Uzrname 224 0
J 1982 221 13 520
Hans Frörum 221 30
Lucasejwertz 216 0
GeMet 215 43
Ronny L (SMVK) 209 0
Jensapag 203 12
88.89.14.37 203 9
Harka 203 8
Kung Midas 203 0
Vesihiisi 202 242
Bairuilong 193 7
Klostergårdaren 190 24
Latitud60 179 0
BanWisco 176 0
Kung Hibbe 175 0
Logjohn 172 24
Tatterdemalion2 171 0
LittleGun 169 20
Matanb 169 0
FBQ 166 24
Alexander Alejandro 161 7
Historiker 155 8
Tommyleelow 152 31
83.254.13.103 151 4
1Kwords 144 4
Vannucci 142 4
Jullan3 141 0
Per W 137 237
Gujo 137 1
FootballsComingHome 133 0
Elinor Rajka 132 0
Wvs 131 1
Boelnorra 128 1
Belairroad 128 0
Chandra Varena 128 0
Sebastian Berlin (WMSE) 128 0
Toker87 127 26
Rkjon 125 0
Lars Törnqvist 124 2
Nosslrac 120 0
Hesekiel 118 0
HSE 118 0
AHA 117 0
Zquid 117 0
Hovastro 116 2
Michael.riessler 115 294
ALRAS 115 0
Frahbil 114 468
AronSimonEli 114 12
FranzGall 112 2
185.65.135.174 112 1
Caztorp 111 212
Mkallgren 109 195
83.226.235.237 109 0
WikiRenen 107 5
Nescionomen 105 0
Tommy Kronkvist 103 3 817
Knallhatten 102 0
Vargnäsalex 102 0
LPfi 99 10
Bjorn.Hakansson 96 0
Hjordmån 94 2
Kuriosatempel 92 1
BPSkantze 91 0
Christian47 90 1
Kigsz 89 1
Battlegriffin 88 0
KressInsel 87 2
RefDr 84 1
185.213.152.164 83 4
Geo39geo 82 0
St.nerol 82 0
TJ Lusitanias 82 0
Julle 80 14
Joshua06 78 3
95.192.36.42 78 0
BabbaQ 77 6
Herr Overall 77 6
Jan Arvid Götesson 76 0
Millwall1234567891 76 0
Mats33 75 1
Väsk 75 1 217
BIL 74 7
Glentamara 74 0
RoMex 73 12
Blockhaj 72 0
Encyklopedian 72 0
BodilKristina 71 0
Idunius 71 0
EriFr 70 0
Hsvinet 69 5
Spidermine 68 7
Herranderssvensson 67 16
Jonas2011 64 71
Macuser 64 8
95.192.19.193 64 0
Showman 61 3
CarlosJalisco 61 2
Stadinovic 61 0
Ainali 59 195
Bulver 59 3
Pontuz 59 1
BP OMowe 58 0
Tutankans 57 0
2.67.84.230 56 7
DTeamGUB 56 0
Mickeno 56 0
194.71.19.185 55 0
Janders 55 0
Maurizio 55 0
Bensin 54 0
Nasko 53 3
92.32.66.165 52 67
LilyKitty 52 2
Nklek 51 1
Edaen 50 6
JokingGold0 50 3

@Yger: Någon Fdely hittar jag inte i listan. Vem är det du menar? --Larske (diskussion) 18 december 2019 kl. 17.44 (CET)[svara]

FDellby skall det vara.Yger (diskussion) 18 december 2019 kl. 18.18 (CET)[svara]
@Yger: För venia gjorde jag nu så att jag läste artikeln och konstaterade då att det var en titel i SvKy. Det vet jag inget om hur man göra med, jag heller. Så jag gick in i en annan artikel om ungefär samma sak. (Kyrkoherde) Där var angivet "P31:Eccestiatical title". Det lät som ett rimligt påstående, varvid jag kopierade det till Venia. Dessutom specificerade jag att det var "av SvKy" som qualifier, för att markera att det är en kyrklig titel i just SvKy och kanske ingen annanstans. Ett sådant här påstående behöver inte källbeläggas, eftersom objektet som sådant till stor del definieras av vilken wp-artikel den är kopplad till. 62 osv (diskussion) 18 december 2019 kl. 18.58 (CET)[svara]
Snyggt! Jag har för andra artiklar försökt göra något liknade men det är svårt hitta dem då det ju saknas etikett på svenska. Yger (diskussion) 18 december 2019 kl. 19.15 (CET)[svara]
Så bra. Och nu har kyrklig titel (Q11773926) en svensk etikett också.
Det finns 263 objekt varav endast 27 har en svensk etikett.
--Larske (diskussion) 18 december 2019 kl. 19.28 (CET)[svara]

Reflektioner i slutet av januari

[redigera wikitext]
görbart
  • se till att alla WPartiklar har ett motsvarande WD objekt (sker nu)
  • att alla nya WPartiklar har WD objekt med instans/underklass (sker nu)
svårt, tveksamt om det är görbart
  • att alla WP artiklar har instans/underklass. >30000 är lite för mycket och värdet är tveksamt för stor del av sortimentet (se nedan)
  • Att alla WDmallar i svwp-artiklar visar upp etikett/beskrivning på svenska. Svårare än trott och mer än trott
Lärdomar
  • att komplett arbeta igenom ett sortiment ger överlägset bäst värde. Svenska kommuner är pärlan men även svenska församlingar fungerar mycket bra och får ett flertal kompletteringar från olika håll. Övriga ligger där de ligger bra men får inte så mycket nytt data.
  • att lägga in WD mallar behövs för att få fart på kvantitativt och kvalitativt arbete i Wikidata. Biografi är här typexemplet som verkar ta flera år komma igenom
  • för en del av övriga sortimentet känns det Wikidata (kan) ge(r) värde, typiskt för mycket konkreta saker som när det finns koordinater. ?bör dessa arbetas mer med?
  • För en stor del av sortimentet känns det som att WD posten inte (kan) ge mervärde till artikeln, förutom möjligen IW-länk
fundering
  • Vore det mer effektivt satsa på att arbeta komplett igenom några fler sortiment ist för att pilla med "alla". Det vill säga slarva med WD posten (bara ge instans/underklass) för de "olönsamma" sortimenten. Jag är inte klar med denna undring ännu.

Yger (diskussion) 29 januari 2020 kl. 16.38 (CET)[svara]

Arbetet med att ge grundläggande uttalanden till alla har redan hjälpt till att få bort några riktigt gamla rötägg ur artikelsortimentet. (genom radering, mallning eller åtgärd) Redan det gör det ju lite mödan värt. 62 osv (diskussion) 29 januari 2020 kl. 17.29 (CET)[svara]

Strukturerat samarbete med föreningen

[redigera wikitext]

Jag har lagt upp detta förslag på ett samarbete med kansliets personal. De frågor jag vill diskutera är dels hur få till källinfo i Wikidata och dels och primärt driftmiljö för uppdateringskörningar mot Wikidata av data från källor som SCB. Jag vill också att deras arbete och vårt bättre koordineras, det hade tex behövt kring naturreservat.Yger (diskussion) 21 februari 2020 kl. 21.28 (CET)[svara]

Jag har nu fått OK på ansökan och vill nu hitta en tid som passar alla som vill vara med. I detta första möte vill jag ta upp:
  • mycket kort, som ren info, vad vi respektive föreningen har gjort inom området
  • kort om dilemmat att få till källor till uppgifterna i Wikidata, när dessa är lite invecklade och redan finns angivna i Wikipedia. Och hur säkra kopplingen data-källa vid ändringara av data
  • hur massuppdateringar av mängddata i Wikidata (som befolkningsuppgifter) hanteras och borde hanteras. Borde dessa rutiner säkras så det är operativa även om skaparen av boten försvinner
För mig passar tider på fm bäst från 10.30 till lunch. Kansliet önskar några datum att välja bland. För mig går alla dagar från den 14 till den 30 mars och även början av april. Kansliet är sedan upptagen tisdagar fm så det går ej. Vilka tider passar er andra som vill delta?Yger (diskussion) 3 mars 2020 kl..14 (CET)
Det här är spännande. Tänker vi oss främst uppdatering av befintlig data i faktarutor, eller även att automatiskt generera nya tabeller, listor, diagram och kartor? Finns det exempel på att någon har lyckats ladda upp en stor statistikfil med olika typer av kronologisk sifferdata, t.ex. brottsstatistik, dödsorsaksregister eller ekonomisk statistik, till Wikidata, och lyckats visualisera det på wikipedia? Jag tänker att det kan vara komplicerat eftersom innehållet måste spridas ut på många ställen på wikidata, properties kan behöva skapas, och Quarry-frågorna blir komplexa.
Ett enklare alternativ till wikidata kan vara att ladda upp hela datafilen till en och samma sida i Commons datanamnrymd, som en .tab-fil (JSON-fil, i framtiden även CSV-fil). Svenska geografiska regiondefinitioner kan laddas upp som .map-filer. Då kan data visualiseras kronologiskt och geografiskt på liknande sätt som det är gjort i {{Animerad världskarta}}. Därför föreslår jag att detta spännande projektet inte låser sig till wikidata, utan även nämner datalagring på commons som en möjlighet.Tomastvivlaren (diskussion) 3 mars 2020 kl. 17.03 (CET)[svara]
Tanken är inte att titta på nya sätt hantera och presentera data inom existerande Wikiprojekt. Och inte ens nya program för att överföra data till wikidata. Tänk Larske kvartalsvisa upp datering av befolkningsuppgifter för kommuner. Det gör han och sköter via en bot. Men skulle det gå att starta den utan att larske gjorde det?Yger (diskussion) 3 mars 2020 kl. 17.12 (CET)[svara]
Ok, jag för lugna mig lite när det gäller tabeller, diagram och kartor... Men överväg gärna import till commons redan idag, när det är enklare eller enda möjligheten. Kan wikigemenskapen en dag i framtiden genom koncensusbeslut komma överens om en jobblista med uppdateringsjobb för dataimport till commons och wikidata, som en bot med minimal manuell inblandning kan följa? Tomastvivlaren (diskussion) 3 mars 2020 kl. 18.41 (CET)[svara]
ja det är lite åt det hållet jag tänker. Men då krävs att dessa botar ligger på annan plats än var och ens PC.Yger (diskussion) 3 mars 2020 kl. 18.46 (CET)[svara]
De gamla toolserverbotarna kunde ju någon enkelt "ta över" om botägaren blev inaktiv. Haken är väl att scripten ofta behöver underhållas. 62 osv (diskussion) 3 mars 2020 kl. 19.49 (CET)[svara]

Chans att ge återkoppling om Wikidatastödda underhållslistor

[redigera wikitext]

Wikimedia Deutschland har gjort lite undersökning om hur underhållslistor stödda av Wikidata används. Innan de går vidare med att börja utveckla lösningar för det de har upptäckt bjuder de in att ge återkoppling för att säkerställa att de inte har uppfattat det fel eller missat något viktigt. Ainali diskussionbidrag 13 mars 2020 kl. 21.57 (CET)[svara]

Generell Wikidata-faktarutemall?

[redigera wikitext]
tråd flyttad till Malldiskussion:Databox/arkiv.Yger (diskussion) 25 augusti 2020 kl. 21.41 (CEST)[svara]

Okej att stoppa in mjukt bindestreck i långa svenska etiketter?

[redigera wikitext]

Nu har layouten för {{Databox}} justerats så att den är lik {{Faktamall}} enligt önskemål. Men därmed blir vänsterkolumnen rätt smal och långa egenskapsnamn bryts på fel ställe utan bindestreck, t.ex. "Dewey decimalklassifikation". Nu har jag avstavat ordet genom att lägga in mjukt bindestreck decimal­klassifikation, i den svenska etiketten på sidan Dewey decimalklassifikation (P1036). För säkerhets skull (för att sökningen ska fungera) la jag in samma stavning utan mjukt bindestreck som alias. Se t.ex. Fascism som har Dewey-kod.

Är det en okej lösning? Isåfall kan vi göra det med fler svenska egenskapsnamn som är längre än cirka 16 tecken och som brukar visas av mallen. T.ex. upptäcktsdatum (P575) och kulturskyddsstatus (P1435), katalognamn (P528), dotterorganisation (P355) samt tidskomplexitet i värsta fall (P3752) till rumskomplexitet i medel (P3757).

Eller bör vi byta namn till t.ex. "Dewey-klassificering"? Tomastvivlaren (diskussion) 19 april 2020 kl. 11.25 (CEST)[svara]

Det ska inte finnas någon HTML-kod i Wikidata (och inte heller någon wiki-kod som [[ och liknande). Etiketter och värden i Wikidata ska kunna läsas och förstås av andra program än webbläsare och wikitexttolkar.
Om det behövs någon formatering av värden innan de presenterar är det en uppgift som Wikipediamallen får lösa på något annat sätt, till exempel genom en lokal översättningstabell som stoppar in "mjuka bindestreck".
--Larske (diskussion) 19 april 2020 kl. 12.04 (CEST)[svara]
Instämmer. Presentation ska inte ligga i Wikidata. --北山 Kitayama (diskussion) 19 april 2020 kl. 12.16 (CEST)[svara]
Ok. Generellt bör vi eftersträva så korta namn som möjligt. Kan man byta namn till "Dewey-klassificering"?
Kravet på att inte lägga in wikilänkar, gäller det även bildtext? Där är det inte ovanligt, eftersom vi brukar kopiera in artikelns befintliga bildtext, eller commons beskrivning, till wikidata när vi ersätter en bild med en wikidatamall som visar samma bild. Tomastvivlaren (diskussion) 19 april 2020 kl. 12.21 (CEST)[svara]
Ja, det gäller även där. --Larske (diskussion) 19 april 2020 kl. 12.32 (CEST)[svara]
Varför så korta namn som möjligt? Att det är trångt i en viss spalt i en viss faktaruta är inget skäl till att ändra en etikett i Wikidata. Det kommer alltid att finnas etiketter som är "för långa" och som behöver tas om hand på något sätt för att inte "spräcka" faktarutan. Istället för att "skruva på Wikidata" för att få ett visst utseende i en viss mall bör problemet hur det ska presenteras i faktarutan lösas i mallen/modulen.
--Larske (diskussion) 19 april 2020 kl. 12.35 (CEST)[svara]
Jag vet inte hur det är med "Databox", men i en del andra mallar som hämtar bildtexter från Wikidata, så kan man använda "motiv" istället för "bildtext" som qualifier till själva bilden. 62 osv (diskussion) 19 april 2020 kl. 12.37 (CEST)[svara]

────────────────────────────────────────────────────────────────────────────────────────────────────Ett sätt att smalna av långa etiketter kan vara att skapa en Lua-tabell med avstavningstipsen. Det går också att välja helt andra ord eller förkortningar till en etikett om det skulle passa bättre i en viss tillämpning.

Exempel
etikett i WD etikett med avstavningstips
eller förkortning i en lokal tabell
resultat i en
smal kolumn
upptäcktsdatum upptäckts­datum upptäckts­datum
kulturskyddsstatus kulturskydds­status kulturskydds­status
dotterorganisation dotter­organisation dotter­organisation
datum för grundande eller skapande grundad grundad

--Larske (diskussion) 19 april 2020 kl. 13.28 (CEST)[svara]

Jag valde att börja med att automatiskt stoppa in mjuka bindestreck enligt enkonsonantsprincipen för avstavning, med några svenska undantag enligt ordledsprincipen. Därmed stämmer den åtminstone för orden i din fina tabell ovan. Skrev lite regex-kod som borde fixa enkonsonantsprincipen för de flesta alfabet som har både vokaler och konsonanter.
Tanken med just denna mall är att den ska vara så generell som möjligt. Den ska kunna hantera tusentals egenskaper både idag och i framtiden, med minimal handpåläggning och språkanpassning. Den ska vara porterbar till andra språk. Vill man stava namnen på ett särskilt vis är det bättre att skapa en dedicerad mall för ämnet. Men jag tänker att en översättningstabell kanske kan vara intressant i mallparametrarna, så att den som lägger in mallen kan ange från fall till om man vill ändra på egenskapsnamn och avstavning. På samma sätt skulle man kunna lägga till eller dra ifrån egenskaper och overrajda Wikidatas värden och ordningsföljd genom mallparametrar. Eventuellt. Vet inte om det blir overkill?
La även in mallparametern "width", som man kan justera t.ex. om avstavningen skulle bli märklig. Css-filen hindrar dock att man kan bredda mallen mer än cirka 300 pixlar. Tomastvivlaren (diskussion) 19 april 2020 kl. 18.11 (CEST) [Efterhandsredigerad] Tomastvivlaren (diskussion)[svara]
Jag tog därför bort css-anropet ur mallen, och la in motsvarande layoutkod i modulen. Därmed ser den lika ut även på andra språk. Men då hoppar mallen ibland in till vänster om bilder och andra mallar, om den inte ligger först i artikeln. Vet inte vad det beror på? [Problem solved] Tomastvivlaren (diskussion) 21 april 2020 kl. 14.53 (CEST)[svara]

Kategorivärden och Wikidata

[redigera wikitext]

Kön, född och avliden, finns för personartiklar dubblerat, som kategori och som propertys i wikidata. Skulle det på något smart sätt gå att genera dessa automagiskt från den ena till den andra, så man slapp skriva in dubbelt och så det inte blir olikheter.Yger (diskussion) 20 april 2020 kl. 15.26 (CEST)[svara]

Tyvärr används ofta Wikipedia som källa, så det riskerar att bli direkt rundgång.
Kön har väl i princip bara använts för att föra statistik, och det klarar vi nu utan kategorierna. Så jag tycker de kan raderas, då de spelat ut sin roll. Födda och Avlidna vet jag inte riktigt syftet med, men det borde gå att lista de fall där det avviker mellan projekten.
Automagiken kan skapas med hjälp av mallar. Man skulle kunna lägga in den magiken i mallar som ofta redan används i artiklarna, och skapa en ny mall där sådana saknas. Haken är att de då hamnar först i listan över kategorier, istället för sist som nu är praxis.
Automagik med hjälp av Java är inte möjligt här, då Java inte kan hjälpa till att fylla några kategorier. 62 osv (diskussion) 20 april 2020 kl. 15.35 (CEST)[svara]
Född och död finns i kategorierna (i svwp) endast på nivån år. Några kategorier för personer födda eller avlidna ett visst datum finns inte. Om du menar födelseplats (P19) så finns det problem med robotar som tolkar kategorier som "Personer från X-ort" som att personen är född i "X-ort" och stoppar in detta som födelseplats (P19) i Wikidata trots att personen kanske "bara" vuxit upp "X-ort".
Det går att jämföra om till exempel kategorisering på födelseår stämmer med årtalet för födelsedatum (P569) i Wikidata.
En test på svenskar med födelseåret 1900 i Wikidata gav napp på fyra personer som har födelsedatum (P569) under år 1900, men har ett annat födelseår enligt kategoriseringen i svwp:
Vad som är rätt i dessa fall måste kontrolleras manuellt mot källorna.
--Larske (diskussion) 20 april 2020 kl. 16.12 (CEST)[svara]
Tillägg: Med tanke på att såväl Wikipedia som Wikidata är utsatt för klotter, oftast helt oberoende av varandra, kan det vara en fördel att man kan jämföra mellan de två och få en "second opinion". Tack vare denna "dubblering" vet vi nu att det finns (minst) fyra fel, i Wikipedia och/eller Wikidata, enligt listan ovan.
--Larske (diskussion) 20 april 2020 kl. 16.23 (CEST)[svara]
Lärorikt. nr 1 hade en ren dubblett i WD och WP, nr2 var en sammanblandning med en namne, nr3 oh 4 rena felskrivningar.Yger (diskussion) 20 april 2020 kl. 18.32 (CEST)[svara]
De fall där vi inte vet med särskilt hög noggrannhet (årtionde eller sämre) blir det en särskild utmaning. 62 osv (diskussion) 20 april 2020 kl. 19.30 (CEST)[svara]

@Yger: Inspirerad av din fråga har jag, för ett antal Wikidataobjekt som du har redigerat i Wikidata (på något sätt, men inte nödvändigtvis födelsedatum), jämfört värdet för egenskapen födelsedatum (P569) med inläggningen i kategori "Födda ÅÅÅÅ" för motsvarande artikel i svwp. Följande tabell visar objekt/artiklar där det är något som misstämmer och behöver undersökas och i förekommande fall rättas till, i Wikidata och/eller i Wikipedia.

Orsaker till att det inte stämmer kan antingen vara

  • att födelsedatum (P569) på något sätt, fat finger syndrome eller klipp-och-klista-fel, har förvanskats på vägen från Wikipedia till Wikidata eller att
  • kategorin i svwp inte överensstämmer med artikeltexten (varifrån input till Wikipedia gissningsvis tagits), ett fel som ibland har funnits alltsedan artikeln skapades.

Det förstnämnda felet skulle försvinna med en automatik, men för det sistnämnda felet skulle en automatik bara leda till att felet spridde sig till Wikidata och alla som använder dess data.

Jämförelsen har bara gjorts mellan årtalsdelen av födelsedatum (P569) i Wikidataobjektet och årskategorin i Wikipedia. Ingen jämförelse är gjord mellan det kompletta datumet i artikelingressen och födelsedatum (P569) i Wikidata. Artikelingressen kan naturligtvis också vara felaktig, se till exempel Fredrik Nilsson (1870–1918)

Där det står SAKNAS i kolumnen för Kategori:Födda betyder det att artikeln inte ligger i någon kategori med ett namn som börjar på "Kategori:Födda" trots att den är kopplad till ett Wikidataobjekt som är en instans av (P31) människa (Q5). Om den ligger i "Kategori:Födelseår saknas" kan det vara ok, men den kollen gjorde jag tyvärr inte automagiskt.

--Larske (diskussion) 26 april 2020 kl. 14.03 (CEST)[svara]

mycket intressant. En del är rena skrivfel av mig och annat beror på motstridiga källor. Men många är också att ett felaktigt årtal har ändrats men att konsekvensändringar inte lagt in. Vi har nu 3-4 platser där födelseår anges, det är orimligt.Yger (diskussion) 26 april 2020 kl. 19.27 (CEST)[svara]
Och då tänker du nog bara på svwp och Wikidata. Totalt sett ligger väl födelseår för personer som till exempel William Shakespeare lagrat på flera hundra olika platser i Wikimedia!
William Shakespeare (Q692) är kopplat till nästan 300 olika Wikimediaprojekt. Om alla dessa har en artikelingress, en faktabox och en födelseårskategorisering, finns samma uppgift, årtalet 1564, lagrat på uppemot 900 olika platser. Om alla projekt använde en mall som {{Faktamall biografi WD}} för att hämta årtalet till sin faktabox, minskar antalet ställen som årtalet lagras på med nästan 300. I princip skulle även årtalskategoriseringen kunna göras med denna mall, då minskar antalet ställen med ytterligare 300 och slutligen skulle även födelseåret i artikelingresserna kunna hämtas från Wikidata (som det görs i en tidigare mening i detta inlägg). I så fall skulle det räcka med att födelsedatum (P569) för William Shakespeare (Q692) lagrades på ett enda ställe, nämligen här. Tiden är antagligen inte mogen för det och en viss redundans kan nog vara bra i en wikimiljö där "vem som helst kan redigera". Utan den är det svårare att upptäcka såväl skrivfel som klotter. Tabellen här ovan bygger ju helt på att jämföra och upptäcka att uppgifter som ska överensstämma inte gör det.
--Larske (diskussion) 28 april 2020 kl. 11.04 (CEST)[svara]
Om vi i stället tittat på årtal ett naturreservat gäller från, så finns det officella värdet i Wikidata fullt källbelagt från Naturvårdsverkets databas (och då i faktaboxen). Sedan finns detta värde i länstyrelsen sida (mycket ofta fel), i löptexten och som kategorivärde. I det fallet är tar jag lättare på ev fel i löptexten (som inte har källnot), men återigen lite tråkigt med kategorivärdet. Ingen stor sak för något som ett ett naturreservat och inte så ofta fel (men kan nog återigen glida isär om det tillkommit ett nytt gällande datum). Men egentligen skulle jag velat ha en funktion som automagiskt skapade kategorin, för korrekthetens skull.Yger (diskussion) 28 april 2020 kl. 12.09 (CEST)[svara]
Om vi bara kan bestämma vilken egenskap i Wikdataobjektet som ska styra årtalet i kategorin så kan vi låta mallen {{Faktamall naturreservat WD}} göra kategoriseringen av artikeln i stället för att den görs manuellt. Detta gäller naturligtvis också kommunkategoriseringen.
Exempel: I Kojmon (Q30160419) finns egenskapen datum för grundande eller skapande (P571) med värdet 14 januari 2008. Men i brödtexten i Kojmon står det "naturskyddat sedan 2007" och artikeln ligger i Kategori:Naturskyddsområden bildade 2007. Vilket datum som beslutet möjligen fattades (alltså beslutsdatum, i detta fall 14 december 2007) är mindre intressant, det bör vara det datum från vilket området är ett skyddat område (alltså gällandedatum, i detta fall 14 januari 2008), som är det som bör stå i artikeln. Detta är kanske en rest från tidigare laddning av data från naturvårdsverket då beslutsdatum användes som datum för grundande eller skapande (P571) och som har rättats för bara sex dagar sedan. Hade kategoriseringen gjorts via mallen hade den rättats automagiskt, så det tycker jag att vi tar och för in. Och så får vi fundera hur vi gör de data som finns i ingressen, årtal och area.
--Larske (diskussion) 28 april 2020 kl. 13.41 (CEST)[svara]
mycket bra att prova dett förfarande i denna grpp av artiklar med 100% god info i Wikidata. Det felet jag la in hänger säkerligen ihop med att länsstyrelen på sin sida skriver fel datum. Och att jag 2018 i mycket använde länstsyrelen sida, och ofta kan ha glömt rätta när korrekt data dök upp i faktaboxen.Yger (diskussion) 28 april 2020 kl. 15.38 (CEST)[svara]

Rent tekniskt finns inga problem med att skriva [[Kategori:Födda {{#property:P569}}]]. Huruvida det är en bra idé är en annan fråga (Wikipedia:Bybrunnen/Arkiv 2018-05#Artiklar baserade på Wikidata). Tyvärr är den diskussionen starkt polariserad. Jag tycker att man måste vara mer pragmatisk. Nyttan måste med råge överväga den ökade komplexiteten. För den första revisionen av Tomomi Ogawa eller mitt kategoriexempel ovan tycker jag inte att det är värt det. Om det däremot skulle vara möjligt att hämta in en stor mängd information (typ listor) med minimalt lite wikitext skulle jag nog vara för det (t.ex alla låtar en låtskrivare har skrivit, alla böcker en författare har skrivit, eller alla filmer en skådespelare har medverkat i). Nirmos (diskussion) 28 april 2020 kl. 19.20 (CEST)[svara]

Ah. Jag ser nu att mitt kategoriexempel ovan kan skrivas som
[[Kategori:Födda {{#property:födelsedatum}}]]
Jag visste inte det. Det är mycket bättre. Nirmos (diskussion) 28 april 2020 kl. 20.00 (CEST)[svara]
Ett litet detalj är att P569 (eller födelsedatum) inte är födelseår utan födelsedatum.
Exempel: För Astrid Lindgren (Q55767): {{#property:P569}} → 14 november 1907
Eftersom vi kategoriserar efter födelseår, behövs det en formatering som extraherar året från födelsedatum (P569). Den kod som gör formateringen till år finns redan tillgänglig.
{{#invoke:Wikidata2|formatStatements|property=P569|enbarten=ja|modifytime=Y|noref=ja}} → 1907
är en variant som kan stoppas in i kategorinamnet, men sån kod vill man nog inte ha i wikitexten utan den bör "förpackas" i en mall med ett beskrivande namn, som till exempel {{Födelseårskategori}} som skapar hela texten för kategoriseringen.
--Larske (diskussion) 28 april 2020 kl. 20.10 (CEST)[svara]
(Redigeringskonflikt)Nirmos:En intressnt variant. Egentligen är jag ute att få till det utan att irriterara de som inte vill se Wikidtakod i Wikipedia texten. Men allra främst är jag ute att höja kvaliteten och bli av med onödiga slarvavskrivningsfel. Och också om vi för de artiklar med full fokus på wikdiatakvalitet om vi kan skippa en del av dagens fnul med kategorier. Och för detta ändamål fungerar din variant väl. Jag misstänker dock frågans krux är att få till fullgoda källor i Wikidata, och först när detta är uppfyllt det går diskutera ersätta visa keteroier med sådan sakpade från Wikidata. Jag tror sedan en implentering av din variant bör ske via mallar typ {{född tagen från Wikdata}} som skapar den kod du skriver.Yger (diskussion) 28 april 2020 kl. 20.20 (CEST)[svara]
Modul:Wikidata2 är inte riktigt anpassad för datum före 1000 än. Se Titus (apostel) som exempel:
Den är heller inte anpassad för datum med sämre noggrannhet än år.
Själv tycker jag när det här är fähigt, att det ska integreras i biografimallen. 62 osv (diskussion) 28 april 2020 kl. 20.29 (CEST)[svara]

Utökning av mängden basdata för nyskapade Wikidataobjekt som kopplas till svwp-biografier till att omfatta även Efternamn och Förnamn

[redigera wikitext]

@Yger, Salgo60: (och andra som flitigt skapar Wikidataobjekt för nya, alternativt framtida, biografier i svwp). Triggad av diskussionen här tog jag en titt på hur det står till med egenskapen efternamn (P734) för Wikidataobjekt om personer som är svenskar. Många efternamn har ju egna färdiga objekt, till exempel Eriksson (Q1354604) och Ericsson (Q1353715), som det är enkelt att koppla till egenskapen efternamn (P734). Samma gäller för förnamn, som till exempel Johan (Q10989273) och Emma (Q541194) för egenskapen förnamn (P735). Om personen har mer än ett efternamn (P734) eller förnamn (P735) behöver uttalandena också förses med bestämningsordet ordningsnummer (P1545) och tilltalsnamnet kan ges Föredragen rang, se till exempel Sven Olof Joachim Palme. Även bestämningsord såsom startdatum (P580), slutdatum (P582) och objekt har rollen (P3831) kan användas, se till exempel Gun Hellsvik.

Det enda kluriga är att välja rätt objekt när det finns både kvinnonamn, mansnamn och kanske efternamn med samma stavning, till exempel Taha (Q96655108) (ett kvinnonamn (Q11879590)), Taha (Q28935033) (ett mansnamn (Q12308941)) och Taha (Q36971791) (ett familjenamn (Q101352)). En annan fallgrop är att det ofta finns objekt för förgreningssidor med samma stavning som ett efternamn, till exempel (Q60823025) och Brändström (Q27881777), och sådana förgreningssideobjekt ska inte användas som värde för egenskapen efternamn (P734). Just därför att det inte är helt trivialt att hitta rätt efternamn (P734) och förnamn (P735) är det värdefullt om detta görs av en kolbaserad användare, vilket därmed minskar risken för att något halvautomatiskt verktyg i händerna på någon slarvig användare drar felaktiga slutsatser baserat på hur något stavas snarare än vad något är och lägger in fel värden/objekt för namnegenskaperna.

Sedan en tid tillbaka förses alla nyskapade biografier i svwp, till exempel Olga Lundström med Wikidataobjekt, Olga Lundström (Q97331418), med "basdata" i form av egenskaperna instans av (P31), kön (P21), medborgare i (P27), födelsedatum (P569), dödsdatum (P570) och sysselsättning (P106) i den mån dessa är kända. Även efternamn (P734) och förnamn (P735) vore fint om de kunde stoppas in "i samma veva", åtminstone för de namn där det redan finns färdiga namnobjekt.

  • Länk till lista som visar de (just nu 66 146) Wikidataobjekt som är kopplade till svwp-artiklar om svenska personer* skapade den senaste veckan de senaste två veckorna och som saknar värde på egenskapen efternamn (P734).

*Not: Listan är begränsad till svenskar för att den inte ska ta så lång tid att skapa, men förslaget att lägga in efternamn (P734) och förnamn (P735) gäller givetvis alla objekt som är instans av (P31) människa (Q5). --Larske (diskussion) 19 juli 2020 kl. 12.28 (CEST)[svara]

Det du observerar är nog mycket ett resultat i mitt skapande av nya WD objekt för alla nya artiklar på svwp som saknar objekt. Jag är osäker i hur att få dessa två värden "rätt" och också om det till tillför värde. Jag uppskattar jag nu skapar 15-25 nya WD objekt per dag (drygt hälften biografier) och att det tar uppemot två timmar per dag (ev lite mindre då även kategorisering ofta är en del av arbetat). Och då, även om varje för efternamn tar mindre än en minut, så tar det en del ytterligare tid. Mitt hopp är att någon av de produktiva biografi skaparna (annika, FBQ, Aciram, MarcusL) även böja lägga in WD data själva, som jag sedan kan vid behov komplettera, och då även med för- och efternamn.Yger (diskussion) 19 juli 2020 kl. 13.49 (CEST)[svara]
Ja, det blir förstås mycket om alla objekt ska skapas av en och samma person. Bättre om fler kan bidra, men min poäng med detta inlägg var främst att det är effektivast, oavsett vem det är som gör det, om efternamn (P734) och förnamn (P735) läggs in när man ändå har objektet framme. För namn som redan har objekt är merarbetet marginellt. Jag har nu lagt in efternamn (P734) och förnamn (P735) för cirka 25 av de "lättare", bland annat ett antal Andersson (Q2817217), som fanns i listan ovan och har därför utökat tidsfönstret i frågan så att resultatet inkluderar artiklar skapade under de senaste två veckorna.
Angående frågan om värdet av dessa egenskaper så kanske det inte är de som är allra viktigast, men med efternamnen på plats skulle det enkelt gå att skapa listerior/listartiklar över till exempel personer som har ett visst efternamn, som till exempel den här Ericsson-listan som jag presenterade i den diskussion som jag länkade till i början av denna tråd.
--Larske (diskussion) 19 juli 2020 kl. 17.15 (CEST)[svara]

Politiker / administrativa indelningar

[redigera wikitext]

Bara som en info

- Salgo60 (diskussion) 19 juli 2020 kl. 12.41 (CEST)[svara]

Ser ut som ett mycket nyttigt projekt. För Sverige borde det utan problem också gå klarmarka nivå 2 (kommun) och tre (distrikt).Yger (diskussion) 19 juli 2020 kl. 13.11 (CEST)[svara]
Jag chattade med Tony och tanken är att det skall finnas med. Vet inte om min lilla hjärna hänger med...
- Salgo60 (diskussion) 19 juli 2020 kl. 13.49 (CEST)[svara]

WD poster utan instans/underklass

[redigera wikitext]

Någonstans (som jag nu inte hittar) gjordes en genomgång för att se hur många wd poster det finns som saknar både instans/underklass. Jag har för mig det var omkring 32000. Åtminstone flera hundra av dessa har sedan kompletterats bla av Nirmos. Jag tycker det vore intressant få fram hur många det är nu. @Larske:.Yger (diskussion) 25 augusti 2020 kl. 07.20 (CEST)[svara]

Yger: Att jag har fixat flera hundra låter som en överdrift eller missförstånd, men det jag har gjort är att jag har skapat Wikipedia:Wikidata/Inga uttalanden. Där visas Wikidataobjekt som har en sitelink till svwiki, men som inte har någon av de egenskaper som listas på Användare:Nirmos/SufficientWikidataProperties.json (just nu instans av (P31), underklass till (P279), del av (P361) eller aspekt av (P1269)). Där finns just nu 8002 objekt som uppfyller det kriteriet. Det var länge sedan jag lade till nya objekt på den sidan, men de senaste veckorna har jag varit ganska duktig på att varje onsdag ta bort de som har blivit fixade. Anledningen till att jag inte har lagt till nya är att det redan finns ganska många, och det tar flera timmar för Användare:Nirmos/DelistObjectsWithClaims.js att gå igenom listan. Jag har funderat på sätt att exponera fler objekt och göra listan mindre, till exempel att ha många små listor, men det är tyvärr inte så lätt som det först kan låta. Det där med att det kanske finns ~30 000 – 35 000 objekt som uppfyller det kriteriet är inget som kommer från mig. Det kommer troligtvis från Larske i Wikipedia:Bybrunnen/Arkiv 2020-01#Projekt Wikipedias användning av Wikidata - januari. Se kommentaren från 13 januari 2020 kl. 20.50 (CET). Nirmos (diskussion) 25 augusti 2020 kl. 07.54 (CEST)[svara]
Tack, ja det är nog därifrån jag fått siffran. Din lista slutar på Ch och det sortimentet är nog ungefär 1/6 av hela, vilket skulle indikera det finns över 50000 just nu utan dessa basattribut.Yger (diskussion) 25 augusti 2020 kl. 08.14 (CEST)[svara]

Nu har jag startat NirmosBot2 igen, bara för att 🙂 Nirmos (diskussion) 25 augusti 2020 kl. 10.37 (CEST)[svara]

I januari var det 167 av 20 000 slumpmässigt valda artiklar i svwp som var kopplade till Wikidataobjekt utan några uttalanden. Jag tog nu ett nytt stickprov med 20 000 artiklar och nu var det 129 av dessa som var kopplade till Wikidataobjekt utan några uttalanden. Andelen har alltså minskat från cirka 0,85 till cirka 0,65 procent.
En uppskattning av antalet svwp-artiklar kopplade till tomma WD-objekt idag blir då cirka 24 000 (mellan 20 000 och 28 000 med konfidensnivån 95 procent). Antalet som saknar både instans av (P31) och underklass till (P279), som frågan gällde, men kanske har någon annan egenskap, kan vara något större.
Eftersom jag hade kvar min undersökning från januari tittade jag speciellt på de 167 objekt som då var tomma. Av dessa är det 20 som idag inte längre är tomma tack vare insatser från olika håll. Det känns därför som en rimlig uppskattning att flera hundra har åtgärdats.
--Larske (diskussion) 25 augusti 2020 kl. 12.36 (CEST)[svara]
Det låter ju fantastiskt positivt att 1/8 blivit åtgärdade! Kan du lista de 20 så jag kan kolla vem och hur de blivit åtgärdade?Yger (diskussion) 25 augusti 2020 kl. 13.13 (CEST)[svara]
Javisst, här är de:
Det är som synes många användare som har hjälpts åt för att fylla på dessa 20, tidigare helt tomma, objekt. Sju av objekten saknar dock fortfarande basdata i form av instans av (P31) (eller underklass till (P279)). Och bara för att de har någon av dessa egenskaper är det ju inte säkert att det är rätt. Flera av de värden som används för instans av (P31) för de 20 objekten, exempelvis (Q3922583), Rättsregel (Q1938208) och juridisk form (Q12047392), saknar också svensk etikett.
--Larske (diskussion) 25 augusti 2020 kl. 17.25 (CEST)[svara]
Jag bevakar fortfarande Nirmos lista, men har insett att den på sätt och vis lockar mig att redigera i ämnen där jag har noll koll. 62 osv (diskussion) 25 augusti 2020 kl. 17.59 (CEST)[svara]
jag fixade de sju utan instans av. Och jag är fortsatt postivt imponerad. Jag får för mig att hälften kan vara ågärdade på detta sätt inom 3-5 år, då det hela inte beror på en enstaka insats!Yger (diskussion) 25 augusti 2020 kl. 18.03 (CEST)[svara]
Ok, bra. Jag tog mig friheten att ändra lite på mekanisk pappersmassaframställning (Q10580063) och uppskjutet underhåll (Q5251510).
  • "Mekanisk pappersmassaframställning" är väl "ett slags process/metod", inte "ett slags pappersmassa".
  • "Uppskjutet underhåll" är väl "ett slags underhåll", inte ett "en instans (=ett exemplar) av underhåll".
--Larske (diskussion) 25 augusti 2020 kl. 19.09 (CEST)[svara]
Tack! Jag börjar sedan uppfatta att läget är att det är 25000 helt tomma WD poster och 50000 som saknar insans eller underklass. Och att den första gruppen misnkar med drygt 15-20% om året men den anrdra bara med under 10% om året. Så om 3-4 år finns det cirka 10000 helt utan info men ändå kring 35000 utan instans/underklass till. Yger (diskussion) 25 augusti 2020 kl. 20.51 (CEST)[svara]

Uppgifter med förbehåll

[redigera wikitext]

Det har blivit ganska populärt på Wikidata att använda parametern källäge (P1480) när man har ett osäkert datum. Typiskt rör det ett datum som är osäkert där den som redigerar på Wikidata valt att lägga in ett "cirka" eller "troligen" för att tydliggöra detta.

Hittills har detta inte varit synligt här, men nu har jag lagt in en funktion som gör att dessa förbehåll syns om man angivit att de ska göra det i anropet. Det gör även att artikeln hamnar i kontrollkategorin Kategori:Uppgifter från Wikidata med förbehåll. För närvarande är funktionen förbehåll aktiverad i Mall:Wikidatadatum, vilket innebär att det syns för födelse- och dödsdatum i de artiklar som använder Faktamall biografi WD, men även en del andra. Jag valde att aktivera funktionen för alla datum, inklusive de som är längre på Wikidata men som vi förkortar till år på grund av den julianska kalendern, vilket var en förbättring i vissa fall men kan bli märkligt i andra. Folk får gärna titta igenom kontrollkategorin när den fylls på för att se om det blir några problem. Jag har märkt en del skillnader mellan våra artiklar och Wikidata här. Väsk 17 september 2020 kl. 22.59 (CEST)[svara]

Listerialistan

[redigera wikitext]

De flesta av dessa har lagt av. Den som fungerar är den för tingsrätter som är klar mindre än de övriga. Jag misstänker de är för stora och att kanske tidsgränserna ändrats. Bör de delas upp för att bli mindre? @Larske:Yger (diskussion) 3 oktober 2020 kl. 12.09 (CEST)[svara]

Det är den automatiska (normalt varje dag) körningen som verkar ha stannat, se min kommentar på Diskussion:Avlidna 2020. Det brukar dock gå bra att få uppdateringar gjorda genom att klicka på länken "Uppdatera listan nu" som finns till höger ovanför respektive lista. Jag gjorde det just på Wikipedia:Projekt_svenska_socknar/Listeralista_senaste_WD-uppdatering, men ibland fungerar det inte.
Det är helt klart något knas centralt och det är konstigt att det varat i mer än en månad nu. Problem med verktyg som många använder brukar normalt åtgärdas ganska snabbt.
--Larske (diskussion) 3 oktober 2020 kl. 12.37 (CEST)[svara]
ja 4-5 har fungerat. De som inte fungerar är kommun, församling och distrikt. Då socken har fler objekt än distrikt och ingen stor ändring skett för dem, så är jag inte klar vad som skiljer, men det borde vara volym väl.Yger (diskussion) 3 oktober 2020 kl. 17.03 (CEST)[svara]
Här lite jämförelse mellan några olika frågorna som används för respektive Listeria:
Listeria Antal objekt som
SPARQL-frågan returnerar
Exekveringstid
(sekunder)
Direktlänk
till WQS
Församlingar 3 420 19,132 länk
Kommuner 3 379 7,175 länk
Distrikt 2 523 11,844 länk
Socknar 2 456 10,509 länk
Tingslag 505 1,173 länk
Tingsrätter 120 0,810 länk
Den enda gräns jag känner till är att Listeriabot inte kan hantera mer än 8 000 poster och den gräns för exekveringstid på 60 sekunder som gäller man kör i Wikidata Query Service direkt, har, åtminstone tidigare, varit större när ListeriaBot kör frågorna. Alla exempel i tabellen ovan har dock stor marginal till dessa gränser.
Men sedan någon månad är det tydligen något som gör att betydligt kortare frågor/mindre resultat också gör att roboten hänger upp sig, förutom att de automatiska/schemalagda körningarna helt har slutat att fungera.
Jag experimenterade lite med församlingarna i Sandlådan och det verkar som om det för tillfället går bra med upp till 2 000 objekt men om det blir mer så hakar den upp sig. Men för en sån här "bevakningslisteria" skulle det väl räcka om den listade de 100 senaste uppdaterade objekten eller så. Det är ju, förutom vid massuppdateringar av befolkningsdata, sällan mer än några enstaka objekt som har uppdaterats sedan sist om man kör fram en ny lista en gång i veckan. Jag ändrade därför frågan för församlingarna så att listan nu är begränsad till de 1 000 senast uppdaterade församlingsobjekten och sorteringen är nu efter fallande uppdateringstidpunkt. Om det känns OK kan vi göra samma för kommunerna, distrikten och socknarna.
--Larske (diskussion) 3 oktober 2020 kl. 18.43 (CEST)[svara]
Mycket bra. Ja 500 senaste räcker, så 1000 ger god marginal.Yger (diskussion) 3 oktober 2020 kl. 19.04 (CEST)[svara]
Det blev jättebra, och det var en handfull konstigheter jag ogjorde i de olika posterna. Stort tack!Yger (diskussion) 3 oktober 2020 kl. 20.09 (CEST)[svara]

Kategorier och Wikidata

[redigera wikitext]

Jag har efter att @Larske: lagt in pescanfrågor tittat på kategoriers WD poster. De som dyker upp som nya och som saknar WD post kan delas in i fyra typfall:

  1. de där det går finna en lämplig WD post att koppla till (=bra och oproblematiskt)
  2. de där det sökerligen aldrig kommer skapas någon motsvarande på andra språkversioner (=där jag skapar WD post som är oproblematiskt)
  3. de som saknar WD post men där det kan tänkas skapa samma kategori på andra språkversioner, tex kategori:Finländska flygpionjärer. Att skapa en WD post tycker jag där inte är självklart, det kan försvåra att en koppling skapas när och om det skapas en likartad kategori på annan språkversion
  4. de som saknar WD post och där det verkar vara en olämplig kategori. Dels några där det är bäst ta bort kategorin helt på svwp, men andra där kategorin är rimlig men andra språkversioner har indelat på annat sätt kategori:personer från Tampico där andra språkversioner kategoriserar på en annan nivå. Kategori:Städer och Gemeinde i Eifelkreis Bitburg-Prüm har på de en snarlik men inte identisk kategori. Egentligen borde där den svenska kategorin och dess användning ses över, men det blir för stort jobb.

Jag låter nu bli skapa WD poster på ej självklara kategorier så får de sälla sig till de nära 5000 kategorier som saknar WD poster/iw-länk.Yger (diskussion) 22 november 2020 kl. 11.02 (CET)[svara]

Jag håller med om punkt 1 och 2, men i punkt 3 förstår jag inte resonemanget. Ska vi avstå att ens försöka skapa en koppling bara för att det är svårt alltså? För om vi avstår nu, och alla andra tänker likadant blir inga kopplingar gjorda alls. Eller hoppas vi på att den andra språkversionen drar en annan slutsats än vi? Mitt förslag är istället försöka få till etiketter på relevanta språk för sådana kategorier, i ditt exempel genom att försöka få fatt i finsktalande wikidatianer som kan sätta en etikett som kan upptäckas av den som är trolig att försöka göra en koppling i framtiden. (Punkt 4 behöver jag tänka lite till på.) Ainali diskussionbidrag 22 november 2020 kl. 11.31 (CET)[svara]
Håller med om punkterna 1 och 2 ovan. Instämmer även i punkt 4, den uppenbarar det faktum att olika språkversioner kan ha skapat helt olika kategoriträd vilka dessutom ibland snarare kan karakteriseras som "kategorinystan" som kan vara ett stort arbete att reda ut.
När det gäller punkt 3 tycker jag nog att vi bör skapa Wikidataobjekt och förse dessa med etiketter, beskrivningar och alias, inte bara på svenska utan även på något eller några andra språk, åtminstone engelska, så att det blir lätt att hitta dessa objekt när motsvarande kategori skapas på andra språkversioner. Svwp behöver inte vara blyga för att vi har skapat en viss kategori först. Skulle det trots detta skapas dubblettobjekt från andra håll så är det enkelt att slå ihop dem.
--Larske (diskussion) 22 november 2020 kl. 11.51 (CET)[svara]
Tillägg: För att "leva som jag lär" skapade jag just objektet Kategori:Feminism i Estland (Q102208237) och kopplade det, se historik, till svwp-kategorin Kategori:Feminism i Estland som är ett exempel på typ 3 enligt ovan och som funnits sedan ett år. Genom att den fått såväl etikett som beskrivning även på engelska så måste man anstränga sig för att skapa ett annat objekt som avser samma sak, men osvuret är väl bäst, det finns ju många språk...
--Larske (diskussion) 22 november 2020 kl. 12.30 (CET)[svara]
Kategori:Feminism i Estland (Q102208237) har ju kategorin kombinerar ämnen (P971) och det tycker jag väl är gott nog för att göra kategorin möjlig att hitta och identifiera. Vad gäller "personer från" så vore det på tiden om vi kunde bestämma oss om vi ska fylla dem med personer relaterade till platsen eller personer född i platsen. 62 osv (diskussion) 22 november 2020 kl. 13.22 (CET)[svara]
tack för hjälpen hur göra med fallen av typ 3!Yger (diskussion) 22 november 2020 kl. 15.26 (CET)[svara]

Jag har nu kört en månad och det visar sig vara övermäktigt. Det dyker upp några (få) kategorier per dag som absolut bör länkas och där jag känner det er mervärde, men de tiotalet andra, typ svenska statliga myndigheter upphörda 2008, känner jag blir för mycket och för lite värde. Samtidigt börjar min övriga patrullering av "hål" mellan sv:wp och wd bli betungande. Den sökningen som heter duplicity svwiki ger dels träff på flyttade artiklar etc vilket är någorlunda OK, men också där någon "utomstående" har avlänkat i Wikidata. cCh dessa är inte roliga reda ut, ogöra. Tex EADS som fanns en tid och Airbus Group som de blev 2014. Vissa versioner har i detta fall två artiklar och vissa en, och de som har en har då mergat in WD objektet i den nyare, vilket gör entiteten om den gamla sakar WD objekt fast det finns artiklar om denna. Och medan jag upplever accepten av Wikidata nu är god för nästan alla, och mallar typ faktamall biografi WD av huvuddelen av skribenterna, så är det fortsatt att flera (5-6) av de "äldre" stora bidragsgivarna skapar artiklar utan WD objekt. Och medan jag tycker det är helt OK, efterskapa för nya och ovana artikelskapare (och några speciella av de erfarna) så börjar det kännas alltmer omotiverande skapa för de andra erfarna, och jag kommer nu försöka få några av dessa blir mer aktiva på WD, har börjat med Anhn. Jag har i detta börjat för tjafsiga objekt skapa slarvigare WD objekt, och känner jag inte kan åta mig att göra mer ambitiösa basobjekt typ lägga in För- och efternamn på personobjekt.Yger (diskussion) 19 december 2020 kl. 15.02 (CET)[svara]

Vad gäller för- och efternamn, så tror jag inte du behöver bry dig om det när det gäller "Anders Andersson". De reder robotarna ut. Det är nog mer av medeltida adelsmän du behöver lägga krutet på där. Vad som är efternamn och vad som är släkt klarar inte robotarna av att klura ut. 62 osv (diskussion) 19 december 2020 kl. 15.19 (CET)[svara]

Nytt användarskript för att hitta artiklar vars Wikidataobjekt har få uttalanden

[redigera wikitext]

Jag vill tipsa om ett användarskript som är fiffigt för att hitta artiklar vars Wikidataobjekt har få uttalanden. Det fungerar så att när man står i en kategori så läggs även en siffra till med hur många uttalanden den artikelns Wikidataobjekt har. Siffran är också en direktlänk till Wikidataobjektet så det blir lättare att hitta de Wikidataobjekt som är i störst behov av att förbättras. Användarscriptet kan installeras genom att lägga till följande till sin common.js: mw.loader.load("//meta.wikimedia.org/w/index.php?title=User:Nikki/StatementCounts.js&action=raw&ctype=text/javascript"); Ainali diskussionbidrag 27 februari 2021 kl. 10.31 (CET)[svara]

Gillar Larske (diskussion) 27 februari 2021 kl. 11.08 (CET)[svara]

Denna funktion har varit av stor nytta. Dels hittar den artiklar som tillkommit utan WD post men viktigare hittar den poster vars WD post tappats bort av ett eller annat skäl (bla vandalisering). I vanliga fall ger den några träffar per dag, men nu har den på två veckor inte givit någon träff. Har den slutat att fungera?LarskeYger (diskussion) 22 maj 2021 kl. 08.18 (CEST)[svara]

Duplicity hör inte till de verktyg som jag använder ofta och vet därför inte hur det brukar se ut, men visst det ser lite konstigt ut att det står "1" i kolumnen Articles without item på raden svwikiden här sidan, men när man klickar på show list på samma rad så är listan tom. Är det den listan du brukar använda?
Klickar du på check random article på svwiki-raden blir det dock napp och artikeln Grammatikdagen, som saknar Wikidatakoppling, kommer fram för bearbetning. Vet inte om Duplicity har någon statussida där man kan se om det verkar fungera. Om du testar att skapa ett Wikidataobjekt för den artikeln kan vi ju se om räknaren tickar ner från "1" till "0" eller om den har hakat upp sig.
Jag hittar ingen diskussion på Wikidatas Project Chat de senaste två veckorna om eventuella problem med Duplicity. I Phabricator anmäldes ett problem med felkod "503 Service Not Available" 15 februari 2021, men det åtgärdades efter fyra dagar genom att verktygets server återstartades.
-- Larske (diskussion) 22 maj 2021 kl. 10.14 (CEST)[svara]
Jag använder denna och där kommer inte Grammatikdagen upp.Yger (diskussion) 22 maj 2021 kl. 10.17 (CEST)[svara]
Men om du klickar på länken med texten "napp" ovan får du väl också napp antar jag. Larske (diskussion) 22 maj 2021 kl. 10.26 (CEST)[svara]
Du valde att skapa objektet för Grammatikdagen, så nu blir det inte längre något napp. Sidan med "available wikis" har också uppdaterats, inte genom att "1" blev "0" för svwiki utan genom att raden med svwiki försvann. Jag tolkar det som att verktyget kör och att det för närvarande inte hittar några, mer än två veckor gamla, artiklar på svwiki som saknar Wikidatakoppling.
Larske (diskussion) 22 maj 2021 kl. 10.33 (CEST)[svara]
Instämmer, tack för hjälpen!Yger (diskussion) 22 maj 2021 kl. 10.34 (CEST)[svara]
Nåt skumt är det dock eftersom PetScan hittar 46 okopplade artiklar vara endast ett fåtal är yngre än två veckor
  • Länk till fråga som ger en lista på (just nu 46) svwp-artiklar som saknar koppling till ett Wikidata-objekt
-- Larske (diskussion) 22 maj 2021 kl. 10.45 (CEST)[svara]
Lojwe har de senaste dagarna gjort ett antal merge i WD av kommun och ort i Spanien och därmed lämnat vår (och Cebuanos) ortsartikel utan WD-koppling. --北山 Kitayama (diskussion) 22 maj 2021 kl. 10.57 (CEST)[svara]
Listan är helt enligt det jag brukar se, och jag hittar att "tappade" WD poster skapats från 7 maj och framåt. Lsjbot relaterade objekt brukar finnas med även om det här är lite fler än vanligt.Yger (diskussion) 22 maj 2021 kl. 11.03 (CEST)[svara]
Så PetScan använder då senare versioner av databaserna än var Duplicity gör eller så gör inte Duplicity fullständiga uppdateringar av sina listor så ofta. Vore käckt om dessa gissningar kunde bekräftas (eller vederläggas) av någon form av dokumentation av hur verktyget fungerar.
Jag såg också att mycket av det okopplade var relaterat till LsjBot/cebwiki och Wikidata-gemenskapen har varit ganska tuffa med att rensa bort sådana objekt. På Duplicity-översiktssidan framgår att mer än 800 000 cebwp-artiklar saknar WD-objekt.
Vilket är bästa sättet att hitta "Wikidatakopplingshistoriken" för en okopplad artikel, till exempel Amerikansk liberalism? Den artikeln har funnits i mer än 12 år och borde rimligen ha haft en koppling till ett WD-objekt som någon har nu har tagit bort, kanske vid en merge av två Wikidataobjekt där det andra redan hade en koppling till en annan svwp-artikel vilket fick Amerikansk liberalism att "hänga i luften". Sådant borde ju meddelas på artikeln diskussionssida så att svwp-gemenskapen kan vidta lämplig åtgärd.
I det här fallet verkar det dock inte vara någon merge inblandad, jag ser nu att Yger har hittat objektet Amerikansk liberalism (Q16152203), bra jobbat, och åter infört kopplingen till den svenska artikeln. Använde du "Sök" och fick träff tack vare att objektet på engelska har ett "Alias" som är "American liberalism"?
Min fråga är alltså om det hade gått att hitta fram till ett objekt (Amerikansk liberalism (Q16152203)) som en artikel (Amerikansk liberalism) tidigare varit kopplad till utan att behöva förlita sig på att "Sök" kan ge tips? Larske (diskussion) 22 maj 2021 kl. 12.30 (CEST)[svara]
Jag hade gärna sett en "logg" kopplad till varje sida som beskriver vilka objekt de varit kopplade till, när de ändrats och av vem. 62 mm (diskussion) 22 maj 2021 kl. 12.33 (CEST)[svara]
Det är ett avancerat detektivarbete att återfinna var artikeln varit kopplad. I många fall går det hitta med sök men ibland har en (tokig) merge varit framme så det tidigare objektet inte finns kvar. Jag har lagt i denna petscan som alternativ till Dupicity (då duplicityfrågan har noll i svarstid så misstänker det regelbundet görs en generell genomgång för att hitta okopplade wp-artiklar, och då att denna genomgång legat still en tid). För räddningsverk (som avkopplats från WD objektet för räddningstjänst) var jag tvungen förstå mig på finska, koppla bort den finska motsvarande artikeln som felaktigt var kopplad till nödanrop och sedan koppla ihop den med den svenska artikeln och skapa ett nytt WD objekt. Yger (diskussion) 22 maj 2021 kl. 13.06 (CEST)[svara]
Det är inte exakt "samma lista" eftersom Duplicity exkluderar artiklar som är skapade de senaste två veckorna medan PetScan-frågan inkluderar även dessa. PetScan-frågan är alltså samma som summan av de två "Alla"-frågorna under avsnitten "Personartiklar som saknar Wikidataobjekt" och "Övriga artiklar som saknar Wikidataobjekt" i avsnitten under. Larske (diskussion) 22 maj 2021 kl. 13.47 (CEST)[svara]
Information om wd-ändringar finns sparad 30 dagar i Senaste ändringarna. Så ibland går det där att hitta objektet som en artikel varit kopplad till. I en liten kategori som Liberalism i USA är det ganska lätt att hitta när Amerikansk liberalism kopplades bort. Det funkar med länkar mellan artiklar också, t.o.m omdirigeringar som Villarino dels Aires med en länk till Villarino de los Aires (kommunhuvudort). 90.227.175.244 22 maj 2021 kl. 15.32 (CEST) Enklast kanske är att lägga endast en länk till artikeln i en sandlåda utan annat innehåll och kolla relaterade ändringar därifrån. 90.227.175.244 22 maj 2021 kl. 15.37 (CEST)[svara]
Bra tips! Larske (diskussion) 22 maj 2021 kl. 16.38 (CEST)[svara]

──────────────────────────────────────────────────────────────────────────────────────────────────── Angående kopplingen av Amerikansk liberalism så upptäckte jag precis att det finns ett objekt Liberalism i USA (Q721556) också. Samma person som kopplade bort svwp-artikeln från Amerikansk liberalism (Q16152203) kopplade även bort artiklarna i nowp, itwp och lmowp. Men dessa artiklar kopplades i samma veva till Liberalism i USA (Q721556) vilket svwp-artikeln inte kunde göras eftersom det redan fanns en annan svwp-artikel kopplad till detta objekt. Se översikten nedan.

I enwp och ptwp verkar man beskriva de två objekten med "klassisk" respektive "modern" liberalism i USA (inte i Amerika). Även frwp, eswp och nlwp har med ordet "modern" eller motsvarande i sina artikelnamn. Stämmer denna uppdelning av "scope" med de två svenska artiklarna? Bör de i så fall kanske döpas om så att distinktionen mellan "klassisk" och "modern" framgår redan av artikelnamnen snarare än att ge ett intryck av att den ena handlar om USA och den andra om Amerika.
--Larske (diskussion) 22 maj 2021 kl. 21.05 (CEST)[svara]

jag har tittat igenom lite noggrannare (jag slarvade med det när jag kopplade). Den andra som handlar om att positionera Liberalismen i moderna USA, vid sidan om motsvarane artiklar om liberalismen i Storbritannien etc, tycker jag länkningen är korrekt. Jag har lagt in "i modern tid" i första meningen i den svensk artikeln för att tydliggöra att det är infallsvinkeln. Även namnet kunde ändras, men jag känner mig inte tillräckligt säker på nomenklatur för att göra så. Den första är lite olika mellan språkversionerna och är inte med i malla etc, så är en "mindre viktig" (4 titt/dag mot 6 för den andra). JAg tycker den svenska texten är bra och att den inte helt motsägs av anda kopplade artiklar, så ser itne behov ändra något i koppling. Namn kan naturlivis diskueras men jag har inga invändningar till hur det är nu. Jag har även lagt in Se även i de båda.Yger (diskussion) 23 maj 2021 kl. 08.38 (CEST)[svara]

Avstämning av könskategorisering i Wikipedia och värde på egenskapen P21 i Wikidata

[redigera wikitext]

@Yger: Jag kompletterade några av de nyskapade objekten för personer med förnamn (P735) och efternamn (P734). Jag fastnade på Jana Zupanc (Q108267153) som hade fått kön (P21) lika med man (Q6581097) trots att motsvarande Wikipediaartikel är ligger i Kategori:Kvinnor. Såna misstag är ju lätta att upptäcka när data är strukturerat och det fick mig att göra ett par PetScan-frågor som kanske kan vara användbara i kvalitetsarbetet.

Jag har kompletterat rutan Avstämningslistor på projektsidan med två frågor enligt nedan:

Det kan finnas en del falska träffar i dessa listor, men i de många fall verkar det handla om antingen felkategorisering i Wikipedia eller felaktigt egenskapsvärde i Wikidata. Det kan också vara objekt som har helt fel instans av (P31) i Wikidata, som till exempel Björn Lindström (Q63246887), eller artiklar som kanske inte borde ligga i någon könskategori i Wikipedia, som till exempel Mordet på Tammy Alexander som är kopplad till ett objekt som är instans av (P31) mord (Q132821). Några Wikimedia-dubblett (Q17362920), som till exempel Johan Palmberg (botaniker)/Johannes Palmberg (Q17265829) dyker också upp i listorna.

-- Larske (diskussion) 29 augusti 2021 kl. 08.47 (CEST)[svara]

mycket i värdefull korslistning. Lite mindre än hälften var rena fel, lätta att fixa och det vara bara ett fåtal där kön saknades helt. Av de som är kvar är det kanske hälften som handlar om de som lite mittenmellan. Sedan var det många om syskon, om där person och produkt (musikgrupp etc) rörts ihop och än mer för mord och mördare/mordoffer lagt in i samma artikel. Och där de olika artiklarna på olika språkversioner inte riktigt går ihop sig. Jag får se om jag orkar reda ut denna rest (omkting 125)Yger (diskussion) 30 augusti 2021 kl. 18.09 (CEST)[svara]

Spatial geografisk information i Wikidata

[redigera wikitext]

Hej! Finns det planer på att lagra spatial geografisk information i Wikidata? Jag har letat men inte hittat något om detta. Som exempel på hur detta kan vara användbart är om ett objekt har en geografisk koordinat lagrad så kan man från denna härleda dess geografiskt administrativa indelningsområde. T.ex. att från en koordinat för en plats automatiskt härleda kommum, distrikt, församling etc. Förutsatt då att områdena lagras med spatiala data i form av polygoner. Vitplister (diskussion) 3 oktober 2021 kl. 17.29 (CEST)[svara]

Denna type av data lagras på Commons. 98.128.181.19 3 oktober 2021 kl. 17.48 (CEST)[svara]
Njae, nu tror jag att du missförstår mig. Som exempel för Göteborgs konstmuseum (Q1992004). Dess koordinat är angiven som 57°41′49″N 11°58′48″Ö / 57.69694°N 11.98000°Ö / 57.69694; 11.98000. Utifrån denna, och bara denna skulle jag vilja härleda (bland annat!) att denna byggnad ligger i Göteborgs Vasa distrikt (Q21566749), Göteborgs kommun (Q52502) och tätorten Göteborg (Q25287) helt baserat på vilken yta dessa administrativa områden täcker. I nuläget behöver man "manuellt" ange i vilket administrativt område något ingår.
Jag tänker mig att man som användare bara skulle behöva ange koordinat och att sedan t.ex. kommun och annat rasslar in av sig själv. Är det en utopisk tanke? Vitplister (diskussion) 3 oktober 2021 kl. 19.42 (CEST)[svara]
Den är inte utopisk, då ju all info finns och det finns exempel när detta gjorts (men det finns oregelbundna polygoner då det är svårt veta om punkten är inom eller ej). Jag pingar Larske som kan detta bättre.Yger (diskussion) 3 oktober 2021 kl. 19.47 (CEST)[svara]
Spännande! Jag är mycket nyfiken på de exempel när detta gjorts som du nämner. Vitplister (diskussion) 3 oktober 2021 kl. 20.03 (CEST)[svara]
Ja har länge tänkt att det vore trevligt att kunna översätta från en godtycklig punkt/koordinat till vilken svensk kommun som punkten ligger i. Om man bara har geodata för de polygoner man vill undersöka går det att koda en funktion som kan avgöra om en punkt ligger inom eller utanför var och en av alla polygoner för ett visst "sortiment", till exempel Sveriges kommuner eller distrikt. Men att läsa in dessa geodata från Commons "on demand" för hundratals (kommuner) eller tusentals (distrikt) objekt är nog mer än vad servrarna tillåter. Man måste därför lagra dessa geodata lokalt och vid behov göra en uppdatering. Kommuner och distrikt ändras ju inte särskilt ofta, men om man skulle vilja veta inom vilket naturreservat en viss punkt (eventuellt) ligger, finns det risk att de allra senaste ändringarna inte finns med.
Jag ska försöka göra ett provskott med de 290 kommunerna och återkommer när/om jag har något som kan provas.
Det vore intressant att höra om det är något speciellt användningsfall (use case) som Vitplister har i åtanke för en sådan möjlighet. Är det för att slippa titta på kartan och i så fall i vilket sammanhang? Är det vid skrivning eller läsning av Wikipediaartiklar eller något annat fall som det skulle komma till användning?
-- Larske (diskussion) 3 oktober 2021 kl. 21.51 (CEST)[svara]
Tack! Mest att det är trevligt i allmänhet, men ett "use-case" har jag väl.
Jag (och Sverigesbiografer) håller sakta men säkert på att lägga in alla biografer i Sverige på Wikidata (både de som funnits och finns). Det saknas riktigt bra systematiska uppställningar. Det bästa som finns för äldre tid är Förteckning över Sveriges Biografer (1930) (Q93803749). Den är uppställd efter "ort", vilket är något diffust. Det kan vara en järnvägsstation, postanstalt, stad by eller lite av varje.
Mitt mål är att så småningom försöka någorlunda exakt koordinatsätta alla biografer. Först kanske grovt, för att sedan göra det mer exakt.
En sak jag har funderat på som skulle göra det enklare att hitta fakta om biograferna är att efter att först ha gjort en grov koordinatsättning kunna sortera posterna i t.ex. distrikt, kommun, län osv. för att på så sätt lättare kunna söka vidare i andra källor. Alltså att kunna på samma gång kunna kolla upp information om alla biografer i ett visst distrikt eller en viss kommun hos hembygdsföreningar, i kommunarkiv etc. T.ex. så har ju hembygd.se sina föreningar sökbara efter just distrikt. Vitplister (diskussion) 4 oktober 2021 kl. 00.58 (CEST)[svara]
När Wikidata var ungt var det mycket prat om att sådant som inom det administrativa området (P131) skulle ersättas av dylikt.
Ett problem är ju dock att spatial data sällan är så exakt man skulle önska. Visst, det är lätt att hitta sådan för svenska tätorter, kommuner och distrikt. Men försök hitta det för Gyllene horden (Q79965) eller Tysk-romerska riket (Q12548)!
Wikidata är inte bara om välordnad data i välstrukturerade länder. Det handlar oftare om historiska data i områden med vaga eller omstridda gränser dit lantmätares händer sällan satt sin fot. 98.128.181.19 4 oktober 2021 kl. 08.41 (CEST)[svara]

Behövs enhetlighet kring grensidor? Diskutera på Wikipedia:Wikidatafrågor#Grensidor. ✍️(skrivet av:) GeMet(användare:) 💬  den 11 oktober 2021 kl. 15.13 (CEST)[svara]

Källös kategorisering i WD hamnar i faktarutor.

[redigera wikitext]

Jag vet inte om jag nu skriver på rätt ställe. Det gäller ett problem som jag upptäckt i Falskmyntarna (roman) men som vad jag förstår gäller principen för överföring mellan WP och SVWP. Problemet är alltså inte i första hand korrektheten i just denna uppgift (fastän jag ifrågasätter den).

Någon har, utan källa, lagt in ordet "hbtq-litteratur" i WD och det hamnar då i "faktarutan" i wikipediaartikeln. Jag ser två problem här:

1) En uppgift utan källa vidarebefordras automatiskt till SVWP. Detta trots att vi med rätta är noga med våra källor. Det är extra allvarligt när uppgiften ges extra tyngd genom att placeras i en faktaruta.

2) Om uppgiften ändras i WD och därmed i faktarutan så syns inte detta i artikelns historik, och den som bevakar artikeln ser inte i sin bevakningslista att faktarutan har ändrats. Därmed minskar möjligheten att hålla koll på vad som händer i SVWP och risken ökar för att felaktigheter kommer in och får stå kvar. Det finns också stor risk att artikeltexten och faktarutan ger sins emellan motsägande uppgifter. --Chandra Varena (diskussion) 12 oktober 2021 kl. 07.21 (CEST)[svara]

beteckningen las in 2017 av en mycket senior användare. Och när man läser den engelska artikelversionen verkar den beteckningen ha fog för sig.Yger (diskussion) 12 oktober 2021 kl. 07.28 (CEST)[svara]
Den specifika uppgiften har diskuterats på Diskussion:Falskmyntarna (roman). Det värde som år 2017 lades in som genre (P136) i Falskmyntarna (Q276722) var dock HBTQ (Q17884) vilket inte är en litterär genre (Q223393). Det korrigerades dock år 2019 till det nuvarande hbtq-litteratur (Q10318944), ett objekt som visserligen har funnits sedan 2013, länge helt tomt och först 2018 fylldes det med egenskaper, så det kan ju vara en förklaring till att det inte hittades 2017.--Larske (diskussion) 12 oktober 2021 kl. 08.41 (CEST)[svara]

Det är önskvärt att alla uppgifter i Wikidata har källor, speciellt om uppgiften är kontroversiell på något sätt.

  1. Det stämmer att ändringar i WD som importeras till en faktaruta inte syns i artikelns historik. Det gäller även ändringar som görs av mallar här i svwp, till exempel navboxar och ändringar som görs av bilder på Commons. Någon kan lägga upp en helt ny version av en bild som visas i en eller flera svwp-artiklar eller göra ändringar i en navbox som visas i hundratals svwp-artiklar utan att det märks i artikelhistorikerna i svwp eller på bevakningslistorna för dem som bevakar dessa artiklar.
  2. När det gäller bevakningslistan finns det möjlighet att i den inkludera redigeringar i Wikidata som påverkar det objekt som är länkat till artikeln, men då får du alla ändringar (möjligen med vissa undantag) i det objektet och inte bara de som påverkar innehållet i faktarutan. Se till exempel Wikipedia:Wikipediafrågor#Se_Wikidata-ändringar_i_bevakningslistan. Testa gärna och meddela hur du tycker att det fungerar.

--Larske (diskussion) 12 oktober 2021 kl. 08.41 (CEST)[svara]

Status november 2021

[redigera wikitext]

Jag har nu i två år skapat WD poster för alla nya Wp artiklar som saknat sådana, dock finns det över 30000 äldre som ännu saknar WD post. Medan det för vissa sortiment, personer, geografiska objekt etc, känns jag skapar "bra" objekt så är det andra sortiment där de nya WDobjektet känns väl tunna. Det finns några få sortiment där basdata i WD laddats innan WP post finns. Oförändrat är att det finns attribut som är lite oklara/dubbeltydiga (tänk författare som menar skriver böcker och författare som menar skribent). Antalet WD objekt som saboterats inom hela vårt sortiment är få, några enstaka per månad, och de är minskande. Och den gamla sanningen råder - tomma objekt drar till sig "smuts" medan välifyllda lämnas i fred. För mitt specialsortiment om cirka 13000 artiklar: socknar, kommuner, församlingar etc fungerar allt mycket bra. Ingen vandalisering eller missriktad förstörelse alls på över nio månader. I kommuner läggs det in hundratals nya egenskaper per månad, församlingar nära hundra per månad. Enda dålighet är att de attribut över objektet på andra språk ofta är tveksamma, svårt skilja på betydesen kommun, församling, distrikt, socken och ort. Danska Wikipedia har börjat skapa artiklar om socknar i Halland och Skåne där de använder en variant av databox så det data jag lagt upp i Wikidata fullt ut återanvänds, kul! Yger (diskussion) 7 november 2021 kl. 09.37 (CET)[svara]

Varifrån kommer uppgiften att det finns "över 30000 äldre (svwp-artiklar) som ännu saknar WD post"? Jag lever i tron att alla svwp-artiklar, förutom de allra senast skapade, är knutna till ett objekt i Wikidata. Definierar du kanske "WD post" som ett "WD-objekt med en viss uppsättning grundläggande egenskaper", i så fall vilka? Larske (diskussion) 7 november 2021 kl. 11.41 (CET)[svara]
Vi gjorde ju en beräkning för några år sedan. En där de helt saknade poster, som blev runt 30000 och en där det som saknades var instans av, underklass till del av och aspekt av och då blev det 50000 (nirmos siffra). En aktuell siffra vore intressant. Yger (diskussion) 7 november 2021 kl. 11.54 (CET)[svara]
Special:UnconnectedPages visar bara 207 sidor. Fast det verkar som en del av dem har koppling som lagts till de senaste två veckorna. F.d. 82.212.68.183 (diskussion) 7 november 2021 kl. 12.23 (CET)[svara]
Jag går två gånger om dagen igenom de artiklar som helt saknas WD poster enligt de listor som finns på projektsidan, så det bör bara vara någon enstaka Yger (diskussion) 7 november 2021 kl. 12.49 (CET)[svara]
@Yger: Jaha, jag trodde att du med "saknar WD post" avsåg "saknar koppling till WD-objekt", men du avsåg tydligen "saknar WD-objekt med uttalanden" (även kallat "tomma objekt"). Jag återkommer med en uppskattning av mängden svwp-artiklar som är kopplade till tomma objekt. Larske (diskussion) 7 november 2021 kl. 12.39 (CET)[svara]
En undersökning av ett stickprov på 10 000 slumpmässigt valda svwp-artiklar gav följande resultat:
  • 74 artiklar (0,74 procent) är knutna till ett Wikidataobjekt som helt saknar uttalanden.
  • 238 artiklar (2,38 procent) är knutna till ett Wikidataobjekt som saknar värde för såväl instans av (P31) som underklass till (P279).
    • av dessa är det 164 (1,64 procent) som har minst en annan egenskap angiven, dock enbart 5 (0,05 procent) som har någon av del av (P361) eller aspekt av (P1269) angivna.
  • Antalet egenskaper med minst ett värde:
    • Medelvärde: 13,2
    • Medianvärde: 9
    • Undre kvartil: 6
    • Övre kvartil: 16
    • Typvärde: 7
Om vi "skalar upp" ovanstående till 2,9 miljoner artiklar, det vill säga multiplicerar med 290 kan följande vara en aktuell uppskattning för hela artikelnamnrymden i svwp:
  • Omkring 21 000 artiklar är knutna till ett Wikidataobjekt som helt saknar uttalanden.
  • Omkring 69 000 artiklar är knutna till ett Wikidataobjekt som saknar värde för såväl instans av (P31) som underklass till (P279).
Med andra ord: Fortfarande en hel del att åtgärda.
--Larske (diskussion) 7 november 2021 kl. 13.44 (CET)[svara]
Tack!, lite fler än jag trott utan basinfo (jag får det till 67.500 om vi tar med anknytning till och del av) och färre än jag trott med helt tom info.Yger (diskussion) 7 november 2021 kl. 14.16 (CET)[svara]
Finns det någon åtgärdskategori för dessa? Eller rapport/query? -- Sturban (diskussion) 8 november 2021 kl. 10.10 (CET)[svara]
@Sturban Jag hittar 19 707 artiklar som helt saknar uttalanden med denna query. Stämmer alltså relativt väl med Larskes uppskattning på 21 000. - Belteshassar (diskussion) 8 november 2021 kl. 11.23 (CET)[svara]
För de objekt som har kanske har något eller några uttalanden, men inte något av de "grundläggande" finns ingen komplett rapport som jag känner till, men här är en fråga som ger en lista som räcker länge för den som känner sig manad att komplettera med en grundläggande egenskap:
Om man inte begränsar antalet begärda resultat i frågan tar den längre än 60 sekunder och ger därför "timeout" som resultat. Med en begränsning till 5 000 artiklar tar den just nu cirka 15 sekunder. Skruva ner "LIMIT" om det ändå blir timeout.
-- Larske (diskussion) 8 november 2021 kl. 11.44 (CET)[svara]
Samma fråga som i november 2021 hittade 19 707 artiklar vars Wikidataobjekt helt saknar uttalanden, hittar idag 10 005 artiklar.
Antalet är alltså ungefär halverat på cirka 16 månader.
  • Länk till fråga som hittar (just nu 10 005) svwp-artiklar som är kopplade till helt tomma Wikidataobjekt.
-- Larske (diskussion) 13 mars 2023 kl. 19.42 (CET)[svara]
Stämmer väl, jag och några andra har skapat drygt 8000 WD objekt för dessa Yger (diskussion) 13 mars 2023 kl. 19.46 (CET)[svara]
Uppdatering februari 2024
@Yger: Ett ganska vanligt fall bland objekt som är kopplade till en svwp-artikel men saknar värde på såväl instans av (P31) som underklass till (P279) är att någon har "slängt in" egenskapen land (P17) med värdet Sverige (Q34) som kanske enda egenskap, möjligen som en "quick fix" för att undvika att objektet ska användas för något annat i någon annan språkversion med en trasslig interwiki som följd. Här är en lista med dessa objekt:
-- Larske (diskussion) 5 februari 2024 kl. 22.06 (CET)[svara]
Kul lista och det kliar i fingrarna ge dem instans. Jag konstaterar dock att alla dessa verkar vara handfasta och reella, alls inte som de mer lösliga som de 19000 jag jobbade med under denna rubrik. Jag får också för mig de knappast finns på andra språkversioner eller att det är frågan om dubbletter. Nu är jag emellertid fast i naturreservaten som nog tar mig till april, får se vilken ork jag har därefter Yger (diskussion) 6 februari 2024 kl. 18.42 (CET)[svara]

{{Folkmängd WD}} och fler mallar som anropas utan PID och QID

[redigera wikitext]

Wikidataanrop gör artiklarnas wikikod svårbegriplig, främst pga PID- och QID-koder, vilket skapar en motvilja mot Wikidata. Bör vi skapa fler mallar som minskar behovet att specificera dessa koder?

Jag gillar mallen {{Folkmängd WD}} för att wikikoden blir så begriplig och inte visar PID. Det verkar finnas acceptans för att den mallen anropas i tabeller, diagram och faktarutor, och där får ersätta {{Stat}}, men ännu inte för att den används i brödtexten. För samtliga dessa tillämpningar är avrundning till tre värdesiffror feltänkt. Även om den får användas i brödtext tycker jag avrundning skulle vara onödigt. Nu visar den folkmängd följd av årtal innanför parentes, men jag tycker att fotnot med källa och datum kan vara bättre.

Om den ska ersätta {{Stat}} i tabeller borde den kunna visa flera olika Wikidataobjekt men utan att kräva QID, utan istället ta artikelnamn, objektnamn eller objektalias som inargument. T.ex. {{folkmängd WD|Göteborgs kommun}} eller {{folkmängd WD|Norge}}. Därmed kan den användas i listor i artiklar om större regioner. Skulle en sådan lösning vara stabil om artiklar eller Wikidataobjekt byter namn eller alias?

Möjligen skulle man kunna lägga till attribut såsom ({{folkmängd WD|Malmö}}), {{folkmängd WD|Malmö|visaår}}, {{folkmängd WD|Malmö|visadatum}}, {{folkmängd WD|Malmö|döljkälla}} eller {{folkmängd WD|Malmö|döljpenna}}.

Finns det något argument för att vi har en särskild modul Modul:Folkmängd WD för ändamålet istället för att mallen anropar en generell Wikidatamodul, t.ex. modul:WikidataIB eller modul:Wikidata2? Det borde vara lättare att hålla reda på flera besläktade mallar, än flera nästan likadana Wikidatamoduler med var sin wrapper.

Vilka fler mallar som är uppkallade efter egenskapsnamnet borde vi skapa? De bör få nytta i ett stort antal artiklar. Jag tänker på {{area WD}} till area (P2046), och {{bild WD}} till bild (P18). Föränderlig statistik är särskilt intressant, så som {{Antal döda WD|intervall=år}}, {{Antal döda WD|intervall=kumulativt}} och {{Antal skadade WD}} vid pågående katastrofer, epidemier och krig.

{{Iriksdagenkallad}} ser jag en poäng med, och den används i ett par hundra artiklar, men den blev omdiskuterad. Så vi bör välja case som fler ser poängen med.

Även mallen Wdtable_row (som används i artikeln Tyne) borde väl kunna vidareutvecklas så att den kan ta objektnamn eller liknande istället för QID som argument, och så att den kan visa fotnoter?

Tomastvivlaren (diskussion) 15 februari 2022 kl. 15.19 (CET)[svara]

Att dölja egenskapers P-nummer med ett begripligare mallnamn är helt ok, man kan till och med ta bort "WD" från mallnamnen om man inte vill förvirra redigerare som inte har en aning om vad den förkortningen står för.
Där du skriver "objektnamn" ovan antar jag att du menar objektets "etikett". Om ett objekt har något "namn" så är det just Q-numret som är objektets unika identifierare.
Etiketter är dock inte unika och det skulle blir problem att veta vilket av flera objekt med samma etikett som avses med ett mallanrop som {{Folkmängd WD|Paris}}. Det finns rätt många Paris att välja på:
Artikelnamn skulle kunna fungera som parameter, men bara tills artikeln man pekar på flyttas vilket händer lite då och då.
-- Larske (diskussion) 15 februari 2022 kl. 16.43 (CET)[svara]
Jag ser att Modul:Wd hanterar följande egenskapsnamn på engelska: Modul:Wd/aliasesP. Det kan vara en idé för fler generella moduler.
Jag har inte hittat något tekniskt sätt att göra {{getQid|<artikelnamn>}} eller liknande. Existerar det ens i teorin? Idealt vore att det skulle funka även för omdirigeringar. Tomastvivlaren (diskussion) 18 februari 2022 kl. 21.29 (CET)[svara]
Varje artikel som är kopplad från något Wikidataobjekt har en "pageprop" som heter "wikibase_item" som pekar tillbaka till objektet i Wikidata och går att nå via ett API. Så här ser det ut för Douglas Adams (som har en koppling till (Q42):
men eftersom ett Wikidataobjekt bara kan vara kopplat till en artikel (per Wikipediaspråkversion) kan en omdirigeringssida får man heller ingen pekar från en omdirigeringssida till samma objekt som omdirigeringsmålet har. (Ett annat objekt kan ibland vara kopplat till omdirigeringssidan, men det hjälper oss inte.
Så här ser det ut för omdirigeringssidan Douglas Noel Adams (som saknar koppling till Wikidata):

Lua-biblioteket mw.wikibase innehåller funktionen getEntityIdForTitle som används av funktionen getEntityFromTitle i Modul:WikidataIB. Men den kan du översätta ett artikelnamn (title) till ett Q-id.
Exempel med Douglas Adams:
  • {{#invoke:WikidataIB|getEntityFromTitle|Douglas Adams}} → Q42
Detta går förstås att bygga in i en mall med den syntax du anger ovan, {{getQid|<artikelnamn>}}, men problemet att artiklar flyttas/byter namn tror jag dock inte löses med denna funktion som nästa exempel visar.
Exempel med omdirigeringssidan Douglas Noel Adams:
  • {{#invoke:WikidataIB|getEntityFromTitle|Douglas Noel Adams}} → (inget Q-id fås för denna omdirigeringssida)
-- Larske (diskussion) 18 februari 2022 kl. 23.38 (CET)[svara]
Alltid lika strålande svar. Synd att RedirectResolvingEntityLookup inte accepterar titel, utan bara entityID. Kanske att Wikibase utökas med en sådan funktion i framtiden. Utan det är det inte så stor idé att vidareutveckla Folkmängd WD för att användas i tabeller med flera olika objekt. Och eftersom användning i brödtext inte tycks accepteras så är det inte så stor idé att skapa övriga av ovanstående förslag till mallar tänker jag. Eller skulle någon ha nytta av {{Folkmängd WD|qid = <QID>}}? Tomastvivlaren (diskussion) 19 februari 2022 kl. 00.42 (CET)[svara]
Hmm, jag ser nu att man kan skrämma fram ett "Q42" även för omdirigeringen Douglas Noel Adams genom att lägga in redirects=1 i API-anropet:
-- Larske (diskussion) 19 februari 2022 kl. 01.18 (CET)[svara]

Avstämningslistor

[redigera wikitext]

de som finns till höger på artikelsidan fungerar inte idag kväll, kan du Larske se om det är tilfälligt eller om någon behöver göras om? Yger (diskussion) 3 november 2022 kl. 18.59 (CET)[svara]

@Yger: Är det fortfarande problem? Jag provade just frågan
Den gav två artiklar som resultat:
-- Larske (diskussion) 3 november 2022 kl. 19.29 (CET)[svara]
Ja nu fungerade det för mig också Yger (diskussion) 3 november 2022 kl. 19.52 (CET)[svara]

Anakronismer i födelseplats och dödsplats

[redigera wikitext]

Vi har ju försökt att se till att de namn på födelse- och dödsförsamlingar som dyker upp i faktarutan som {{Faktamall biografi WD}} ska överensstämma med det namn som gällde vid födelsedatum (P569) respektive dödsdatum (P570) genom att församlingsobjekt som har bytt namn en eller flera gånger har försetts med uppgifter om namn (P2561) för respektive perioder. Det verkar fungera bra.

Idag upptäckte jag att det finns rätt många objekt som har åsatts en födelseplats (P19) eller en dödsplats (P20) som är en församling som har ett datum för grundande eller skapande (P571) som är senare än födelsedatum (P569) respektive dödsdatum (P570). Wikidata har en viss kontroll av sådana misstag och varnar för samtidsproblem om man stoppat in en födelseplats (P19) eller dödsplats (P20) som inte alls fanns under någon del av personens levnad och varnar för detta med en cirkel med ett utropstecken i, se till exempel här. Tyvärr verkar sådana varningar ofta ignoreras och dels fångar det ju inte alla fel enligt ovan om församlingen som angivits som födelseplats skapas efter födelsedatum (P569) men före personens dödsdatum (P570) eller om personen fortfarande lever. Just nu finns det 430 fall av anakronismer för födelseplats (P19) och 134 fall anakronismer gällande dödsplats (P20). Av dessa är det 210 resp 68 som avser personer som har en svwp-biografi som använder {{Faktamall biografi WD}} och där dessa fel alltså syns i svwp. Men alla fel bör naturligtvis rättas.

Ibland har anakronistiska uppgiften om födelse- eller dödsförsamling skrivits in även i artikelingressens, som i Carl Beck-Friis som är född 1886 och den angivna födelseförsamlingen Jakobs församling inte grundades förrän 1907. Rätt födelseförsamling torde vara Jakob och Johannes församling (Q54006791).

I några fall kan en förväxling ha gjorts om församlingen har funnits flera gånger med samma namn och som representeras av olika objekt i Wikidata. Detta gäller till exempel Södertälje församling som även fanns 1966 då Birger Christenson avled där, men det är Södertälje församling (Q11055449), som har 2010 som värde på datum för grundande eller skapande (P571), som har använts som dödsplats (P20) för Birger Christenson (Q5608366) i Wikidata, se här, när det borde vara den Södertälje församling (Q70043395) som fanns mellan 1946 och 2001. -- Larske (diskussion) 11 augusti 2023 kl. 23.06 (CEST)[svara]

Det var svåra och tunga fall dessa. Tex upptäckte jag att det var fel startdatum för riddarholmens församling, rätt är 1600 inte 1620 Yger (diskussion) 12 augusti 2023 kl. 08.27 (CEST)[svara]
Nu alla fixade. Det var trassligt och lite svårt men mycket lärorikt (och jag hittade 3-4 fel i det grunddatat jag skapat en gång i tiden). En stor del var bara mänskliga felskrivningar och detta att en församling kallats olika saker vid samma tid. Men tex SBL har jättemycket fel i sitt data om dessa ting. Och problemen i Göteborg kring Nya varvet på 1820-talet slår igenom även här. Yger (diskussion) 14 augusti 2023 kl. 10.40 (CEST)[svara]