Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2022
Sydamerika
[redigera wikitext]Kan nämna att nu är även Sydamerika grovstädat. På nyårsafton kom vi också under 500 000 artiklar med {{Robotskapad}}
. Min bedömning är att cirka hälften av kvarvarande kommer att massraderas, resten kräver fingenomgång och består till en mycket stor del av relevanta artiklar. Där krävs att alla geografiintresserade Wikipedianer hjälper till. Men, det blir ju lättare att ta hand om blommorna när jag väl har rensat ogräset. --Kitayama (diskussion) 3 januari 2022 kl. 18.54 (CET)
Felkoppling
[redigera wikitext]På iswp finns den korta Hestur (Hestfjörður) om ett fjäll vid Ísafjarðardjúp som ligger mellan de båda sidofjordarna Hestfjörður och Seyðisfjörður och är cirka 540 meter högt. (536 meter enligt kartan.) Det finns en artikel på svwp som passar in på detta, nämligen Hestur (kulle i Island, Västfjordarna, lat 66,00, long -22,89). Men den isländska artikeln har på wikidata Q27014524 av misstag kopplats till Hestur (kulle i Island, Västfjordarna, lat 65,68, long -23,69), som alltså måste brytas loss tillsammans med ceb. Eller är det bättre att bryta ut den isländska artikeln som tidigare enligt historiken hade nummer Q16427709, alltså ett lägre nummer än den senare fick? Jag vet inte hur man gör detta. Räcker det med att trycka "gör ogjord" (eller "återställ"?), men det som ska ogöras ligger flera år tillbaka i tiden, så då kan det väl bli kaos bland redigeringar som skett efteråt? (Bilden till den felkopplade artikeln har också hamnat fel om man får tro bildtexten, men det kan jag fixa själv om det svåra blir gjort.) För övrigt vet jag inte vad som är skillnaden mellan "gör ogjord" och "återställ". /Dagsuddare (diskussion) 8 januari 2022 kl. 11.28 (CET)
- Jag återställde wd-objekten till versionerna innan sammanslagning och slog istället samman is:Hestur (Hestfjörður) med Hestur (kulle i Island, Västfjordarna, lat 66,00, long -22,89). Kolla gärna att det blev rätt.
- Att använda "gör ogjord" eller "återställ" är ibland bra alternativ eftersom det ger möjlighet att skriva en redigeringskommentar, vilket annars är svårt att göra i Wikidata. Men det förutsätter att man vet vad funktionerna gör. "Gör ogjord" ändrar tillbaks en enda ändring, det är inte alltid möjligt om senare ändringar ändrat samma påståenden som den ändring man vill ogöra. Med "återställ" ändrar man tillbaks till en tidigare version så att alla senare ändringar tas bort, det funkar alltid men man måste vara försiktig så att man inte tar bort bra ändringar som gjorts efter den version man återställer till. Om du är osäker hur det fungerar kan du testa funktionerna i något av Wikidatas sandlådeobjekt, t.ex. Wikipedia:Wikidata/Sandlåda för Wikidata (Q4115189). F.d. 82.212.68.183 (diskussion) 8 januari 2022 kl. 13.26 (CET)
- Ja, det är rätt nu. Tack, och tack för förklaringen. /Dagsuddare (diskussion) 8 januari 2022 kl. 14.32 (CET)
Särskrivna namn på ett femtiotal fjärdar i sydvästra delen av Finland
[redigera wikitext]Via Senaste Ändringar halkade jag in på Kategori:Fjärdar i Egentliga Finland och förvånades där av de särskrivna namnen på många, men inte alla, fjärdar. Namn i bestämd form som inte är av typen "<väderstreck> ...fjärden" ser lite udda ut, men tittar man på kartan, till exempel här, vimlar det av inkonsekvent namngivning. Just här verkar det skilja mellan om fjärden ligger i Åland eller i Egentliga Finland.
- Länk till fråga som ger en lista över svenska etiketter (vilket i stort sett överensstämmer med de svenska artikelnamnen) för de (just nu 459) Wikidataobjekt som är instans av (P31) lika med fjärd (Q9258947) och land (P17) lika med Finland (Q33)
- Länk till fråga som ovan, men begränsat till de (just nu 56) objekt vars etikett slutar på "en", "et" eller "fladan" och som innehåller ett blanktecken och med angivande av administrativa områden.
- Länk till fråga som visar antal fjärdar samt antal och andelen särskrivna namn på fjärdar för olika inom det administrativa området (P131) enligt föregående lista. För de flesta av de 70 områdena är andelen 0, men för några områden har upp till drygt hälften av fjärdarna namn som är särskrivna.
- Länk till fråga som visar på en karta vilka av fjärdarna ovan som har särskrivna (röda prickar) respektive inte särskrivna (gröna prickar) namn.
Någon som kan förklara den i mina ögon och öron besynnerliga stavningen som verkar tillämpas i "den sydvästra delen" av Finland? Pingar några, @Svensson1, LPfi, Robertsilen:, som jag tror kanske kan svara på denna fråga. -- Larske (diskussion) 12 januari 2022 kl. 10.58 (CET)
- Dialekterna i området kan tydligen ha bestämd form på ett huvudord med genitivattribut. Det nämns lite här, men jag har för mig att jag också har läst om det i en annan finlandssvensk språkvårdstext som jag inte kan hitta nu. //Essin (diskussion) 12 januari 2022 kl. 11.15 (CET)
- Jag hade inte koll på den förklaringen, men har observerat fenomenet, på kartor och i talat språk. Jag antar att formen "Nagu Berghamn" som känns naturlig för mig, har att göra med samma dialektala fenomen (eller något närliggande). Jag har undrat varför jag inte vill skriva på annat sätt för den särskiljningen, och för liknande i trakten. –LPfi (diskussion) 12 januari 2022 kl. 11.34 (CET)
- Fast Nagu Berghamn är väl naturligt även på rikssvenska. Det är väl en genitivform. I bestämd form skulle det ju dock skrivits ihop på riksvenska - Nagubergshamnen. FBQ (diskussion) 12 januari 2022 kl. 12.23 (CET)
- Jag hade inte koll på den förklaringen, men har observerat fenomenet, på kartor och i talat språk. Jag antar att formen "Nagu Berghamn" som känns naturlig för mig, har att göra med samma dialektala fenomen (eller något närliggande). Jag har undrat varför jag inte vill skriva på annat sätt för den särskiljningen, och för liknande i trakten. –LPfi (diskussion) 12 januari 2022 kl. 11.34 (CET)
- Japp, ortsnamn som slutar på vokal behöver ingen ändelse -s för att bilda genitiv. Och "Nagubergshamn" antyder att det är en sammanfogning av "Naguberg" och hamn. "Naguberghamn" vore bättre, men "Naguberg" är nog ändå den mest närliggande tolkningen för utomstående. I Sverige finns liknande bildningar där bindestreck används, t.ex. Kinne-Vedums socken.
- andejons (diskussion) 12 januari 2022 kl. 14.23 (CET)
- Det är närmast skrivning med bindestreck som jag avvägt, men den har inte känts helt rätt. Motsvarande torde gälla också orter vars namn inte slutar på vokal. Jag är osäker på hur Berghamn i Houtskär brukar benämnas (bör det vara genitiv eller inte?). Berghamn är i obestämd form, men samma typ av särskiljning gäller vid behov namn i bestämd form – särskiljningsbehovet är det samma, och att kalla Lammholmen för Lammholm då särskiljning behövs skulle vara ytterst förvirrande. –LPfi (diskussion) 12 januari 2022 kl. 15.59 (CET)
- Svenska ortsnamn som Dala-Järna eller Upplands-Väsby är ju ofta skrivna med bindestreck. Sedan kan ju det tolkas som Dala och Järna och används ju även så, även om det ju egentligen betyder Järna i Dalarna. Men jag antar att det räknas som stelnade former där namnet snarast ses om en enhet än som en tilläggande särskiljning. FBQ (diskussion) 13 januari 2022 kl. 10.50 (CET)
- Det är närmast skrivning med bindestreck som jag avvägt, men den har inte känts helt rätt. Motsvarande torde gälla också orter vars namn inte slutar på vokal. Jag är osäker på hur Berghamn i Houtskär brukar benämnas (bör det vara genitiv eller inte?). Berghamn är i obestämd form, men samma typ av särskiljning gäller vid behov namn i bestämd form – särskiljningsbehovet är det samma, och att kalla Lammholmen för Lammholm då särskiljning behövs skulle vara ytterst förvirrande. –LPfi (diskussion) 12 januari 2022 kl. 15.59 (CET)
Milstolpe nådd: Afrika är grovstädat - ingen mer massradering av botskapade artiklar för länder i Afrika.
[redigera wikitext]En milstolpe har nåtts inom projekt Wikipedia:Projekt alla platser-städning. Afrika är grovstädat!
Det innebär att ej relevanta artiklar har raderats och att kvarvarande artiklar har bedömts som relevanta, antingen för att de har en interwiki-länk till annat projekt än cebwiki eller arzwiki eller att de har bedömts vara intressanta trots att ingen interwiki-länk finns. Det finns dock ett antal artiklar med robotskapad-mall och utan annan iw än cebwiki, och det är artiklar som avser orter och administrativa enheter. De måste gås igenom en och en. Det finns nämligen tre problem med dessa 1) Dålig matchning i Wikidata p g a olikheter i namnsättning för framförallt administrativa enheter. Det behövs ett stort antal merge (sammanslagningar) i Wikidata. 2) Ort/kommun-problemet där vi skiljer oss åt från de flesta andra wikiprojekt genom att ha en artikel för centralorten och en för kommunen. Bör tacklas med sunt förnuft land för land. 3) Även om de flesta orter och administrativa enheter är relevanta och existerar så finns det mycket skräp i Geonames-datat. Att skilja agnarna från vetet kräver att man tittar på artikel för artikel.
Kvarvarande artiklar med robotskapad-mall är därmed kandidater för "finstädning", dvs vi bör förbättra artiklarna, ta bort "bot-fluff", förse dem med riktiga källor (bland annat korrekt och aktuellt invånarantal för orter, kommuner och liknande, korrekta höjder för berg etc.) och ta bort robotskapad-mallen. Finstädningen kan också ge vid handen att artikeln trots allt inte är relevant - då bör den raderas enligt normal process.
Det finns också ett behov av att gå igenom grensidorna i kategorin Robotskapade landförgreningar, ta bort rödlänkar, kolla att länken går direkt till artikeln och inte till en omdirigering, allmän "puts" och, efter genomförd genomgång, ta bort kategorin 'Robotskapade landförgreningar.
Det finns också behov av att förenkla kategoriträdet i många länder enligt tidigare diskussion.
Det "undantagstillstånd" vi har där gemenskapen tolererar massradering utanför normal process anser jag inte längre gäller för Afrika.
De kvarvarande artiklarna är utmärkta att ha som tävlingsobjekt!
När jag noterade antal botskapade artiklar den 1 februari 2017 så var det 216 445 artiklar som avsåg länder i Afrika. Nu finns endast 10 133 artiklar med robotskapad-mall kvar.
Artiklar med robotskapad-mall per land i Afrika per 23 dec 2021:
Algeriet | 348 | |
Angola | 111 | |
Benin | 122 | |
Botswana | 88 | |
Burkina Faso | 582 | |
Burundi | 1946 | Många vattendrag med iw till swahili. Relevans? |
Centralafrikanska republiken | 189 | |
Djibouti | 55 | |
Egypten | 340 | |
Ekvatorialguinea | 49 | |
Elfenbenskusten | 255 | |
Eritrea | 162 | |
Etiopien | 488 | |
Gabon | 137 | |
Gambia | 395 | |
Ghana | 209 | |
Guinea | 158 | |
Guinea-Bissau | 64 | |
Kamerun | 295 | |
Kap Verde | 102 | |
Kenya | 326 | |
Komorerna | 153 | |
Kongo-Brazzaville | 45 | |
Lesotho | 167 | |
Liberia | 836 | Drygt 700 "klaner", overifierbara(?) admin-enheter på lägsta nivå. Radera? |
Libyen | 70 | |
Madagaskar | 257 | |
Malawi | 52 | |
Mali | 150 | |
Marocko | 1805 | Mycket dåligt matchning av orter och kommuner mot WD. Stort putsjobb! |
Mauretanien | 81 | |
Sydsudan | 89 | |
Västsahara | 7 |
Nu återstår grovstädning av resten av jordklotet (förutom Antarktis som redan är grovstädat). Slut på rapporten från städkontoret. --Kitayama (diskussion) 23 december 2021 kl. 21.26 (CET)
- Det var en riktig julklapp, tack för den! Jag rotar nu vidare i Kongo-Brazzaville, ffa med omkategorisering med ledning av den tidigare diskussionen. Det verkar inte riktigt finnas lika lättillgängliga källor för naturgeografin där som i Kongo-Kinshasa, och dessutom verkar en del artiklar på dewp ha skapats med Geonames som enda källa och frwp-artiklar ha fått klimatavsnitt översatta från svwp...
- Är det värt att radera grensidor med skript? Jag har tidigare sammanställt Kongogrensidor som är överflödiga pga endast två betydelser där en är tydligt dominerande, nu i Användare:Essin/Sandlåda, och skulle kunna göra något liknande för grensidor med bara rödlänkar. Om någon admin raderar grensidorna kan jag åta mig att göra flyttar och annan efterstädning. //Essin (diskussion) 3 januari 2022 kl. 17.04 (CET)
- Att radera grensidor med skript är att skjuta mygg med älgstudsare. Mycket arbete för liten vinst. Dessutom mycket riskabelt då de har redigerats manuellt och numera kan innehålla normal grensidetext. Jag har inte raderat en enda grensida med skript. Det bästa är att du skapar en lista, meddelar mig och sen raderar jag hela listan manuellt. Jag har tillägg till Edge som gör att att jag kan öppna upp till 40 grensidor med ett kommando och sedan raderar jag dem med en speciell raderingsknapp baserade på ett Nirmos-skript, dessutom specialkodad knapp på musen som gör att när jag trycker på raderingsknappen så utförs raderingen och sidan stängs (annars får man ju upp en bekräftelsesida). Så 200 grensidor är inget problem att radera på under en kvart om allt på dem är rött. Kitayama (diskussion) 3 januari 2022 kl. 17.15 (CET)
- På så sätt. Då skulle jag först vilja be om radering av grensidorna i sandlådan (urvalet är gjort manuellt, det finns ett par fall med tre artiklar men då är den tredje posten en flygplats som normalt inte brukar tas med på grensidor), och så återkommer jag senare med en till lista när jag har gått igenom rödlänkar i Kategori:Robotskapade Kongo-Brazzavilleförgreningar. //Essin (diskussion) 3 januari 2022 kl. 18.16 (CET)
- @Essin Raderat. Du har lite kvällspyssel att flytta orterna till huvudordet och efterstäda. Kitayama (diskussion) 3 januari 2022 kl. 18.49 (CET)
- @Kitayama: Tack! Jag har gått igenom grensidorna nu och identifierat en grupp där det finns en blålänk kvar till platser utanför Kongo-Brazzaville, som kanske ska raderas eller flyttas till grundordet. Iw-länkar saknas i flera fall men eftersom platserna är långt från mina vanliga "jaktmarker" är det möjligt att jag har missat några potentiella sammanslagningar på Wikidata eller rödlänkar som borde läggas till på grensidorna. Därför vore det bra om fler kan titta igenom den nya listan i min sandlåda och bedöma vad som ska göras. //Essin (diskussion) 5 januari 2022 kl. 12.58 (CET)
- Fixat av YesDi, tack för det! I Kongo-Brazzaville kvarstår nu fyra ostädade artiklar som visserligen har iw, men till mycket bristfälliga artiklar, se diskussion:mare de Galiba, diskussion:monts Kinoumbou (kullar), diskussion:Bouloukombo och diskussion:montagnes Tobo. Det är ett allmänt fenomen att sjöar och berg ofta är svåra att källbelägga ordentligt... //Essin (diskussion) 20 januari 2022 kl. 10.13 (CET)
- @Kitayama: Tack! Jag har gått igenom grensidorna nu och identifierat en grupp där det finns en blålänk kvar till platser utanför Kongo-Brazzaville, som kanske ska raderas eller flyttas till grundordet. Iw-länkar saknas i flera fall men eftersom platserna är långt från mina vanliga "jaktmarker" är det möjligt att jag har missat några potentiella sammanslagningar på Wikidata eller rödlänkar som borde läggas till på grensidorna. Därför vore det bra om fler kan titta igenom den nya listan i min sandlåda och bedöma vad som ska göras. //Essin (diskussion) 5 januari 2022 kl. 12.58 (CET)
- @Essin Raderat. Du har lite kvällspyssel att flytta orterna till huvudordet och efterstäda. Kitayama (diskussion) 3 januari 2022 kl. 18.49 (CET)
- På så sätt. Då skulle jag först vilja be om radering av grensidorna i sandlådan (urvalet är gjort manuellt, det finns ett par fall med tre artiklar men då är den tredje posten en flygplats som normalt inte brukar tas med på grensidor), och så återkommer jag senare med en till lista när jag har gått igenom rödlänkar i Kategori:Robotskapade Kongo-Brazzavilleförgreningar. //Essin (diskussion) 3 januari 2022 kl. 18.16 (CET)
- Att radera grensidor med skript är att skjuta mygg med älgstudsare. Mycket arbete för liten vinst. Dessutom mycket riskabelt då de har redigerats manuellt och numera kan innehålla normal grensidetext. Jag har inte raderat en enda grensida med skript. Det bästa är att du skapar en lista, meddelar mig och sen raderar jag hela listan manuellt. Jag har tillägg till Edge som gör att att jag kan öppna upp till 40 grensidor med ett kommando och sedan raderar jag dem med en speciell raderingsknapp baserade på ett Nirmos-skript, dessutom specialkodad knapp på musen som gör att när jag trycker på raderingsknappen så utförs raderingen och sidan stängs (annars får man ju upp en bekräftelsesida). Så 200 grensidor är inget problem att radera på under en kvart om allt på dem är rött. Kitayama (diskussion) 3 januari 2022 kl. 17.15 (CET)
Mauretanien
[redigera wikitext]Jag vet inte hur långt ni har hunnit i Afrika. Läste diskussionen ovan om grovstädning. Jag har nu vid två tillfällen i mitt stubbprojekt stött på regioner i Mauretanien som jag kontrollerade. Den andre som jag stötte på har samma upplägg som den första, så jag tar den som exempel: Brakna Där finns en tabell över departement, eller moughataa, där de inte är länkade. Eftersom det är platser sökte jag i sökrutan och får då upp artiklar om dessa platser, och här kommer problemet som gör jag skriver här för att uppmärksamma er (innan jag går vidare med mitt projekt): Det finns tre artiklar för varje departement, även i första jag stötte på och antagligen i alla Mauretanska regioner:
- Alég, är en stad i regionen Brakna... (faktarutan rödlänkar departementet Alég som länkar till Aleg (departement) )
- För Bababé så är departementet blått, men då är det en omdirigering från Bababe (departement i Mauretanien) till Bababé (departement)
- Alég (departement) är en vanlig Lsjbot-artikel med temperaturerna mm, och står den är i regionen Brakna.
- Alég (moughataa) är en omdirigering till artikeln om regionen Brakna (som jag utgick ifrån)
Själv är jag för dåligt insatt i geografilänkarna och den städning som görs, men tänkte jag kunde lägga detta här, ganska utrett så ni ser problemet, så kanske "någon" förbarmar sig över detta när den har tid över. Jag förstår om det inte är högsta prioritet. MVH Adville (diskussion) 3 februari 2022 kl. 22.59 (CET)
- Det finns bara en artikel om varje departement. Stadsartiklarna handlar inte om departementen och bör forstätta vara egna artiklar (jämför Stockholms stad och Stocholms län). Moughataa-omdirigeringarna är rester från gamla (stubb)artiklar som infogats och omdirigerats långt innan lsjbot. Jag har ändrat dem så de leder till de botskapade departementen. De artiklarna har inte heller mycket innehåll om botfluffet städas bort, men där finns åtminstone spårklänkar till engelska och franska. F.d. 82.212.68.183 (diskussion) 4 februari 2022 kl. 14.59 (CET)
- Tack, det är bra. Adville (diskussion) 4 februari 2022 kl. 15.12 (CET)
Ort/kommun-problemet i Centralafrikanska republiken
[redigera wikitext]Ett återkommande problem här är ort/kommun-problemet, dvs att Lsjbot skiljer strikt på orter och kommuner, men goda källor baserade på tydliga definitioner betraktar dem som samma sak för vissa länder. I mitt arbete i mellersta Afrika har jag nu råkat ut för att Centralafrikanska republiken verkar befinna sig någonstans mellan dessa två ytterligheter, och funderar på vad vi ska göra. Lsjbot har skapat artiklar om orter och "subprefekturer" (ibland oöversatt från Geonames-engelska "sub-prefecture" eller originalspråket franska "sous-prefecture") – jag tror att "underprefekturer" är en bättre översättning.
Statistiska årsboken beskriver fem nivåer av administration: regioner, prefekturer, underprefekturer, kommuner/arrondissement och byar/stadsdelar ("le territoire centrafricain est subdivisé hiérarchiquement à ce jour en 7 Régions, 17 Préfectures, y compris la Capitale Bangui (considérée comme une préfecture spéciale et le chef-lieu de la Région n°7), 74 Sous-Préfectures, 179 Communes (y compris les 8 arrondissements de Bangui) et 8294 villages et 1422 quartiers"). Regioner har vi inga artiklar om, så dem kan vi lugnt ignorera. Prefekturer är också hyfsat okomplicerade. Frågan är hur man ska reda ut underprefekturer, kommuner och orter.
Underprefekturer är alltid namngivna efter sin huvudort, men kommuner kan också vara namngivna efter t ex en flod. Underprefekturer kan bestå av en eller flera kommuner. Det förekommer underprefekturer som omfattar en enda kommun med annat namn än underprefekturen (men med samma namn som kommunens huvudort).
Till skillnad från i Frankrike, där en underprefektur är huvudorten i/ämbetshuset för ett arrondissement och en prefektur dito för ett departement eller region, är centralafrikanska prefekturer och underprefekturer (även?) geografiska områden (jfr ”territoire” i citatet ovan). Detta har orsakat förvirring på enwp och Wikidata där huvudorten i en underprefektur med flera kommuner beskrivs som en underprefektur.
Vissa kommuner består bara av stadsdelar, andra av bara byar eller en blandning av byar och stadsdelar.
Ett problem är att folkräkningen 2003 inte verkar finnas tillgänglig i sin helhet på internet. De mest detaljerade upplysningarna jag har hittat är denna uppskattning från 2015 som har siffror för prefekturer, underprefekturer och kommuner. Folkräkningen verkar ha definierat städer på något sätt, men jag har inte hittat tydligt hur de avgränsas. https://citypopulation.de/Centralafrica.html har folkmängder för städer, som åtminstone delvis verkar vara klart annorlunda än kommunsiffrorna från 2015 (om man antar 2,5 % tillväxt per år).
Till att börja med föreslår jag att kommuner som bara består av stadsdelar beskrivs som "kommun och ort" i en artikel, och att underprefekturer som omfattar en enda kommun beskrivs i samma artikel om kommunen, oavsett om de har samma namn. Om de har olika namn, bör artikeln få namn efter kommunen eller underprefekturen? I en del sådana fall är underprefekturen i nuläget iw-länkad till huvudorten (med samma namn) snarare än till kommunen (med samma utsträckning och folkmängd), och det är inte helt lyckat.
Hur gör vi med kommuner som består av både stadsdelar och byar? Ingen människoskapad språkversion verkar ha två artiklar om kommuner där huvudorten har samma namn, men det är möjligt att det återspeglar en ofullständighet i artikelskrivandet snarare än den lokala uppfattningen om vad som är en naturlig artikelavgränsning. Frwp har en (antagligen) komplett serie artiklar om kommunerna och har separata artiklar om huvudorterna endast om de har andra namn, vilket är principiellt märkligt.
Finns det erfarenheter från andra länder som kan tillämpas här? Andra idéer eller förslag? //Essin (diskussion) 22 februari 2022 kl. 17.07 (CET)
Grovstädning för länder utanför Europa klar
[redigera wikitext]Ännu en milstolpe har nåtts inom projekt Wikipedia:Projekt alla platser-städning. Världen utanför Europa är grovstädad! Nu återstår bara 18 länder i Europa med uppskattningsvis 80 000 artiklar + grensidor som ska raderas. Finland och Åland kommer jag inte att grovstäda, där måste man finstäda, annars kan mycket relevant inom det svenskspråkiga området försvinna.
Det betyder att vi kommer med största sannolikhet inte att gå under 2 500 000 artiklar och kommer inte att bli mindre än franskspråkiga Wikipedia.
Lite repetition av vad jag menar med "grovstädning": Det innebär att ej relevanta artiklar har raderats och att kvarvarande artiklar har bedömts som relevanta, antingen för att de har en interwiki-länk till annat projekt än cebwiki eller arzwiki eller att de har bedömts vara intressanta trots att ingen interwiki-länk finns. Det finns dock ett antal artiklar med robotskapad-mall och utan annan iw än cebwiki, och det är artiklar som avser orter och administrativa enheter. De måste gås igenom en och en. Det finns nämligen tre problem med dessa 1) Dålig matchning i Wikidata p g a olikheter i namnsättning för framförallt administrativa enheter. Det behövs ett stort antal merge (sammanslagningar) i Wikidata. 2) Ort/kommun-problemet där vi skiljer oss åt från de flesta andra wikiprojekt genom att ha en artikel för centralorten och en för kommunen. Bör tacklas med sunt förnuft land för land. 3) Även om de flesta orter och administrativa enheter är relevanta och existerar så finns det mycket skräp i Geonames-datat. Att skilja agnarna från vetet kräver att man tittar på artikel för artikel.
Kvarvarande artiklar med robotskapad-mall är därmed kandidater för "finstädning", dvs vi bör förbättra artiklarna, ta bort "bot-fluff", förse dem med riktiga källor (bland annat korrekt och aktuellt invånarantal för orter, kommuner och liknande, korrekta höjder för berg etc.) och ta bort robotskapad-mallen. Finstädningen kan också ge vid handen att artikeln trots allt inte är relevant - då bör den raderas enligt normal process.
Det finns också ett behov av att gå igenom grensidorna i kategorin Robotskapade landförgreningar, ta bort rödlänkar, kolla att länken går direkt till artikeln och inte till en omdirigering, allmän "puts" och, efter genomförd genomgång, ta bort kategorin 'Robotskapade landförgreningar.
Det finns också behov av att förenkla kategoriträdet i många länder enligt tidigare diskussion.
Det "undantagstillstånd" vi har där gemenskapen tolererar massradering utanför normal process anser jag inte längre gäller för länder utanför Europa.
De kvarvarande artiklarna är utmärkta att ha som tävlingsobjekt! Kitayama (diskussion) (Signatur tillagd i efterhand.)
- Ett stort tack till dig Kitayama och alla andra "storstädare" för ett otroligt arbete! :) Höstblomma (diskussion) 23 februari 2022 kl. 06.11 (CET)
- Tack så mycket för detta arbete! Jag hade aldrig gett mig på att städa robotartiklar om inte artiklarna utan iw raderats, det hade känts fullständigt oöverkomligt.
- Vissa WP-versioner (de: och fr: åtminstone, kanske fler) verkar tolerera artiklar som bara är baserade på Geonames, antingen direkt eller via översättning från Lsjbot. Är motsvarande sv:-artiklar också snabbraderingskandidater om ingen annan källa kan hittas? (Monts de Pangala är ett exempel som gick att åtgärda med andra källor, de:Montagnes Tobo var däremot hopplöst.)
- En allmän uppmaning: Vid finstädning är det viktigt att kontrollera att iw-länkarna syftar på samma sak. Felaktiga objektssammanslagningar på Wikidata är inte helt ovanliga (t ex en gruva med en flod, eller två olika floder), och det kan vara nödvändigt att återställa sammanslagningar eller flytta iw-länkar från ett objekt till ett annat. Slutresultatet kan bli en Lsjbot-artikel som saknar iw och därmed kan snabbraderas, även om grovstädningen i det landet är avslutad.
- //Essin (diskussion) 23 februari 2022 kl. 09.58 (CET)
Elfenbenskusten
[redigera wikitext]Lsjbot verkar ha baserat sina artiklar på den regionindelning som gällde till 2011. Regionerna var då första nivån under staten (A.ADM1), men eftersom distrikt infördes som ny förstanivå 2011 har boten kallat dessa enheter "distrikt". Ibland har det blivit rätt ändå eftersom några regioner ombildades till distrikt som omfattade flera nya regioner, men ofta är det fel. Här är en karta över den nya indelningen. Omfattande uppröjning behövs, bl a ersättning av det nuvarande kategoriträdet med kategorier på distrikts- eller enbart landsnivå (jfr den tidigare diskussionen om kategorier).
Elfenbenskusten har också ett liknande problem som Centralafrikanska republiken med underprefekturer, kommuner och orter, men med den ytterligare komplikationen att kommunnivån verkar ha avskaffats i många delar av landet, se en:Communes of Ivory Coast. Jag vet inte heller hur mycket underprefekturerna ändrades 2011. Är det ens värt att försöka rädda underprefekturartiklarna?
Jag misstänker att jag förr eller senare inte kommer att kunna hålla mig ifrån att rota i detta, men om någon annan är sugen på det skulle jag bara bli glad. Samma gäller Centralafrikanska republiken där jag känner att jag har kört fast eftersom ort/kommun-diskussionen inte kom någonvart (borde vi förlänga arkiveringstiden på den här diskussionssidan?). //Essin (diskussion) 13 april 2022 kl. 15.38 (CEST)
- Noterar också att vissa WP-upplagor har två artiklar om områden som inte bytt utsträckning eller namn utan bara enhetstyp, och i ett fall två artiklar där utsträckning och enhetstyp är oförändrade men inte namn (Fromager/Gôh). Jag tycker att med den mängd information vi har blir det snarare pedantiskt än överskådligt för läsare och ser helst att vi inte delar upp artiklarna på detta vis när de städas. //Essin (diskussion) 20 april 2022 kl. 15.24 (CEST)
Marktäcke och klimat
[redigera wikitext]Marktäcke och klimatdata är en stor del av robotartiklarna, och antagligen svårast att bedöma för nytillkomna användare (och för användare på andra språkversioner som översätter våra artiklar). Därför tänkte jag försöka sammanställa diskussionerna där vi kom fram till att klimatdata inte är pålitliga:
- Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2021#Klimat
- Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2019#Vattendrag
- Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2018-02 - 2018-12#BotKina
- Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2017-08 - 2018-02#Hur börja?
- Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2017-03 - 2017-08#Nu börjat ta bort klimatdata "i förbifarten"
- Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2017-03 - 2017-08#Hemiboreala klimatzonen
- Wikipedia:Bybrunnen/Arkiv_2017-06#Lsjbot sex månader senare
Jag har antagligen missat några, bidra gärna med fler! //Essin (diskussion) 25 april 2022 kl. 18.29 (CEST)
Administrativa enheter i Indien
[redigera wikitext]I min strävan att få ner antalen på Användare:Kitayama/grovstädat#Grovstädning klar, men med utestående frågor har jag den senaste tiden ägnat mig ganska mycket åt Indien. Många artiklar i Kategori:Indelningar i Indien-trädet har gått att flytta till Kategori:Distrikt i Indien-trädet och iw-koppla, eller slå ihop med människoskapade artiklar. De flesta kvarvarande artiklarna är på nivån under distrikt.
- Är "underdistrikt" ett vedertaget namn på svenska för dessa enheter? Det nämns inte i tehsil men den artikeln verkar vara lite bortglömd. Olika ord används i olika delar av Indien så det skulle onekligen vara praktiskt att hålla sig till en översättning, men jag vill inte att Wikipedia uppfinner en översättning som inte användes tidigare.
- Andra WP-upplagor har dålig täckning av denna nivå, och i vissa fall blandas uppgifter om enhet och huvudort både på WP och WD. Särskilt tydligt är detta i Karnataka, där en annan bot hade kopplat många enhetsartiklar på sv/ceb till WD:s ortsobjekt, som i vissa fall sedan fått ganska omfattande uppgifter som egentligen syftar på enheten, se t ex d:Q712521, d:Q760166 och d:Q2238940. WD hade redan enhetsobjekt också, eftersom Wikipedia på newari av någon anledning har satsat på att ha artiklar om enheterna. I ett fåtal fall finns också separata artiklar på engelska, kanaresiska och några andra språk. Jag tror att alla svwp- och cebwp-artiklar ligger på rätt objekt nu, likaså Geonames-koderna, men finns det något enkelt sätt att identifiera och flytta andra uppgifter som hamnat fel? Hur förankrar man det bland WD:s användare?
- Kvarvarande Kategori:Indelningar i Maharashtra och eventuellt någon till är ett undantag, det verkar vara byar som var felklassade i Geonames. Meningsfullt att åtgärda eller lika bra att radera?
Jammu och Kashmir behöver städas också, men det är inte direkt Lsjbots fel även om det berör en del Lsjbot-artiklar. //Essin (diskussion) 30 maj 2022 kl. 10.17 (CEST)
- 2. d:Wikidata talk:Country subdivision task force/India kanske är rätt ställe att fråga.
- 3. Med hjälp av folkräkningen gick det mycket riktigt att bekräfta att de flesta var byar, de andra har raderats som overifierbara. Jag har lagt in folkräkningens ortskoder på WD och ändrat till byar i artiklarna, men jag är inte egentligen övertygad om att det är lämpligt att ha artiklar om varenda by. //Essin (diskussion) 31 maj 2022 kl. 14.13 (CEST)
- Tack för det jobb du lägger ned! Kitayama (diskussion) 31 maj 2022 kl. 14.15 (CEST)
Grovstädning avslutad
[redigera wikitext]Under juni månad har grovstädningen av de botskapade geografiartiklarna slutförts. Det innebär att ej relevanta artiklar har raderats och att kvarvarande artiklar har bedömts som relevanta, antingen för att de har en interwiki-länk till annat projekt än cebwiki eller arzwiki eller att de har bedömts vara potentiellt intressanta trots att ingen interwiki-länk finns (i synnerhet orter och administrativa enheter). Artiklarna är därmed kandidater för "finstädning", dvs vi bör förbättra artiklarna, ta bort "bot-fluff", förse dem med riktiga källor (bland annat korrekt och aktuellt invånarantal för orter, kommuner och liknande, korrekt höjder för berg etc.) och ta bort robotskapad-mallen. Dessutom finns ett stort antal artiklar om orter och administrativa enheter utan interwiki-länk som behöver granskas noga. I många fall ska de slås samman med annan artikel eller slås samman med annat Wikidata-objekt. Det arbetet måste ske artikel för artikel. Finstädningen kan också ge vid handen att artikeln trots allt inte är relevant - då bör den raderas enligt normal process. Det finns just nu 297 077 geografiartiklar med robotmallen, det är cirka 20% av det ursprungliga antalet. Alla har dock inte raderats - en del har förvandlats till normala artiklar utan robotmall. Tilläggas kan att Finland har undantagits från grovstädningen. Kitayama (diskussion) 3 juli 2022 kl. 22.46 (CEST)
- Vilket jättejobb! Tack @Kitayama! Jag har sett en del av din städning när det gäller Afghanistan och närliggande områden - och det är väldigt många dubbletter och andra konstigheter som har rensats ut. Och därmed blir det lättare, och mera lockande, att göra något åt resten.--Chandra Varena (diskussion) 3 juli 2022 kl. 22.55 (CEST)
- Strongt att ro projektet i land. De flesta av oss hade gett upp innan det första landet betats av. bbx (diskussion) 4 juli 2022 kl. 00.30 (CEST)
Jag instämmer i hyllningskören till dessa utomordentliga insatser. /Anhn ✎ 4 juli 2022 kl. 08.20 (CEST)
- Jag är kluven. Jag hoppas verkligen att inga barn åkt ut med badvattnet! Samtidigt ser jag fram emot att uppslagsverket åter skall börja växa. Och jag är full av beundran för arbetsinsatserna. Jag har fortfarande svårt att smälta att Lsj drevs iväg på det sätt som skedde, men jag inser att en städning varit nödvändig. Om den kombinerats med en kompenserande tillväxt hade det varit ännu bättre... Tostarpadius (diskussion) 4 juli 2022 kl. 08.28 (CEST)
- Låt oss säga att vi botskapade artiklar om alla svenskar med namn, födelsedatum, klimatet på deras bostadsort, högsta inkomsten inom 10 km radie och att efternamnet är ovanligt ofta förekommande inom 20 km radie. Fullständigt värdelösa artiklar om dessa svenskar. Alltså raderar vi dem. Då kommer givetvis vi att radera artiklar (kanske några 1000-tal av de 10 miljoner skapade) om relevanta personer som vi saknar artikel om. Men det fanns inget, absolut inget, i de raderade artiklarna som påvisade relevans. Det har INTE medvetet raderats någon artikel där relevans fanns påvisade i artikeln. Däremot så har det med största säkerhet raderats artiklar som vid en djupare efterforskning skulle ha visat sig handla om ett relevant objekt. Vi står nu med 300 000 artiklar vars innehåll är uruselt, men där bedömningen är att det borde gå att förvandla dem till riktiga artiklar. Kitayama (diskussion) 4 juli 2022 kl. 09.24 (CEST)
- Det handlar inte bara om irrelevanta artiklar, utan också om en hel radda artiklar om ett och samma objekt, med olika stavning. Det har jag sett åtskilliga gånger när det gäller Afghanistan, och ibland bett om (och fått) städningshjälp av Kitayama. Chandra Varena (diskussion) 4 juli 2022 kl. 10.09 (CEST)
- Ja, att städningen behövdes är det ingen som betvivlar. Problemet var att Lsj ensam fick bära hundhuvudet trots att gemenskapen hade godkänt och uppmuntrat projektet. Tostarpadius (diskussion) 4 juli 2022 kl. 10.15 (CEST)
- Jag minns att jag har slagit samman en hel del dubbletter för Island, Färöarna och Storbritannien. Sjunnesson (diskussion) 4 juli 2022 kl. 10.23 (CEST)
- En helt annan fråga, för att spinna vidare på @Tostarpadius första inlägg. Vad är lägsta antalet artiklar vi har nu, innan det (kanske) vänder uppåt igen? Bara så att det noteras och vi kan se en ökning av artiklar. Jag inser även att fler blir raderade eller ihopslagna då finstädningen påbörjas, men det är en del av det som måste ske. Adville (diskussion) 4 juli 2022 kl. 11.09 (CEST)
- Den 27 juni hade vi 2 550 746 artiklar, jag bedömer detta kommer vara det lägsta antalet då finstädning raderar i lägre takt är antalet nytillkomna Yger (diskussion) 4 juli 2022 kl. 11.21 (CEST)
- Tack, @Yger. Adville (diskussion) 4 juli 2022 kl. 12.24 (CEST)
- Den 27 juni hade vi 2 550 746 artiklar, jag bedömer detta kommer vara det lägsta antalet då finstädning raderar i lägre takt är antalet nytillkomna Yger (diskussion) 4 juli 2022 kl. 11.21 (CEST)
- En helt annan fråga, för att spinna vidare på @Tostarpadius första inlägg. Vad är lägsta antalet artiklar vi har nu, innan det (kanske) vänder uppåt igen? Bara så att det noteras och vi kan se en ökning av artiklar. Jag inser även att fler blir raderade eller ihopslagna då finstädningen påbörjas, men det är en del av det som måste ske. Adville (diskussion) 4 juli 2022 kl. 11.09 (CEST)
- @Tostarpadius: Det stora problemet var ju att hela geografiprojektet var som en stor klump. Boten trodde att flygplatser (Edmonton International Airport) och utbildningssituationer (University of British Columbia Okanagan, kolla historiken) osv var orter. När jag söker på en flygplats eller utbildningsinstitution så är information om klimatet, hur terrängen är där eller hur högt det ligger över havet ej relevant. Det hade varit bättre om Lsj hade gjort flera mindre projekt som hade delats upp beroende på vad Geonames-objekten egentligen var. DIEXEL (diskussion) 4 juli 2022 kl. 12.22 (CEST)
- Instämmer. Bättre förberedelser för respektive land hade också gjort nytta. Exempel: Boten missade helt att England har olika strukturer för lokalt självstyre; ibland en nivå (primär- och sekundärkommun samma objekt=enhetskommun), ibland två nivåer (grevskap och distrikt), därutöver de ceremoniella grevskapen. Resultatet blev en salig röra med mängder med fel. Kitayama (diskussion) 4 juli 2022 kl. 12.29 (CEST)
- Problemet var att gemenskapen inte tog ansvar för projektet utan utsåg Lsj till syndabock. Om jag inte missminner mig hörde jag till dem som var tveksamma när det drog igång, men det fanns konsensus för det. Tostarpadius (diskussion) 4 juli 2022 kl. 12.57 (CEST)
- Ser fram emot att börja gå igenom de kvarvarande artiklarna och kunna förbättra dem. En sak som återstår är de robotskapade förgreningssidorna som fått många röda länkar till raderade artiklar, dessa bör tas bort. Thoasp (diskussion) 4 juli 2022 kl. 21.27 (CEST)
- @Thoasp, kan du lägga en länk till en kategori eller så så man kan hitta dem så kan jag hjälpa till att radera dessa rödlänkar. Mvh Adville (diskussion) 4 juli 2022 kl. 21.38 (CEST)
- Kategori:Robotskapade förgreningssidor. Just nu 38 273 sidor. De flesta rödlänkar som finns är INTE till raderade sidor, det är till sidor som aldrig skapades. I vissa fall så bör de vara kvar, i synnerhet till orter och administrativa enheter. Dessa är relevanta rödlänkar. Kitayama (diskussion) 4 juli 2022 kl. 21.43 (CEST)
- Ok, tack. Bra att veta att man ska göra en kontroll ändå av länkarna. Då är det nog bäst man gör land för land eller så så att fler kan jobba samtidigt. Det var ganska många sidor... Adville (diskussion) 4 juli 2022 kl. 21.56 (CEST)
- Bäst är att börja med de länder som också hade botskapade artiklar. De listas i Användare:Kitayama/grovstädat. För dessa länder kan i princip alla rödlänkar raderas på förgreningssidor. Kitayama (diskussion) 4 juli 2022 kl. 21.59 (CEST)
- (Redigeringskonflikt)
- Kategori:Robotskapade förgreningar efter land är en bra ingång där man kan jobba med ett land i taget. Många länder i slutet av alfabetet har robotskapade förgreningar men inga Robotskapade geografiartiklar. Jag är tveksam till nyttan med att bevara förgreningssidor som endast listar rödlänkar, eftersom rödlänkarnas relevans inte går att bedöma. För den som i framtiden vill komplettera sortimentet med geografiartiklar för ett visst land är det bättre att välja relevanta artikelförslag på annat sätt, till exempel orter som har artiklar på många andra språk. Den som granskar en förgreningssida och finner rödlänkarna relevanta bör i så fall ta bort robotkategorin från den förgreningssidan. Raderingen av robotskapade förgreningssidor började med en allmän radering av de sidor som då bara hade rödlänkar. Om den operationen skulle göras om nu skulle fler sidor tas bort. Plumbum208 (diskussion) 4 juli 2022 kl. 22.22 (CEST)
- Jag började kolla Barbados nu och kom till Saint Andrew (olika betydelser). Undrade varför den hette så och kollade på Saint Andrew som också var en förgreningssida. De är inte heller helt samma, då Storbritannien saknas helt i den ena. Det kan vara värt att tänka på när man kollar dessa grensidor om det finns andra för hopslagning. Var skriver man upp ens progress, för att andra inte skall göra dubbelarbete? Jag stoppar där nu ikväll. Adville (diskussion) 4 juli 2022 kl. 23.56 (CEST)
- Ok, tack. Bra att veta att man ska göra en kontroll ändå av länkarna. Då är det nog bäst man gör land för land eller så så att fler kan jobba samtidigt. Det var ganska många sidor... Adville (diskussion) 4 juli 2022 kl. 21.56 (CEST)
- Kategori:Robotskapade förgreningssidor. Just nu 38 273 sidor. De flesta rödlänkar som finns är INTE till raderade sidor, det är till sidor som aldrig skapades. I vissa fall så bör de vara kvar, i synnerhet till orter och administrativa enheter. Dessa är relevanta rödlänkar. Kitayama (diskussion) 4 juli 2022 kl. 21.43 (CEST)
- @Thoasp, kan du lägga en länk till en kategori eller så så man kan hitta dem så kan jag hjälpa till att radera dessa rödlänkar. Mvh Adville (diskussion) 4 juli 2022 kl. 21.38 (CEST)
- Ser fram emot att börja gå igenom de kvarvarande artiklarna och kunna förbättra dem. En sak som återstår är de robotskapade förgreningssidorna som fått många röda länkar till raderade artiklar, dessa bör tas bort. Thoasp (diskussion) 4 juli 2022 kl. 21.27 (CEST)
- Problemet var att gemenskapen inte tog ansvar för projektet utan utsåg Lsj till syndabock. Om jag inte missminner mig hörde jag till dem som var tveksamma när det drog igång, men det fanns konsensus för det. Tostarpadius (diskussion) 4 juli 2022 kl. 12.57 (CEST)
- Instämmer. Bättre förberedelser för respektive land hade också gjort nytta. Exempel: Boten missade helt att England har olika strukturer för lokalt självstyre; ibland en nivå (primär- och sekundärkommun samma objekt=enhetskommun), ibland två nivåer (grevskap och distrikt), därutöver de ceremoniella grevskapen. Resultatet blev en salig röra med mängder med fel. Kitayama (diskussion) 4 juli 2022 kl. 12.29 (CEST)
- Jag minns att jag har slagit samman en hel del dubbletter för Island, Färöarna och Storbritannien. Sjunnesson (diskussion) 4 juli 2022 kl. 10.23 (CEST)
- Ja, att städningen behövdes är det ingen som betvivlar. Problemet var att Lsj ensam fick bära hundhuvudet trots att gemenskapen hade godkänt och uppmuntrat projektet. Tostarpadius (diskussion) 4 juli 2022 kl. 10.15 (CEST)
- Det handlar inte bara om irrelevanta artiklar, utan också om en hel radda artiklar om ett och samma objekt, med olika stavning. Det har jag sett åtskilliga gånger när det gäller Afghanistan, och ibland bett om (och fått) städningshjälp av Kitayama. Chandra Varena (diskussion) 4 juli 2022 kl. 10.09 (CEST)
- Låt oss säga att vi botskapade artiklar om alla svenskar med namn, födelsedatum, klimatet på deras bostadsort, högsta inkomsten inom 10 km radie och att efternamnet är ovanligt ofta förekommande inom 20 km radie. Fullständigt värdelösa artiklar om dessa svenskar. Alltså raderar vi dem. Då kommer givetvis vi att radera artiklar (kanske några 1000-tal av de 10 miljoner skapade) om relevanta personer som vi saknar artikel om. Men det fanns inget, absolut inget, i de raderade artiklarna som påvisade relevans. Det har INTE medvetet raderats någon artikel där relevans fanns påvisade i artikeln. Däremot så har det med största säkerhet raderats artiklar som vid en djupare efterforskning skulle ha visat sig handla om ett relevant objekt. Vi står nu med 300 000 artiklar vars innehåll är uruselt, men där bedömningen är att det borde gå att förvandla dem till riktiga artiklar. Kitayama (diskussion) 4 juli 2022 kl. 09.24 (CEST)
Civil parishes - rapport från en skurhink
[redigera wikitext]I England finns på "landsbygden" en administrativ enhet civil parish. Det är ett slags "byråd" med ett geografiskt område. Endast 40% av Englands befolkning bor i en civil parish. Det finns drygt 10 000 civil parishes. Vi hade ganska många artiklar om civil parishes "före" boten, boten skapade resten åt oss, men la alla 10 000 i en kategori, dessutom ofta dubbletter till de redan existerande artiklarna. Jag tankade ned 2019:s lista över civil parishes och började en genomgång för att kvalitetssäkra att vi hade "rätt" civil parishes i rätt ceremoniella grevskap. Nu har vi 10 476 artiklar, både botskapade och manuellt skapade, fördelat på kategorier för 46 olika ceremoniella grevskap, i kategoriträdet Kategori:Civil parishes i England, dessa stämmer med 2019 års lista förutom en del förändringar som skett sedan dess som Swave 2 hållt koll på och skapat/uppdaterat artiklar. Civil parishes kommer och går den 1 april varje år, det är inte en statisk mängd. Jag har (tror jag) dessutom säkerställt att vi har koordinater i alla artiklar och att det finns någon form av infobox (antingen rå geobox eller {{ortsfakta Storbritannien}}
) i alla artiklar. Det betyder att vi nu har en "99% korrekt" bas med alla dessa civil parishes. Detta är ett exempel på hur vi kan utnyttja de goda sidorna av botens arbete. Det kräver dock rejält med arbete för att förvandla "botmassan" till en artikelmängd som vi känner är tillräckligt korrekt. Vad som nu återstår för Storbritannien är att få ordning på nivån ovanför, "kommunerna". Där finns klara förbättrings- och städbehov både hos de manuella artiklarna och de botskapade artiklarna. Vi saknar också bra artikeltext om Englands administrativa indelning - som är snårig och komplex och framförallt, inte enhetlig över hela landet. Men det är ett senare arbete ... Kitayama (diskussion) 4 juli 2022 kl. 16.39 (CEST)
- Gillar Yger (diskussion) 4 juli 2022 kl. 16.42 (CEST)
- Vi har ett historiskt perspektiv. Därför bör inte försvunna civil parishes raderas, lika litet som nedlagda franska kommuner. Tostarpadius (diskussion) 4 juli 2022 kl. 22.42 (CEST)
- Jaha? Det har inte raderats några försvunna civil parishes. Tvärtom har Swave 2 skapat nya artiklar om tidigare civil parishes. Kitayama (diskussion) 4 juli 2022 kl. 22.44 (CEST)
- Kategoriträdet Kategori:Tidigare civil parishes i England har för närvarande 731 artiklar. Kitayama (diskussion) 4 juli 2022 kl. 22.47 (CEST)
- (Redigeringskonflikt) Utmärkt! Då är allt som det skall vara. Detta framgick inte av det tidigare inlägget. Tostarpadius (diskussion) 4 juli 2022 kl. 22.49 (CEST)
- Kategoriträdet Kategori:Tidigare civil parishes i England har för närvarande 731 artiklar. Kitayama (diskussion) 4 juli 2022 kl. 22.47 (CEST)
- Jaha? Det har inte raderats några försvunna civil parishes. Tvärtom har Swave 2 skapat nya artiklar om tidigare civil parishes. Kitayama (diskussion) 4 juli 2022 kl. 22.44 (CEST)
- Vi har ett historiskt perspektiv. Därför bör inte försvunna civil parishes raderas, lika litet som nedlagda franska kommuner. Tostarpadius (diskussion) 4 juli 2022 kl. 22.42 (CEST)
Indonesien
[redigera wikitext]Det finns många förslag för artiklar om admin och orter Indonesien i Kategori:Artiklar föreslagna för infogning eller sammanslagning 2022-08. Inga ska slås ihop. Det finns två typer av problem.
1. Det vanliga att Valterbot använd PPL för lägsta admnivå, i detta fall ADM3, vilket gav fel interwiki. Ortsartiklen ska vara för sig eller ha interwiki till ett nuvarande wikidataobject. Admin ska flyttas till wikidata med administrativ kod för Indonesien (P2588) som har id för ett adminområde. Ortsartikeln finns för närvarande i admin wikidataobjektet
2. För Indonesien importerades två olika databaser för ADM3. Detta har get upphov till två wikipediaartiklar för lägsta admnivån. En ska tas bort inte infogas. Den som bör vara kvar har ett värde för administrativ kod för Indonesien (P2588) i wikidata. Som icke admin kan jag göra det med omdirigeringar i wikipedia (både i sv och ceb) och raderabegäran i wikidata av det object som inte längre har sv eller ceb wikipediaartiklar.
Maundwiki (diskussion) 7 september 2022 kl. 16.41 (CEST)
- Även ADM4 från geonames har dubbletter och bör hanteras som 2 ovan. Maundwiki (diskussion) 9 september 2022 kl. 22.21 (CEST)
- Flera av de föreslagna sammanslagningarna verkar vara mellan en "ort" X och en adm3-enhet Kecamatan X, när det också finns en adm4-enhet Desa X i Kecamatan X. Det verkar uppenbart olämpligt, så långt är jag med. Däremot undrar jag om det är allmänt vedertaget i officiell statistik och andra geografiska beskrivningar att skilja på orter och administrativa enheter i Indonesien som GeoNames har gjort. Cilidus som har jobbat mycket med de indonesiska Lsjbot-artiklarna kanske vet? //Essin (diskussion) 19 september 2022 kl. 12.28 (CEST)
- Jag har gjort en del djupdykningar i detta "träsk". Jag har inte sett någonstans, varken i de olika indonesiska wikiversionerna (finns ju flera beroende på språk), eller i den officiella statistik som jag tittat på, att man skiljer på ort och administrativ enhet. Man följer den struktur som finns beskriven i Indonesiens administrativa indelning. Att slå ihop orter med rätt nivå i hierarkin (normalt nivå II, ibland nivå III) anser jag är helt OK.
- På samma ämne: Geonames har bara cirka 1/4-1/3 på nivå IV, Desa eller kelurahan, och de artiklar som skapats har sällan WD-länk till någon inhemsk språkversion. Många finns dock i t ex idwiki, men måste då slås samman i WD. Just nu har vi cirka 20000 artiklar Eftersom Cilidus har tagit bort Desa och kelurahan ur många artiklar och därmed förvandlat dem från administrativa enheter till orter så har vi fått ännu sämre täckning på nivå IV. Senast jag tittade på Indonesien skrev jag detta i min "logg": 23784 orter och distrikt med enbart cebwiki som iw. De flesta är "desa", byar på lägsta administrativa nivån. De finns förmodligen i idwiki, men ett enormt matchningsjobb. Är det värt det? Eller ska vi fokusera på att matcha nivå två och tre? Kitayama (diskussion) 19 september 2022 kl. 12.41 (CEST)
- Om du anser att jag gjort något fel får du gärna säga till om detta. Jag tror dock att du har missat att jag kopplat ihop alla artiklar jag flyttat i Wikidata (jämför Dumpil (Q12482113)), precis som du tipsade mig om för ett tag sedan. Det finns vissa skillnader mellan desa och kelurahan, se t.ex. tabell här, så om man absolut behöver den informationen finns detta fortfarande kvar i artikeln, dock inte i titeln, precis som med idwp, nlwp, jvwp, mswp och suwp. Att jag skulle ha förvandlat administrativa enheter till orter förstår jag inte – det framgår fortfarande av Lsjbots brödtext att det rör sig om administrativa byar snarare än orter, och jag har inte påstått att de är orter. Cilidus (diskussion) 19 september 2022 kl. 23.36 (CEST)
- Jag hade missat att texten om administrativ by stod kvar. Då är det frid och fröjd. Kitayama (diskussion) 19 september 2022 kl. 23.45 (CEST)
- Om du anser att jag gjort något fel får du gärna säga till om detta. Jag tror dock att du har missat att jag kopplat ihop alla artiklar jag flyttat i Wikidata (jämför Dumpil (Q12482113)), precis som du tipsade mig om för ett tag sedan. Det finns vissa skillnader mellan desa och kelurahan, se t.ex. tabell här, så om man absolut behöver den informationen finns detta fortfarande kvar i artikeln, dock inte i titeln, precis som med idwp, nlwp, jvwp, mswp och suwp. Att jag skulle ha förvandlat administrativa enheter till orter förstår jag inte – det framgår fortfarande av Lsjbots brödtext att det rör sig om administrativa byar snarare än orter, och jag har inte påstått att de är orter. Cilidus (diskussion) 19 september 2022 kl. 23.36 (CEST)
- Flera av de föreslagna sammanslagningarna verkar vara mellan en "ort" X och en adm3-enhet Kecamatan X, när det också finns en adm4-enhet Desa X i Kecamatan X. Det verkar uppenbart olämpligt, så långt är jag med. Däremot undrar jag om det är allmänt vedertaget i officiell statistik och andra geografiska beskrivningar att skilja på orter och administrativa enheter i Indonesien som GeoNames har gjort. Cilidus som har jobbat mycket med de indonesiska Lsjbot-artiklarna kanske vet? //Essin (diskussion) 19 september 2022 kl. 12.28 (CEST)
Hur ska urusla Geonames-koordinater hanteras?
[redigera wikitext]Hur hanterar ni andra de fall där det finns iw-länkar, men där de leder till en plats så långt bort att det är oklart om Geonames koordinater är fel eller om det egentligen är olika platser? Några exempel från Gambia där jag försöker använda folkräkningen för att botstäda lite just nu:
- Sami (ort), se diskussion:Sami (ort)
- Wellingara, GeoNames placerar orten i ett översvämningsområde nära Wellingara Momodou (Wellingara Momodou Jallow i folkräkningen) medan dewp och plwp handlar om en förort till Banjul, här delade jag på Wikidataobjekten men vet inte om den GeoNames-baserade artikeln borde behållas
- Nema Kunku, där enwp blandar uppgifter om GeoNames-positionen (i östra delen av West Coast) och två orter som faktiskt finns i folkräkningen (i västra delen av West Coast respektive i North Bank), varav övriga WP-upplagor verkar beskriva den ena
//Essin (diskussion) 2 september 2022 kl. 15.38 (CEST)
- Frågan är hur mycket arbete vi ska lägga ned på att försöka rädda undermåliga botartiklar. När det är svårt att verifiera platsens existens trots en djup analys på gränsen till originalforskning så är det nog trots allt bättre att radera artikeln. Kitayama (diskussion) 9 september 2022 kl. 23.08 (CEST)
- Jo, om jag finge bestämma helt själv skulle alla artiklar raderas som inte omedelbart kan identifieras i folkräkningar, officiell befolkningsstatistik eller andra lika trovärdiga källor (dit räknar jag definitivt inte GeoNames). Då skulle å andra sidan ett och annat räddningsbart artikelämne ha strukit med, t ex Kasenga flygplats. //Essin (diskussion) 19 september 2022 kl. 12.21 (CEST)
- Ett annat liknande fall är diskussion:San Martín (kommunhuvudort i Argentina, San Juan). //Essin (diskussion) 13 oktober 2022 kl. 15.38 (CEST)
- Jo, om jag finge bestämma helt själv skulle alla artiklar raderas som inte omedelbart kan identifieras i folkräkningar, officiell befolkningsstatistik eller andra lika trovärdiga källor (dit räknar jag definitivt inte GeoNames). Då skulle å andra sidan ett och annat räddningsbart artikelämne ha strukit med, t ex Kasenga flygplats. //Essin (diskussion) 19 september 2022 kl. 12.21 (CEST)
Jag har lagt ett förslag om ändrad formulering på malldiskussion:Robotskapad#Saker som ska kollas innan mallen kan tas bort. Kom gärna med synpunkter där! //Essin (diskussion) 13 oktober 2022 kl. 15.38 (CEST)
Sidor märkta med mall:robotinfoga
[redigera wikitext]Hur ska dessa hanteras på sikt? Om det finns en manuellt skapad artikel redan verkar vi ha nått den punkt att den robotskapade brödtexten inte är något att ha, möjligtvis kan faktarutan infogas om en sådan inte finns redan. För att följa licenskraven borde i så fall historiken bevaras, men det finns problem med olika tänkbara tillvägagångssätt:
- Att lämna kvar robotsidan oförändrad kan ge upphov till förvirring och merarbete när någon annan går igenom sidan senare. Det är önskvärt att markera infogningsförslaget som avklarat.
- Att omdirigera robotsidan till artikeln gör att den riskerar att raderas senare som omdirigering mellan namnrymder. Jag tycker att problemen med sådana omdirigeringar just här är mindre än förlusten av historik, men jag förstår om inte alla håller med.
- Att flytta robotsidan till artikelnamnrymden innan infogning kan ge upphov till olämpliga sidtitlar (jag har sett "artikelnamn (lsjbot)").
- Att flytta robotsidan till samma titel och sammanfoga versionshistorikerna leder sannolikt till en svårläst versionshistorik.
Andra förslag på metoder?
Om det är helt uppenbart att varken brödtexten eller faktarutan kan användas, borde de då raderas? Särskilt oanvändbara är sidorna om självständiga stater som jag just upptäckte, som beskrivs som liggande mitt i sig själva. //Essin (diskussion) 13 oktober 2022 kl. 15.38 (CEST)
När interwikilänkar som behåll-kriterium inte är tillräckligt - exemplen Burundi och Gambia
[redigera wikitext]Jag har redan tidigare antytt att "artiklar på andra språk än ceb och arz" bara nästan alltid är ett rimligt kriterium för att behålla robotskapade artiklar. Speciellt i länder som få WP-aktiva skriver om kan det vara en enda persons urvalsmetod som avgör vilka artiklar vi har kvar nu. Denna person och deras hem-WP-upplaga kan i sin tur ha betydligt lägre krav på vad som är godtagbara källor och källhänvisningar än vad SVWP i allmänhet och detta projekt i synnerhet åtminstone i teorin strävar efter. Här är två konkreta exempel, men det går säkert att hitta flera:
Det finns 1832 robotskapade artiklar kvar om vattendrag i Burundi, samtliga med iw till swahili, 78 med iw till kirundi, och endast två (Kaburantwa (vattendrag i Burundi, lat -3,02, long 29,23) och Nyabugogo) med iw till andra språk (dessutom raderades Ruhwa och Ruvyironza (vattendrag) eftersom jag först nyss iw-kopplade ceb:Ruhwa och ceb:Ruvyironza (suba)). Swahiliartiklarna verkar vara skapade av Riccardo Riccioni och kirundiartiklarna av Failstate14. Ett stickprov antyder att kirundiartiklarna, utom några som har utvidgats senare, bara är källösa substubbar på formen "X är ett vattendrag i Burundi", medan swahiliartiklarna innehåller vaga upplysningar om avrinningsområde men inte anger andra källor än Geonames. Några av dem är kanske viktiga vattendrag som det vore värt att leta källor till, men hur tar man reda på var man ska börja?
Ett liknande fall, men något överkomligare, är 45 artiklar om öar och uddar i Gambia, mestadels skapade på tyska av Atamari och på spanska av Warairarepano&Guaicaipuro. Artiklarna har bara turistkartor angivna som källa men en del innehåller upplysningar som måste komma från annat håll.
Så, vad göra?
- Om vi helt ska undvika barn i badvattnet måste vi för varje enskild artikel leta källor och sedan på något vis avgöra att källetandet misslyckats innan radering. Jag menar att det är helt ogörbart för fall som Burundi.
- Man kan vända på saken och först hitta några generella men detaljerade källor (likt Africamuseums Kongo-provinsmonografier) och sedan endast behålla de objekt som diskuteras i dessa källor. Men var hittar man sådana källor och hur väljer man dem?
- Att bara låta artiklarna ligga leder kanske till att några enstaka förbättras inom några år, men artiklarna är inte underhållsfria heller, t ex är en provinsreform på gång i Burundi enligt en:Provinces of Burundi. Vi riskerar också att bidra till att opålitliga data sprids till andra WP-upplagor och Wikidata.
- Att urskillningslöst radera artiklar i kategorier av den här typen skulle definitivt ge upphov till protester.
- Att sortera artiklarna efter storlek på SWWP eller RNWP verkar inte ge några ledtrådar om vilka vattendrag som är viktigast.
//Essin (diskussion) 26 oktober 2022 kl. 15.37 (CEST)
- Det här är ett sånt fall där jag anser att vi bör söka gemenskapens konsensus på att radera en större mängd artiklar. Först måste dock någon göra ett försök att se om det finns källor som kan hjälpa till att identifiera de relevanta artiklarna. Det är alltså först 2) och sedan radera resten. Kitayama (diskussion) 27 oktober 2022 kl. 15.40 (CEST)