Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2017-08 - 2018-02
Cebwiki och Wikidata
[redigera wikitext]Wikidata ser ut att ha tröttnat. I d:Wikidata:Project chat#Dealing with our second planet ser det ut att finnas stöd för att inte bot-importera artiklar från cebwiki längre. Detta med anledning av allt extra arbete det tillför projektet. -- Innocent bystander (diskussion) 27 augusti 2017 kl. 02.28 (CEST)
- Djupt beklagligt. Tostarpadius (diskussion) 30 oktober 2017 kl. 06.20 (CET)
Dubbletter Malta
[redigera wikitext]Det verkar ha blivit ett relativt stort antal dubbletter för platser i/på Malta. Ett antal av dem räknas upp här. Många fler finns antagligen. Felet beror på att Lsjbot har kört fram exempelvis artiklar för både Ta’ Qassisu och Ta' Qassisu. Vad jag kan se har boten inte uppfattat att ’ och ' i de här fallen och i alla andra fall beträffande Malta, betyder samma sak. Jag undrar, för det första, om det går att köra ut en lista för alla de här Maltadubbletterna, och för det andra, hur de lämpligen ska åtgärdas. Finns det några synpunkter på det här? Sjunnesson (diskussion)
- Vilket skrivsätt är mest korrekt? Förslagsvis lägger vi omdir från det ena namnet till det andra. Så har boten normalt gjort i liknande fall. Kitayama (diskussion) 5 september 2017 kl. 09.40 (CEST)
- Det mest märkliga här är att roboten har gett två artiklar samma geonames-Id? Det normala har varit att det funnits två (eller ibland ännu fler) artiklar på grund av att GeoNames är fullt med dubbletter. -- Innocent bystander (diskussion) 5 september 2017 kl. 10.14 (CEST)
- Korrekt skrivsätt bör vara ' eftersom maltesiska Wikipedia konsekvent använder det, t.ex. i "r-Repubblika ta' Malta". Sjunnesson (diskussion) 5 september 2017 kl. 12.54 (CEST)
- @Larske: Har du möjlighet att göra en lista på de maltesiska dubbletterna? Sjunnesson (diskussion) 5 september 2017 kl. 12.54 (CEST)
- @Sjunnesson: Exakt vad är det som kännetecknar dubbletterna? Är de att det är två olika artiklar i Kategori:Robotskapade Maltaartiklar som har ett och samma Geonames-id?
- I så fall...
- @Larske: Har du möjlighet att göra en lista på de maltesiska dubbletterna? Sjunnesson (diskussion) 5 september 2017 kl. 12.54 (CEST)
- Korrekt skrivsätt bör vara ' eftersom maltesiska Wikipedia konsekvent använder det, t.ex. i "r-Repubblika ta' Malta". Sjunnesson (diskussion) 5 september 2017 kl. 12.54 (CEST)
- Det mest märkliga här är att roboten har gett två artiklar samma geonames-Id? Det normala har varit att det funnits två (eller ibland ännu fler) artiklar på grund av att GeoNames är fullt med dubbletter. -- Innocent bystander (diskussion) 5 september 2017 kl. 10.14 (CEST)
- --Larske (diskussion) 5 september 2017 kl. 14.03 (CEST)
- Tack, det var just det som jag tänkte kunde tas fram maskinellt. Sedan finns det enstaka andra, men de måste nog sökas fram manuellt, för då är det som med bl.a. Island och Irland att det finns botskapade artiklar där det redan förut fanns manuellt skapade artiklar. Sjunnesson (diskussion) 5 september 2017 kl. 17.02 (CEST)
- --Larske (diskussion) 5 september 2017 kl. 14.03 (CEST)
Kanada små kommuner och orter
[redigera wikitext]Blev det koncensus på om bägge ska behållas eller slås samman till en. I vilket fall sker en del klipp och klistra sammanslagningar/flyttar av ett IP (Användardiskussion:90.227.175.244) nummer som inte har tillgång till funktionen "Flytta". Maundwiki (diskussion) 5 oktober 2017 kl. 17.09 (CEST)
- DEt är väl i praktiken omöjligt att hålla ordning och återställa alla sådana sammanfogningar. Det är ju dessutom upp till bevis för den som vill behålla båda att visa att de existerar, vilket inte alls alltid är enkelt. Sedan tror jag inte det är jättemycket som går förlorat i dylika klipp-klistra-flyttar. Lsjbot är ju ofta upphovsman till båda artiklarna. -- Innocent bystander (diskussion) 5 oktober 2017 kl. 20.37 (CEST)
- Det som syns i den nya artikelhistoriken är att "IP" skrev, det går inte att se att lsj(bot) skrev innan. Till mig är det ingen skillnad i att det bör gå att spåra vem ursprungsförfattaren var även om en bot skriver eftersom det finns en användare bakom förvandlingen av data till text. Nu pratar du praktiskt om att göra om och jag tror att om det är gjort får det nog stå kvar. Beträffande små orter/kommuner i Kanada och Frankrike behövs nog bara som i Frankrike kommunartikeln men det fick jag mothugg för för några år sedan. Maundwiki (diskussion) 6 oktober 2017 kl. 02.09 (CEST)
- Ok, jag förutsatte att det klistrades från en bot-artikel till en annan. I sådana fall borde det kvitta. GeoNames har visat sig urusel som källa för orter. Det de gjort är att de skrapat kartor på namn, och förutsatt att allt är orter (det är det inte). För kommuner har de visat sig använda tillförlitligare källor. -- Innocent bystander (diskussion) 6 oktober 2017 kl. 08.26 (CEST)
- Ja en bot till en annan OK. Jag klipper och klistrar ofta när jag infogar botskapade artiklar i användarskapade när de handlar om samma objekt eller för förgreningssidor. Maundwiki (diskussion) 11 oktober 2017 kl. 18.38 (CEST)
- Ok, jag förutsatte att det klistrades från en bot-artikel till en annan. I sådana fall borde det kvitta. GeoNames har visat sig urusel som källa för orter. Det de gjort är att de skrapat kartor på namn, och förutsatt att allt är orter (det är det inte). För kommuner har de visat sig använda tillförlitligare källor. -- Innocent bystander (diskussion) 6 oktober 2017 kl. 08.26 (CEST)
- Det som syns i den nya artikelhistoriken är att "IP" skrev, det går inte att se att lsj(bot) skrev innan. Till mig är det ingen skillnad i att det bör gå att spåra vem ursprungsförfattaren var även om en bot skriver eftersom det finns en användare bakom förvandlingen av data till text. Nu pratar du praktiskt om att göra om och jag tror att om det är gjort får det nog stå kvar. Beträffande små orter/kommuner i Kanada och Frankrike behövs nog bara som i Frankrike kommunartikeln men det fick jag mothugg för för några år sedan. Maundwiki (diskussion) 6 oktober 2017 kl. 02.09 (CEST)
- Jag tror inte det finns konsensus att alltid göra det ena eller det andra. Det får avgöras från fall till fall. Det skiljer sig mellan provinser och även inom provinser mellan landsbygd och mer tätbebyggda områden. I flera provinser består kommuner på landsbygden bara av själva orten och är omgivet av områden som inte är del av någon kommun. I andra områden kan kommunsammanslagningar ha gjort att kommun och ort är mer olika. I stadsområden kan det vara oklart vad som är en ort (vad skulle t.ex. Sundbyberg (ort) vara?). Där verkar också geonames ha problem, t.ex. med befolkningsdata för kommuner i ortsobjekt.
De flesta artiklar där jag "klipp-och-klistrat" är till omdirigeringssidor. Men egentligen finns inget kvar utom kategorin från de robotskapade artiklarna. Det är nya artiklar helt baserade på de nya källor som anges i artiklarna. Ett par gånger har jag skapat den nya artikeln på en helt ny sida, men det skiljer sig inte mycket från det som skapats på omdirigeringssidor. (När jag behövt flytta sidor har jag gjort det som Användare:F.d. 82.212.68.183.) 95.204.130.157 (f.d. 90.227.175.244) 11 oktober 2017 kl. 20.09 (CEST)- Finns det örter med samma namn som kommunen bör det också vara separata artiklar och detta även om de omfattar samma geografiska område. I Sverige skiljer vi mellan socknar, församlingar och landskommuner och har dessutom artiklar om kyrkbyn, som ofta, dock långtifrån alltid, har samma namn. Tostarpadius (diskussion) 30 oktober 2017 kl. 06.27 (CET)
- Jag tycker källäget, interwiki och artikelinnehållet ska avgöra huruvida artiklarna ska slås ihop. Geonames kan vi bortse ifrån. Om vi talar om botskapade artiklar om orter som utgör egna kommuner där bara den ena artikeln har interwiki och i stort sett allt artikelinnehåll är dubblerande – då tycker jag definitivt vi ska slå ihop artikearna. Det här har ju diskuterats förr, och ingen tydlig konsensus finns så varje land får behandlas för sig./Gotogo (diskussion) 30 oktober 2017 kl. 08.32 (CET)
- Finns det örter med samma namn som kommunen bör det också vara separata artiklar och detta även om de omfattar samma geografiska område. I Sverige skiljer vi mellan socknar, församlingar och landskommuner och har dessutom artiklar om kyrkbyn, som ofta, dock långtifrån alltid, har samma namn. Tostarpadius (diskussion) 30 oktober 2017 kl. 06.27 (CET)
Detta ära en robotgenererad grensida. Den innehåller både röda och blå länkar, dels till platser med Rosenberg i namnet, dels till andra platser. Jag är benägen att stryka länkar till platser som inte uttryckligen har Roselberg i namnet. Innan jag gör detta, undrar jag emellertid hur sådana orter kommit med här. Om det är gamla tyska namn på orter, som nu har slaviska namn, var finns källorna? Roufu (diskussion) 24 oktober 2017 kl. 00.11 (CEST)
- "Källan" är vad som någon lagt in som alternativnamn i Geonames. Det kan alltså vara allt från helt fel till helt rätt. Jag skulle stryka rödlänkar till platser utan Rosenberg i namnet. Blålänkar bör man kanske försöka verifiera (t ex finns källa i artikeln?) Om det misslyckas - stryk. Kitayama (diskussion) 24 oktober 2017 kl. 00.33 (CEST)
- Tack för rådet. Jag jar följt det och också infogat (klipp ohc klistra) den robotgenererade sidan Rosenberg (olika betydelser) i den manuiellt skapade grensidan Rosenberg. Roufu (diskussion) 27 oktober 2017 kl. 11.09 (CEST)
- Tack för insatsen! Sammanslagningen var dock olycklig. Den kunde ha fått nytt namn istället. Vi borde ha fler separata grensidor för efternamn respektive geografiska namn. De förenade blir ofta överskådliga. Tostarpadius (diskussion) 30 oktober 2017 kl. 06.24 (CET)
- Tack för rådet. Jag jar följt det och också infogat (klipp ohc klistra) den robotgenererade sidan Rosenberg (olika betydelser) i den manuiellt skapade grensidan Rosenberg. Roufu (diskussion) 27 oktober 2017 kl. 11.09 (CEST)
Kommuner och orter i Belgien
[redigera wikitext]Belgien har 589 kommuner, som täcks av egna artiklar både på svenska och på flera andra språk. Många av de svenska artiklarna är manuellt skrivna, men Lsjbot har fyllt på så att listan i princip är komplett.
För mer än 200 bot-skapade artiklar finns både en kommun- och en ortsartikel samt en gensida som skiljer mellan dessa. Denna uppdelning är en följd av källan, Geonames, och inte av det verkliga behovet. Den finnss i övrigt bara på cebuano och heller inte för manuellt skapade svenska artiklar. Interwikilänkarna går till kommunartilarna, medan ortsartiklarna bara verkar till cebuano.
Jag menar att uppdelningen i kommun och ort bör tas bort också för de botskapade belgiska kommunartiklarna. @YesDi: har bearbetat belgiska kommunartiklar och då gjort detta i mindre skala. Skall sådana ändringar göras effektivt, krävs det emellertid administratörsredskap och gärna också en bot, något som jag inte har. Innan jag går vidare, vill jag därför lufta mitt förslag här.
- Varför skall de tas bort? Finns inte orterna? Jag anser annars att det är vår styrka att vi har artiklar både för kommuner och deras centralorter. Att andra språkversioner inte gör den distinktionen är inte ett tillräckligt skäl för radering. Grensidorna bör däremot avlägsnas om de enbart innehåller den uppdelningen. Tostarpadius (diskussion) 30 oktober 2017 kl. 06.17 (CET)
- @Roufu:, @Tostarpadius: Jag minns att jag ett tag jobbade med Belgien. Förmodligen blev det en del klipp- och klistra artiklar eftersom jag inte hade tillgång till några adminverktyg. Jag tror att jag slutade att fortsätta med kommunerna för att källan till befolkningsuppgifterna dog. Jag håller i nuläget inte på med Belgien, men jobbar istället med kommunerna i Schweiz. Där har jag gjort så att jag har raderat grensidan, flyttade kommunartikeln till huvudordet och låtit orterna vara kvar. Diskussionerna om detta har förkommit tidigare. Det enda vi nog riktigt har kommit fram till är att grensidorna ska plockas bort och att någon av kommun/ortsartikeln bör flyttade till huvudordet. YesDi (diskussion) 30 oktober 2017 kl. 08.19 (CET)
- Det är just det tillvägagångssättet jag stöder. I Sverige äger orterna företräde. Det är den modell jag normalt förespråkar, men det får bedömas från land till land. Tostarpadius (diskussion) 30 oktober 2017 kl. 08.21 (CET)
- Det är också det jag menar. Det är bara de botskapade belgiska kommun/ort-förgreningarna jag vill åt. Sammanfallande namn av andra orsaker måste särskiljas systematiskt (inte efter infallsmetoden).
- För de botskapade Belgien-artiklarna är det kommunartiklarna som har mest relevant information, viktigast interwikilänkarna. De skillnader i befolkningstal jag observerat är små och visar att centralorten är helt dominerande i kommunen. Belgien är ett tätbefolkat land med 11 miljoner inbyggare på en yta motsvarande Småland. Kommunerna blir då mindr än i Sverige, både till befolkningstalet (det är 290 kommuner i Sverige) och inte minst till ytan. Roufu (diskussion) 30 oktober 2017 kl. 11.27 (CET)
- (Redigeringskonflikt) Inte ens små länder som Belgien och Schweiz kan bestå enbart av orter utan omland. Även omlandet måste tillhöra kommuner. Vet ni som sysslat med detta om dessa länder har en konsekvent uppdelning i stadskommuner och landskommuner? Annars är det troligt att kommunerna i dessa länder täcker mer än sin centralort och då är det fel att slå ihop orts- och kommunartiklar oavsett hur det ser ut på andra språkversioner. /Ascilto (diskussion) 30 oktober 2017 kl. 11.33 (CET)
- Som jag ser det tycker jag inte att man nödvändigtvis behöver skilja orter och kommuner. Eventuella stadsägor kan ju mycket väl beskrivas i artikeln om staden. Ett större problem har ju varit att wikidata i många fall förutsatt att det finns en ort med samma namn som kommunen även när en sådan inte existerar. Vad meta är - existerar överhuvud taget centralortsbegreppet i Frankrike och Belgien och har man någon centalort alls i alla kommumer?FBQ (diskussion) 30 oktober 2017 kl. 13.12 (CET)
- I många europeiska länder så består ett stort antal kommuner av enbart en ort, omlandet i kommunen är enstaka gårdar och små byar. Kommun har ju där en helt annan innebörd än i Sverige. På tyska kallas detta Ortsgemeinde. Jag anser att i de fall kommun = en ort med omland så behöver vi inte två artiklar. Det gäller dock att verifiera att det är en "ortskommun". Så fort kommunen har flera signifikanta, verifierbara orter så kan det vara olika artiklar OM det finns något att skriva om någon ort som inte är centralort i kommunen. Det räcker ju med ett verifierat invånarantal så finns det något att skriva. För t ex Österrike finns officiell statistik på alla småorter i kommunerna, oftast med under 100 invånare per ort. Jag föredrar då att lista alla orterna med dess invånarantal i kommunartikeln i stället för att skapa stubbartiklar för orter med 7 invånare. Jag märker att många tänker Sverige när de diskuterar kommun/ort. Här gäller det att tänka i nya banor för varje land. Helst bör det för varje land finnas en geografisk riktlinje som det råder konsensus om. Av riktlinjen bör artimrlstruktur för landet framgå, hur de administrativa enheterna ska översättas, vilka befolkningskällor och areakällor. som bör användas, om wikidata används eller ej etc. Kitayama (diskussion) 30 oktober 2017 kl. 13.28 (CET)
- Om kommunen består av en ort och ett omland med gårdar och byar så är per definition inte orten identisk med kommunen och då måste vi ha två olika artiklar, en om orten och en om kommunen (utan hänsyn till att de gör fel på andra språkversioner) samt skapa korrekta WD-objekt utifrån detta. /Ascilto (diskussion) 30 oktober 2017 kl. 13.37 (CET)
- Av bot-artiklarna om belgiskaa förhållanden länkas ortsartiklarna som enbart till cebuano och och kommunartiklarna till bådecebuano och i underkant av 40 andra språk. Jag räknar med att artiklarna på cebuano också är bot-producerade. Det blir absurt, om vi skall låta cebuanoversionen bestämma vilka artiklar vi skall ha på svenska. Roufu (diskussion) 30 oktober 2017 kl. 14.36 (CET)
- Vem har hävdat att vi skall följa cebuano-versionen? /Ascilto (diskussion) 30 oktober 2017 kl. 14.46 (CET)
- Det finns inga sånt måste. Man kan välja att bara ha en artikel om kommunen och beskriva allt i den. Den ska då länkas till wd-objektet för kommunen. Vad vi inte får göra är att korsa mellan ort och kommun mellan svwp och wd, det är obra. OM man väljer att ha endast en artikel så bör kommunen väljas då den har verifierbara källdata om yta och befolkning. Det är ytterst sällan som det finns något källdata om själva orten, eftersom statistikmyndigheterna i dessa länder inte ser någon skillnad på ort och kommun för dessa småkommuner. Kitayama (diskussion) 30 oktober 2017 kl. 14.50 (CET)
- Vem har hävdat att vi skall följa cebuano-versionen? /Ascilto (diskussion) 30 oktober 2017 kl. 14.46 (CET)
- Av bot-artiklarna om belgiskaa förhållanden länkas ortsartiklarna som enbart till cebuano och och kommunartiklarna till bådecebuano och i underkant av 40 andra språk. Jag räknar med att artiklarna på cebuano också är bot-producerade. Det blir absurt, om vi skall låta cebuanoversionen bestämma vilka artiklar vi skall ha på svenska. Roufu (diskussion) 30 oktober 2017 kl. 14.36 (CET)
- Om kommunen består av en ort och ett omland med gårdar och byar så är per definition inte orten identisk med kommunen och då måste vi ha två olika artiklar, en om orten och en om kommunen (utan hänsyn till att de gör fel på andra språkversioner) samt skapa korrekta WD-objekt utifrån detta. /Ascilto (diskussion) 30 oktober 2017 kl. 13.37 (CET)
- I många europeiska länder så består ett stort antal kommuner av enbart en ort, omlandet i kommunen är enstaka gårdar och små byar. Kommun har ju där en helt annan innebörd än i Sverige. På tyska kallas detta Ortsgemeinde. Jag anser att i de fall kommun = en ort med omland så behöver vi inte två artiklar. Det gäller dock att verifiera att det är en "ortskommun". Så fort kommunen har flera signifikanta, verifierbara orter så kan det vara olika artiklar OM det finns något att skriva om någon ort som inte är centralort i kommunen. Det räcker ju med ett verifierat invånarantal så finns det något att skriva. För t ex Österrike finns officiell statistik på alla småorter i kommunerna, oftast med under 100 invånare per ort. Jag föredrar då att lista alla orterna med dess invånarantal i kommunartikeln i stället för att skapa stubbartiklar för orter med 7 invånare. Jag märker att många tänker Sverige när de diskuterar kommun/ort. Här gäller det att tänka i nya banor för varje land. Helst bör det för varje land finnas en geografisk riktlinje som det råder konsensus om. Av riktlinjen bör artimrlstruktur för landet framgå, hur de administrativa enheterna ska översättas, vilka befolkningskällor och areakällor. som bör användas, om wikidata används eller ej etc. Kitayama (diskussion) 30 oktober 2017 kl. 13.28 (CET)
- Som jag ser det tycker jag inte att man nödvändigtvis behöver skilja orter och kommuner. Eventuella stadsägor kan ju mycket väl beskrivas i artikeln om staden. Ett större problem har ju varit att wikidata i många fall förutsatt att det finns en ort med samma namn som kommunen även när en sådan inte existerar. Vad meta är - existerar överhuvud taget centralortsbegreppet i Frankrike och Belgien och har man någon centalort alls i alla kommumer?FBQ (diskussion) 30 oktober 2017 kl. 13.12 (CET)
- (Redigeringskonflikt) Inte ens små länder som Belgien och Schweiz kan bestå enbart av orter utan omland. Även omlandet måste tillhöra kommuner. Vet ni som sysslat med detta om dessa länder har en konsekvent uppdelning i stadskommuner och landskommuner? Annars är det troligt att kommunerna i dessa länder täcker mer än sin centralort och då är det fel att slå ihop orts- och kommunartiklar oavsett hur det ser ut på andra språkversioner. /Ascilto (diskussion) 30 oktober 2017 kl. 11.33 (CET)
- Det är just det tillvägagångssättet jag stöder. I Sverige äger orterna företräde. Det är den modell jag normalt förespråkar, men det får bedömas från land till land. Tostarpadius (diskussion) 30 oktober 2017 kl. 08.21 (CET)
- @Roufu:, @Tostarpadius: Jag minns att jag ett tag jobbade med Belgien. Förmodligen blev det en del klipp- och klistra artiklar eftersom jag inte hade tillgång till några adminverktyg. Jag tror att jag slutade att fortsätta med kommunerna för att källan till befolkningsuppgifterna dog. Jag håller i nuläget inte på med Belgien, men jobbar istället med kommunerna i Schweiz. Där har jag gjort så att jag har raderat grensidan, flyttade kommunartikeln till huvudordet och låtit orterna vara kvar. Diskussionerna om detta har förkommit tidigare. Det enda vi nog riktigt har kommit fram till är att grensidorna ska plockas bort och att någon av kommun/ortsartikeln bör flyttade till huvudordet. YesDi (diskussion) 30 oktober 2017 kl. 08.19 (CET)
Jag har nu gjort det jag kunnat manuellt, bland annat kontrollerat och rättat så att interwikilänkar leder rätt samt behandlat alla fall med fler betydelser av kommunnamnen. Kvar blir 120 enkla fall, som jag begärt robothjälp för. Så långt jag kan se, är detta uteslutande ett problem för kommuner i Flandern. Kommuner i Vallonien och i Brysselregionen verkar behandlas riktigt.
När robotjobbet har körts, återstår det att kontrollera och eventuellt rätta listor med konmunnamn. Roufu (diskussion) 5 november 2017 kl. 08.42 (CET)
- @Roufu: Exakt vad är det som kännetecknar de 120 artiklar som du har listat i din sandlåda? Är inte artiklarna Beauraing, Begijnendijk, Berloz, Bertogne, Blégny, Braives, Brasschaet, Brugelette och Büllingen, bara för att nämna några orter på "B" i listan över robotskapade Belgienförgreningar, av precis samma slag och borde hanteras på samma sätt som artiklarna i din lista? --Larske (diskussion) 5 november 2017 kl. 12.36 (CET)
@Larske: Tack för insatsen. Jag har gått ut från listor, där kommunerna varit sorterade efter provins och arrondissement. Det är bara kommunerna i Flandern jag har sett noga på. Jag gick för fort fram, när jag skrev att jag trodde kommonuerna i Vallonien var i ordning.Jag skall se mer på dessa. Jag tror att jag hamnade fel på grund av att de robotskapade kommunsidorna saknade kategorisering efter provins. Jag hade rättat men glömt att jag jhade gjort det för Flandern.
Två kommuner på din lista är emellertid från Flandern.
Begijnendijk är nummer 30 på min kommunlista. Den är alltså inte glömd.
Brasschaet är en stavningsvariant eller felskrivning av Brasschaat, som är manuellt skriven och har interwikilänkar också till andra språk än cebuano. Bägge grenarna i Brasschaet gick emellertid samma riktiga sida. Jag har gjort om Brasschaet till en omdirigering.
Jag menar att det är möjligt att köra de 120 Flandernkommunerna nu. Om någon Flanderkommun är glömd, ser jag det bland annat på hur kommuunnamnet ser ut i Kategori:Indelningar i Flandern. Roufu (diskussion) 5 november 2017 kl. 16.54 (CET)
- @Larske: Jag har nu lagt till de kommuner i Vallonien som kan robotbehandlas. Totala antalet är nu 238. Jag har gjort en obetydlig ändring i proceduren för att täcka in det fall då filerna i moment 4 och 5 redan saknaas. Det är ett antal kommuner i Vallonien kvar som måste behandlas individuellt. De har bland annat namn som delas med vattendrag eller med kommuner i andra länder. Roufu (diskussion) 10 november 2017 kl. 13.50 (CET)
Frankrike
[redigera wikitext]Detta är kanske inte rätt plats för just detta ämne, eftersom de franska kommunerna inte skapades i det stora geografiprojektet. Jag ser det dock som alltmer besvärande att artiklarna inte har uppdaterats efter de omfattande sammanslagningar som ägt rum. Tostarpadius (diskussion) 30 oktober 2017 kl. 08.36 (CET)
- @Tostarpadius: Ett annat stort problem är att befolkningsuppgifterna börjar bli gamla. Kommer det att gå och uppdatera dessa uppgifter med bot? Eftersom Frankrike har ca 36000 kommuner ser jag det som omöjligt att uppdatera uppgifterna för hand. Dessutom står det att uppgifterna kommer från 2010. När man kontrollerar i källan är det egentligen uppgifter från 2009. YesDi (diskussion) 30 oktober 2017 kl. 10.23 (CET)
- Via den här sidan, som jag tolkar hör till någon fransk motsvarighet till SCB men behöver hjälp med att bedöma om det är verkliga data eller bara något som är för demonstrationsändamål, kan man hämta olika data. Jag har just laddat ner 38 385 poster som avser befolkningsuppgifter för diverse franska indelningar per 2014-01-01. Men det kanske avser "innan sammanslagningarna" som Tostarpadius skriver om. I så fall kan ni bortse från detta inlägg.
Data från 2014 gäller
Antal | Typ | Från (kod) | Till (kod) | Total folkmängd (2014) |
---|---|---|---|---|
17 | "region" | Guadeloupe (01) | Corse (94) | 67 357 823 |
45 | "arrondissementMunicipal" | Marseille 1er Arrondissement (13201) | Paris 20e Arrondissement (75120) | 3 625 090 |
100 | "departement" | Ain (01) | La Réunion (974) | 67 357 823 |
334 | "arrondissement" | Belley (011) | Saint-Paul (9744) | 67 357 823 |
2 020 | "canton" | Ambérieu-en-Bugey (0101) | Saint-Paul 3e Canton (97425) | 62 571 616 |
35 868 | "commune" | L'Abergement-Clémenciat (01001) | Cilaos (97424) | 67 407 278 |
- I Wikidata finns det befolkningsuppgifter för alla(?) franska kommuner, men de färskaste påstås avse 2013 för de allra flesta kommuner. (84 kommuner har uppgifter från 2014 och 1 från 2017). De flesta är dock "importerade från franskspråkiga Wikipedia", men även "esperantospråkiga wikipedia" och "ryskspråkiga wikipedia" förekommer som källa. Om aktuella uppgifter, med riktig källa, stoppas in i Wikidata för alla franska kommuner, kan de sedan hämtas därifrån till alla språkutgåvor av Wikipedia.
- Här är en lista på 36 601 franska kommuner som i Wikidata har uppgift om befolkning som gäller 2013 eller senare tillsammans med "kommunkod", "folkmängd", "datum" och "källa".
- --Larske (diskussion) 30 oktober 2017 kl. 12.08 (CET)
- Några inlägg på begäran:
- Orsaken till att jag inte uppdaterat befolkningsdatan i de franska kommunerna är att Insee gjort det svårare att göra datauttag.
- Befolkningssiffrorna behöver inte uppdateras med robot, utan ligger lagrade i en mall. Mallen skapades innan wd var i bruk och planerades att avskaffas när det wd kom igång och fyllts på med källbelagda befolkningsuppgifter. Att låta en robot läsa av enwp och proppa in data i wd utan att ange ursprungskällan gör att den delen av wd blir oanvändbart. Man ska normalt sett källhänvisa till primärkällan och inte till wp.
- Befolkningsuppgifterna uppdateras normalt sett varje år medan det görs en noggrannare uppdatering med nya kartgränser omkring vart 9:e år. Befolkningsdiagrammen i artiklarna visar den noggranna befolkningsräkningen och kartuppdateringen, se Lyon-Befolkningsutveckling (sv). Om vi jämför med tätortsindelningen i Sverige så sker en sådan uppdatering vart 5:e år (med undantag för extrem glesbygd där kartuppdateringar sker var 12:e år (dock utan att vara fullständiga). I de franska artiklarna finns en tabeller och diagram med demografiska uppgifter som är tagna från samma källa (Insee), se Lyon-Befolkningsutveckling (fr).
- Hur gör man då för att uppdatera artiklarna. Det elegantaste är givetvis att använda wd, och att först uppdatera wd med källbelagda uppgifter från Insee. Det mindre eleganta sättet är att uppdatera mallen, fast den är antagligen ingen bra lösning på lång sikt. Nasko (✉) 30 oktober 2017 kl. 20.26 (CET)
- Jag ser föråldrade befolkningssiffror som ett mindre problem så länge de är daterade. Däremot har alltså kommuner slagits samman i stor skala. Om jag minns rätt skedde detta 1 januari 2016. Även regionindelningen har förändrats. Tostarpadius (diskussion) 30 oktober 2017 kl. 20.43 (CET)
- Artikeln Frankrikes administrativa indelning har nu fått mallen
{{inaktuell}}
eftersom den beskriver läget för 2013. --Larske (diskussion) 30 oktober 2017 kl. 21.03 (CET)- @Taxelson: Varit offwiki några dagar, se min egen disk. Insee är den franska motsvarigheten till SCB, ja. En stat-mall är nog en bättre lösning än att använda Wikidata om där saknas datering och källan är Wikipedia. Naturligtvis vore det bra om datan på Wikidata uppdateras, men viktigare är nog att uppdatera om sammanslagningar och liknande. insee brukar vara duktiga på att redovisa mätmetod, och då ska den datan också redovisas på Wikidata. (Soldater och person på särskilt boende kan ha avvikelser mellan bokföringsadress och vistelseadress. Det kan också röra sig om "uppskattningar". Insee har vid sådana fall ibland redovisat att det bott icke-heltal av personer på en plats.) Inte heller jag tycker gammal data är ett jätteproblem så länge det redovisas hur gamla de är och har en bra källa. -- Innocent bystander (diskussion) 2 november 2017 kl. 10.28 (CET)
- Artikeln Frankrikes administrativa indelning har nu fått mallen
- Jag ser föråldrade befolkningssiffror som ett mindre problem så länge de är daterade. Däremot har alltså kommuner slagits samman i stor skala. Om jag minns rätt skedde detta 1 januari 2016. Även regionindelningen har förändrats. Tostarpadius (diskussion) 30 oktober 2017 kl. 20.43 (CET)
- Några inlägg på begäran:
Island, "den centrala delen" (robotartiklar)
[redigera wikitext]Ett problem med lägesangivelser för olika platser på Island är när det anges att en plats ligger i en region som "ligger i den centrala delen av landet": Så här: "Det/Den ligger i regionen Norðurland eystra/Norðurland vestra/Suðurland/Austurland i den centrala delen av landet." I artikeln om exempelvis Norðurland eystra står det att den ligger i "landets norra mellersta del", vilket kan anses vara riktigt. Däremot blir det fel när Lsjbot anger att dessa regioner ligger i den centrala delen av landet, exempelvis om Álar (vik), "Den ligger i regionen Norðurland eystra, i den centrala delen av landet". Man får då uppfattningen att viken ligger i den centrala delen av landet, medan den i själva verket ligger i den norra delen. Så här ser det ut för många isländska platser, troligtvis ett hundratal. Går det att maskinellt helt ta bort uppgiften om att en region "ligger i den centrala delen av landet"? För ingen isländsk region ligger helt i den centrala delen av Island. Det borde räcka att det står i vilken region en plats ligger, och avstå från att ange var regionen i sin tur ligger, eftersom det blir missvisande. Sjunnesson (diskussion) 31 oktober 2017 kl. 09.48 (CET)
- Formuleringen ", i den centrala delen av landet," förekommer i 1 120 artiklar som handlar om platser i någon av de fyra regionerna Austurland (76), Suðurland (212), Norðurland vestra (285) eller Norðurland eystra (547). --Larske (diskussion) 31 oktober 2017 kl. 10.43 (CET)
- Ja, och eftersom den största delen av artiklarna, 547 st., gäller Norðurland eystra, är de det största problemet. Kan en lämplig lösning vara den jag skrev här ovan: att ta bort "ligger i den centrala delen av landet" för alla 1 120 artiklarna? Att det då följer med många artiklar där platserna mycket riktigt ligger i landets centrala delar kan inte ha så stor betydelse, eftersom ingen av de fyra regionerna ligger enbart centralt i landet, och att det då inte heller bör stå så. Sjunnesson (diskussion) 31 oktober 2017 kl. 12.12 (CET)
- En annan möjlighet är att skriva "ligger i landets sydvästra delar" för de platser som ligger i Suðurland, "ligger i landets östra delar" för de som ligger i Austurland, "ligger i landets nordvästra delar" för de som ligger i Norðurland vestra och "ligger i landets nordöstra delar" för de som ligger i Norðurland eystra. Sjunnesson (diskussion) 4 november 2017 kl. 11.11 (CET)
- @Larske:, @Taxelson:, @Kitayama:: Finns det synpunkter på det här, och skulle det möjligen gå att rätta "centrala delen av landet" (hur det nu ska göras) som ett robotjobb? Sjunnesson (diskussion) 5 november 2017 kl. 08.55 (CET)
- Texten "ligger i den x:a delen av landet" känns i många fall överflödig och krystad. I Danmark tar jag bort den i vissa fall. Frågan är vad den tillför i små länder med distinkta regioner. Alla botartiklar har en karta, där kan läsaren lätt avgöra var i landet platsen ligger. Klickar man på regionen kan man läsa mer om var i landet regionen ligger. Alltså är jag inne på att helt sonika ta bort texten. Kitayama (diskussion) 5 november 2017 kl. 09.07 (CET)
- Jag instämmer helt i det Kitayama skriver. Jag lägger nu in en robotbegäran om att få detta utfört. Sjunnesson (diskussion) 25 april 2018 kl. 08.51 (CEST)
- @Sjunnesson: Formuleringen i de robotskapade artiklarna är så här:
- Det/Den/De ligger i regionen <länkat regionnamn>, i den <väderstreck> delen av landet, <avstånd> km från huvudstaden Reykjavik.
- I begäran om robothjälp står det att:
- uppgifter av typen "ligger i den x:a delen av landet" ska tas bort "i områdena Norðurland eystra och Norðurland vestra.
- Jag tolkar detta som att för artiklar som ligger i någon underkategori till Kategori:Landformer i Norðurland eystra eller Kategori:Landformer i Norðurland vestra, alltså i dessa 1 730 artiklar, i den mån uppgiften fortfarande finns kvar, ska ändras så att det istället står:
- Det/Den/De ligger i regionen <länkat regionnamn>, <avstånd> km från huvudstaden Reykjavik.
- Ändringen ska alltså ske även i artiklar som inte (längre) ligger i Kategori:Robotskapade Islandartiklar, till exempel i Arnarþúfufoss.
- Ska uppgiften om "del av landet" alltså vara kvar för alla de andra regionerna trots det som Kitayama skriver om att "uppgiften känns överflödig och krystad" och som du håller med om?
- Är detta rätt uppfattat? --Larske (diskussion) 26 april 2018 kl. 09.05 (CEST)
- Du har uppfattat min begäran rätt. Men egentligen kan ju uppgiften tas bort för samtliga regioner, jag tänkte bara att det är mest fel i de båda nämnda regionerna. Men jag har sett att det inte stämmer så bra i Suðurland heller. För min del får gärna nämnda uppgifter tas bort för hela Island. Behöver jag ändra till det i min robotbegäran? Sjunnesson (diskussion) 26 april 2018 kl. 11.21 (CEST)
- Om det ska göras för hela Island är det dessa 6 398 artiklar som behöver undersökas och vid behov ändras. Jag tycker att det är bättre att en begäran om Robothjälp diskuteras och i detalj formuleras på till exempel den här diskussionssidan för att därefter, när konsensus finns, föras in på WP:RH. Det är mest du som har argumenterat för ändringen här förutom ett inlägg från Kitayama. Med tanke på att frågan togs upp av dig för mer än ett halvår sedan kan man väl tolka det som att det inte finns några starka åsikter om detta bland dem som läser den här sidan och därmed en liten risk för protester om denna ändring genomförs. Själv tycker jag inte att problemet är så besvärande, men hjälper gärna till med att genomföra den. Om det nu ska ändras tycker jag att det är bättre om man hanterar alla regioner i Island på samma sätt. Island är dock bara ett av många länder som har regioner och där samma formulering finns om "läget inom landet" för den administrativa enhet inom vilket den aktuella landformen finns. --Larske (diskussion) 26 april 2018 kl. 12.01 (CEST)
- Det är bara på Island jag vet att det förekommer den här typen av felaktiga lägesuppgifter. Jag har i år hållit på en del med Australien, som har liknande uppdelning i söder, öster, norr och väster som Island har, men där har jag hittills inte hittat en enda felaktig uppgift när det gäller centrala delar eller delar efter väderstreck. Så det kanske, av någon anledning, är enbart på Island det här felet förekommer, och då kanske inte de som har sysslat med andra länder har haft anledning att reagera. Som jag skrev här ovan är det främst i Islands båda nordliga landsdelar som felet förekommer, så för mig är det där det känns mest angeläget att ändra. Det allra bästa vore kanske om någon robot kunde räkna om lägesuppgifterna från Island så att de blir korrekta, men annars ser jag, liksom Kitayama, att det är enklast att ta bort. Jag tycker kanske inte att uppgiften i sig är onödig, men den bör, liksom när det gäller allt annat på Wikipedia, robotskrivet eller manuellt skrivet, vara korrekt. Sjunnesson (diskussion) 26 april 2018 kl. 12.35 (CEST)
- Jag ser nu att det här med läget också har diskuterats i "Geografiska platsers läge inom olika länder" av mig och några andra, och att det tydligen finns avvikelser även i en del andra länder. Men det är en större fråga än just lägesangivelserna på Island. För mig är det enklast att begränsa mig till de sistnämnda. Sjunnesson (diskussion) 26 april 2018 kl. 12.56 (CEST)
- Jag har nog ingen bestämd uppfattning om läget i landet ska anges för Island. Beträffande Kina har vi nyligen ändrat så att läget i landet styrs av provins, så att varje provins definierades som liggande i viss del av landet enligt en lista - se omfattande diskussion nedan. Det skulle säkert gå för Island också om man vill, men för närvarande tillåter min tid dock inte några dylika projekt. Taxelson (diskussion) 27 april 2018 kl. 21.35 (CEST)
- Om man skulle göra så för Islands del skulle man, istället för att lista provinser, behöva lista alla platsers läge på Island, eftersom de 6 av de 8 isländska regionerna sträcker sig från kusten och långt in i inlandet. Men det borde gå att med robot räkna ut var varje plats ligger "i den x:a delen av landet", om man nu ska ha den texten med. På kartorna är ju platserna någorlunda rätt placerade och det borde gå att få texten att motsvara koordinaterna. När det har lyckats för Australien borde det också kunna bli rätt för Island. Sjunnesson (diskussion) 28 april 2018 kl. 07.44 (CEST)
- Jag har nog ingen bestämd uppfattning om läget i landet ska anges för Island. Beträffande Kina har vi nyligen ändrat så att läget i landet styrs av provins, så att varje provins definierades som liggande i viss del av landet enligt en lista - se omfattande diskussion nedan. Det skulle säkert gå för Island också om man vill, men för närvarande tillåter min tid dock inte några dylika projekt. Taxelson (diskussion) 27 april 2018 kl. 21.35 (CEST)
- Jag ser nu att det här med läget också har diskuterats i "Geografiska platsers läge inom olika länder" av mig och några andra, och att det tydligen finns avvikelser även i en del andra länder. Men det är en större fråga än just lägesangivelserna på Island. För mig är det enklast att begränsa mig till de sistnämnda. Sjunnesson (diskussion) 26 april 2018 kl. 12.56 (CEST)
- Det är bara på Island jag vet att det förekommer den här typen av felaktiga lägesuppgifter. Jag har i år hållit på en del med Australien, som har liknande uppdelning i söder, öster, norr och väster som Island har, men där har jag hittills inte hittat en enda felaktig uppgift när det gäller centrala delar eller delar efter väderstreck. Så det kanske, av någon anledning, är enbart på Island det här felet förekommer, och då kanske inte de som har sysslat med andra länder har haft anledning att reagera. Som jag skrev här ovan är det främst i Islands båda nordliga landsdelar som felet förekommer, så för mig är det där det känns mest angeläget att ändra. Det allra bästa vore kanske om någon robot kunde räkna om lägesuppgifterna från Island så att de blir korrekta, men annars ser jag, liksom Kitayama, att det är enklast att ta bort. Jag tycker kanske inte att uppgiften i sig är onödig, men den bör, liksom när det gäller allt annat på Wikipedia, robotskrivet eller manuellt skrivet, vara korrekt. Sjunnesson (diskussion) 26 april 2018 kl. 12.35 (CEST)
- Om det ska göras för hela Island är det dessa 6 398 artiklar som behöver undersökas och vid behov ändras. Jag tycker att det är bättre att en begäran om Robothjälp diskuteras och i detalj formuleras på till exempel den här diskussionssidan för att därefter, när konsensus finns, föras in på WP:RH. Det är mest du som har argumenterat för ändringen här förutom ett inlägg från Kitayama. Med tanke på att frågan togs upp av dig för mer än ett halvår sedan kan man väl tolka det som att det inte finns några starka åsikter om detta bland dem som läser den här sidan och därmed en liten risk för protester om denna ändring genomförs. Själv tycker jag inte att problemet är så besvärande, men hjälper gärna till med att genomföra den. Om det nu ska ändras tycker jag att det är bättre om man hanterar alla regioner i Island på samma sätt. Island är dock bara ett av många länder som har regioner och där samma formulering finns om "läget inom landet" för den administrativa enhet inom vilket den aktuella landformen finns. --Larske (diskussion) 26 april 2018 kl. 12.01 (CEST)
- Du har uppfattat min begäran rätt. Men egentligen kan ju uppgiften tas bort för samtliga regioner, jag tänkte bara att det är mest fel i de båda nämnda regionerna. Men jag har sett att det inte stämmer så bra i Suðurland heller. För min del får gärna nämnda uppgifter tas bort för hela Island. Behöver jag ändra till det i min robotbegäran? Sjunnesson (diskussion) 26 april 2018 kl. 11.21 (CEST)
- @Sjunnesson: Formuleringen i de robotskapade artiklarna är så här:
- Jag instämmer helt i det Kitayama skriver. Jag lägger nu in en robotbegäran om att få detta utfört. Sjunnesson (diskussion) 25 april 2018 kl. 08.51 (CEST)
- Texten "ligger i den x:a delen av landet" känns i många fall överflödig och krystad. I Danmark tar jag bort den i vissa fall. Frågan är vad den tillför i små länder med distinkta regioner. Alla botartiklar har en karta, där kan läsaren lätt avgöra var i landet platsen ligger. Klickar man på regionen kan man läsa mer om var i landet regionen ligger. Alltså är jag inne på att helt sonika ta bort texten. Kitayama (diskussion) 5 november 2017 kl. 09.07 (CET)
- @Larske:, @Taxelson:, @Kitayama:: Finns det synpunkter på det här, och skulle det möjligen gå att rätta "centrala delen av landet" (hur det nu ska göras) som ett robotjobb? Sjunnesson (diskussion) 5 november 2017 kl. 08.55 (CET)
Italien
[redigera wikitext]Råder det verkligen konsensus för att ta bort grensidorna innan artiklarna skapats? Tostarpadius (diskussion) 31 oktober 2017 kl. 12.48 (CET)
- Jag tror inte att konsensus finns. Eftersom det tveklöst är minst ett relevant objekt (kommunen) och möjligen även två (orten också) så bör inte grensidan raderas. Det är en annan femma om det är uddar, kullar eller annat som förmodligen inte finns något att skriva om, men jag uppfattar detta som grensidor med par kommun/ort.Kitayama (diskussion) 31 oktober 2017 kl. 13.04 (CET)
- Det känns onödigt att spara grensidorna. En av artiklarna är förmodligen relevant, men jag tror inte att de kommer skapas inom en snar framtid. Eftersom projektet är nedlagt tycker inte jag att vi behöver spara alla grensidor där det bara finns röda länkar. Meningen var att boten först skapade grensidorna och sedan artiklarna. Boten hann skapa grensidorna till Italien, men aldrig artiklarna. Om man nu skulle vilja läsa om någon av kommunerna i Italien ger dessa grensidorna ingen information om kommunen utom dess läge i Italien. Om någon sedan skulle vilja återskapa artiklarna med vettig information har jag inga problem med det. YesDi (diskussion) 31 oktober 2017 kl. 14.47 (CET)
- Även om grensidorna innehåller rödlänkar så utgör de information om orter och kommuner i landet. Vi raderar inte adekvat information utan andra skäl än att det "känns onödigt" att spara dem. Grensidorna innehåller dessutom koordinater och kartor (sist jag tittade på en) och flera av dem har just därför länkar till sig från t.ex. biografiska artiklar. /Ascilto (diskussion) 31 oktober 2017 kl. 15.15 (CET)
- Tack för svaret! Det är som jag trodde, konsensus saknas. Tostarpadius (diskussion) 31 oktober 2017 kl. 16.27 (CET)
- Är det denna typ av grensidor som åsyftas?--Gotogo (diskussion) 31 oktober 2017 kl. 16.32 (CET)
- Ja. Min syn är att de kan raderas när minst en av artiklarna skapats, men de innehåller, som Ascilto så riktigt påpekar, värdefull information. Tostarpadius (diskussion) 31 oktober 2017 kl. 16.37 (CET)
- Är det denna typ av grensidor som åsyftas?--Gotogo (diskussion) 31 oktober 2017 kl. 16.32 (CET)
- Tack för svaret! Det är som jag trodde, konsensus saknas. Tostarpadius (diskussion) 31 oktober 2017 kl. 16.27 (CET)
- Även om grensidorna innehåller rödlänkar så utgör de information om orter och kommuner i landet. Vi raderar inte adekvat information utan andra skäl än att det "känns onödigt" att spara dem. Grensidorna innehåller dessutom koordinater och kartor (sist jag tittade på en) och flera av dem har just därför länkar till sig från t.ex. biografiska artiklar. /Ascilto (diskussion) 31 oktober 2017 kl. 15.15 (CET)
- Det känns onödigt att spara grensidorna. En av artiklarna är förmodligen relevant, men jag tror inte att de kommer skapas inom en snar framtid. Eftersom projektet är nedlagt tycker inte jag att vi behöver spara alla grensidor där det bara finns röda länkar. Meningen var att boten först skapade grensidorna och sedan artiklarna. Boten hann skapa grensidorna till Italien, men aldrig artiklarna. Om man nu skulle vilja läsa om någon av kommunerna i Italien ger dessa grensidorna ingen information om kommunen utom dess läge i Italien. Om någon sedan skulle vilja återskapa artiklarna med vettig information har jag inga problem med det. YesDi (diskussion) 31 oktober 2017 kl. 14.47 (CET)
@Tostarpadius:, @Kitayama:, @Ascilto: Eftersom jag verkar vara ensam om att tycka att grensidorna är "onödiga", kommer jag börja återskapa dem. Jag trodde helt enkelt att det fanns konsensus för att de skulle raderas eftersom boten aldrig hann så långt. YesDi (diskussion) 31 oktober 2017 kl. 16.55 (CET)
- GeoNames är en usel källa till att "orter" över huvud taget existerar, så ... -- Innocent bystander (diskussion) 2 november 2017 kl. 10.31 (CET)
- Jag gjorde så för ett område i norra Italien att jag förvandlade alla grensidor till stubbartiklar om kommunen. Kommunen kan verifieras mot källor och mot itwp (som inte är källa, men bra som kontrollreferens). Det är en bättre väg att gå om man vill bli av med dessa "fula" grensidor. Ortartiklar kan skapas när behov finns och orten verkligen kan verifieras.Kitayama (diskussion) 2 november 2017 kl. 10.35 (CET)
- Se Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2016 - 2017-02#Punkt 9 - Grensidor. Kitayama (diskussion) 2 november 2017 kl. 10.38 (CET)
- Jag tycker det är en mycket bra lösning att omvandla de fula grenartiklarna till stubbar med interwiki. Med risk för att starta en lång och resultatlös diskussion; men är det inte bättre att låta stubben handla om orten. Orter är mer historiska och över tid bestående, administrativa enheter mer föränderliga. T.ex. genomför Estland just nu en stor kommunreform med sammanslagningar och där flertalet Lsjbot-skapade kommunartiklar måste uppdateras/märkas om.--Gotogo (diskussion) 2 november 2017 kl. 10.52 (CET)
- Problemet med orten är att de är betydligt svårare att verifiera, oftast finns inget officellt data om orten som yta eller invånarantal. Så länge Italien inte genomför en kommunreform så är kommuner bättre som artikel. Den dagen de genomför en reform så har vi jobb så det räcker och blir över... Kitayama (diskussion) 2 november 2017 kl. 10.58 (CET)
- Ja, går det att enkelt visa att det finns något sådant som Sundbyberg (ort), för att citera någon användare någonstans här. -- Innocent bystander (diskussion) 2 november 2017 kl. 11.12 (CET)
- Kloka invändningar. Jag backar. En idé: Borde vi inte på någon undersida till detta projekt sammanställa en lista över olika länders officiella uppgifter/statistik vad gäller geografi, till exempel befolkningsstatistik från motsvarigheter till SCB, ortnamnsregister och kartor från motsvarigheter till Lantmäteriet etc. Jag har bra koll på finska och estniska förhållanden, men skulle inte vara ett dugg behjälplig när det gäller Italien.--Gotogo (diskussion) 2 november 2017 kl. 11.36 (CET)
- @Gotogo: Det är en bra idé. För befolkningsstatistik för kommuner i Italien finns statistiken på den här webbplatsen.
- Jag stöder förslaget att ge företräde åt kommunerna framför orterna, eftersom det då finns officiella källor till artiklarna. /Ascilto (diskussion) 2 november 2017 kl. 15.19 (CET)
- @Gotogo: Här är en lista med webbadresser till olika länders statistikorganisationer. --Larske (diskussion) 2 november 2017 kl. 15.36 (CET)
- Tack för länkar!--Gotogo (diskussion) 5 november 2017 kl. 22.49 (CET)
- Stöder kommun som enda artikel om det blir en artikel. Maundwiki (diskussion) 9 november 2017 kl. 01.33 (CET)
- Tack för länkar!--Gotogo (diskussion) 5 november 2017 kl. 22.49 (CET)
- @Gotogo: Det är en bra idé. För befolkningsstatistik för kommuner i Italien finns statistiken på den här webbplatsen.
- Kloka invändningar. Jag backar. En idé: Borde vi inte på någon undersida till detta projekt sammanställa en lista över olika länders officiella uppgifter/statistik vad gäller geografi, till exempel befolkningsstatistik från motsvarigheter till SCB, ortnamnsregister och kartor från motsvarigheter till Lantmäteriet etc. Jag har bra koll på finska och estniska förhållanden, men skulle inte vara ett dugg behjälplig när det gäller Italien.--Gotogo (diskussion) 2 november 2017 kl. 11.36 (CET)
- Ja, går det att enkelt visa att det finns något sådant som Sundbyberg (ort), för att citera någon användare någonstans här. -- Innocent bystander (diskussion) 2 november 2017 kl. 11.12 (CET)
- Problemet med orten är att de är betydligt svårare att verifiera, oftast finns inget officellt data om orten som yta eller invånarantal. Så länge Italien inte genomför en kommunreform så är kommuner bättre som artikel. Den dagen de genomför en reform så har vi jobb så det räcker och blir över... Kitayama (diskussion) 2 november 2017 kl. 10.58 (CET)
- Jag tycker det är en mycket bra lösning att omvandla de fula grenartiklarna till stubbar med interwiki. Med risk för att starta en lång och resultatlös diskussion; men är det inte bättre att låta stubben handla om orten. Orter är mer historiska och över tid bestående, administrativa enheter mer föränderliga. T.ex. genomför Estland just nu en stor kommunreform med sammanslagningar och där flertalet Lsjbot-skapade kommunartiklar måste uppdateras/märkas om.--Gotogo (diskussion) 2 november 2017 kl. 10.52 (CET)
- Se Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2016 - 2017-02#Punkt 9 - Grensidor. Kitayama (diskussion) 2 november 2017 kl. 10.38 (CET)
- Jag gjorde så för ett område i norra Italien att jag förvandlade alla grensidor till stubbartiklar om kommunen. Kommunen kan verifieras mot källor och mot itwp (som inte är källa, men bra som kontrollreferens). Det är en bättre väg att gå om man vill bli av med dessa "fula" grensidor. Ortartiklar kan skapas när behov finns och orten verkligen kan verifieras.Kitayama (diskussion) 2 november 2017 kl. 10.35 (CET)
Geografiska platsers läge inom olika länder
[redigera wikitext]Med utgångspunkt från "Island, "den centrala delen" (robotartiklar)" här ovan vill jag ställa en fråga om lägesangivelser överhuvud taget i Lsjbot-artiklar. Kanske har det här diskuterats någon gång förut, det är i alla fall inget som jag vet. Vad är det som styr "ligger i den x:a delen av landet"? Det finns ingen källhänvisning till det, och om både den lägesbeskrivningen och koordinaterna kommer från Geonames borde de båda uppgifterna stämma överens i samtliga länder som omfattas av geografiprojektet. Om man ser på uppgifter från Island visar det sig till exempel att dalen Karlsárdalur (lat 66.00486, long -18.58656) ligger "i regionen Norðurland eystra, i den norra delen av landet," medan det i närheten av den dalen finns två andra dalar Bakkadalur (dal i Island, Norðurland eystra, lat 65,90, long -18,70) "ligger i regionen Norðurland eystra, i den centrala delen av landet", medan Bakkadalur (dal i Island, Norðurland eystra, lat 66,10, long -18,19) "ligger i regionen Norðurland eystra, i den norra delen av landet". Även om en ögrupp strax norr om Islands norra kust, Hólmarnir (öar), lat 65.65842, long -18.05554, står det att den "ligger i regionen Norðurland eystra, i den centrala delen av landet". Om det hade funnits samordning mellan uppgifterna skulle ju alla de tre dalarna samt Hólmarnir ligga i den norra delen av landet.
Om det nu föreligger motstridiga uppgifter från ett land, kan det då inte vara så att det här har hänt också för andra länder i geografiprojektet? Sjunnesson (diskussion) 9 november 2017 kl. 12.51 (CET)
- Jag vill minnas att vi haft diskussioner både om Finland och om Storbritannien i det här ärendet. Minns inte exakt vad problemet var i Finland, men kanske samma problem som skulle ha uppstått i en artikel om Sverige, där troligen Stockholm skulle anses ligga i södra delen av landet, istället för i de centrala delarna av landet som Fjollträskborna själva tror att de gör. (Det är ju snarare vi Västernorrlänningar och Jämtar som bor i de centrala delarna.) I fallet Storbritannien så innehöll ju det landet även områden på Cypern, och där ansågs de delarna där ligga i "sydöstra delen av landet". Så, ja, de här uppgifterna är lite godtyckliga, och kan kraftigt påverkas om/när ett området som Cypern ligger långt ifrån landets kärna. I de flesta sådana fall så är det dock så att tex "Svalbard" och "Bouvetön" haft egna landskoder och därmed inte samkörts med Norge. Uddar och berg på Bouvetön har därför (tack och lov) inte hamnar i södra delen av Norge. -- Innocent bystander (diskussion) 9 november 2017 kl. 13.30 (CET)
- Hur har Lsj-bot fått fram de här lägesuppgifterna, både de felaktiga och de riktiga? Och i de fall då de är motstridiga måste det ju ha blivit fel, kanske någon felaktig källuppgift eller någon felaktig beräkning. Vilken roll har Geonames i det? Sjunnesson (diskussion) 9 november 2017 kl. 15.53 (CET)
Kod (Lsjbot) public static int getcountrypart(int gnid) { double gnidlat = gndict[gnid].latitude; double gnidlong = gndict[gnid].longitude; double countrylat = gndict[gndict[gnid].adm[0]].latitude; double countrylong = gndict[gndict[gnid].adm[0]].longitude; double area = countrydict[gndict[gnid].adm[0]].area; double kmdeg = 40000 / 360; //km per degree at equator double scale = Math.Cos(0.5*(countrylat+gnidlat)*3.1416/180); //latitude-dependent longitude scale double dlat = (gnidlat - countrylat)*kmdeg; double dlong = (gnidlong - countrylong)*kmdeg * scale; if (countrylat < -80) //Antarctica { if (gnidlat < -86) //central part return 82; if ((gnidlat > -61) && ((gnidlong > -47) && (gnidlong < -44))) //South Orkney Islands return 84; if (gnidlong > -45) //East Antarctica return 86; else //West Antarctica { if ((gnidlong > -64) && (gnidlong < -52)) { if (((gnidlong < -60) && (gnidlat > -64)) || ((gnidlong >= -60) && (gnidlat > -62.8))) //South Shetland Islands return 83; else return 85; } else return 85; } } if ((dlat * dlat + dlong * dlong) < (area / 9)) //central part return 82; if (dlat * dlat > 4 * dlong * dlong) { if (dlat > 0) // northern part return 83; else //southern part return 84; } else if (dlong * dlong > 4 * dlat * dlat) { if (dlong > 0) // eastern part return 86; else //western part return 85; } else if (dlong > 0) { if (dlat > 0) //northeastern return 87; else //southeastern return 88; } else { if (dlat > 0) //northwestern return 89; else //southwestern return 90; } }
- Den här koden hittade jag i Wikipedia:Projekt DotNetWikiBot Framework/Lsjbot/Make-Geonames. Jag vet inte om det är senaste versionen av koden, men det är kanske något som inte förändrats så mycket under resans gång. De första raderna handlar om några specialfall (Antarktis och Sydshetlandsöarna) sedan följer standardkoden för resten av området. Om jag förstår den rätt så finns det en koordinat för landet (countrylat/countrylong). Avståndet mellan den punkten i latitud och longitud räknas fram (dlat/dlong). Sedan räknas den tredjedel av landet som ligger närmast denna punkt som "centrala delen" (landet förenklat som en kvadrat med samma area som landet). Det kan alltså finnas en ganska strikt linje mellan den punkt som ligger i "centrala delen av landet" och en som ligger i "norra/nordvästra".
- GeoNames har nog ingen roll alls-- Innocent bystander (diskussion) 9 november 2017 kl. 16.11 (CET)
- Från början var det landets koordinater i Geonames som användes som mittpunkt som riktningarna utgick från. Enligt Användardiskussion:Lsjbot/Projekt alla platser/Arkiv 2016#Den centrala delen av landet (Finland) ändrades det till en annan utgångspunkt. De artiklar som skapades enligt Geonames landskoordinater verkar inte ha uppdaterats efter den diskussionen. 90.227.175.244 9 november 2017 kl. 18.11 (CET)
- Lägesuppgifter av detta slag och anomalier i dessa finns naturligtivis också för Kina. De är emellertid stort sett meningslösa och blir inte mycket bättre om de korrigeras. Kina är nästan lika stort som Europa och har nästan dubbelt så stor befolkning, men denna är mycket ojämnt fördelad. Kinas provinser (som det inte hör till allmänbildningen att känna till) är jämförbara med europeiska stater.
- Det finns en traditionell indelning i regioner, som återges på slutet av Lista över regioner i Kina. Enligt denna ligger provinserna Shanxi i norra och Sichuan i sydvästra Kina.Lsj hara inte känt till detta, och Lsjbot lägger bägge provinserna i centrala kina, se tiill exempel Taiyuan Shi (prefektur i Kina) och Chengdu Shi (prefektur i Kina), som ligger 400 respektive 1500 kilmeter sydväst om Peking.
- Problemen för Kina motsvarar alltså frågor som om . Island ligger i norra eller nordvästra Europa, och vad som är avståndet är från olika isländska platser till Bryssel. Roufu (diskussion) 9 november 2017 kl. 16.33 (CET)
- I Roufus exempel ligger landet Kinas koordinat vid 35°N 105°Ö / 35°N 105°Ö. Föreställer man sig då Kina som en kvadrat och räknar på avståndet mellan denna punkt och den punkt som anges för Shanxi resp Sichuan så hamnar nog båda dessa inom den tredjedel av landet som är i "centrala delen av landet" enligt algoritmen. Det kanske då inte finns någon punkt alls i landet som ligger i "sydvästra delen av landet" eftersom landet inte sträcker sig så långt åt sydväst från 35 N 105 Ö räknat. Men vad som anses vara centrala delen av landet och vad som geometriskt är det är inte nödvändigtvis samma. Vi hade en liknande diskussion på Wikidata en gång i tiden. Frågan var om det skulle skapas en property för "landet/områdets största stad". De som röstade nej, tyckte att man istället skulle ställa upp alla "städer" i ett land och sedan plocka fram den största. Ett problem visade sig komma just från Kina. Shanghai anses vara landets största stad enligt alla källor. Men räknar man upp alla städer i landet och sorterar dem efter folkmängd, så är det inte självklart att Shanghai hamnar först. -- Innocent bystander (diskussion) 9 november 2017 kl. 16.45 (CET)
- @Roufu: I just den här tråden var Island bara ett exempel, eftersom det är det som jag känner till. I det fallet kan det nog lösas med att man tar bort alla uppgifter "ligger i den centrala delen av landet" (i drygt 1000 artiklar). Jag förstår att det är problem av en helt annan storleksordning för Kina och för andra stora länder, just så som du och Innocent bystander beskriver det här ovan. Så just Island är inget stort problem. Sjunnesson (diskussion) 9 november 2017 kl. 17.00 (CET)
- @Innocent bystander: Frågan om vilken stad i Kina som har störst befolkning problematiseras av tabellen i en:List of cities in China by population and built-up area. Efter befolkningen i "metropolitan area" är det Guangzhou, efter "urban area" Shanghai och efter "administrative area" Chongqing. Jag menar att man bör undvika sådana frågor.
- @Roufu: I just den här tråden var Island bara ett exempel, eftersom det är det som jag känner till. I det fallet kan det nog lösas med att man tar bort alla uppgifter "ligger i den centrala delen av landet" (i drygt 1000 artiklar). Jag förstår att det är problem av en helt annan storleksordning för Kina och för andra stora länder, just så som du och Innocent bystander beskriver det här ovan. Så just Island är inget stort problem. Sjunnesson (diskussion) 9 november 2017 kl. 17.00 (CET)
- I Roufus exempel ligger landet Kinas koordinat vid 35°N 105°Ö / 35°N 105°Ö. Föreställer man sig då Kina som en kvadrat och räknar på avståndet mellan denna punkt och den punkt som anges för Shanxi resp Sichuan så hamnar nog båda dessa inom den tredjedel av landet som är i "centrala delen av landet" enligt algoritmen. Det kanske då inte finns någon punkt alls i landet som ligger i "sydvästra delen av landet" eftersom landet inte sträcker sig så långt åt sydväst från 35 N 105 Ö räknat. Men vad som anses vara centrala delen av landet och vad som geometriskt är det är inte nödvändigtvis samma. Vi hade en liknande diskussion på Wikidata en gång i tiden. Frågan var om det skulle skapas en property för "landet/områdets största stad". De som röstade nej, tyckte att man istället skulle ställa upp alla "städer" i ett land och sedan plocka fram den största. Ett problem visade sig komma just från Kina. Shanghai anses vara landets största stad enligt alla källor. Men räknar man upp alla städer i landet och sorterar dem efter folkmängd, så är det inte självklart att Shanghai hamnar först. -- Innocent bystander (diskussion) 9 november 2017 kl. 16.45 (CET)
- När jag skriver om Kina, var det absolut inte menat som kritik av Sjunnessons exempel Island. Jag är av personliga orsaker intresserad av Kina men räknar med att andra i mindre grad delar detta intrese. I sakfrågorna tror jag vi är helt överens. Roufu (diskussion) 10 november 2017 kl. 00.02 (CET)
- Ja, Roufu, vi koncentrerar oss ju på det vi känner till och har ett personligt intresse av, och i ditt fall är det Kina. Jag tycker att det är bra ju mer som kommer fram om vilka problem som har uppstått i samband med den beskrivning av geografiska platser som Lsjbot har gjort för olika länder. Sedan är det en fördel att geografiprojektet har aktiverat en del av svenskspråkiga Wikipedias användare när det gäller geografiska frågor. Hade kvalitén på uppgifterna varit bättre skulle det ha varit till ännu större nytta, men nu gör ju också det här städprojektet att det blir en förbättring av kvalitén. Sjunnesson (diskussion) 10 november 2017 kl. 08.36 (CET)
Kallt ökenklimat i Spanien?
[redigera wikitext]Jag har tidigare diskuterat klimatuppgifter för Spanien (inkl. Kanarieöarna) ett par gånger. Det gällde då tundraklimat och stäppklimat. Nu har jag sett att det finns drygt 200 artiklar om platser i Spanien som har "kallt ökenklimat". Jag såg det därför att en användare ändrade uppgiften för en ort i Spanien från "kallt ökenklimat" till "varmt ökenklimat", som också verkar helt rimligt utifrån temperaturuppgifterna. De platser i Spanien som enligt Lsjbot har "kallt ökenklimat" finns på Gran Canaria (30st.), i Andalusien (115 st.), Aragonien (44 st.) och Kastilien (24 st.). Frågan är om det verkligen är ökenklimat och om det är kallt. Enligt kartan till Spaniens klimat [Fil:Climas de España.png|thumb|500px|Spaniens klimat] finns det ett område i sydöstra Spanien som är halvöken. Gran Canaria däremot visas som till största delen "subtropical seco" (subtropisk torr) medan resten av ön är "subtropical húmedo" (fuktig). Till artikeln Halvöken finns denna karta [File:Koppen World Map BSh BSk.png|thumb|Halvöknar i världen.|350x350px]. På den kartan ser halva Spanien ut att vara halvöken. I ingen del av Spanien är det alltså ökenklimat och allra minst på Gran Canaria. På en detaljerad Köppen-karta över det spanska fastlandet, Köppen Climate types of Spain, visas bara en liten del av Andalusien som semi-arid (halvöken) medan däremot en större del av provinsen Murcia är semi-arid. Men för Murcia har ingen Lsjbot-artikel någon uppgift om ökenklimat ("halvöken" nämns inte i dessa artiklar). Vad beträffar "kallt" stämmer det med Köppen, som har beteckningen "cold semi-arid" (kall halvöken) för delar av spanska fastlandet. Däremot stämmer det inte med de temperaturer som anges i svwp. Ett typiskt exempel, Sorbas (kommun): "Den varmaste månaden är juli, då medeltemperaturen är 30 °C, och den kallaste är januari, med 10 °C". Genomsnittlig årsnederbörd är 396 millimeter." Enligt uppgifter i artikeln Öken: "Kalla öknar (köldöknar) har varmaste månaden medeltemperaturer mellan 10 och 30 °C och kallaste månaden under 0 °C." Som synes av exemplet Sorbas (kommun) är det betydligt varmare än så på de drygt 200 nämnda platserna. Det har påpekats tidigare att uppgifterna om typ av klimat och om temperaturer är från två olika källor, Köppen resp. Nasa, men det strider, tycker jag, mot POMMF att uppge att platser med en medeltemperatur om +20 grader C ska anses ha ett kallt klimat. Sjunnesson (diskussion) 10 november 2017 kl. 17.36 (CET)
- Varför behålla klimatuppgifterna i artiklarna? De känns inte pålitliga och framförallt känns de onödiga. Varför ska varje plats ha klimatuppgift? Sånt hör hemma på regionnivå, inte för varje udde, kulle, by, vik eyc som lsjbot skapat klimatdata för. Vid minsta tveksamhet om riktigheten, radera klimatdatat. Kitayama (diskussion) 10 november 2017 kl. 20.08 (CET)
- Vi har diskuterat detta tidigare och då uppfattade jag att det var lämligt att ta bort klimatuppgifterna. Jag gör numera så med alla artiklar (finländska) jag fixar. Det klimat som kunde vara relevant att beskriva för t.ex en mindre ö vore i så fall dess mikroklimat, men om det hade ju Lsjbot inga uppgifter. Taxelson (diskussion) 10 november 2017 kl. 20.15 (CET)
- (Redigeringskonflikt) Klimat kan vara lokalt, som vid ett sydväxtberg tex, som är väldigt lokalt. Men källan här är inte av den kvalitén. -- Innocent bystander (diskussion) 10 november 2017 kl. 20.15 (CET)
- @Sjunnesson: "Kallt ökenklimat" betyder inte att det är ett "kallt klimat", det betyder bland annat att årsmedeltemperaturen är lägre än för "varmt ökenklimat". Jag tror att den data som ligger till grund för Lsjbot och som klassificerar ett litet område i sydöstra Spanien som "kallt ökenklimat" (BWk) är samma data som ligger till grund för den karta ("World_Koppen_Map.jpg") som går att ladda ner från den sida som är länkad som referens i artiklarna som Lsjbot har skapat. Här är en delförstoring av kartan med Spanien och en del av teckenförklaringen.
- Dessa klimatdata har upplösningen 0,1 grad i såväl longitud som latitud och det motsvarar alltså ett rektangulärt område med en utsträckning på cirka 11,1 km i nord-sydlig riktning och cirka 8,9 km (på Sydspaniens latitud) i öst-västlig riktning. Jag menar inte att de klimatuppgifter som finns i artiklarna nödvändigtvis är relevanta, utan vill med detta inlägg bara försöka förklara var uppgifterna kommer ifrån.
- Att ändra från "kallt ökenklimat" till "varmt ökenklimat" för platser i det aktuella området är alltså i strid mot den angivna källan för klimat och beror antagligen på att det är lite förvirrande med olika källor för klimat och temperatur. För att hitta "varmt ökenklimat", enligt Köppen, får man bege sig en bit ner i Marocko/Algeriet/Tunisien.--Larske (diskussion) 11 november 2017 kl. 11.26 (CET)
- @Larske: Jag håller med om att det är fel, som den nämnde användaren gjorde, att ändra från kallt till varmt, eftersom det strider mot källan. Du skriver om "ett litet område i sydöstra Spanien som "kallt ökenklimat" (BWk)". Kanske är det så att det är där alla de 115 platserna i just Andalusien finns, men dessutom finns ju uppgifter från Gran Canaria (30 st.), Aragonien (44 st.) och Kastilien (24 st.) och då kan man undra om de platserna också är klassade som "kallt ökenklimat" enligt Köppen (framgår inte av kartan). Om man tittar i artikeln Öken finns en definition med Nationalencyklopedin som källa: "Kalla öknar (köldöknar) har varmaste månaden medeltemperaturer mellan 10 och 30 °C och kallaste månaden under 0 °C". Om man kan anta att den definitionen är rätt, och även anta att de Lsjbots temperaturer med Nasa som källa är rätt, skulle det alltså inte var fråga om "kallt ökenklimat", som däremot Köppenkartan visar åtminstone för ett hörn av Andalusien. Det stämmer alltså inte överens. För visst måste "kallt" ha med de genomsnittliga temperaturerna att göra i texten från artikeln Öken. Sjunnesson (diskussion) 11 november 2017 kl. 16.15 (CET)
- Dessutom, enligt Nationalencyklopedin, "Köppens system används i första hand för att beskriva klimatet inom större regioner". Vad Lsjbot har gjort är att beskriva klimatet för enstaka platser. Jag tycker som Kitayama och Taxelson att klimatuppgifterna bör tas bort. Sjunnesson (diskussion) 11 november 2017 kl. 16.45 (CET)
- @Larske: Jag håller med om att det är fel, som den nämnde användaren gjorde, att ändra från kallt till varmt, eftersom det strider mot källan. Du skriver om "ett litet område i sydöstra Spanien som "kallt ökenklimat" (BWk)". Kanske är det så att det är där alla de 115 platserna i just Andalusien finns, men dessutom finns ju uppgifter från Gran Canaria (30 st.), Aragonien (44 st.) och Kastilien (24 st.) och då kan man undra om de platserna också är klassade som "kallt ökenklimat" enligt Köppen (framgår inte av kartan). Om man tittar i artikeln Öken finns en definition med Nationalencyklopedin som källa: "Kalla öknar (köldöknar) har varmaste månaden medeltemperaturer mellan 10 och 30 °C och kallaste månaden under 0 °C". Om man kan anta att den definitionen är rätt, och även anta att de Lsjbots temperaturer med Nasa som källa är rätt, skulle det alltså inte var fråga om "kallt ökenklimat", som däremot Köppenkartan visar åtminstone för ett hörn av Andalusien. Det stämmer alltså inte överens. För visst måste "kallt" ha med de genomsnittliga temperaturerna att göra i texten från artikeln Öken. Sjunnesson (diskussion) 11 november 2017 kl. 16.15 (CET)
- Om det är ordet "kallt" som stör dig kan du, för att slippa fastna på det, läsa förklaringen av "BWk" som "kallare ökenklimat". Kallare än vadå? Jo, kallare än "BWh", vars förklaring du av samma skäl kan läsa som "varmare ökenklimat". För att veta vilka temperaturer som gäller för respektive klimatklass får man gå till Köppens definitioner av "BWk" och "BWh" utan att lägga in några subjektiva värderingar om vad som "är kallt" eller "är varmt" i någon absolut mening.
- När det gäller olika källor så är det väl inte så konstigt att det inte helt "stämmer" om Köppen använder lufttemperaturen och NASA använder månadsvärden för marktemperatur, om det nu är så det var.
- Vad gäller ditt tillägg från 16.45 så är det väl precis det som Lsjbot gör. Det står "i trakten". Om du läser "trakt" som "region" så får du precis vad NE säger. Men hade Lsjbot skrivit "i regionen" så hade någon raskt påpekat att "region" (i många länder) är ett definierat begrepp för den administrativa indelningen och klimatet ändras inte vid de administrativa regiongränserna. --Larske (diskussion) 11 november 2017 kl. 16.56 (CET)
- Man kan inte anta att temperaturerna från Nasa stämmer så som de används i artiklarna. Normalt används annan temperaturdata för klimatdiagrammen som visas i artiklarna (i andra sammanhang kan Nasas data var helt ok). Källan som används för klimattyper är betydligt bättre. Där står tydligt vilka definitioner som används och vilka beräkningar som gjorts. Där nämns även lite om felaktigheter i resultaten. Sedan finns en del konstigheter hur den källan används av roboten. Bland annat översättningen av klimattyperna i källan till svenska och hur det stämmer överens med klimatartiklar på svenska Wikipedia. Dessutom är källens främsta syfte kanske inte att ge exakt rätt klimattyp för varje plats på jorden, utan mer ge en bild över större regioner. I källan går gränsen mellan varma och kalla öknar vid årsmedeltemperatur 18°C. 90.227.175.244 11 november 2017 kl. 16.57 (CET)
- Just precis det, Larske, är väl vad Nationalencyklopedin menar, att Köppen ska ge en bild över större regioner, som rimligtvis är ett mycket vidare begrepp än "i trakten". Och i beskrivningen av temperaturen i meningen efter beskrivningen av klimatet "Årsmedeltemperaturen i trakten är x °C" måste väl "i trakten" vara ett rätt begränsat område, och de båda "i trakten" ska rimligtvis gälla samma trakt. Beträffande "kallt" så syftade jag, i det senaste jag skrev, enbart på den beskrivning av "kallt ökenklimat" som finns i vår artikel Öken med Nationalencyklopedin som källa. Sjunnesson (diskussion) 11 november 2017 kl. 17.38 (CET)
- @Sjunnesson: Det var "trakten" i meningen om klimatet som jag avsåg. Det är lite olyckligt att samma ord används även för temperaturen när det, precis som du påpekar, i allmänhet inte är exakt samma "trakt" som avses. Vill man veta hur stort det område, är "område" ett tillräckligt generellt begrepp, som omger en plats som har samma klimatklassificiering, eller temperatur, får man gå till källorna. Det minsta möjliga området, för källor som har upplösningen 0,1 grader × 0,1 grader, är cirka 100 km² på breddgrader motsvarande södra Spanien. Uppåt finns det ingen gräns, området kan omfatta hela länder, som Saudiarabien, Egypten och nästan hela Libyen när det gäller "varmt ökenklimat". Det skulle föra för långt att ange storleken på dessa omgivande områden i artikeln om en enskild plats. Lsjbot hade, baserat på källorna, kunnat skriva
"<namn> ligger i den <väderstreck/central>a delen av ett <storlek> km² stort område som har ett klimat som klassificeras som <klimattyp> och i den <väderstreck2/central> delen av ett <storlek2> km² stort område som har en årsmedeltemperatur på <temperatur>."
Jag tycker att den nuvarande skrivningen är bättre trots de brister man kan anföra (om klimat alls ska redovisas i allmänhet för enskilda platser). - När det gäller länken till "Ökenklimat" (som idag omdirigeras till "Öken") borde den, om nu ingen känner för att skriva artikeln "Ökenklimat", kanske ersättas (eller kompletteras) med en länk till Köppens klimatklassifikation som dessutom borde kompletteras med de detaljer som saknas angående 18º-gränsen mellan BWk och BWh som finns med i avsnittet om ökenklimaten i den mer utförliga engelska motsvarigheten. Observera att artikeln om Öken har fyra olika klasser av Öknar beroende på temperaturen medan Köppen endast har två.
- Tillåter mig att avsluta med en liten ordvits: "Såna här öknar kan man inte kalla kalla, de borde heta heta" --Larske (diskussion) 11 november 2017 kl. 19.14 (CET)
- Man får ju intrycket när man till exempel säger "den finns här i trakten" att det så inte är särskilt långt bort. Det är alltså oprecist med "i trakten" både när det gäller beskrivningen av klimatet och beskrivningen av temperaturen i ett område. Man vet inte hur stort område som menas, hur långt en viss klimattyp sträcker sig, eller hur stort område en viss temperaturangivelse gäller. Det är också skillnad vilken sorts artikelsubjekt det är. Om det är en kommun omfattar det rimligtvis ett större område än om det exempelvis är en kulle, och gäller det en flod, som det i vissa fall gör, som Río Cambrones, bör "i trakten" vara ett rätt långsträckt område där kanske till och med finns mer än en klimattyp. Sjunnesson (diskussion) 11 november 2017 kl. 20.20 (CET)
- Och när jag nu har kommit in på ämnet floder och deras utsträckning i samband med klimatuppgifter: Det som nämns i den första punkten i "Saker att göra för Wikipedia:Projekt alla platser-städning" är "Artiklar om floder och bergskedjor anger klimatdata. I de flesta fall torde dessa vara missvisande på grund av objektens utsträckning, och borde därför tas bort. (Klimatuppgifterna i Lsjbot-artiklar är av den arten att de nog bör tas bort generellt)". Sjunnesson (diskussion) 12 november 2017 kl. 10.10 (CET)
- En sista anmärkning angående Spaniens klimat: I artikeln Desert Climate, avsnittet en:Desert climate#Cold desert climates i enwp, nämns en:Bardenas Reales i Spanien som en plats med 'cold desert climate'. I svwp står det istället om Bardenas Reales att "Kustklimat råder i trakten". Området ligger i provinsen Navarra, i inlandet. Enligt artikeln Kustklimat: "Kustklimat, maritimt klimat eller havsklimat utmärks av större luftfuktighet". Det är alltså motsatsen till Ökenklimat som har "mycket sparsam nederbörd och ofta hög avdunstning". Sjunnesson (diskussion) 12 november 2017 kl. 12.18 (CET)
- Och när jag nu har kommit in på ämnet floder och deras utsträckning i samband med klimatuppgifter: Det som nämns i den första punkten i "Saker att göra för Wikipedia:Projekt alla platser-städning" är "Artiklar om floder och bergskedjor anger klimatdata. I de flesta fall torde dessa vara missvisande på grund av objektens utsträckning, och borde därför tas bort. (Klimatuppgifterna i Lsjbot-artiklar är av den arten att de nog bör tas bort generellt)". Sjunnesson (diskussion) 12 november 2017 kl. 10.10 (CET)
- Man får ju intrycket när man till exempel säger "den finns här i trakten" att det så inte är särskilt långt bort. Det är alltså oprecist med "i trakten" både när det gäller beskrivningen av klimatet och beskrivningen av temperaturen i ett område. Man vet inte hur stort område som menas, hur långt en viss klimattyp sträcker sig, eller hur stort område en viss temperaturangivelse gäller. Det är också skillnad vilken sorts artikelsubjekt det är. Om det är en kommun omfattar det rimligtvis ett större område än om det exempelvis är en kulle, och gäller det en flod, som det i vissa fall gör, som Río Cambrones, bör "i trakten" vara ett rätt långsträckt område där kanske till och med finns mer än en klimattyp. Sjunnesson (diskussion) 11 november 2017 kl. 20.20 (CET)
- @Sjunnesson: Det var "trakten" i meningen om klimatet som jag avsåg. Det är lite olyckligt att samma ord används även för temperaturen när det, precis som du påpekar, i allmänhet inte är exakt samma "trakt" som avses. Vill man veta hur stort det område, är "område" ett tillräckligt generellt begrepp, som omger en plats som har samma klimatklassificiering, eller temperatur, får man gå till källorna. Det minsta möjliga området, för källor som har upplösningen 0,1 grader × 0,1 grader, är cirka 100 km² på breddgrader motsvarande södra Spanien. Uppåt finns det ingen gräns, området kan omfatta hela länder, som Saudiarabien, Egypten och nästan hela Libyen när det gäller "varmt ökenklimat". Det skulle föra för långt att ange storleken på dessa omgivande områden i artikeln om en enskild plats. Lsjbot hade, baserat på källorna, kunnat skriva
- Just precis det, Larske, är väl vad Nationalencyklopedin menar, att Köppen ska ge en bild över större regioner, som rimligtvis är ett mycket vidare begrepp än "i trakten". Och i beskrivningen av temperaturen i meningen efter beskrivningen av klimatet "Årsmedeltemperaturen i trakten är x °C" måste väl "i trakten" vara ett rätt begränsat område, och de båda "i trakten" ska rimligtvis gälla samma trakt. Beträffande "kallt" så syftade jag, i det senaste jag skrev, enbart på den beskrivning av "kallt ökenklimat" som finns i vår artikel Öken med Nationalencyklopedin som källa. Sjunnesson (diskussion) 11 november 2017 kl. 17.38 (CET)
- Man kan inte anta att temperaturerna från Nasa stämmer så som de används i artiklarna. Normalt används annan temperaturdata för klimatdiagrammen som visas i artiklarna (i andra sammanhang kan Nasas data var helt ok). Källan som används för klimattyper är betydligt bättre. Där står tydligt vilka definitioner som används och vilka beräkningar som gjorts. Där nämns även lite om felaktigheter i resultaten. Sedan finns en del konstigheter hur den källan används av roboten. Bland annat översättningen av klimattyperna i källan till svenska och hur det stämmer överens med klimatartiklar på svenska Wikipedia. Dessutom är källens främsta syfte kanske inte att ge exakt rätt klimattyp för varje plats på jorden, utan mer ge en bild över större regioner. I källan går gränsen mellan varma och kalla öknar vid årsmedeltemperatur 18°C. 90.227.175.244 11 november 2017 kl. 16.57 (CET)
Oprecisa koordinater i Kanada
[redigera wikitext]Med anledning av pågående Bybrunnen diskussion, wp:BB#Lsjbot och exemplet Mimulus Creek, kom jag ihåg en sak som jag tidigare noterat, men inte uppmärksammat (tror jag), nämligen de konstiga koordinatfelen som verkar ha drabbat många artiklar i Kanada. Vid Mimulus Creeks koordinater finns ingen bäck, men några i närheten. Misstänker att koordinaterna är avrundade i något annat koordinatsystem och därefter konverterat till wgs84. Har sett det förr, men aldrig förstått hur det uppkommit och därför inte kunnat sätta {{Oprecis koordinatangivelse}}
på några. Om man a) visste vilket koordinatsystem koordinatdatan ursprungligen låg i, och b) hittar en algoritm för att konvertera tillbaka till det systemet, torde det vara möjligt att identifiera artiklarna med de felaktiga koordinaterna och malla dem på samma sätt som gjorts för Finland m.fl länder. Är det någon som har några insikter i vilka kartprojektioner som kan vara inblandade och hur man kan detektera dem? Ett sätt att hitta exempel på artiklar med detta problem är att att leta efter platser där flera olika artiklar har samma koordinater, exempelvis denna där flera bäckar och uddar påstås ligga på exakt samma plats utan att det verkar finnas mycket till vattendrag just där och där udden Three Mile Point i själva verket ligger ett stycke åt nordväst enligt googlemaps. Någon som kommer vidare med detta? Taxelson (diskussion) 15 november 2017 kl. 20.45 (CET)
- @Taxelson: Var det inte så att många koordinater i Geonames är avrundade till minut (1/60 grad alltså) vilket ofta är för dålig precision för platser med en liten utsträckning, platser på land som hamnar i havet och så vidare. I fallet Three Mile Point som du pekar på verkar koordinaterna inte vara jämna WGS84-minuter, men om de är avrundade i något annat koordinatsystem, "X", innan de konverterats till WGS84 är det väl ändå omöjligt att ogöra den avrundningen även om man skulle kunna konvertera tillbaka till "X". Eller menar du bara att en koordinat som har ett jämnt värde i "X" ska flaggas som misstänkt oprecis. En precis koordinat kan ju då råka ha ett jämnt värde och därmed bli felaktigt "anklagad" för att vara oprecis. --Larske (diskussion) 15 november 2017 kl. 21.25 (CET)
- @Larske: Vi har förstås säkert några falska positiva flaggade även bland dem som har jämna minuter. En del öar och sjöar som är tillräckligt stora för att träffas rätt ändå framför allt. Men då så många faktiskt är allvarligt missvisande av de med avrundade koordinater (en vattendragsartikel som pekar i närheten av flera vattendrag t.ex), bör de ändå hellre vara flaggade tills de kontrollerats. Samma sak borde göras om avrundningen skett med ungefär samma bristande noggrannhet (någon km) i ett annat koordinatsystem. Notera att det bara är de där både x och y koordinaten har ett misstänkt avrundat värde som ska flaggas. I fallet med wgs84, där sekund är normal upplösning, är det därför bara 1/60^2, alltså 1/3600 som är falska positiva, vilket bör vara en fullt acceptabel nivå. Det viktiga är att det sannolika felet blir tydligt uppmärksammat. Taxelson (diskussion) 15 november 2017 kl. 21.42 (CET)
- BC Geographical Names har den här informationen om sina koordinater. På något sätt verkar geoname använt det och andra provinsers databaser som källa (kanske via Canadian Geographical Names Database). 90.227.175.244 15 november 2017 kl. 21.43 (CET)
- Tack 90.227.175.244. Denna fråga på de aktuella koordinaterna ger de platser vi har artiklar om, men med korrekta positioner angivna med wgs84. Det står om ett api, som kanske skulle kunna användas för att rätta. Kanske är det alltså en:NAD27 som avrundats före konvertering, men fattar inte riktigt ännu. Kanske en annan dag! Taxelson (diskussion) 15 november 2017 kl. 23.00 (CET)
- Här är en lista på alla artiklar som har en "primär koordinat" inom rutan som syns på kartan till höger, i vilken bland annat Three Mile Point (udde i Kanada, British Columbia) ligger. Platserna är sorterade i stigande avstånd från rutans centrum och platser med exakt samma avstånd hamnar alltså intill varandra på listan och kan då granskas närmare för att se om även latitud och longitud är samma eller (eller om de bara "råkar" ligga på exakt samma cirkelbåge).
- Som synes finns ett flertal olika "creeks" som har två eller fler namn med exakt samma koordinater.
- --Larske (diskussion) 15 november 2017 kl. 22.50 (CET)
- Här är ett utdrag med de första cirka 100 och de sista cirka 100 från en mer lättarbetad typ av lista som endast omfattar artiklar med identiska koordinater norr om 40ºN och mellan 140ºV och 50ºV så hela Kanada är med.
- Hela listan omfattar drygt 30 000 artiklar som är "dubblettplatser". Av dessa är det drygt 11 000 unika koordinater. Om någon är intresserad kan jag ladda upp den på någon undersida här.
- --Larske (diskussion) 16 november 2017 kl. 00.49 (CET)
- Bland ovan nämnda dubbletter är det nästan 100 platser/koordinater där det finns mellan 10 och 25 artiklar med exakt samma koordinater. Allra värst är punkten 45°30′00″N 73°35′57″V / 45.50008°N 73.59918°V där det finns 265 artiklar om parker med olika namn! Geonames är en ymnig källa... --Larske (diskussion) 16 november 2017 kl. 01.39 (CET)
- Någon påpekade i diskussionen om cewiki på meta att Lsjbot skapat artiklar om plaketter uppsatta i parker, rimligen eftersom de fått fel objektstyp. Tydligare än så kan knappast principen "skit in-skit ut" illustreras. Lägg upp listan, gärna i en form man kan sortera på olika lämpliga sätt, så får vi se hur det skall hanteras.
- andejons (diskussion) 16 november 2017 kl. 09.04 (CET)
- En lista med 29 965 artiklar från kategorin Kategori:Robotskapade Kanadaartiklar som har primära koordinater som inte är unika, det vill säga att de är samma som koordinaterna för minst en annan artikel i kategorin finns att hämta i Sandlådan (den är mycket stor och tar en stund att ladda). Det finns 11 157 unika koordinater bland dessa. --Larske (diskussion) 16 november 2017 kl. 11.05 (CET)
- --Larske (diskussion) 16 november 2017 kl. 11.05 (CET)
- Tillägg. Fördelningen av "klusterstorlekar", från punkter med 2 artiklar med samma koordinat till punkten med 265 artiklar med samma koordinat framgår av den här tabellen:
Kluster-
storlekAntal
punkterAntal
artiklar2 7 622 15 244 3 1 936 5 808 4 757 3 028 5 344 1 720 6 189 1 134 7 111 777 8 63 504 9 49 441 10 28 280 11 15 165 12 17 204 13 6 78 14 4 56 15 3 45 16 5 80 17 1 17 18 3 54 19 0 0 20 2 40 21 0 0 22 0 0 23 0 0 24 0 0 25 1 25 265 1 265 Totalt 11 157 29 965
Om floder
[redigera wikitext]Efter att jag lämnat svwp fortsatte jag att utveckla Lsjbot för cebwp, bland annat vad gäller information om floder. Har funderat ett tag på att berätta om utfallet här, och nu har floder och bristen på info om dessa återigen kommit upp på WP:BB, så det kunde vara ett lämpligt tillfälle. Jag tänker inte ge mig in i någon debatt om flodkvalitet, utan tänkte bara informera om vad som finns att tillgå till flodartiklarna, om det är någon som kan ha glädje av det:
- Floder som rinner direkt ut i havet finns kategoriserade efter vilket hav de rinner ut i. Se ceb:Kategoriya:Mga suba sa dagat (Kategori:Floder efter hav). Kan missa floder med djupa mynningsvikar, deltan, eller påtagliga koordinatfel, men det ska inte finnas floder tilldelade till fel hav.
- Floder som tillhör avrinningsområdet till någon av världens 400 största floder (vilket sammantaget är huvuddelen av jordens våta landyta) finns kategoriserade efter avrinningsområde. Se ceb:Kategoriya:Mga tubig-saluran (Kategori:Avrinningsområden).
- I vissa fall har det med hjälp av GIS-data gått att identifiera vilka floder som är direkta bifloder till världens 600 största floder. Se sökresultat här.
Lsj (diskussion) 15 november 2017 kl. 22.30 (CET)
- Hej Lsj. Hoppas du är här för att stanna! Ovan låter intressanta för flodartiklarna. Har kategoriserat manuellt många av "dina" vattendrag efter avrinningsområde.--Gotogo (diskussion) 15 november 2017 kl. 23.22 (CET)
- @Lsj: Det där låter mycket bra! Var en flod mynnar ut och vilket avrinningsområde den tillhör är grundlägggande basinformation som varje flodartikel bör ha med, dels i ingressen och dels i en faktaruta. Det vore fantastisk om det gick att köra boten för att automatiskt lägga till den informationen i de botgenererade flodartiklarna. Jag inser att du numera fokuserar på cebuanska wikipedia, men Du skulle kanske kunna göra ett litet kort gästspel här på svenska wikipdia för att lägga till den informationen? Det vore ett mycket värdefullt bidrag till vårt projekt att förbättra de botskapade geografiaratiklarna, och det finns ingen annan som kan det här med botar och geografi lika bra som Du. Martinogk (diskussion) 19 november 2017 kl. 15.16 (CET)
Parker
[redigera wikitext]Jag tittade lite snabbt på Larskes lista ovan , och hittade Parc des Sommets, Parc des Patriotes (park i Kanada, lat 45,27, long -72,13) och Parc des Tisserands (park i Kanada, lat 45,27, long -72,13), som alla hade samma koordinater. De verkar dock alla ligga i samma samhälle, så det var inte helt uppåt väggarna, bara oprecist. Jag strök därför allt som var framräknat, eftersom det inte är speciellt relevant, och i fråga om höjd över havet troligen fel. Däremot är ju dessa parkartiklar ytterligare parodiskt: varför får jag som läsare reda på avstånd till Ottawa, men inte vilket samhälle de ligger i? Är det relevant att ha sådana artiklar öht?
andejons (diskussion) 16 november 2017 kl. 11.48 (CET)
- Det finns i GeoNames inget som berättar om vilket samhälle som omger en park. Det går med lite strul att få fram vilken bebodd plats som ligger närmast en park, men det finns ju inget som visar att parken ligger i den bebodda platsen, och ibland kanske den inte ens gränsar till den. Det kan ju variera vad man menar med "park". Skuleskogens nationalpark ligger i ödemarken, inte i ett samhälle. -- Innocent bystander (diskussion) 16 november 2017 kl. 17.57 (CET)
- Det finns heller inget som säger att en park är en park. Om den har Oval i namnet och ligger i Australien är det en bana för cricket och australisk fotboll. Bot-artiklarna inneåller ingenting om detta men ger många ovidkommande upplysningar på linje med verkliga parker. Memorial Park, en grensida med tre grenar, kan tjäna som exempel. Jag kan inte se att det finns nåon möjlighet att ersätta sådana meninslösheter med verklig information. Intresset är för litet och uppgiften för stor. Roufu (diskussion) 16 november 2017 kl. 20.18 (CET)
- Jag tror inte heller att en park behöver vara det som på svenska menas med ordet park utan skulle snarare säga att kategorin park i Geonames kan innehålla allt som det på engelska går att sätta efterledet "Park" på, utöver cricketplaner och arenor för australisk fotboll hittade jag även travbanor, shoppingcenter, industriområden och nöjesparker. Då tog jag bara en snabbtitt på Perth och områden väster om London, samt kollade enbart "parker" som har artiklar på enwp, så det lär nog finnas fler exempel att hitta. Murmeldjuret (diskussion) 17 november 2017 kl. 03.05 (CET)
- Jag tycker inte det verkar finnas mycket till alternativ än att radera alla artiklar om parker. Att artiklar innehåller felaktiga klimatuppgifter eller höjduppgifter är en sak, men om de har fel om vilken typ av objekt något är så går det inte att behålla dem.
- andejons (diskussion) 17 november 2017 kl. 08.11 (CET)
- Jag tror inte heller att en park behöver vara det som på svenska menas med ordet park utan skulle snarare säga att kategorin park i Geonames kan innehålla allt som det på engelska går att sätta efterledet "Park" på, utöver cricketplaner och arenor för australisk fotboll hittade jag även travbanor, shoppingcenter, industriområden och nöjesparker. Då tog jag bara en snabbtitt på Perth och områden väster om London, samt kollade enbart "parker" som har artiklar på enwp, så det lär nog finnas fler exempel att hitta. Murmeldjuret (diskussion) 17 november 2017 kl. 03.05 (CET)
- Det finns heller inget som säger att en park är en park. Om den har Oval i namnet och ligger i Australien är det en bana för cricket och australisk fotboll. Bot-artiklarna inneåller ingenting om detta men ger många ovidkommande upplysningar på linje med verkliga parker. Memorial Park, en grensida med tre grenar, kan tjäna som exempel. Jag kan inte se att det finns nåon möjlighet att ersätta sådana meninslösheter med verklig information. Intresset är för litet och uppgiften för stor. Roufu (diskussion) 16 november 2017 kl. 20.18 (CET)
Det är inte "namnet" på en plats som ska avgöra hur platsen kategoriseras, men det händer säkert att det slarvas med detta. Slarvet ligger, som jag ser det, helt i källan GeoNames om bidragsgivare där inte har respekterat de "definitioner" som finns för olika "Features Codes".
De platser som Ljsbot har omnämnt som parker i de robotskapade artiklarna i svwp är platser som i källan (GeoNames) har taggats som L.PRK
. Det finns inget godtycke eller några "beräkningar" inblandade i denna enkla "översättning" (men vi vill ju inte att det står att "X är en L.PRK" i artiklarna). Detta, samt de definitioner som GeoNames har för olika "Feature Codes", till exempel L.PRK, framgår av
Om det visar sig att en stor andel av platserna som i GeoNames har taggats med L.PRK är något som vi inte anser bör beskrivas som en park utan är felklassade i GeoNames, stöder jag också att sådana artiklar raderas. Men vi bör först skaffa oss en uppfattning om det är 90 procent, 9 procent eller 0,9 procent av "park-platserna" som är felkategoriserade i källan. Är det någon som vet om det finns någon "städpatrull" som rättar dylika fel i GeoNames? Kanske det finns länder där parkklassificeringen i GeoNames är perfekt och då vore det ju synd om artiklarna för dessa parker tas bort. --Larske (diskussion) 17 november 2017 kl. 10.29 (CET)
- Geonames har inte någon "gemenskap" som arbetar med att rätta fel. Det är ett enmansverk i botten och sedan går folk in och lägger till och ändrar efter eget godtycke. Innan jag gav mig in i Wikipedia-världen försökte jag vara geonames-tomte för Sverige. Hopplöst. Jag raderade felaktiga hotell. Någon la dit dom igen. Ingen möjlighet att anmäla det eller att kontakta användaren. Geonames saknas många av grundpelarna som Wikipedia har - som har gjort att Wikipedia är på samma nivå som kommersiella uppslagsverk. Det rättas dock fel i Geonames. Jag har ibland sett fel i lsjbot-artiklar och gått in i Geonames för att rätta även där. Då händer det att jag ser i historiken att det har redan rättats där, ofta av vad jag uppfattar som "botanvändare", dvs data från filer. "Features Codes" för användarskapade poster i Geonames bygger på gissning från användaren. De kan vara rätt, de kan vara fel. Det beror också på hur importfiler till Geonames har tolkats av den som gjort importen. Vi har mycket holmar i Norge i Geonames. Det beror nog på att Statens Kartverk har en klassning och den har använts. För andra länder kanske inte man gjort skillnad på storlek på ö och då har allt blivit öar. Det är alltså olika måttstockar i olika länder.
- Eventuella massraderingar ska analyseras och beslutas på landsnivå och objektstypsnivå. Vi får aldrig dra slutsatser om parker i land A baserat på fel i parker i land B. Vi får aldrig dra slutsatser om parker i land A baserat på fel i uddar i land A. Kitayama (diskussion) 17 november 2017 kl. 12.08 (CET)
- Och rättelser jag har gjort, när jag tex upptäckt att man lagt in hundratals invånare i en Ångermanländsk by med två gårdar, har återställts. Byn har därmed åter hundratals invånare. SCB bekräftar att det finns en plats med detta namn som hade så många invånare 2005, men den ligger i Södermanland. -- Innocent bystander (diskussion) 17 november 2017 kl. 12.29 (CET)
- Om man tittar på Lsjbot-skapade parker i Australien (8359 st.) kan man se att 661 av dem är nationalparker. Säkerligen är många av dem dubbletter till manuellt skapade artiklar, men vi borde kanske ändå ha koll på nationalparker. Sjunnesson (diskussion) 19 november 2017 kl. 15.40 (CET)
- Jag håller med om det som Kitayama säger om att en analys bör göras för att avgöra kvaliten per objektstyp och per land. Det blir dock ett stort antal beslut; något hundratal använda objekttyper multiplicerat med 142 länder. För att få en uppfattning om hur de robotskapade artiklarna fördelar sig på objekttyp och land kan vi göra en tabell med dessa antalsuppgifter per land och objekttyp. Sen skulle man kunna färglägga de celler som motsvarar artiklar som ska behållas med grönt, de som ska utredas vidare med gult och de som ska raderas med rött innan det blir aktuellt med någon massradering.
- I sandlådan finns en sådan tabell påbörjad med data för de två länderna Afghanistan (36 445 artiklar) och Albanien (2 668 artiklar) ifyllda per objekttyp. För dessa två länder finns det sammanlagt 13 123 berg (T.MT), 11 755 periodiska vattendrag (H.STMI), 2 775 vattendrag (H.STM), 1 500 bergspass (T.PASS), 1 406 kullar (T.HLL) och så vidare.
- Är det meningsfullt att fylla de övriga 140 landskolumnerna med data också och lägga tabellen på en projektsida?
- Detta hade kunnat göras snabbt om artiklarna vid skapandet hade kategoriserats inte bara efter land utan även efter objekttyp. Nu vet jag inget annat sätt än att läsa igenom artikel för artikel och hämta ut den kod, till exempel <!--T.MT--> som Lsjbot har lagt in i artiklarna och det tar lite tid med 1 454 502 artiklar. --Larske (diskussion) 17 november 2017 kl. 23.50 (CET)
- Detta ger nog i princip kanaler i Egypten, t.ex. För bedömningen borde nog dock hänsyn tas till kvalitén på koordinaterna i varje grupp. Är dessa huvudsakligen avrundade är artiklarna i en kategori betydligt mindre värda än om de är adekvata. Taxelson (diskussion) 18 november 2017 kl. 11.42 (CET)
- Ja, Sök är ju väldigt kraftfullt och fungerar kanske för de flesta länder utan alltför många falska träffar. Tack för tipset! --Larske (diskussion) 18 november 2017 kl. 14.20 (CET)
- Detta ger nog i princip kanaler i Egypten, t.ex. För bedömningen borde nog dock hänsyn tas till kvalitén på koordinaterna i varje grupp. Är dessa huvudsakligen avrundade är artiklarna i en kategori betydligt mindre värda än om de är adekvata. Taxelson (diskussion) 18 november 2017 kl. 11.42 (CET)
- Om man tittar på Lsjbot-skapade parker i Australien (8359 st.) kan man se att 661 av dem är nationalparker. Säkerligen är många av dem dubbletter till manuellt skapade artiklar, men vi borde kanske ändå ha koll på nationalparker. Sjunnesson (diskussion) 19 november 2017 kl. 15.40 (CET)
- Och rättelser jag har gjort, när jag tex upptäckt att man lagt in hundratals invånare i en Ångermanländsk by med två gårdar, har återställts. Byn har därmed åter hundratals invånare. SCB bekräftar att det finns en plats med detta namn som hade så många invånare 2005, men den ligger i Södermanland. -- Innocent bystander (diskussion) 17 november 2017 kl. 12.29 (CET)
Hur börja?
[redigera wikitext]- Hitflyttat från Wikipediadiskussion:Projekt alla platser-städning/Arkiv 2016 - 2017-02 17 november 2017 kl. 14.36 (CET)
Jag tänkte försöka mig på att i en lite långsammare takt att städa lite artiklar, jag är först och främst intresserad av att rätta till artiklar om vattendrag i Storbritannien. Men jag är lite fundersam hur jag ska gå till väga, har aldrig tidigare städat några robotskapade artiklar och har dessutom ingen förkunskap inom detta ämne. Försökte att söka lite i arkivet men hittade inga svar där, har därför några frågor innan jag börjar
- Först och främst, vilka vattendrag är relevanta? Abhainn na Glasa är ett namngivet vattendrag men verkar vara såpass litet att det inte ens syns på kartan?
- Numera är det väl konsensus att ta bort all klimatdata?
- Vart vill vi sätta kordinaterna på vattendragen, där de mynnar ut, startar eller i mitten? Abhainn na Frithes kordinater är i en skog strax ovanför mitten av vattendraget.
- Är det verkligen relevant att veta att Abhainn Crò Chlach ligger i Skottland och 800 km från huvudstaden London. Jag skulle hellre vilja veta avståndet till Skottlands huvudstad Edinburgh.
// Hastrian (diskussion) 17 november 2017 kl. 13.22 (CET)
- Kan du inte ens verifiera att vattendragen finns, så är den absolut en raderingskandidat.
- Ja
- Gör som du tycker passar bäst för att beskriva det.
- Exakt vad som bäst sätter ett bra perspektiv på artikeln klarar du nog att avgöra själv. Jag ser inte alls här en stad 80 mil bort skulle göra det. -- Innocent bystander (diskussion) 17 november 2017 kl. 14.43 (CET)
- Koordinater på vattendragen brukar jag sätta vid mynningen. Det är i linje med den rekommendation som finns på enwp. Läs gärna en:Wikipedia:WikiProject Geographical coordinates/Linear och en:Wikipedia:WikiProject_Rivers#Geographical_coordinates om koordinater på floder. Vi behöver ju inte följa enwp, men om vi inte ser något hinder så kan vi ju följa deras koordinat-principer. Kanske hela sidan en:Wikipedia:WikiProject Rivers kan vara intressant som inspel till tankarna om hur du vill strukturera upp vattendrag i Storbritannien. Hitta en detaljerad och officiell online-karta över landet och använd den som källa. Kanske [1]. Jag hittade en för Danmark där man kan mäta längden på vattendragen med ett musklick - underbar! Kitayama (diskussion) 17 november 2017 kl. 15.12 (CET)
- Jag skulle också sätta koordinaterna vid mynningen, det är den enda varianten jag sett för svenska vattendrag. Viktigare än hur långt det är till huvudstaden är att ange var vattendraget mynnar (vilken sjö, var i havet, vilket större vattendrag) och genom vilka distrikt och grevskap det rinner. /Ascilto (diskussion) 17 november 2017 kl. 16.05 (CET)
- @Hastrian: noterar att de stickprov jag gjort bland skottlands vattendrag har alla haft dåliga koordinater (minut-avrundning), och ligger alltså upp till någon kilometer fel. Det kan vara tämligen mödosamt att fixa sådana... Taxelson (diskussion) 17 november 2017 kl. 22.44 (CET)
- Är koordinaterna i Gazetteer for Scotland bättre? Exempelvis River Snizort (River Snizort).
Använder man rätt parametrar i geoboxen kan man ange både källa (source_lat_/source_long_) och mynning (mouth_lat_/mouth_long_). Att bara ange en punkt (lat_/long_) utan att ange vilket slags punkt är ett sämre alternativ. 90.227.175.244 17 november 2017 kl. 23.56 (CET)- Tack för alla svar, har nu börjat lite smått med vattendragen. Koordinaterna är precis som Taxelson säger, väldigt ospecifika här. Men jag lyckades iallafall att lokalisera Abhainn na Glasa med hjälp av Gazetteer for Scotland. Koordinaterna har jag enbart satt vid mynningen hittills, känns som lite överarbete annars. Har iallafall specificerat i geoboxen att det är mynningen.
- Tyvärr så har det officiella MagicMap som Kitayama länkade fungerat väldigt dåligt för mig och jag har istället fått mäta längden på vattendragen med det inofficiella (men väldigt bra) Wheres the Path tillsvidare, tyvärr inte det säkraste att ange som källa dock då sidan kan stängas ned närsomhelst av ägaren som verkar vara en privatperson.
- En bra fingervisning om relevans finns är ju om artikeln finns på enwp. Bra om du kan fixa interwiki-länkar. Avstånd till huvudstad tar jag vanligtvis bort för floder. Beror ju på varifrån man mäter och är egentligen ganska ointressant. Viktigare med längd, landskap motsvarande, biföden, plats för källa och framför allt mynning (vilket hav).--Gotogo (diskussion) 18 november 2017 kl. 12.44 (CET)
- Koordinater för mynningen räcker bra. Det är dessutom mer sällan man lyckas hitta källor som anger koordinater för vattendrags källor.
En annan sak som bör göras vid städningen är att ersätta källhänvisningar till geonames med någon bättre källa. 90.227.175.244 18 november 2017 kl. 12.55 (CET)- Kommentar om Schweiz, Laufenburg (distriktshuvudort) blev omdirigerad till Laufenburg, Schweiz. I geonames är ytan för dessa object olika och kommunen har sedan 2010 den tidigare kommnen Sulz, Aargau som ort (enligt svwp 1/3 eller 1/4 bor i Sulz beroende på om antalet invånare i Laufenburg, Schweiz är ADM eller PPL). Troligen borde inte orten Laufenburg peka till kommunartikeln och om den gör bör troligen "population_urban" o.s.v. finnas för PPL. Kommunartikeln pekade på geonames PPL(A) istället för ADM3 som är ganska vanligt på wikidata (fixat om ingen ändrar tillbaka som händer). Det går inte att säga att kommun/ort alltid ska vara en artiklel eller alltid två artiklar. Vi bör troligen titta på hur stor skillnaden är både till yta och folkmängd. Om ADM har mer än en PPL som finns eller inte finns på svwp bör både ADM och PPL troligen finns kvar på svwp. Maundwiki (diskussion) 28 januari 2018 kl. 20.37 (CET)
- Är koordinaterna i Gazetteer for Scotland bättre? Exempelvis River Snizort (River Snizort).
- @Hastrian: noterar att de stickprov jag gjort bland skottlands vattendrag har alla haft dåliga koordinater (minut-avrundning), och ligger alltså upp till någon kilometer fel. Det kan vara tämligen mödosamt att fixa sådana... Taxelson (diskussion) 17 november 2017 kl. 22.44 (CET)
- Jag skulle också sätta koordinaterna vid mynningen, det är den enda varianten jag sett för svenska vattendrag. Viktigare än hur långt det är till huvudstaden är att ange var vattendraget mynnar (vilken sjö, var i havet, vilket större vattendrag) och genom vilka distrikt och grevskap det rinner. /Ascilto (diskussion) 17 november 2017 kl. 16.05 (CET)
- Koordinater på vattendragen brukar jag sätta vid mynningen. Det är i linje med den rekommendation som finns på enwp. Läs gärna en:Wikipedia:WikiProject Geographical coordinates/Linear och en:Wikipedia:WikiProject_Rivers#Geographical_coordinates om koordinater på floder. Vi behöver ju inte följa enwp, men om vi inte ser något hinder så kan vi ju följa deras koordinat-principer. Kanske hela sidan en:Wikipedia:WikiProject Rivers kan vara intressant som inspel till tankarna om hur du vill strukturera upp vattendrag i Storbritannien. Hitta en detaljerad och officiell online-karta över landet och använd den som källa. Kanske [1]. Jag hittade en för Danmark där man kan mäta längden på vattendragen med ett musklick - underbar! Kitayama (diskussion) 17 november 2017 kl. 15.12 (CET)
Hur avgör man om en bergstopp är relevant?
[redigera wikitext]Började för en stund sedan med att städa i Kategori:Robotskapade Schweizartiklar. Städade artiklarna om bergstopparna Aiguille du Pissoir och Aiguille du Vélan med hjälp av den här kartan i skala 1:10 000. Jag tänkte börja städa artikeln Aiguilles Tourelle, men insåg snabbt att den inte var utmärkt på kartan. Toppen verkar dock finnas om man kollar på klättringssidor, se här. Är toppen fortfarande relevant även om den inte finns med på kartan med skala 1:10 000. YesDi (diskussion) 17 november 2017 kl. 16.41 (CET)
- Om det där är en karta från en nationell lanmäterimyndighet, som jag tror, så bör det betyda att artikeln må raderas som overifierbar även om toppen som sådan finns med angiven höjd. (länk med markering). Taxelson (diskussion) 17 november 2017 kl. 18.32 (CET)
- @Taxelson: Tack för svar! Kartan kommer från den schweiziska lantmäterimyndigheten. Inte ens höjdmeter står angivet på kartan om Aiguilles Tourelle. Antagligen sticker bergstoppen inte upp tillräckligt mycket från omgivningen för att de ska sätta ut toppens höjdmeter och namn. Jag tar och raderar artikeln. YesDi (diskussion) 17 november 2017 kl. 21.28 (CET)
- @YesDi: Bra. Men, jo visst var höjden angiven till samma som i artiklen (3167m) - se min länk i ovanstående inlägg, under röda plutten) men alltså inget namn. Taxelson (diskussion) 17 november 2017 kl. 22.12 (CET)
- @Taxelson: Aha! Jag ville ha reda på vad Aiguilles Tourelle låg, men istället har jag lyckats förväxla Aiguilles Tourelle med Aiguille Tourelle utan s som tydligen låg precis i närheten, iaf om man ska tro den här sidan. Här är en karta med båda våra markeringar. Helt mitt fel. YesDi (diskussion) 17 november 2017 kl. 22.30 (CET)
- @YesDi: Bra. Men, jo visst var höjden angiven till samma som i artiklen (3167m) - se min länk i ovanstående inlägg, under röda plutten) men alltså inget namn. Taxelson (diskussion) 17 november 2017 kl. 22.12 (CET)
- @Taxelson: Tack för svar! Kartan kommer från den schweiziska lantmäterimyndigheten. Inte ens höjdmeter står angivet på kartan om Aiguilles Tourelle. Antagligen sticker bergstoppen inte upp tillräckligt mycket från omgivningen för att de ska sätta ut toppens höjdmeter och namn. Jag tar och raderar artikeln. YesDi (diskussion) 17 november 2017 kl. 21.28 (CET)
Kategorisera?
[redigera wikitext]Jag erbjöd nyligen min hjälp med att radera sidor utifrån en kategori (Special:Diff/42119698). Det var innan jag såg hur kategoriträdet ser ut. Jag ser nu att kategoriträdet inte är mer finfördelat än "Robotskapade {land}artiklar", till exempel Kategori:Robotskapade Kanadaartiklar med 249 000 artiklar. Så här stora kategorier skulle skapa en rad praktiska problem för mig. Skulle det vara det här projektet till gagn att först dela in dessa artiklar i mer hanterbara kategorier som "Robotskapade artiklar om {typ} i {land}", till exempel "Kategori:Robotskapade artiklar om parker i Kanada"? Nirmos (diskussion) 18 november 2017 kl. 14.04 (CET)
- Vi har redan 146 kategorier om "Robotskapade <namn på land>artiklar". Om vi skapade kategorierna "Robotskapade <namn på objekttyp>artiklar", det är väl ett par hundra av objekttyperna i GeoNames som har använts i projektet, skulle man sedan med antingen "Search" (incategory:A incategory:B) eller med Petscan kunna erhålla den skärningsmängd man vill lista och undersöka närmare för att städa artiklarna. I ditt exempel skulle de "Robotskapade artiklarna om parker i Kanada" fås som skärningen av "Robotskapade Kanadaartiklar" och "Robotskapade parkartiklar". --Larske (diskussion) 18 november 2017 kl. 14.18 (CET)
- Så kan man göra, men det skulle inte hjälpa mig. Nirmos (diskussion) 18 november 2017 kl. 14.29 (CET)
- Såhär då, baserat på det tips som Taxelson gav i tråden ovan, något modifierat till att använda befintliga kategorier:
- Robotskapade artiklar om parker i Kanada.
- --Larske (diskussion) 18 november 2017 kl. 14.30 (CET)
- @Nirmos: Nu har jag inte full insikt i dina script förstås, men Denna petscanfråga ger en lista på robotskapade parker i Kanada (alltså robotskapade kanadaartiklar (alltså sådana med Lsjbotmall kvar) som länkar till Park. Lista går ju att få genom att ändra output till något lämpligt. (sedan vet jag inte om alla dessa är raderingskandidater. Helst kanske bara de med dåliga koordinater, men att hitta dem är ju för Kanadas del ännu ett olöst problem...) Är du verkligen beroende av att det är en kategori, så går det ju att kategorisera i en temporär raderingskategori med AWB, även om det synes mig vara en onödig omväg Taxelson (diskussion) 18 november 2017 kl. 15.35 (CET)
- Den frågan ger många som inte ska raderas: Alla med "Provincial park" i namnet ska säkert behållas, men även t.ex Carmanah Walbran Park som kan vara svårare att skilja ut. Taxelson (diskussion) 18 november 2017 kl. 15.45 (CET)
- @Nirmos: Nu har jag inte full insikt i dina script förstås, men Denna petscanfråga ger en lista på robotskapade parker i Kanada (alltså robotskapade kanadaartiklar (alltså sådana med Lsjbotmall kvar) som länkar till Park. Lista går ju att få genom att ändra output till något lämpligt. (sedan vet jag inte om alla dessa är raderingskandidater. Helst kanske bara de med dåliga koordinater, men att hitta dem är ju för Kanadas del ännu ett olöst problem...) Är du verkligen beroende av att det är en kategori, så går det ju att kategorisera i en temporär raderingskategori med AWB, även om det synes mig vara en onödig omväg Taxelson (diskussion) 18 november 2017 kl. 15.35 (CET)
- Så kan man göra, men det skulle inte hjälpa mig. Nirmos (diskussion) 18 november 2017 kl. 14.29 (CET)
- Man kan förmodligen behålla de artiklar som har iw till annat än cebwiki i en första omgång. Sedan kan vi se hur många artiklar som finns kvar, och i vilken mån det är möjligt att åtgärda dem med direkta insatser av människor.
- andejons (diskussion) 18 november 2017 kl. 16.06 (CET)
Jag ser för mig att man skapar nya malpåse-kategorier med samma namn som de nu existerande men med t.ex. ett %-tecken först i namnet. De artiklar som flyttas dit skulle också få detta tecken först i namnet. Man skulle då kunna tömma de existerande kategorierna på meningslösa artiklar och bara bibehålla de med verklig information, botskapade eller manuellt skapade.Om förhållandena ändrar sig, eller man har gjort fel, är det enkelt att ta fra artiklarna ur malpåsen. Skall detta fungera optimalt, behövs ett verktyg för sådana massflyttningar och namnändringar.
Som det nu är skymmer botartiklarna för de med verkligt innehåll. Se till exempel Kategori:Vattendrag i Shanxi som har en manuellt skapad artikel, Fenfloden, och 46 botskapade meningslösheter. Bland de senare ingår dubbletten Fen He (vattendrag i Kina, Shanxi). Roufu (diskussion) 18 november 2017 kl. 21.51 (CET)
- "Parkera" lsjbotskapade artiklar. De är inte synliga för normalläsare och gömda från sökmotorer. Liknande Användare:Lsjbot/Dubletter..... Om de raderas är de fortfarande synliga för administratörer men inte för andra användare. Omdirigeringen vid flytten måste raderas så det bör troligen göras med ett skript men enstaka artiklar kan flyttas av vem som helst med en raderabegäran för omdirigeringen eller en bot kan kolla efter omdirigeringar till "parkera"..... och radera dessa. Även om de är undermåliga så kan de flyttas till en gemensam sandlåda. Om något flyttas som inte borde ha flyttats är det lättare for den icke administratör som upptäcker det att fixa genom att lägga till vad som behövs för att göra artikeln relevant och flytta tillbaka den. Nu är artiklar med "verkligt innehåll" inte alltid bättre. Naturligtvis ar de som inte bra färre eftersom de inte var botskapade. Vi bör kanske tala om att ta bort saker vars källa (geonames) är tvivelaktig inte att ta bort botskapade artiklar. Maundwiki (diskussion) 19 november 2017 kl. 14.06 (CET)
- Ja, det är ju just att GeoNames är källa som är det största problemet. Sjunnesson (diskussion) 19 november 2017 kl. 14.56 (CET)
Det finns ingen anledning att radera i den skala som föreslås här. Skall vi utplåna vårt adelsmärke, de artiklar som gör oss och cebwp till Wikipedias flaggskepp på resan mot framtiden? Tostarpadius (diskussion) 19 november 2017 kl. 22.27 (CET)
- Huvuddproblemet med botproducerade skräpartiklar är inte källornas eller upplysningarnas kvalitet, utan att det som står i dem är totalt ointressnant. Avstånd till huvudstaden är intressant för ett litet land som Belgien men inte för Kanada eller för Kina, som är nästan lika stort som Europa. Kartorna för stora länder har så dålig upplösning att till exempel nästan hela Europa är med på Kinakartan. Klickar man på kartan för att få den större, försvinner lägesmarkören. Interwikilänkar går bara till cebuano, där Lsjbot också har producerat artiklarna.
- Jag räknar att man i många fall kan finna vettiga fakta att sätta in i artiklarna, men vi har inte kapacitet att göra detta. Alla uppgifter, även de enklaste som att länka bot-artiklar till enwp, är enorma på grund av antalet artiklar. Och många artiklar handlar om objekt som idag bara finns i botåroducerade artiklar. Om ingen tar sig av dem, är de evigt skräp.
- Lösningen är inte massradering utan massprarkering eller malpåse. Först då skräpet röjts undan, kan vi få ett användbart uppslagsverk för länder som Kina och Kanada. Roufu (diskussion) 21 november 2017 kl. 00.27 (CET)
Röda botskapade wikilänkar på förgreningssidor
[redigera wikitext]Jag är halvägs genom alfabetet för förgreningsidor i denna rundan. Bör jag fortsättningsvis inte infoga röda wikilänkar från botskapde förgreningsidor för klippor, vattendrag, vikar, sjöar, bergstoppar, öar, ????, etc. Kanske lättar med vad som behålls: distikt, provinser, kommuner, orter (men inte orter i Frankrike om det finns kommun), om det bara finns en av ett namn under ett land inte många olika särskiljningar för samma namn behålls flod, sjö, berg, vik, ????, allt under rubriken "alla länder" behålls. Om det finns en inkommande wikilänk till den röda artiklen behålls den på förgreningssida. Maundwiki (diskussion) 19 november 2017 kl. 14.28 (CET)
- Enkelt exempel. I Madera skulle jag ta bort 2 och 3 i Mexiko men roda länkr under Ryssland och Saudiarabien skulle vara kvar. Maundwiki (diskussion) 19 november 2017 kl. 15.04 (CET)
Gruvor och övergivna gruvor
[redigera wikitext]När jag kollade wikilänkningen till Alicia råkade jag hitta "Alicia (gruva)" respektive "Alicia (övergiven gruva)", samt ex kategori Kategori:Naturresurser i Región de Atacama och Kategori:Naturresurser i Región de Antofagasta där rätt så många uppslag verkar vara märkligt namngivna/är dubbletter med olika särskiljning/ser ut att handla om samma plats med olika koordinater och liknande. Är gruvartiklar och deras kvalitet något som diskuterats i städprojektet tidigare? Frågar för att veta därför att jag inte följt alla diskussioner här och för att jag undrar om de är ett fall för radering eller ej? Höstblomma (diskussion) 26 november 2017 kl. 12.54 (CET)
- Något lite här. Taxelson (diskussion) 26 november 2017 kl. 13.13 (CET)
- Inget om gruvornas historia, inget om vad man gruvat sig över och inget om vem som gruvat sig. Det är inte mycket till artiklar. -- 109.228.149.82 26 november 2017 kl. 13.16 (CET)
- Ok, man kan ju tänka sig att det finns ett par relevanta gruvor i ett land, nu vet jag inte om någon har städat upp i Kategori:Gruvor i Makedonien (?) men i de två kategorier jag länkade ovan känns det osannolikt att alla gruvor är relevanta. Kollade snabbt cirka 10 st och ingen hade någon interwikilänk annat än till cebwp. Tycker att att man vet vad som bryts i en gruva är ett minimum för relevans. Samt att det verkligen är en verklig gruva. En del uppslag som "Costa Rica (gruva)" eller "New York (gruva i Chile)" känns spontant väldigt märkliga. Sådant borde nog kunna raderas utan att man ska behöva kolla efter om de verkligen finns? Eller behövs en sffr för detta? Höstblomma (diskussion) 26 november 2017 kl. 13.36 (CET)
- Jag tror de i förekommande fall bör raderas som oartiklar eller overifierbara, inte på rel, och därmed är sffr nog mindre lämplig. Taxelson (diskussion) 26 november 2017 kl. 13.56 (CET)
- Om man går på relevans, så är det för att den ej är styrkt i artikeln, inte för att ämnet inte är relevant. Men något om när, vad, hur mycket, av vem, och/eller dess geologiska förutsättningar, behöver ju finnas med. Taxelson (diskussion) 26 november 2017 kl. 14.20 (CET)
- Ok, man kan ju tänka sig att det finns ett par relevanta gruvor i ett land, nu vet jag inte om någon har städat upp i Kategori:Gruvor i Makedonien (?) men i de två kategorier jag länkade ovan känns det osannolikt att alla gruvor är relevanta. Kollade snabbt cirka 10 st och ingen hade någon interwikilänk annat än till cebwp. Tycker att att man vet vad som bryts i en gruva är ett minimum för relevans. Samt att det verkligen är en verklig gruva. En del uppslag som "Costa Rica (gruva)" eller "New York (gruva i Chile)" känns spontant väldigt märkliga. Sådant borde nog kunna raderas utan att man ska behöva kolla efter om de verkligen finns? Eller behövs en sffr för detta? Höstblomma (diskussion) 26 november 2017 kl. 13.36 (CET)
- Inget om gruvornas historia, inget om vad man gruvat sig över och inget om vem som gruvat sig. Det är inte mycket till artiklar. -- 109.228.149.82 26 november 2017 kl. 13.16 (CET)
- Statistik över gruvtyp
Om någon vill grotta ner sig i de robotskapade gruvartiklarna kanske den här sammanställningen av antal gruvor av olika typ kan vara av intresse:
Kod | Typ av gruva | Antal artiklar (i skrivande stund) |
---|---|---|
S.MN | ospecificerad | 5 042 |
S.MNAU | guldgruva | 55 |
S.MNC | kolgruva | 147 |
S.MNCR | kromgruva | 4 |
S.MNCU | koppargruva | 53 |
S.MNFE | järngruva | 41 |
S.MNN | saltgruva | 13 |
S.MNQ | övergiven gruva | 109 |
--Larske (diskussion) 26 november 2017 kl. 14.14 (CET)
- Någon som har koll på vad "gruva" här betyder? Kan det handla om ett enskilt schakt, eller kanske bara en skärpning eller ett mindre dagbrott?FBQ (diskussion) 26 november 2017 kl. 14.44 (CET)
- Det beror nog på vilka källor GeoNames har använt, och det vet inte här. De stickprov jag sett nu, antyder att det ibland kan röra sig om flera olika schakt inom samma gruva. Jag säger inte att ett enskilt schakt inte kan vara relevant, utan bara att artiklarna här innehåller alldeles för lite för att avgöra vad de egentligen beskriver. -- 109.228.149.82 26 november 2017 kl. 14.54 (CET)
- Vi måste komma ihåg att källan i Geonames många gånger kan vara en person utan djup kunskap i engelska som lägger in platser i sitt hemland. Det är mycket godtyckligt vilken objekttyp som åsatts ett objekt. Tänk er ett Wikipedia utan kontroll av vad som läggs in. Då har ni Geonames. Mycket är rätt, mycket är fel, mycket är sisådär-rätt. Allt som kommer från Geonames bör kontrolleras mot en källa. Kitayama (diskussion) 26 november 2017 kl. 15.15 (CET)
- Efter en jämförelse med kategorierna på enwp och eswp så ser det ut som några gruvor där har fått en motsvarande botartikel här. Dessa kan man städa upp och spara, men mycket i dessa kategorier verkar ju kunna raderas som oartiklar och eller som overifierbart. Märkligt är dock att många av gruvorna som tas upp på enwp och eswp inte fått en botartikel här. Då verkar det ändå röra sig om lite mer kända gruvor. Framkommer inget annat argument inom ett dagar tycker jag det verkar klart att gruvor där det är oklart vad de har för betydelse eller vad de är kan raderas som oartiklar. Höstblomma (diskussion) 27 november 2017 kl. 19.16 (CET)
- Nej det är inte alls märkligt att det finns gruvor med artiklar i enwp och/eller eswp inte har "fått någon botartikel här". De robotskapade geografiartiklarna i "Projekt alla platser" på svwp har använt GeoNames som källa för platser/objekt. Roboten har ingen kunskap om vad som är "lite mer kända gruvor" och har inte använt artiklar på andra språkversioner som bas för artikelskapandet. Det vore därför mycket märkligt om gruvor som finns i enwp eller eswp men inte i GeoNames hade dykt upp som ett resultat av robotens artikelskapande här på svwp (och cebwp). --Larske (diskussion) 27 november 2017 kl. 20.15 (CET)
- Jag förstår att boten inte använt andra wiki som källa, jag tänkte bara att det är konstigt att inte de större och mer kända gruvorna blivit inlagda i Geonames, när så många smågruvor eller schakt verkar ha blivit det. Jag kanske försöker kolla upp några sådana emellanåt och antigen putsa och stärka upp dem med en annan källa eller radera dem om jag inte finner andra källor utanför Geonames som bekräfta det som står i botartikeln. Höstblomma (diskussion) 1 december 2017 kl. 19.02 (CET)
- Nej det är inte alls märkligt att det finns gruvor med artiklar i enwp och/eller eswp inte har "fått någon botartikel här". De robotskapade geografiartiklarna i "Projekt alla platser" på svwp har använt GeoNames som källa för platser/objekt. Roboten har ingen kunskap om vad som är "lite mer kända gruvor" och har inte använt artiklar på andra språkversioner som bas för artikelskapandet. Det vore därför mycket märkligt om gruvor som finns i enwp eller eswp men inte i GeoNames hade dykt upp som ett resultat av robotens artikelskapande här på svwp (och cebwp). --Larske (diskussion) 27 november 2017 kl. 20.15 (CET)
- Efter en jämförelse med kategorierna på enwp och eswp så ser det ut som några gruvor där har fått en motsvarande botartikel här. Dessa kan man städa upp och spara, men mycket i dessa kategorier verkar ju kunna raderas som oartiklar och eller som overifierbart. Märkligt är dock att många av gruvorna som tas upp på enwp och eswp inte fått en botartikel här. Då verkar det ändå röra sig om lite mer kända gruvor. Framkommer inget annat argument inom ett dagar tycker jag det verkar klart att gruvor där det är oklart vad de har för betydelse eller vad de är kan raderas som oartiklar. Höstblomma (diskussion) 27 november 2017 kl. 19.16 (CET)
- Vi måste komma ihåg att källan i Geonames många gånger kan vara en person utan djup kunskap i engelska som lägger in platser i sitt hemland. Det är mycket godtyckligt vilken objekttyp som åsatts ett objekt. Tänk er ett Wikipedia utan kontroll av vad som läggs in. Då har ni Geonames. Mycket är rätt, mycket är fel, mycket är sisådär-rätt. Allt som kommer från Geonames bör kontrolleras mot en källa. Kitayama (diskussion) 26 november 2017 kl. 15.15 (CET)
- Det beror nog på vilka källor GeoNames har använt, och det vet inte här. De stickprov jag sett nu, antyder att det ibland kan röra sig om flera olika schakt inom samma gruva. Jag säger inte att ett enskilt schakt inte kan vara relevant, utan bara att artiklarna här innehåller alldeles för lite för att avgöra vad de egentligen beskriver. -- 109.228.149.82 26 november 2017 kl. 14.54 (CET)
- Någon som har koll på vad "gruva" här betyder? Kan det handla om ett enskilt schakt, eller kanske bara en skärpning eller ett mindre dagbrott?FBQ (diskussion) 26 november 2017 kl. 14.44 (CET)
- Jag har nu försökt verifiera de fyra kromgruvorna mot någon annan källa än geonames. Alla gruvorna ligger i Iran. Jag känner inte till någon officiell myndighet för detta i Iran och jag har enbart försökt att googla på namnen.(Resultaten är så få att det inte är svårt att kontrollera alla)
- Ma‘dan-e Sar-e Rūr verkar inte finnas någon annan stans än i geonames. På google maps ser det dock ut som om det är ett vattenfyllt hål.
- Ma‘dan-e Korom-e Bīdū'īyeh verkar inte heller finnas annat än i geonames. På google maps skulle man kanske kunnat huggit lite i berget här.
- Ma‘dan-e Korowm-e Sobḩān finns i någon typ av databas från den amerikanska militären här. Enlgit kartan har man kanske huggit lite här med.
- Ma‘dan-e Korowm-e Ārchīnū finns med i samma databas som föregående här och även en bild finns på nätet där det ser uppenbart ut som man brutit något.
- Jag har dock inte kunnat verifiera att någon av gruvorna verkligen har funnits än mindre vad som brutits där och jag är mycket tveksam till att de då ens hade varit relevanta att döma av kartbilderna. Kolurpen (diskussion) 27 november 2017 kl. 20.56 (CET)
- Den amerikanska databasen ser ut att härstämma från den militära Geonames varifrån grunddatat till civila Geonames har hämtats. Kodningen av platstyp i Geonames härstammar från den militärdatabasen. S.MNCR syns ju på sidorna du länkar till. Detta samband gör att du kan hitta samma plats med samma stavning i bägge databaserna. Det gör inte källäget bättre... Kitayama (diskussion) 27 november 2017 kl. 21.05 (CET)
I Sverige har geonames de här gruvorna. Om de artiklarna hade botskapats hade det säkert gått att hitta svenska källor för många av dem, och med en del arbete skapa acceptabla artiklar med innehåll som inte bara handlar om gruvornas koordinater. För andra länder har vi betydligt mindre lokalkännedom och svårare att hitta bra källor för att skapa acceptabla artiklar, eller för att ens avgöra gruvornas relevans. 90.227.175.244 1 december 2017 kl. 21.08 (CET)
- Precis, jag tror ingen har något emot om raderade artiklar återskapas med för ämnet relevant innehåll. -- 109.228.149.82 2 december 2017 kl. 07.41 (CET)
Koordinater och avstånd
[redigera wikitext]Om man känner koordinaterna för två punkter på jordytanm kan det vara intressant att veta avståndet mellan dem. Det är inte något jag räknar ut i huvudet, inte ens approximativt, men det är ganska enkel trigonometri, om man amtar att jordklotet är en perfekt sfär och bobortser från tillplattningen vid polerna. Min fråga är om det finns en rutin tillgänglig för allmänt bruk som gör denna beräkning, och om det inte gör det, om det är någon som är villig att skriva den. Formlerna kan jag bidra med Detta skulle göra det lättare att identifiera möjliga dubbletter, när koordinaterna inte är exakt lika. Roufu (diskussion) 26 november 2017 kl. 17.12 (CET)
- Det finns api:n, t.ex https://sv.wikipedia.org/w/api.php?action=query&list=geosearch&gscoord=60.1%7C15.1&gsradius=2000&format=xml&gslimit=500 ger artiklarna med primärkoordinater inom 2000 meter från punkten 60.1,15.1. Taxelson (diskussion) 26 november 2017 kl. 17.59 (CET)
- Hm, det var kanske ett goddag-yxskaft-svar, men jag kom inte riktigt underfund med hur frågans båda delar riktigt hänger ihop. En räknesnurra som beräknar avstånd mellan två koordinatpar kan man ju göra, men hur man ska använda den för att hitta dubbletter förstår jag inte riktigt. Att köra ett skript på en lista med artiklar och identifiera de som ligger nära varandra (och har liknande namn) kan nog också gå att åstadkomma, men är en lite annan uppgift. Själv bygger jag ganska ofta den typen av verktyg i php, men kan ofta bara köra dem lokalt p.g.a för långa exekveringstider och andra begränsningar på det webbutrymme jag har på webbhotell, vilket gör det lite bökigt att dela med sig av, då man måste installera en egen virtuell server för att använda det. Taxelson (diskussion) 26 november 2017 kl. 18.13 (CET)
- @Roufu: Jag delar Taxelson undran om vad det egentligen är du vill göra. Jag har gjort en testmall som returnerar avståndet mellan två punkter givet dess koordinater. Det går naturligtvis att utveckla den till att acceptera andra format för indata och så vidare, men innan jag lägger mer tid på det är det bra om jag förstår vilket problem som ska lösas.
- Här är ett exempel:
Avståndet mellan Lycksele kyrka 64°35′54″N 18°40′33″Ö / 64.598417°N 18.675867°Ö och Forsdalakyrkan 64°34′50″N 18°40′19″Ö / 64.580683°N 18.671867°Ö är cirka 1 980 meter. - Det ser ut att stämma med vad man får om man använder till exempel eniro.
- --Larske (diskussion) 26 november 2017 kl. 20.07 (CET)
- Jag har inte så stora ambitioner. Jag önskar helt enkelt kunna veta hur långt det är mellan två punkter vars koordinater (latitud och longitud) jag känner från Wikipedia.
- Larskes testmall gör sannolikt det tillräckligt bra för mig. Jag vill gärna kunna öppna en sådan rutin i ett eget fönster ï Windows och kopiera dit koordinater, är andan faller på. Nu senast för GeoNames "gruvor" i Atacamaöknen i Chile, där den bergarten caliche finns i ett tunt lager under markytan i stora områden, och där övergivna salpeterbruk numera är världsarv.
- Min egen programmeringserfarenhet började tidigare än de flestas (med maskinspråk för SMIL i Lund 1962), men jag har nu inget högnivåspråk på PCn, som jag själv behärskar. Roufu (diskussion) 27 november 2017 kl. 12.15 (CET)
- @Roufu: Då kanske du kan öppna den här sidan i ett eget webbläsarfönster. Med exempelkoordinater från Lycksele ger den resultatet 1,981 km. --Larske (diskussion) 27 november 2017 kl. 12.28 (CET)
- @Larske: Tack för hjälpen- Roufu (diskussion) 27 november 2017 kl. 13.06 (CET)
- @Roufu: Ett annat sätt, om du hellre vill utgå från artiklarnas objektidentiteter i Wikidata, är att du öppnar den här sidan i ett webbläsarfönster. Genom att stoppa in de två objektens "qid" på de två raderna som börjar med
VALUE
och trycka på ikonen med en vit pil nere till vänster får du, under förutsättning att båda objekten har koordinater, en resultatrad med avståndet avrundat till hela meter. Även här blir resultatet 1 981 meter med exempelplatserna. --Larske (diskussion) 27 november 2017 kl. 13.11 (CET)
- @Roufu: Ett annat sätt, om du hellre vill utgå från artiklarnas objektidentiteter i Wikidata, är att du öppnar den här sidan i ett webbläsarfönster. Genom att stoppa in de två objektens "qid" på de två raderna som börjar med
County i Kanada (eller åtminstone i Ontario)
[redigera wikitext]Regional Municipality of Niagara säger att 'Regional Municipality of Niagara är ett "county".' Det är iofs en korrekt beskrivning, men den är inte särskilt informativt. De flesta vet inte vad ett "county" är, eftersom det i princip kan vara nästan vad som helst, beroende på var det ligger. Utifrån en:Census divisions of Ontario tolkar jag det som att en "Regional Municipality" bättre beskrivs som en sekundärkommun. Den sysslar inte exakt med samma saker som våra landsting och regioner, men den ger i vilket fall kompletterande kommunal service bredvid mer lokala kommuner. Alla enheter på denna "nivå" går dock inte att beskriva som sekundärkommuner, eftersom "Single-tier Municipalities" likt Gotland saknar primärkommuner, och "Districts" saknar kommunala funktioner. Det här ser inte enkelt ut att gå att lösa med robot, men jag tror vi behöver diskutera och dokumentera det här någonstans, så ... -- 109.228.149.82 27 november 2017 kl. 13.41 (CET)
- Samma problem finns i hela Kanada. Boten har kallat alla administrativa enheter på den här nivån 'county' trots att den termen i Kanada bara används i några provinser om vissa typer av enheter. Om 'sekundärkommun' (eller något annat svenskt ord) beskriver enheten bättre på svenska tycker jag det kan användas tillsammans med den rätta kanadensiska termen. Dessutom behövs en utökning av artikeln om Kanadas administrativa indelning eventuellt med underartiklar för provinserna, så att det finns åtminstone en kort förklaring av de olika typerna av admininistrativa enheter. 90.227.175.244 27 november 2017 kl. 20.36 (CET)
- Gjort ett litet försök att beskriva hur det fungerar i Ontario. Jag vet nog mer när jag jobbat mig igenom de här artiklarna. -- 109.228.149.82 29 november 2017 kl. 10.05 (CET)
- I Haldimand County har vi ett exempel på där det gått riktigt snett. Det är bara ett County till namnet. I själva verket är det en stad. -- 109.228.149.82 30 november 2017 kl. 10.07 (CET)
- Gjort ett litet försök att beskriva hur det fungerar i Ontario. Jag vet nog mer när jag jobbat mig igenom de här artiklarna. -- 109.228.149.82 29 november 2017 kl. 10.05 (CET)
- Funderar på kategoriseringen i Kanada. Det är en j-a röra, helt saknande enkel struktur i det här landet. Vad sägs om att kategorisera efter folkräkningsområden under provins-nivå? Det ser ut att vara den enda enhetliga indelningen som funkar i hela landet. Sedan kan åtminstone Ontarios kommuner kategoriseras efter typ. Regional Municipality of Niagara är då en Regional Municipality, en typ av sekundärkommun. -- 109.228.149.82 30 november 2017 kl. 10.42 (CET)
- Jag tycker det är viktigare att kategoriseringen inom varje provins fungerar bra än att ha en det är samma kategorisering i hela landet. Men syftet med indelningen i folkräkningsområden är just att skapa en nivå mellan provins och kommun som fungerar bra för statistikändamål. Den verkar använda mellannivåerna i de provinser som har sådana (t.ex. MRC i Québec och regional districts i BC). Där mellannivån saknas grupperas kommunerna på ett genomtänkt sätt för att skapa en mellannivå. Det borde fungera bra även för oss när vi behöver kategorisera under provinsnivån. I territorierna finns inte så många folkräkningsområden (i Yukon bara ett), men där finns kanske inte heller lika mycket att kategorisera i underkategorier. Kategorisering av kommuner efter typ inom en provins låter bra. 90.227.175.244 3 december 2017 kl. 21.16 (CET)
- En nackdel är att det tvingar fram en massa främmande ord i kategorierna. För skillnaden mellan en 'single tier town' och en 'lower tier city' skulle riskera försvinna i en översättning!?
- Det röriga kan bli att det finns single tier kommuner som folkräkningsmässigt tillhör ett county, men som administrativt är självständiga. Det kräver tydlighet i brödtext och kanske också några ord i kategorisidorna. -- 109.228.149.82 4 december 2017 kl. 09.09 (CET)
- Jag tycker det är viktigare att kategoriseringen inom varje provins fungerar bra än att ha en det är samma kategorisering i hela landet. Men syftet med indelningen i folkräkningsområden är just att skapa en nivå mellan provins och kommun som fungerar bra för statistikändamål. Den verkar använda mellannivåerna i de provinser som har sådana (t.ex. MRC i Québec och regional districts i BC). Där mellannivån saknas grupperas kommunerna på ett genomtänkt sätt för att skapa en mellannivå. Det borde fungera bra även för oss när vi behöver kategorisera under provinsnivån. I territorierna finns inte så många folkräkningsområden (i Yukon bara ett), men där finns kanske inte heller lika mycket att kategorisera i underkategorier. Kategorisering av kommuner efter typ inom en provins låter bra. 90.227.175.244 3 december 2017 kl. 21.16 (CET)
- Hittade en äldre kommentar om ungefär samma ämne på Kategoridiskussion:Countyn i Ontario. 90.227.175.244 31 december 2017 kl. 11.02 (CET)
- Ontarios administrativa indelning finns redan också, även om den säkert kan förbättras. //Essin (diskussion) 3 januari 2018 kl. 19.41 (CET)
Sjö vid sjö
[redigera wikitext]Lake Moodie (sjö i Kanada) ligger enligt artikeln "ligger vid sjön Lake Gibson." En sjö som ligger vid en annan sjö låter som en hydrologisk utmaning. Sjöarna är grannar, utan tvekan. Går det att fixa det här så att det låter vettigare? -- 109.228.149.82 3 december 2017 kl. 11.03 (CET)
- Jag brukar byta ut till ”ligger norr/söder/väster/öster om” eller ”ligger nära”. Kitayama (diskussion) 3 december 2017 kl. 11.48 (CET)
- Det verkar som det finns långt över 10 000 (troligen närmare 20 000) sjöar i Kanada som "ligger vid sjön" Lake X, Y, osv. Sjunnesson (diskussion) 3 december 2017 kl. 14.01 (CET)
- Någon som vågar sig på att göra det här med bot? -- 109.228.149.82 3 december 2017 kl. 14.18 (CET)
- Frasen "ligger vid sjön" finns i 32 083 artiklar i Kategori:Robotskapade Kanadaartiklar. Då ingår inte bara sjöar utan även andra "platser" som vattendrag, orter och county. I kategorierna under Kategori:Insjöar i Kanada är det 20 313 artiklar som har denna fras.
- Själv är jag är inte så besvärad över "vid sjön" och är därför tveksam till hur angeläget det är att göra denna ändring i tiotusentals artiklar? --Larske (diskussion) 3 december 2017 kl. 15.13 (CET)
- Att orter och annat skräp ligger "vid sjön" har jag inget emot. Det är att ett vatten tycks ligga "vid" ett annat vatten som stör mig. Två sjöar som ligger skavfötters brukar inte kunna låta bli att blanda sitt vatten med varandra. Och då är det inte längre två sjöar, utan en enda. -- 109.228.149.82 3 december 2017 kl. 17.18 (CET)
- Jag tror visst att det kan finnas en hel del fall där sjöar ligger alldeles invid varandra. Ottersjön (Kilanda socken, Västergötland) och Tinnsjön, Västergötland ligger kloss intill varandra. De skiljs åt av en smal vägbank och var åtskilda även innan vägen byggdes. Ta en titt på kartan. /Ascilto (diskussion) 3 december 2017 kl. 17.31 (CET)
- Absolut, men det är knappast det i alla de här 30000 fallen. -- 109.228.149.82 3 december 2017 kl. 20.19 (CET)
- Jag tror visst att det kan finnas en hel del fall där sjöar ligger alldeles invid varandra. Ottersjön (Kilanda socken, Västergötland) och Tinnsjön, Västergötland ligger kloss intill varandra. De skiljs åt av en smal vägbank och var åtskilda även innan vägen byggdes. Ta en titt på kartan. /Ascilto (diskussion) 3 december 2017 kl. 17.31 (CET)
- Att orter och annat skräp ligger "vid sjön" har jag inget emot. Det är att ett vatten tycks ligga "vid" ett annat vatten som stör mig. Två sjöar som ligger skavfötters brukar inte kunna låta bli att blanda sitt vatten med varandra. Och då är det inte längre två sjöar, utan en enda. -- 109.228.149.82 3 december 2017 kl. 17.18 (CET)
- Någon som vågar sig på att göra det här med bot? -- 109.228.149.82 3 december 2017 kl. 14.18 (CET)
- Det verkar som det finns långt över 10 000 (troligen närmare 20 000) sjöar i Kanada som "ligger vid sjön" Lake X, Y, osv. Sjunnesson (diskussion) 3 december 2017 kl. 14.01 (CET)
Kommuner och orter i Belgien - nytt försök
[redigera wikitext]Jag har försökt att få ordning på kommuner och orter i Belgien, men arbetet har nu stoppat up i väntan på en botkörning. Väntan ger emellertid tillfälle till eftertanke, och jag har därför nu gjort några mindre ändringar i förslaget till botkörning. Om detta inte duger eller är för komplicerat för tillgängliga robotar, är jag beredd på att göra ändringarna manuellt. Jag behöver då hjälp av administratör för cirka 240 flyttningar.
För de belgiska kommmuner/orter som behandlats manuellt på svenska finns bara en gemensam artikel, och så är det också på andra språk utom cebuano. Där liksom på svenska har Lsjbot genererat två skilda artiklar med GeoNames som utgångsoyunkt. Skillnaden är liten, men kommunen, som omfattar ett större område, har naturligt nog fler invånare.
För den slumpvis valda kommunen/orten Durbuy är skillnaden 7.5 %. Efterson ytangivelser helt saknas i i artiklarna, vet man ändå ingenting om befolkningsfördelningen i ortens omland. Den angivna befolkningstätheterna är identiska och kommunen ligger 9 meter högre över havet än orten., helt ointressant.
Utom befolkningsuppgifterna finnns ingenting som kan motivera skilda artiklar för kommun och ort. Menar man emellertid att denna skillnad är viktig, skulle bägge befolkningssiffrorna kunna läggas i samma artikel. Så vitt jag kan se kräver detta ett tillägg till den använda mallen Geobox. Sådana tillägg anges som är farliga att göra för oerfarna användare, dit jag själv raknar mig. Är det möjligt att få hjälp med detta? Roufu (diskussion) 5 december 2017 kl. 12.02 (CET)
- Tror inte att Gebox behöver utökas, den har redan möjlighet att visa ett stort antal olika befolkningar, se exempel nedan:
- Det gäller bara att bestämma vad det ska stå på de olika raderna.
Exempel | |
Folkmängd | |
---|---|
- tätort | 123 456 |
- kommun | 234 567 |
- storstadsområde | 345 678 |
- vad du vill | 111 111 |
- och så vidare | 222 222 |
- folkmängd 3 | 333 333 |
- folkmängd 4 | 444 444 |
- folkmängd 5 | 555 555 |
- folkmängd 6 | 666 666 |
- folkmängd 7 | 777 777 |
- folkmängd 8 | 888 888 |
- folkmängd 9 | 999 999 |
- folkmängd 10 | 987 654 |
- folkmängd 11 | 876 543 |
- folkmängd 12 | 765 432 |
- --Larske (diskussion) 5 december 2017 kl. 12.43 (CET)
- Tack för hjälpen. Jag förstår nu att jag kan lägga till de nödvändiga raderna som saknas i mallen som den visades i kommunartikeln för mitt exempel Durbuy. Roufu (diskussion)
- I det här fallet ser det ut som befolkningsuppgiften för Durbuy (ort) egentligen gäller hela kommunen omkring år 2004 (den lades in i geonames 2006). I Durbuy (kommun i Belgien) finns motsvarande siffra från 2010 (då den lades in i geonames). Enligt franska Wikipedia finns flera orter i kommunen med betydligt större befolkning än Durbuy. Här tycker jag inte en sammanslagning kan motiveras med att det är liten skillnad mellan kommun och ort. Däremot kanske ortartikeln kan raderas eftersom den bara baseras på koordinaterna och ett felaktigt invånarantal, samt att vi inte har någon bättre källa än geonames. 90.227.175.244 5 december 2017 kl. 18.47 (CET)
- Sett samma i Kanada. Ort-artiklarna kan ha helt upp på väggarna data när det kommer från GeoNames. I något exempel hade kommunen 130000 invånare medan orten hade bara några tusen mindre. Statistics Canada påstod å andra sidan att folkmängden i orten var tre gånger större, dvs ungefär som Stockholm där tätorten är halvannan gång större än kommunen. -- 109.228.149.82 8 december 2017 kl. 20.20 (CET)
Mitt personliga intresse för Belgien är minimalt. Genom Alexander Kiellands roman Gift (1883) har Belgiens städer blivit en symbol i Norge för meningslösa skolkunskaper.
Min tanke var emellertid att efter städning skulle vi få en heltäckande samling artiklar om Belgiens kommuner, där bot-artiklarna fyllde de hål, som lämnats av de manuellt skapade artiklarna. I väntan på en bot-körning, som jag tvivlar på någonsin blir av, tänkte jag så att de botproducerade kommunartiklarna kunde kompletteras med de enda meningsfulla upplysningarna som fanns i motsvarande ortsartiklar - invånartalen för huvudorterna.
Jag valde en kommun, Durbuy (kommun i Belgien), helt sluimpvis för att visa källäget. Jag förstår nu, att invånarantalet för Durbuy (ort) betecknar något annat än vad jag trodde. Att djupdyka i varenda belgiska kommun och beskriva den verkliga befolkningsfördelningen (hvudort - mindre orter - landsbygd) ligger utanför mitt program. Det var att städa i botartiklarna, inte att ersätta dem med nya manuellt skrivna artilar.
Jag har därför gått tillbaka till min ursprungliga tanke, att helt bortse från innehållet i ortsartiklarna. De blir omdirigeringar till kommunartiklarna och kommer därmed att finnas kvar i historiken. Kommunartiklarna har nu hanterbara namn i fall med namnlikhet med andra företeelser och interwikilänkar till andra språkversioner, inte bra till cebuano. När projektet är färdigt, kommer de vidare i typiska fall ha kommunens namn utan särskiljande kvalifikationer. För ett litet land som Belgien menar jag vidare att de botproducerade kommunartiklarna inte är helt meningslösa.
Innan jag gav upp tanken på att överföra ortsdata till kommunartiklarna, han jag lägga in invånarsiffror för tätort i följande kommuner i Antwerpenprovinsen: Hemiksem, Kalmthout, Niel, Ranst, Rumst, Schelle, Stabroek, Wijnegem, Zandhoven, Puurs, Sint-Amands, Dessel, Grobbendonk och Herenthout. Det är fritt att undersöka om dessa upplysningar har något värde eller om de är meningslösa som för Durbuy (ort). Roufu (diskussion) 12 december 2017 kl. 19.13 (CET)
- Även om jag principiellt anser att vi bör ha artiklar för både orter och kommuner ställer jag mig bakom Roufus hantering av belgiska förhållanden. Vi måste i den uppkomna situationen hitta realistiska lösningar. Tostarpadius (diskussion) 13 december 2017 kl. 05.56 (CET)
- Jag misstänker att alla robotskapade ortartiklar i Belgien med samma namn som en kommun har fått kommunernas invånarantal. Det har gjorts två större inläggningar av invånarantal för de här orterna och kommunerna i Geonames. Först (2006) fick ortobjekten siffror som ser ut att vara kommunernas invånarantal ca 2004. Några år enare (2010) lades då aktuella kommunsiffror i kommunobjekten. Bland de ovan nämnda kommunerna finns flera som enligt geonames karta och nederländska wikipedias artiklar består av flera orter, och där de robotskapade ortartiklarnas invånarantal inte kan stämma. Omdirigering är ett bra sätt att bli av med de här felen. 90.227.175.244 13 december 2017 kl. 19.55 (CET)
Jag tackar för kommentarerna och stödet till mitt projekt så långt. Jag är ändå osäker på om det är någon mening att fortsätta med det.
Undefär 240 sidor har samma botproducerade datastruktur, där jag betecknar kommnnamnet med X.
1. Huvudsidan "X" grenar till "X(församling)" OCh "X(ort)".
2. "X (församling)" omdirigerar till "X (kommun i Belgien)".
3. "X ( kommun i Belgien)" inehåller bot-producerad information samt interwikilänkar till andra språk.Detta är denna sida som skall bevaras.
4. "X(ort)" innehåller liknande information som "X (kommun i Belgien)" men befolkningssiffrorna är felakt. Det är enighet om att denna sida skall omdirigeras till kommunsidan .
Den naturliga lösningen på detta är att flytta "X (kommun i Belgien)" till "X" samt låta de andra tre sidorna bli omdirigeringar till "X". Man kan uppnå detta på tre sätt:
1. Med robothjälp. Jag bad detta 5 november, men det är ingen som är intresserad. Den rekation jag har fått är att listan inte var fullständig. Den är nu ungefär dubbelt så lång. Jag är medveten om att ingen har plikter i Wikipedia. Kanske är uppgiften för krånglig för att vara av intresse. Kanske är den för otydligt beskriven.
2. Manuellt utförda flytningar och omdirigeringar. För detta krävs det administratörshjälp för flyttningen av "X (kommun i Bergen)" till "X". Det är som ssagt cirka 240 sådana flyttningar. För att inte överbelasta administratörerna, kan jag tänka mig att lägga ut 10 om dage på BOÅ. Denna del av uppgiften blir då genomförd på i underkant av en månad.
3. Som föregående men med klipp och klistra flytt av "X (kommun i Belgien)" till "X". Det skapar oreda i historikerna och är mot reglerna, men förstör inte någon information. Omm man gör en flyttning i minuten är det 4 timmars arbete. Till detta kommer tid för att sättta upp uppgiften och få rutin, men detta är överkomligt. Min fråga är om klipp och klistra kan tolereras i ett fall som detta?
Det finns invändningar mot alla tre lösningsförslagen och jag kan tänka mig att detta hindrar att projektet genomförs. Detta är synd, eftersom Belgien är ett litet land, som borde vara överkomligt. Roufu (diskussion) 17 december 2017 kl. 00.49 (CET)
- @Roufu: Jag tog mig friheten att lägga in en tabell under din lista. Den visar på var det finns undantag från det generella mönstret med "X", "X (kommun i Belgien)", "X (ort)" och "X (församling)". Antalet undantag är ganska litet, men det är kanske enklast att hantera dessa undantag manuellt. --Larske (diskussion) 17 december 2017 kl. 09.25 (CET)
@Larske: Tack för insatsen. Undantagen är av flera slag. Där huvudordet är rödlänkat, är det antagligen ett skrivfel från min sida. Jag ser gradvis sämre, och det gör det allt svårare att läsa korrektur. Det är ett problem som nästan alla äldre i min familj har fått. Så är det några där huvudordet är en grensida, och kommmunsidan finns, men den enna eller bägge de andra saknas. Det kan vara lika bra att behandla dessa manuellt. Slutligen är det Dessel, som YedDi åtgärdat manuellt och som skall strykas från listan. Roufu (diskussion) 17 december 2017 kl. 14.59 (CET)
- @Larske: Jag har rättat felskrivningar och tagit bort delvis rödlänkade kommuner för separat behandling. Jag hoppas att listan nu är i sådant skick att den kan användas. Roufu (diskussion) 18 december 2017 kl. 01.50 (CET)
Parish på Barbados
[redigera wikitext]Boten har kort och gått döpt den administrativa indelningen på Barbados för parish, jag tycker inte detta låter som något svenskt. Det finns en lista på svenska: Barbados församlingar som listar dessa administrativa regioner, men jag skulle inte vilja kalla dessa församlingar utan snarare regioner. Jag har inte funnit något annat på svenska som säger vad det ska heta. Är det någon som har något emot att de får heta regioner eller finns bättre förslag? Kolurpen (diskussion) 8 december 2017 kl. 17.21 (CET)
- Är inte Barbados ganska mycket för litet för att kunna delas in i regioner eller provinser? Socknar kunde kanske funka, de var administrativa enheter på ett annat sätt än vad församlingar någonsin varit. /Ascilto (diskussion) 8 december 2017 kl. 17.26 (CET)
- Socken är bra, men känns lite väl skandinaviskt. Distrikt kanske? Låter mindre än region och provins (håller med Ascilto att Barbados känns för litet för dessa ord). Kitayama (diskussion) 8 december 2017 kl. 17.34 (CET)
- Jag håller med om att distrikt verkar kunna passa. /Ascilto (diskussion) 8 december 2017 kl. 17.38 (CET)
- Är inte beteckningarna övertagna från Storbritannien? @Swave 2: eller @Maundwiki: borde veta. Roufu (diskussion) 8 december 2017 kl. 20.02 (CET)
- Jag håller med om att distrikt verkar kunna passa. /Ascilto (diskussion) 8 december 2017 kl. 17.38 (CET)
- Socken är bra, men känns lite väl skandinaviskt. Distrikt kanske? Låter mindre än region och provins (håller med Ascilto att Barbados känns för litet för dessa ord). Kitayama (diskussion) 8 december 2017 kl. 17.34 (CET)
- Bot-artiklarna kan ha helt uppåt väggarna benämningar på indelningarna ibland, men försöka försvenska dem utan goda källor tycker jag vi ska vara försiktiga med. -- 109.228.149.82 8 december 2017 kl. 20.23 (CET)
- I enwp en:Parish (administrative division) "it is known as a civil parish to distinguish it from the ecclesiastical parish". Inte enbart församling eftersom enligt svwp "kristen församling" men kanske med tillägg "administrativ församling" men ingen extern källa som stöder. Google Translate => socken som stämmer med svwp Parish men det tycker jag är en äldre benämning. För alla dessa länder med administration som har sitt ursprung ur Storbritannien behöver troligen enwp artikeln Parish (administrative division) översättas. Distrikt passar också med det senaste i Sverige men kan vara allt från litet till stort. Kommun, franska kommuner t.ex. är mycket små, är ett alternativ, även de svenska landskommunerna var små. Men om vi inte har en klar beskrivning och benämning på svenska av vad det är kvittar namnet. Vi har "Parish" på svwp så vi kanske bör använda det. Om vi inte tycker det bör de artiklar som beskriver administration uppdateras för att peka i samma riktning. Det bör ske innan vi börjar ändra namn i artiklarna i de olika länderna även om Belgien ändrades från församling till kommun. Veckans tävling administrationsartiklar? Maundwiki (diskussion) 9 december 2017 kl. 14.00 (CET)
- Enligt en:Parishes of Barbados så verkar det som om dessa inte har någon beslutande försmling som de svenska kommunerna. De skulle nog mer kunnas liknas vid de distrik vi har i Sveige idag, användandet av termen distrikt skulle dock kunna vara förvirrande med de distrikt som fanns på ön under 50 och 60 talet. Sedna ser det ut som det finns en central kyrka i varje Parish vilket kanske betyder att det är någon typ av församling eller socken. Detta har jag dock inte funnit i någon källa.
- Det verkar dock vara så att det inte finns några bra källor för vad dessa Parish egentligen är eller för hur de ska översättas. Kolurpen (diskussion) 9 december 2017 kl. 21.37 (CET)
- Distrikt är en bra kompromiss. Parish är inte svenska. Och som IB-numret skriver ovan ska vi vara väldigt försiktiga med att försvenska utan goda källor. Bättre då att använda en generisk term som distrikt.--Gotogo (diskussion) 9 december 2017 kl. 22.04 (CET)
- Vi använder parish i Louisiana, men jag vet inte om det har samma brittiska ursprung som annorstädes. -- 109.228.149.82 13 december 2017 kl. 06.05 (CET)
- Att Louisiana administrativa enheter kallas "parishes" verkar ha att göra med de katolska församlingar som fanns när Louisiana var franskt, även om indelningen ändrats sedan dess. I Barbados är indelningen geografiskt de församlingar som skapades vid mitten av 1600-talet[3] för brittiska kyrkan. Det fanns en lag från 1885 att varje församling ska välja en "en:Vestry" för att ta hand om "local government matters". Men engelska Wikipedia säger att sedan 1967 finns inte "Local Government Councils" på församlingsnivå eftersom frågorna hanteras nationellt. Om inte "fösamling" fungerars som svensk översättning för de här indelningarna tycker jag det bästa är att använda den engelska termen. Sverige har infört distrikt baserat på församlingar men det gör inte att församlingsindelningar i andra länder kan kallas "distrikt". 90.227.175.244 1 januari 2018 kl. 20.22 (CET)
- Vi använder parish i Louisiana, men jag vet inte om det har samma brittiska ursprung som annorstädes. -- 109.228.149.82 13 december 2017 kl. 06.05 (CET)
- Distrikt är en bra kompromiss. Parish är inte svenska. Och som IB-numret skriver ovan ska vi vara väldigt försiktiga med att försvenska utan goda källor. Bättre då att använda en generisk term som distrikt.--Gotogo (diskussion) 9 december 2017 kl. 22.04 (CET)
- I enwp en:Parish (administrative division) "it is known as a civil parish to distinguish it from the ecclesiastical parish". Inte enbart församling eftersom enligt svwp "kristen församling" men kanske med tillägg "administrativ församling" men ingen extern källa som stöder. Google Translate => socken som stämmer med svwp Parish men det tycker jag är en äldre benämning. För alla dessa länder med administration som har sitt ursprung ur Storbritannien behöver troligen enwp artikeln Parish (administrative division) översättas. Distrikt passar också med det senaste i Sverige men kan vara allt från litet till stort. Kommun, franska kommuner t.ex. är mycket små, är ett alternativ, även de svenska landskommunerna var små. Men om vi inte har en klar beskrivning och benämning på svenska av vad det är kvittar namnet. Vi har "Parish" på svwp så vi kanske bör använda det. Om vi inte tycker det bör de artiklar som beskriver administration uppdateras för att peka i samma riktning. Det bör ske innan vi börjar ändra namn i artiklarna i de olika länderna även om Belgien ändrades från församling till kommun. Veckans tävling administrationsartiklar? Maundwiki (diskussion) 9 december 2017 kl. 14.00 (CET)
Kommunhuvudorter i Lettland
[redigera wikitext]Som diskuterats på bybrunnen under denna rubrik har det uppstått ett fel med kommunhuvudorterna i vissa länder. Jag har varit i kontakt med Lsj, som har skapat en kod för att rätta alla felen av denna typ. Han har kört den på cebwp och den fungerade, men den bör testas först här långsamt så att det inte finns några buggar. Han har ej botkonto här längre och kan därför ej testa den. Någon botägare får gärna använda koden som nu ligger på denna undersidan till detta projektet. Adville (diskussion) 10 december 2017 kl. 23.08 (CET)
- En fungerande länk till avsnittet i Bybrunnen eller inkopiering här sulle uppskattas. Roufu (diskussion) 11 december 2017 kl. 06.23 (CET)
- Fungerar inte länken till bybrunnen för dig? Jag kommer direkt till avsnittet med den. Adville (diskussion) 11 december 2017 kl. 07.22 (CET)
- Nu kommer jag nästan rätt, dvs. hamnar mitt i diskussionen om Lettland. Jag hamnade någon annan stans tidigare. Kanske blir sådana här länkar fel, när texten ovanför den plats det länkas till, ändrar längd.
- Eller så är det någon utvecklare som har bestämt att man skall börja läsa mitt i avsnittet och inte från början. Så har det i längre tid varit med kommandona Nästa/föregående sida på långa kategorilistor. Det hade varit mycket lättare, om man hamnade i början av sidan man flyttar till. Då kunde man bläddra vidare med ett musklick. Den som försöker bläddra i Kategori:Män ser fort hur tuungvint det nuvarande systemet är. Roufu (diskussion) 13 december 2017 kl. 08.23 (CET)
- Jag märker också ofta det problemet. Adville (diskussion) 13 december 2017 kl. 09.07 (CET)
- Problemet härstammar ofta från kollapsade tabeller och mallar. -- 109.228.149.82 13 december 2017 kl. 17.18 (CET)
- @Fluff:? -- 109.228.149.82 13 december 2017 kl. 17.21 (CET)
- @Adville:, @Roufu: Kikar på det senare idag om ingen annan har kikat, eller är på gång att kika, på det. /Fluff?Fluff! 17 december 2017 kl. 08.23 (CET)
- Har kört en städomgång med Fluffbot, de länder som var listade i LSJ:s kod skall vara rättade. /Fluff?Fluff! 17 december 2017 kl. 12.11 (CET)
- Felen finns fortfarande kvar i dubblettartiklar som Användare:Lsjbot/Dubletter/Ta' Xbiex (kommun). Det kanske inte är så viktigt att rätta dem, men det kan vara bra att veta om man vill flytta information därifrån till artikelrymden. 90.227.175.244 31 december 2017 kl. 11.08 (CET)
- @Fluff:? -- 109.228.149.82 13 december 2017 kl. 17.21 (CET)
- Problemet härstammar ofta från kollapsade tabeller och mallar. -- 109.228.149.82 13 december 2017 kl. 17.18 (CET)
- Jag märker också ofta det problemet. Adville (diskussion) 13 december 2017 kl. 09.07 (CET)
- Fungerar inte länken till bybrunnen för dig? Jag kommer direkt till avsnittet med den. Adville (diskussion) 11 december 2017 kl. 07.22 (CET)
Narmada District
[redigera wikitext]Det finns tydligen ett Narmada District i Indien och ett i Indonesien (se Narmada District), men alla länkar jag hittills stött på leder enbart till distriktet i Indonesien (även om det som avses är distriktet i Indien). Jag kan för lite om geografiprojekten för att veta vilken åtgärd som är den bästa (t.ex vilket distrikt som bör ha företräde samt vad artiklarna borde heta). //Vätte (diskussion) 13 december 2017 kl. 18.01 (CET)
- Döpt om artikeln, ändrar på grensida, ändrat i artiklar som länkade till den gamla sidan. Om distriktet i Indien finns ju ingen artikel så det blir rödlänk. Kitayama (diskussion) 13 december 2017 kl. 19.10 (CET)
Skulle vara tacksam om någon kunde titta till artikeln Kurgalskij. Jag får inte till nålen på kartan över Leningrad oblast. Koordinaterna är ok, men ingen kartnål är synlig.--Gotogo (diskussion) 18 december 2017 kl. 13.27 (CET)
- Fixat Det var parametern map_locator som inte hade något värde. --Larske (diskussion) 18 december 2017 kl. 14.31 (CET)
Lista över interwiki
[redigera wikitext]En fråga till er tekniskt kunniga. Kan man få fram listor över artiklar inom Kategori:Estlands geografi som 1) saknar interwiki och 2) som endast har interwiki med cebuano? Gärna i form av åtgärdskategori (motsvarande Kategori:Artiklar med troligen alltför avrundade koordinater i Estland - som jag precis tömt och raderat). Alternativt i form av en lista (motsvarande: Användare:Gotogo/Lsjbot-dubbletter för Estland som Taxelson bussigt ordnade åt mig). I l istan över artiklar som saknar interwiki handlar det nog främst om artiklar där t.ex. jag glömt att lägga till interwiki under arbetet. I den andra listan kommer vi nog främst hitta artiklar med dubbletter på wikidata - jag har mergat tusentals objekt på wikidata. Jag tycker interwikin är ganska viktig, eftersom den ger viss relevans till de artiklar som annars bara har referenser till geonames. Om det är jättekrångligt att ta fram sådana listor är det kanske inte värt besväret, största nyttan är att det blir en indikator på att städarbetet går framåt (men även en lista över potentiellt svaga artiklar)./--Gotogo (diskussion) 22 december 2017 kl. 11.24 (CET)
- @Gotogo: Har nu tagit fram 2 tabeller på användare:kolurpen/Estland där den första bara innehåller artiklarna utan wd objekt och den andra med enbart länk till cebuano. Om du vill uppdatera tabellerna kan man bara trycka på länken före tabellen och lägga in texten man får på wikisida.Kolurpen (diskussion) 31 december 2017 kl. 13.18 (CET)
- Tack så mycket!/Gotogo (diskussion) 31 december 2017 kl. 15.55 (CET)
Sidnamn efter alfabet
[redigera wikitext]Lsjbot har producerat mycket som jag inte viste om. En sak är "Kategori:Sidnamn efter alfabet" med 25 underkategorier för de använda alfabeten eller teckensystemen. Den största underkategorin är "Kategori:Sidnamn med arabiska alfabetet" med 94789 sidor, nummer två är "Kategori:Sidnamn med kinesiska tecken" med 46473 sidor. Den minsta underkategorin är "Kategori:Sidnamn med syriska alfabetet" med 2 idor.De sidor, som jag har sett för kinesiska och arabiska är omdirigeringar till ordinära svenska artiklar producerade av lsjbot. Det finns inte något navigeringssystem för annat än det vanliga svenska alfabetetet, så jag kan bara ta stickprov i listorna.
Jag har bara prövat Mao Zedong bland kinesiska personnamn och räknar med att desaknar omdirigeringar från kinesisk skrift. För en stad kan det finnas två sätt att skriva namnet på kinesiska, Taiyuan och Taiyuan Shi. Bägge finns med med kinesisk skrift med länk till botartikeln "Taiyuan Shi (prefektur i Kina)", som i sin tur är en dubblett till den manuellt producerade "Taiyuan". Den senare har interwikilänkar och potential för vidare utveckling.
Jag räknar alltså med att Lsjbot har producerat två omdirigeringar från kinesisk skrift för varje botproducerad artikel. Det bör då finnas i överkant av 20000 unika geografiska botartiklar artiklar om Kina. Detta är den viktigaste lärdomen från "Kategori:Sidnamn med kinesisk skrift".
Det är självsagt omöjligt att gå igenom och eventuellt rätta upp dessa artiklar. Intresset för detta är minimalt. Belgien, Island och Lettland är hanterbara länder men inte Kina. Vi får leva med att Kina i svenska Wikipedia översvämmas av botproducerade meningslösheter och söka information om landets geografi i andra språkversioner.
För arabvärlden är probelemn ännu större, men mitt personliga intresse är just Kina. Roufu (diskussion) 29 januari 2018 kl. 21.09 (CET)
- För skoj skull kollade jag första artikeln på den arabiska kategorin, Ţāqcheh Jīq (botskapad) och kollade alla sidor som länkar dit. Det blev 9 olika stavningsvarianter som är botskapade och omdirigeras till denna artikeln (+ en lsjbot-sida och en länkning från ett berg). Hur många av dessa är nödvändiga? Alla med annat alfabet än vårt borde väl kunna raderas? (på svwp söker man på svensk stavning) Adville (diskussion) 29 januari 2018 kl. 22.24 (CET)
- @Roufu: Antalet robotskapade Kinaartiklar är 20 428. Du kan hitta den uppgiften i början av sidan Kategori:Robotskapade Kinaartiklar. Och på sidan Kategori:Robotskapade geografiartiklar hittar du antalet robotskapade geografiartiklar per land. --Larske (diskussion) 29 januari 2018 kl. 23.10 (CET)
Kumla | |
Tätort (stad) | |
Land | Sverige |
---|---|
Län | Örebro län |
Koordinater | 59°07′12″N 15°48′43″Ö / 59.12°N 15.812°Ö |
Kumlas läge på Kina-kartan
|
Jag tackaar för upplysningen. 20000 somm jag skrev var för få botskapade Kinaartiklar. Rätta talet var alltså 38000. Detta påverkar inte mitt resonemang. Antalet är oöverkomligt. Verklig information druinknar i botskapade meningslösheter.
Som exempel har jag tagit koordinaterna för svenska Kumla, som har en föredömlig kartrepresentation, och lagt in på karatn i en typisk botproducerad Kina-artikel. Ingen blir klokare av detta.
Tag sedan vilken som helst artikel i Kategori:Vattendrag i Shanxi utom den manuellt skapade Fenfloden och förklara vilken information den ger. Det är 46 artiklar att välja bland. Interwikilänkar finns inte annat än till cebuano. Man kan också gå andra vägen, från engelska en:Category:Rivers of Shanxi . Den har 10 manuellt producerade sidor. En är troligen felkategoriserad (en:Wuding River). Utom Fenfloden med dubbletten Fen He (vattendrag i Kina, Shanxi) finns ingen med på svenska Shanxilistan. Däremot finns de i Kategori:Vattendrag i Kina. Några har manuellt skapade artiklar eller stubbar, andra har botartiklar.
Jag kan lägga till provinskategorier och interwikilänkar, där de saknas, men sådana förbättringar blir bara en droppe havet av vad som behövs. Det som dominerar Kinas geografiär botproducerade artiklar utan specifik information om det beskrivna objektet. Jag upprepar mitt förslag om att sådana artiklar bör kunna tas bort ur den vanliga artikelrymden och placeras i "malpåse". Roufu (diskussion) 31 januari 2018 kl. 20.25 (CET)
- Jag förstår om undermåliga Kina-artiklar är ett problem, men menar du att omdirigeringarna är det? De kan lätt raderas i samband med att man raderar felaktiga artiklar. Jag för mig att vi inte har något emot omdirigeringar från ursprungsspråket till artiklar vi skall ha, vare sig det rör sig om Helsinki eller مدينة الكويت. Har jag missförstått något? --LPfi (diskussion) 6 februari 2018 kl. 16.09 (CET)
Jag blev överväldigad av antalet sidor med titlar med främmande skrivsätt (mer än 150000) och drog därav en alltför konservativ slutsats om antalet botartiklar om Kinas geografi. Samtidigt såg jag hur oerfarna användare, som fïrsökte lägga in främmande skrift i personartiklar bekämpades av en administratör, som till yttermera visso är byråkrat. Jag trodde då att sidtitlar med främmande skrift var oönskade och ville påpeka detta. Men nu skriver du @LPfi: att de inte är oönskade, och i diskussionen om personnamn, är det klart att vederbörande byråkrat inte har fått medhåll, så jag får tro att du har rätt.
De undermåliga Kina-artiklarna är inte principiellt felaktiga, de är meningslösa. Oartiklar är en wikipediaterm, som kanske passar på dem. Omdirigeringarna från främmande skrift ligger i egna kategorier och gör därför liten skada. Det är själva de botgenererade artiklarna som är det stora problemet, och det ligger flera olyckliga val bakom den rådande situationen.
Att utgångsdata från GeoNames inte är tillförlitliga är välkänt men inte grundproblemet enligt min mening. Kina är lika stort till ytan som Europa och har nära dubbelt så många invånare, medan Belgien är lika stort som Småland. Båda är självständiga nationer och behandlas likt av Lsjbot. Kinas provinser kan till antal och storlek jämföras med Europas nationer, inte med svenska landskap eller län. Avstånd och riktningar till Bryssel ger mening inom Belgien. Avstånd och riktning till Peking blir som att ange avståndet till Bryssel för geografiska företeelser i Sverige och Finland. Min Kinakarta med Kumla angivet i stället för en ort i Kina visar vidare hur dåligt hur dåligt Kina beskrivs av Lsjbot.
Man kan sedan se på texten i bot-artiklarna, se hur läget beskivs och vilka uppgifter som förmedlas. Jag avstår från detta här.
Jag räknar med att jag atort sett talar för döva öron, när jag tar upp dessa frågor. Problemet är för stort för att andra skall orka tänka på det. Det handlar om tyo 38000 artiklar, som dränker den information som faktiskt finns i de manuellt skrivna geografiska artiklarna, dära soeciellt @Bothnia: har utfört ett storverk. LPfi skall ha tack för att han har läst det jag skrivit ovan, men jag får inga kommentarer till frågan om att lägga bot-artiklar i malpåse. Om detta är för svårt att tänka på, är alternativet massradering av bot-artiklar, som inte kan interwikilänkas till andra språkversioner än cebuano. Är det en bättre lösning? Roufu (diskussion) 7 februari 2018 kl. 10.28 (CET)
- Jag har alltid menat att det är orimligt att anta att det skall gå att manuellt hantera bottartiklarna och att de behöver på något sätt tas bort ur den normala namnrymden tills de fått handpåläggning. Problemet är att framför man den åsikten så blir det ramaskri från folk som tycker det är fantastiskt roligt att vi har mängder med artiklar.
- andejons (diskussion) 7 februari 2018 kl. 11.00 (CET)
- Jag stödjer att vi lägger botskapade artiklar i malpåse. Jag har ju hållt på att jobba med lilla Estland i ett års tid. Det är helt orimligt att vi har tiotusentals artiklar om kullar, mossar och uddar i Indonesien och Kina som inget mänskligt öga har kvalitetssäkrat. Ett snabbt sätt att göra en första kvalitetssäkring är att göra listor med artiklar med enbart interwiki till cebuano. Som denna. Interwikin ger en viss fingervisning huruvida objektet finns och är relevant. Från nämnd lista har jag hittat många problemartiklar. Men det låter ju inte så lovande om interwiki helt saknas på de botskapade Kina-artiklarna. Man bör väl visserligen vara selektiv i vilka artiklar som läggs i malpåse, dvs. inte alla på en gång./Gotogo (diskussion) 7 februari 2018 kl. 13.25 (CET)
- @Gotogo: Så välstrukturerade listor som du visar för malpåsekandidater från Estland, kan det aldrig bli tal om för Kina. Med 38000 sidor att välja mellan skulle jag aldrig bli färdig.
- @Andejons: Jag uppfattar problemet med botproducerade oartiklar som specifikt för länder med stor utsträckning, där Kanada ,ed 240000 ich Aystralien med 80000 troligen är värst. Kanada är till ytan ungefär lika stort som Kina, medan Australien är något mindre. Jämfört med Kina är de extremt glesbefolkade. Genom att de har engelska som modersmål, är det är man inte lika hjälplös där som man är på Kina-kartan. Geonames verikar vidare ha inkluderat namntyper där som man skippat för Kina, t.ex. parker och idrottsplatser, som det är lätt att undgå, när man söker information. Själv har jag so starka personliga skäl att intressera mig för Kina och frustreras av botskapade oartiklar om ting som kanske, kanske inte finns i den lilla del av landet som jag personligen känner. Artiklarna saknar ju egentliga lägesuppgifter (jfr Kumla på Kinakartan). Roufu (diskussion) 8 februari 2018 kl. 05.16 (CET)