Hoppa till innehållet

Wikipediadiskussion:Projekt substubbar/Arkiv2008

Sidans innehåll stöds inte på andra språk.
Från Wikipedia

Jag fixade 10 av 13 artiklar som märkts som substub.

Sen är det två artiklar som gömmer en stor mängd likadana som inte märkts upp, dessa bör inte tas bort förrän alla i serien är fixade.

  • Det finns runt 100 Stadsdelar i Rio de Janeiro som jag skall redirecta någon gång.
  • Det finns runt 300 bilmodeller som Användare:Lglswe har skrivit, de kanske kan räknas som stubbar eftersom alla har en ifylld faktabox.

Alltså:Jag började med 13 substubbar och är nu uppe i 401 :-) /Johan Jönsson 24 februari 2008 kl. 20.26 (CET)[svara]

Den 16-19 maj 2008 fixade jag till stadsdelar i Rio de Janeiro. I stället för substubbar är de nu redirects till den sidan. --LA2 6 juni 2008 kl. 04.01 (CEST)[svara]
  • Bjärnå å är ett exempel på den långa lista av Finlandsstubbar som finns, de har skapats som en del i något svenskspråkigt finlandsprojekt. Som de flesta geo-stubbar så har de potential att bli något. Cirka två tredjedelar av de femtio artiklarna i Kategori:Finländska åar är extremt korta och av typen:
"Bjärnå å är en å i Bjärnå kommun, Egentliga Finland, finska Perniönjoki" med rätt kategorisering och stubmärkning. De kan antingen redirectas eller infogas i närmaste vattenområde eller kommun i brist på lättillgänglig svenskspråkig information. Fast de är ju så vackert upplagda så att en intresserad användare kan börja med att fylla i fakta istället för att fundera över mallar och kategorier, lätt att hitta också med det fina kategorisystemet. De får vara kvar som de är och nu har dessutom någon tyckt att Bjärnå å inte är substub./Johan Jönsson 9 mars 2008 kl. 20.43 (CET)[svara]
Ja, det finns en oändlig massa substubbar om finska åar, öar, sjöar och byar. Ofta utan att det finns en artikel om det på finska wikipedia. Det är svårt att avgöra hur relevanta alla dessa är. /Pieter Kuiper 20 mars 2008 kl. 21.27 (CET)[svara]
Bjärnå å var ett typexempel på de finska stubbartiklar, som jag just nu ägnar mig åt att infoga i artikeln för respektive kommun. Bjärnå passerades 12 april. Många småkommuner återstår, men de stora är åtgärdade. --LA2 17 april 2008 kl. 04.28 (CEST)[svara]
  • Catherine McCarthy är första exemplet jag stött på där jag vill radera artikeln i brist på information. Användare:Janee har utgående från en rad svenska femtiotalsfilmer skapat artiklar om alla skådespelare och musiker, i de flesta fall har de utvecklats till fina artiklar. Det finns dock några undantag bland Kategori:Brittiska kompositörer som inte blivit mer än substubbar sen de skapades 2005. Just Catherine är det svårt att hitta något om på nätet, förutom omnämnande i SFI-databasen men det är nog källan till Janees kunskap från första början./Johan Jönsson 20 mars 2008 kl. 21.17 (CET)[svara]
OK, hur gör jag nu, på WP:SFFR står det att artiklar inte skall anmälas för att de är bristfälliga och det rä skälet jag anför. Jag tror Catherine är relevnat annars./Johan Jönsson 21 mars 2008 kl. 14.11 (CET)[svara]

Galet projekt

[redigera wikitext]

Inledningstexten på projektsidan är alldeles för vänlig mot substubbarna. Alla tänkbara metoder för att rädda dem läggs fram, och på slutet nämns radering som ett sista undantag. Utgångsläget borde i stället vara att substubbar ska raderas, och sedan kunde man räkna upp några få undantag. Som projektet är formulerat nu kommer det aldrig att gå i land. Det kan ta flera minuter att leta upp fakta (finns verkligen den här orten, personen, fabriken) för att bygga ut substuben och det tar åtminstone en minut att göra en ihopslagning på rätt sätt. Multiplicera det med många tiotusentals substubbar. Radering däremot går fort och då kunde man beta av ett stort antal stubbar på rimlig tid och få lite framgång. En första fråga kunde ju vara: Hur många substubbar finns det idag? Enligt Wikipedia Statistics har sv.wp över 56% av artiklarna som är längre än 512 bytes, dvs att 44% är stubbar (att jämföra med 70%/30% för no.wp och 81%/19% för ru.wp). Men hur många är substubbar? Det står på projektsidan att när projektet startade fanns det 233 substubbar. Hursa? Har man glömt några nollor på slutet, där kanske? --LA2 30 mars 2008 kl. 22.56 (CEST)[svara]

Jag tycker det är rätt utgångspunkt. Jag tycker inte att vi behöver ha så bråttom, det här är inget projekt som kommer att ta ett par veckor att färdigställa, eller ens några månader eller några år. Det är ett projekt vi alltid kommer att ha framför oss och det är inget fel i det. För övrigt har vi bara drygt 1100 artiklar under 100 bytes, dessa borde vara en bra första utgångspunkt. Dessa listas i Special:Korta sidor. /Grillo 30 mars 2008 kl. 23.01 (CEST)[svara]
Många av dessa är förgreningssidor. De borde inte vara med i en sådan lista. /Pieter Kuiper 30 mars 2008 kl. 23.21 (CEST)[svara]
Listan listar korta sidor rakt av, den tar inte hänsyn till vad de innehåller. Många av förgreningssidorna är dessutom onödiga. förr skapade vi alltid förgreningar om det fanns mer än en betydelse, numera har vi blivit mer flexibla. /Grillo 30 mars 2008 kl. 23.22 (CEST)[svara]
Detta projekt handlar om substubbar, artiklar märkta med {{substub}} och som hamnat i kategorin Kategori:Substubbar, inte samtliga korta stubbar. Att klassa ett projekt som galet är inte särskilt konstruktivt. Finns det konsensus för att substubbar ska raderas? I många fall tycker jag att infogningar är att föredra. Det vore som sagt väldigt bra om Korta sidor kunde på ngt sätt sålla bort förgreningssidor och wiktionarymärkta sidor så man skulle kunna fokusera på de övriga. / Elinnea 31 mars 2008 kl. 03.32 (CEST)[svara]
Min analys av vad konsensus för substubbar är att de är okej att radera om de innehåller absolut ingen information, alternativt består av klotter. I andra fall är det något kontroversiellt, men de flesta verkar inte se något problem med att radera mikrostubbar. Det verkar vara en generationsfråga, de som varit med sedan WP:s begynnelse verkar vara mindre benägna att vilja radera substubbar. De som är nya verkar i vissa fall även kunna tänka sig att radera korta okej artiklar. Jag personligen tycker att information så långt det går bör bevaras. Samtidigt tycker jag att man kan radera artiklar som skapats mekaniskt, ett bra exempel är att det av artiklarna om de kanadensiska politikerna inte ens framgick om de fortfarande levde eller var aktiva. Artiklar som saknar så basal information kan i min mening raderas. /Grillo 31 mars 2008 kl. 16.38 (CEST)[svara]

Om man i stället för markeringen {{substub}} utgår från artiklarnas längd så hittar man flera tusen artiklar som är kortare än, säg, 150 tecken. Enklaste sättet är att söka med CatScan under kategori:Stubbar och några nivåer ner. Borde jag kanske låta en bot lägga in markeringen {{substub}} i alla dessa? Då får ni ju lite mer att göra här i projektet. --LA2 13 april 2008 kl. 22.59 (CEST)[svara]

Jag har följt LA":s exempel lite ikväll och jag infogade och omdirigerade några finska 'byar'. Det är ganska mycket jobb, upptäckte jag, särskilt när man inte vet något om dessa finska kommuner. Mitt intryck är att 'byarna' oftast består av inte mycket mer än en enda gård och några hus. Dessutom finns det stubbar på några få ord om enstaka (obebodda?) skär som råkar ha ett svenskt namn. Jag tror att det är lika bra om en administratör bara raderar dem. /Pieter Kuiper 13 april 2008 kl. 23.33 (CEST)[svara]
På danska Wikipedia ägde den stora stubbröjningen rum sommaren 2005. Användaren Twid satte då igång en robot som raderingsmarkerade alla substubbar. Borde vi göra något likande? --LA2 16 april 2008 kl. 20.09 (CEST)[svara]
CatScan verkar vara en mycket bra funktion för att hitta de allra kortaste artiklarna. Kanske borde man tipsa varje ämnesprojekt att de kan använda den för att hitta "sina" allra kortaste stubbar och åtgärda dessa. Det med raderingsmärkning av alla substubbar är nog något som bör tas upp på Bybrunnen, snarare än här. {{Substub}} förändrades nyligen, så nu står det att de riskerar att raderas om de inte utökas. Jag tror i många fall att infogning är bättre än radering, men det det kräver visserligen mer jobb. Som sagt jag tror att det vore bra med en stor diskussion kring detta, Wikipedia:Lägsta godtagbara artikelkvalitet är väl ett försök till en sådan diskussion tror jag, men den handlar om kvalitet snarare än antal bytes. Jag tror att vi behöver komma fram till någon slags gräns som folk kan vara eniga kring. / Elinnea 17 april 2008 kl. 10.46 (CEST)[svara]

Toppdomäner

[redigera wikitext]

Har egentligen ingen aning om var jag borde lägga det här inlägget, men eftersom det behandlar substubbar får det bli här. I princip samtliga artiklar (.se, .fi, .com är några av undantagen) om toppdomäner ser ut som .aw, dvs X är Y. Ska dessa artiklar raderas (och garanterat återskapas) eller kanske länkas till lista över toppdomäner? Eller ska det få vara kvar som de är, och förhoppningsvis utvecklas? //Lelle1987 10 april 2008 kl. 21.15 (CEST)[svara]

Jag föreslår lista; trenden går mot att de lämnas som de är utan någon som helst vidare förklaring. De artiklar som är längre (t.ex .se) bör väl i så fall brytas ur? //moяlist 10 april 2008 kl. 23.19 (CEST)[svara]
Instämmer! Listan kan länka till de domännamn som har tillräckligt mycket text, i form av en {{huvudartikel}}-mall. Popperipopp 11 april 2008 kl. 10.37 (CEST)[svara]

Städer i afrika

[redigera wikitext]

Har tittat lite och hittat artiklarna Abou Deïa, Akoumapé, Aledjo-Koura om städer i tre olika afrikanska länder som är precis lika intetsägande. Engelska wikipedian har rödlänkar till artiklarna, men inga artiklar. Är det bara att radera dem tycker ni (verkar ju irrelevanta)? //moяlist 18 april 2008 kl. 00.25 (CEST)[svara]

Jag föreslår hårdhänt snabbradering av den typen av artiklar. Som synes har de legat sedan 2005 utan utökning, och Google ger för det mesta inget matnyttigt... Det är möjligt att dessa städer är relativt stora, men så länge det inte finns någon verifierbar information om dem kan vi inte ha några artiklar om dem. Om de finns listade i landsartiklarna kan man ju omdirigera dem dit. /Grillo 18 april 2008 kl. 00.30 (CEST)[svara]
Det är inte ens några artiklar som länkar till sidorna i fråga, så raderingsargumentet stärks därmed ytterligare. Sannolikheten att någon kommer hitta artiklarna, och vidare ha nytta av dem, är minimal. Jag protesterar inte om någon raderar artiklar av den här typen, som garanterats skapats av någon lista som funnits någonstans utanför Wikipedia (eller på enwp). /Grillo 18 april 2008 kl. 00.32 (CEST)[svara]
Iofs visas artikeln ett dussintal gånger i månaden, men det är nog inget argument för att ha kvar dem. Se också [1], där man kan hitta de artiklarna som skapades då. //moяlist 18 april 2008 kl. 01.03 (CEST)[svara]

I artikeln Tchad finns en lista över landets 18 regioner, där alla är rödlänkar utom huvudstadsregionen. Jag utökade inte desto mindre tabellen med regionhuvudstäder och en lista över departementen inom varje region. Det blev tre blålänkar i ett hav av rödlänkar. Alla blålänkar är inte helt korrekta, de beskriver kanske ett folkslag i stället för en region, men det är ju en petitess i sammanhanget. Den som intresserar sig för ett visst land bör starta från toppen och skriva artiklar om större städer och regioner innan man går ner och skriver artiklar om småorter och landskommuner. Vi har precis samma problem med det näraliggande Finland. En del småbyar med 40 invånare har artiklar, som kan vara både långa och korta, medan en del stora kommuner har usla stubbar. --LA2 18 april 2008 kl. 03.09 (CEST)[svara]

Bra gjort, där fanns ju faktiskt en av städerna undangömd som Aboudeïa Department./Johan Jönsson 18 april 2008 kl. 19.45 (CEST)[svara]


Nystart/omorganisering?

[redigera wikitext]

Att dela in sig efter bokstav fungerar bra för wikifiering, men jag funderar på om man inte här ska omorganisera detta efter ämnesområde istället? Verktyget CatScan är väldigt bra för att hitta substubbar och man skulle då kunna ta några ämnesområden, och olika personer skulle kunna ansvara för olika områden. Jag har redan lagt ut lite länkar på resp projektsida, men jag tror att det kan vara bra med lite tabeller, så man kan se om det minskar eller ökar, vilket både kan vara bra som en översikt, och för att peppa. Jag tror synbara resultat är psykologiskt viktiga. Det är ofta roligt att se att det för en månad sedan var t.ex 500 artiklar och nu har det minskat till 300 eller ngt, då känner man att ens arbete har givit resultat. Man kan då sätta upp delmål att jobba mot tillsammans, oavsett om man raderar, infogar eller utökar dessa pytteartiklar. Det är ofta ganska lätt att utöka en artikel till över 500 bytes. Ungefär 46 % av svenskspråkiga Wikipedias artiklar är under 500 bytes, därför vore det bra att försöka få så många som möjligt över det strecket istället. De flesta har något område som de tycker att det är roligt eller lätt att skriva artiklar om, och därför vore det bra om var och en kunde ta ansvar för några stubbkategorier var. Kanske kan du se till att det inte finns några artiklar under 500 bytes om just ditt län? Kanske är du intresserad av bilar och kan jobba med att minska antalet fordonstubbar som är under 500 bytes? Eller kattstubbar som är under 500 bytes? Eller filmstubbar som är under 500 bytes? Oavsett intresseområde gör du en insats om du åtgärdar dessa pytteartiklar. Man skulle kunna göra tabeller med olika ämnesområden, för att se om antalet minskar vartefter.

Exempeltabell:

Stubbar Författare Musiker Skådespelare Politiker
20 april 238 774 547 195
Stubbar Författare Musiker Skådespelare Politiker
20 april 5 61 0 22

/ Elinnea 20 april 2008 kl. 14.47 (CEST)[svara]

Jag delar ju, som framgått ovan, åsikten att man bör utgå från artiklarnas längd. Frågan om nystart av projektet tar jag inte ställning till, eftersom jag valt att arbeta självständigt utanför det här projektet. Men gränsen 500 bytes handlar om vad som är en stubbe, medan det här projektet handlar om substubbar. Det finns cirka 17.000 sidor som är kortare än 250 bytes (grensidor och redirects oräknade) och flera tusen som är kortare än 150 bytes. Att lägga 20 tecken till en artikel som redan är 490 tecken är det enklaste sättet att minska antalet stubbar, eftersom man då knuffar nästan-vinnarna över mållinjen. Men enligt min mening är svenska Wikipedias problem inte våra 490-bytesartiklar utan de många sidor som är mycket kortare än så. --LA2 20 april 2008 kl. 20.28 (CEST)[svara]
Det måste dock påpekas att den lilla knuffen över 500b inte ger någon kvalité till wikipedia, utan det är hela grejen att utöka de korta artiklarna så de säger mer än ingenting som skapar mer kvalité. //moяlist 20 april 2008 kl. 20.49 (CEST)[svara]
Men var har jag påstått att man ska fokusera på 400-bytesartiklar och "knuffen över 500 bytes"? Självklart är det bra att börja med de allra kortaste! Personligen tycker jag att det känns lite meningslöst att förlänga t.ex en 120 bytes-artikel till 380 bytes, att det är bättre att förlänga den till 500 bytes när man ändå håller på, det krävs ju ganska lite. Antalet stubbar förändras knappast genom att lägga till 20 tecken på en 490 bytes-artikel, den är troligtvis fortfarande en stubbe då. Som sagt, det är bra att fokusera på de allra kortaste artiklarna, men min tanke med detta var att få folk att fokusera på ämnesområden som de är intresserade av, och förlänga substubbarna inom det området, och att 500 bytesgränsen skulle kännas motiverande... / Elinnea 20 april 2008 kl. 21.02 (CEST)[svara]
Sjuttontusen!?! Jag skulle önska att någon admin raderade sådana stubbar där all info redan finns en huvudartikel, ett exempel är Alvis 12/50 osv. Det vore det mest effektiva. /Pieter Kuiper 20 april 2008 kl. 21.09 (CEST)[svara]
Ja, sjuttontusen. En tabell med statistik finns på användare:LA2#Dagbok (10 april 2008). Enbart i intervallet 150-174 bytes har vi 2605 sidor. Eller hade när databasdumpen gjordes 6 april 2008. Förhoppningsvis har det börjat sjunka något, men hur mycket kan vi först veta när nästa databasdump kommer inom ett par veckor. Jämför med de andra språken i tabellen. De 65 sidor som var exakt 116 bytes långa var Alvina, Aspsjö, Autosomal, Baldringetorp, Basaliom, Bastustråket, Befolkningssammansättning, Beledweyne, Bläckmagi, Bogsböle, Bredträsk, Campo Manin, Chandaka, CVA, Diar, Dillö, Ernestas, Finnby, Borgå stad, Flytträsket, Fredrik Koos, Fröjböle, Gebbelby, Germundsvidja, Grevböle, Gåloren, Gästerby, Haverö, Järngrund, Killingholm, Kisor, Klubbskatan, Kuckus, Kyldisk, Lassfolk, Lillbolstad, Lövöarna, Mangbetu-azande, Michael Hayden (designer), Mjösund, Monegasker, Nociceptiv, Omfamning, Petäjärvi (Anttila), Plymå, Pomares, Porsö, Power Park, Quebecair, Rekuby, Schanfigg (region, CH-GR), Slettedaler, Stusnäs, Sunnanå, Dragsfjärds kommun, Svend Stouge, Tokyo Disney Resort, Tryckluftsborr, Tålamods, Una (namn), Urberga, Utbildningsåret 1855, Uttermossa, Vedby, Ytterbråtö, Äpplö, Överbråtö.
Att radera är inte det svåra. Sätt bara in {{radera}} i artiklarna. Det svåra är att veta om all information redan återfinns någon annanstans. Jag raderingsmarkerade de innehållslösa radioåret 1890 - 1919 tidigare idag, så där minskade våra substubbar med 30 stycken på ett bräde. --LA2 21 april 2008 kl. 02.23 (CEST)[svara]
Elinnea, jag skrev inte att man måste ägna sig åt 490-bytesartiklarna, men det riskerar att bli så när du sätter gränsen vid 500 bytes. Jag tycker du skulle använt en mycket lägre gräns, förslagsvis 200 bytes. Vi har tillräckligt många (flera tusen) sidor som är kortare än 200 bytes. När dessa börjar bli utrotningshotade kan vi titta uppåt mot 300 och 400 bytes. Att ämnesindela är säkert förnuftigt. Det är ju precis det jag gör när jag angriper geografistubbar-Finland.
Förutom de finländska stubbarna, är följande markeringar vanliga bland artiklar som är kortare än 200 bytes (enligt databasdumpen 6 april 2008): {{stub}} (119 förekomster), {{sportstub}} (107), {{personstub}} (90), {{geografistub-Skåne}} (89), {{geografistub-Färöarna}} (78), {{substub}} (67), {{geografistub-Brasilien}} (67), {{språkstub}} (59), {{ugglan}} (54), {{geografistub-Estland}} (54), {{namnstub}} (50), {{ickewiki}} (50), {{geografistub-Indien}} (48), {{musikstub}} (46), {{Wiktionaryflytt|flyttad}} (42), {{geografistub-Västra Götaland}} (42), {{3LC}} (40), {{musikerstub}} (39), {{poesilänk}} (38), {{medicinstub}} (37), {{geografistub-Gävleborg}} (37), {{sportpersonstub}} (35), {{geografistub-Sverige}} (35), {{teknikstub}} (34), {{bandstub}} (32), {{arkitekturstub}} (32), {{företagsstub}} (31), {{TV-stub}} (30), {{poesistub}} (30), {{litteraturstub-Sverige}} (30), {{utbildningsstub}} (29), {{kortspelsstub}} (29), {{geografistub-Madagaskar}} (28), {{filmstub}} (28), {{geografistub-Västerbotten}} (27), {{geografistub-Norrbotten}} (27), {{politikerstub}} (26), {{TV-stub-Sverige}} (25), {{militärstub}} (25), {{matstub}} (25), {{kyrkostub}} (25), {{biologistub}} (25).
Jag har redan tipsat Grillo om de skånska och MikaelLindmark om Västerbotten-stubbarna. Det går bra att använda CatScan för att söka fram de korta artiklarna inom respektive kategori. --LA2 22 april 2008 kl. 08.10 (CEST)[svara]
Nu har jag gjort ett förslag ovan med 200 bytes också och ändrat på Mall:Förläng till 200 bytes istället för 500 bytes. Min poäng med förslaget var själva idén med ämnestabeller, så man tydligt kan se att det (förhoppningsvis) minskar, att det fanns X antal artiklar under y bytes det datumet. Hoppas att vi fortsättningsvis kan diskutera själva förslaget istället för att fastna i en diskussion om på värdet på y, det kan man ju alltid ändra på. / Elinnea 24 april 2008 kl. 11.16 (CEST)[svara]

Just idag 2 maj fördelar sig de stubbar som är kortare än 200 bytes enligt följande. De finländska geografistubbarna är alltså fortfarande i klar dominans. Men deras andel har sjunkit kraftigt och de är nu bara fyra gånger fler inte ens dubbelt så många som Brasilien-stubbarna. Geografistubbar-Finland (253 119 stycken), Sportstubbar (98), Stubbar (85), Personstubbar (83), Geografistubbar-Brasilien (66), Substubbar 2008-18 (58), Språkstubbar (53), Musikstubbar (50), Geografistubbar-Estland (50), Namnstubbar (45), Företagsstubbar (42), Geografistubbar-Indien (39), Substubbar 2008-17 (36), Musikgruppsstubbar (36), Utbildningsstubbar (33), Musikerstubbar (33), Sverige-TV-stubbar (32), TV-stubbar (31), Medicinstubbar (31), Arkitekturstubbar (31), Sportpersonstubbar (28), Militärstubbar (28), Marinstubbar (28), Filmstubbar (28), Matstubbar (27), Mytologistubbar (26), Juridikstubbar (26), Litteraturstubbar-Sverige (25), Geografistubbar-Madagaskar (25), Ekonomistubbar (24), Kortspelsstubbar (23), Datorspels- och TV-spelsstubbar (23), Trafikstubbar (22), Klädstubbar (22), Kyrkostubbar (21), Geografistubbar-Mauretanien (21), Musikstyckesstubbar (20), Företagsekonomistubbar (20), Anatomistubbar (20), Tidningsstubbar (19), Teaterstubbar (19), Samhällsstubbar (19), Litteraturstubbar (19), Kristendomsstubbar (19), Konstnärstubbar (19), Handbollsstubbar (19), Albumstubbar (19), Textilstubbar (18), Flygstubbar (18), Farmakologistubbar (18), Dryckesstubbar (18), Yrkesstubbar (17), TV-seriestubbar (17), Bokstubbar (17), Växtstubbar (16), Teknikstubbar (16), Politiska partistubbar (16), Geografistubbar-Sri Lanka (16), Politikerstubbar (15), Brottsstubbar (15), Seglingsstubbar (14), Politikstubbar (14), Folkstubbar (14), Seriestubbar (13), Järnvägsstubbar (13), Historiestubbar (13), Historiepersonstubbar (13), Geologistubbar (13), Bilstubbar (13), Psalmstubbar (12), Poesistubbar (12), Meteorologistubbar (12), Drogstubbar (12), Programvarustubbar (11), Materialstubbar (11), Konststubbar (11), Fotbollsstubbar (11), Släktstubbar (10), Religionsstubbar (10), Radiostubbar (10), Häststubbar (10), Geografistubbar-Norge (10), Geografistubbar-Danmark (10), Geografistubbar-Botswana (10), Företagsstubbar-Sverige (10), Datorstubbar (10).

Sänker man i stället ribban till 150 bytes, ser listan ut så här: Geografistubbar-Finland (79 inga alls), Geografistubbar-Brasilien (57), Substubbar 2008-18 (45), Stubbar (24), Namnstubbar (21), Musikstubbar (20), Substubbar 2008-17 (19), Sportstubbar (19), Personstubbar (19), Mytologistubbar (15), Geografistubbar-Estland (12), Militärstubbar (11), Marinstubbar (11), Geografistubbar-Sri Lanka (11), Geografistubbar-Madagaskar (11), TV-stubbar (10), Trafikstubbar (10), Sverige-TV-stubbar (10), Musikgruppsstubbar (10), Musikerstubbar (10), Matstubbar (10), Kortspelsstubbar (10), Juridikstubbar (10), Folkstubbar (10), Anatomistubbar (10). --LA2 2 maj 2008 kl. 10.45 (CEST)[svara]

Veckonumrering och subst-mallen ub

[redigera wikitext]

Jag ändrade mallen enligt mönster från {{rel}}. Numera ska man skriva {{subst:ub}}. Substubbarna hamnar i en ny kategori varje vecka (t.ex. 2008-17). Tidigare var det en kategori per månad (t.ex. 2008-04), men stubbarna låstes aldrig fast i sin månad ändå. Nu får vi bättre koll på hur lång tid som gått från det att sidan markerades som substub. --LA2 24 april 2008 kl. 10.44 (CEST)[svara]

Det verkar bra! / Elinnea 24 april 2008 kl. 11.19 (CEST)[svara]

Substubbar och korta stubartiklar

[redigera wikitext]

För mig är en substub en atikel som inte tillför läsaren något, som Älvros kyrka är en kyrka i Älvros, och denna typ av artiklar bör angripas hårt. Men jag ser många kort artiklar innehålla nyttig information för läsaren, och extra mycket när det finns en iw-länk. Nu hittar jag plötsligt en hel skrälldus med artiklar som inte jag skulle kalla substubbar märkta med den nya mallen. Mario Kart Super Circuit, Monsanto Handels- och administrationsprogrammet Hamre, Forsa E10 (bränsle) etc. Om vi vill angripa korta stubartiklar så tycker jag det skall starta som ett nytt projekt, inte bredda innehållet i termen substubb. Wanpe 24 april 2008 kl. 13.04 (CEST)[svara]

Hamre, Forsa är en substub, och Hamre bör göras till en förgreningssida. Artikeln Handels- och administrationsprogrammet innehåller inte mer än vad man skulle kunna gissa utifrån rubriken. E10 (bränsle) är ytterst marginell - artikelnamnet säger redan att det är ett bränsle, och man kanske kan gissa att det handlar om 10 % Etanol. /Pieter Kuiper 24 april 2008 kl. 13.17 (CEST)[svara]
Jag delar inte Wanpe:s strikta defintion av substubbar. Den verkar inte heller vara förankrad på engelska Wikipedia (Wikipedia:Substub; intressant är för övrigt att läsa avsnittet #Historical). För mig handlar det om en gränsdragning mellan "det här är början till något stort" och "det här kommer aldrig att bli mer än så här". Jag menar att alla riktigt korta artiklar bör substub-märkas när man ser dem första gången. Helst bör man samtidigt uppmärksamma stubbskaparen på märkningen. Sedan ger man stubbskaparen ett antal veckor på att lägga in mer material. Då fungerar det som en karantän. Av alla nyfödda små artiklar är en del livskraftiga och kan bli något, medan andra är dödfödda. Ansvaret att bevisa att stubben kan bli något vilar i första hand skaparen av stubben. Kan E10 (bränsle) någonsin bli en riktig artikel? Varför skulle det inte vara en del av artikeln E85 eller Etanolbränsle? Ska vi ha en ny artikel för varje procentandel av etanolinblandning? --LA2 24 april 2008 kl. 14.01 (CEST)[svara]


Har nu dragit igång länskampen, där deltagare från olika län förhoppningsvis kommer att kämpa med att just deras län ska ha så få substubbar som möjligt. Tanken är att det ska kännas kul, och att målen ska kännas uppnåeliga. Det är ett test, om folk tycker att det är roligt och engagerar sig, så kan man utöka till andra ämnesområden. / Elinnea 27 april 2008 kl. 12.48 (CEST)[svara]

Har det tagits i beaktning att Jämtlands län delats upp i Jämtlands- och Härjedalsstubbar? Sedan finns även Hälsinglands-, Helsingborgs-, Uppsala- och Medelpadsstubbar utöver de respektive länsstubbarna. //Heimvennar - divider 27 april 2008 kl. 20.17 (CEST)[svara]
Om det finns underkategorier i länsstubbarna så räknas de med, som med Kategori:Geografistubbar-Uppsala som ligger i Kategori:Geografistubbar-Uppsala län, men om inte Kategori:Geografistubbar-Härjedalen läggs i Kategori:Geografistubbar-Jämtland så kommer de inte räknas med. Jag ser ingen poäng med att ha landskapsindelning OCH länsindelning på stubbarna, så det bästa vore nog om Kategori:Geografistubbar-Härjedalen och Kategori:Geografistubbar-Medelpad togs bort helt, och man enbart sorterade in platser beroende på vilket län de ligger i. / Elinnea 28 april 2008 kl. 12.32 (CEST)[svara]

Undermåliga grensidor

[redigera wikitext]

Eftersom Special:Korta sidor redovisar både korta artiklar och korta grensidor, så får jag ögonen på en hel del grensidor av typen Statarna som innehåller två grenar till statare och Statarna (roman). Vad skiljer egentligen en sådan grensida från en orddefinitionsartikel av den typ som vi förr märkte med wiktionaryflytt, men numera raderar? Sidan som handlar om romanen borde ju rimligen nämna begreppet statare, så folk skulle ju hitta fram till statare även om de hamnade på sidan om romanen när de gick till Statarna. Efter substub-sjukan kanske vi borde ta hand om denna epidemi av orddefinitionsmässiga grensidor? --LA2 29 april 2008 kl. 12.01 (CEST)[svara]

Håller med, det finns väldigt många onödiga förgreningssidor. Jag tror att Wikipedia:Projekt länkutredning sysslar med att åtgärda sånt. Ett problem med exemplet ovan är dock att Statarna (roman) inte är en artikel om romanen utan bara en redirect till Ivar Lo-Johansson. / Elinnea 29 april 2008 kl. 12.31 (CEST)[svara]
Ja, det har du rätt i, att den är en redirect. Och en likadan redirect borde nog "Statarna" också vara. Men exemplet är hur som helst illustrerande. --LA2 29 april 2008 kl. 13.30 (CEST)[svara]
En annan läsning vore att omdirigera "statarna" till "Statare" och använda en not överst. I vilket fall tycker jag de flesta omdirigeringar med bara två ord borde bort.
andejons 29 april 2008 kl. 18.24 (CEST)[svara]

Om två timmar börjar en ny vecka. Det blir andra gången vi "knoppar av" en kategori av substubbar. Den första, Substubbar 2008-17, har under den gångna veckan sjunkit från 240 till 211 substubbar. Den andra, Substubbar 2008-18, innehåller just nu 254 substubbar. Kanske sjunker dessa kategorier med 10-20 procent per vecka och efter några veckor blir det dags att radera de återstående substubbarna. Det kommer att ta många veckor, flera månader, innan antalet mycket korta artiklar verkligen börjar minska. Men vi har ingen brådska. Jag tror att några hundra substubbar per vecka är en lagom arbetstakt. Att angripa de undermåliga grensidorna på ett mer systematiskt sätt tror jag ligger längre fram i tiden. Grensidor som idag länkar till en artikel och en stubbe, kanske i framtiden bara länkar till en enda artikel. Då blir de lätta att ersätta med en redirect. --LA2 4 maj 2008 kl. 22.10 (CEST)[svara]

substub contra infoga mall

[redigera wikitext]

Jag har börjat att systematiskt arbeta med de äldsta markerade substubbarna. Och jag tycker då själv att vissa substubbmarkerade artiklar borde markerats med infoga istf substub. Dvs de är korta men där radering inte verkar riktigt, se tex Kråkberg, där jag tog bort substubmallen men där jag själv är i valet och kavlet om inte en infogamall kunde platsa. Wanpe 8 maj 2008 kl. 09.14 (CEST)[svara]

Modigt jobbat! Helt plötsligt halverades substubbarna 2008-17. Det finns många fall då det inte alls är uppenbart var en stubbe skulle kunna infogas. Det finns luriga fall som "Tjärstad är en ort i Kinda kommun", som visade sig vara ett falskt påstående, för Tjärstad är inte alls någon (tät-)ort utan en församling, och den hade redan en artikel. Om jag vet var stubben ska in, så infogar jag vanligen direkt (t.ex. album->artist, stadsdel->stad och här skulle man nog kunna infoga byn i kommunens artikel), men annars märker jag som substub. Infoga-märkningar tenderar att bli liggande kvar utan åtgärd i evigheter. Är det någon som bevakar dem systematiskt? Det finns just nu 897 sidor i Kategori:Artiklar föreslagna för infogning. --LA2 8 maj 2008 kl. 22.44 (CEST)[svara]
Jag är rädd att jag är skyldig till ett antal av dessa infoga-mallar. Jag lägger ut dem i förhoppning att artikelförfattaren eller en annan ämneskunnig ska ta itu med det. Ibland kommer det en reaktion (som i Diskussion:Aktiv optik, men jag har svårt att se skillnaden med Adaptiv optik). Ofta händer inget. Särskilt vid medicinska artiklar vågar jag inte skriva själv, men då har skylten i alla fall funktionen att läsaren dras till en annan artikel med mer information. /Pieter Kuiper 8 maj 2008 kl. 22.59 (CEST)[svara]
Jag tycker det är bra med infoga-mall när man själv är osäker. Då får man ett par extra ögon till som kollar innan infogningen sker. Vi hade ju en tävling med infogning för ett tag sedan. Ganska bra idé, tycker jag. --Kr-val 9 maj 2008 kl. 06.14 (CEST)[svara]
I kat 08-17 som jag nu gått igenom (och skall göra en efterskanning av om någon dag) så fanns det många för läsaren mer irriterande än hjälpande texter, som skolläkare är en läkare i skolan eller dd är en äppelsort (enda länk från lista över äppelsorter). Det fanns också några få viktiga som kardning som verkligen behövdes utökas. Båda dessa fall ser jag som bra önskvärda effekter av substubmärkningen (radera, resp utöka). Sedan finns det ett antal gränsfall (dock bara knappt 10%) där jag verkar vara tolerantare än mallsättarna åtminstone för artiklar av bestående karaktär och speciellt när det finns iw-länkar. Men jag är fortsatt ifrågasättande att använda substubmallen när infoga är mer korrekt och tänker mig nog i de fortsatta genomgångarna mycket byta substubmall mot infogamall, då jag anser att göra en kvalificerad infogning ligger utanför arbetat med att bearbeta substubartiklar. (sedan kan vi senare köra ett projekt för att angripa och bearbeta de artiklar som är märkta med infoga) Wanpe 9 maj 2008 kl. 09.05 (CEST)[svara]

Erfarenheter (igen)

[redigera wikitext]

Jag har nu gått igenom kat 08-17 2 ggr och de första bokstäverna i kat 08-18 och åtgärdat drygt 200 substubmärkta artiklar och mina erfarenheter hittils är:

  • De substub märkta artiklarna är nästan alla djupt otillfredsställande artiklar. Jag har här själv bytt åsikt och ger nu LA2 och Elinnea rätt - det är nödvändigt börja märka upp för bearbetning dessa djupt otillfredsställande artiklar och man kan mycket väl betrakta detta som ytterligare en sil i det allmänna kvalitestarbetet.
  • Jag saknar mycket den diskussion med andra för att komma till konsensus för lämplig åtgärd som sker på artiklarnas diskussionssidor inom projekt relktrl - tyvärr är nog dock inte den tekniken gångbar i dessa fall. Än mer saknar jag någon motsvarighet till SFFR där man kan ta upp problematiska/prejudicerande fall för allmän diskussion.
  • Tiden för att åtgärda en substubmärkt artikel är lång, där den största tiden går åt till analys av vad det är - letning på andra wp, sökning i andra artiklar mm, vilket krävs för att bedöma om infogning, utökning eller radering är lämpligt. Själv åtgärden - infogning, utökning tar också en del tid men ändå mindre totalt än analysen. Och med en medeltid på 4-5 minuter per substubmärkt artikel, så innebär det att de cirka 250 nya substubmräkningar som nu görs per vecka motsvara en åtgärdsbehovstid på 20-25 timmar/vecka. Och det krävande arbetet med analys och bedömning försvåras ytterligare i avsaknad av ordentliga accepterade rutiner i arbetet (tex har jag fått kommentarer om hur jag skriver in orsak när radering bli fallet) och konsnesus där radering ändå bör ske (jag som är emot radering av ortsartiklar gjorde detta ändå för två oidentifierbara byar i Spanien och Cypern som omedelbart ifrågasattes). Både mer diskussion om hanteringen och rutiner behövs, likväl som fler resurser som systematiskt betar av de substubmärkta artiklarna.Wanpe 19 maj 2008 kl. 08.35 (CEST)[svara]

Mina förslag på förbättringar av projektarbetet:

  • Vi bör lägga locket på den diskussion som förekommit runt gränsen mellan djupt otillfredsställande artiklar och bara otillfrdsställande. Vi har tillräckligt av den värsta sorten så låt oss hellre fria än fälla i gränsfall.
  • vi bör sätta upp en sida likande sffr för fall vi vill diskutera flera, gärna en ny sida under projektsidan.
  • vi bör "starta" om sidan för projektet och sätta upp den som för wikifiering och relktrl, med vissa basics för hanteringen överst och deltagare sedan och några sifferserier som för relktrl. Jag ser det som en stor förbättring om vi kan få några fler engagerade även om det bara gäller medverkan i de principiella diskussionerna. Wanpe 19 maj 2008 kl. 09.14 (CEST)[svara]
Varför anser du att tekniken med att diskutera på artikelns diskussionssida inte är gångbar för substubbar? Jag kan tycka att det är rätt plats att skriva åsikter om artikeln som är bra att ha som dokumentation i senare läge, exempelvis om resultatet blir "behåll som egen artikel". --Kr-val 19 maj 2008 kl. 15.11 (CEST)[svara]
Jag tänkte det inte går att diskutera vad man bör göra utan att ha gjort en analys först, men det skulle ju också vara möjligt på diskussionssidan skriva in det man successivt fått fram om artikleämnet. Wanpe 19 maj 2008 kl. 15.45 (CEST)[svara]

Det måste bli lättare att radera

[redigera wikitext]

Som vanlig användare kan man utvidga eller omdirigera, men det är svårt att bara bli av med uppslagsord. Jag röjde upp bland artiklar mindre än 250 byte i fysik. Några markerade jag för snabbradering, och det så skedde också i vissa fall. Se dock diskussion:Avläsningspunkt för att det finns administratörer som anser att man bör gå till SSFR för att bli av med dessa 214 bytes. Se även senaste redigering av substubsmallen, där länk till snabbradering togs bort. Jag tycker att det bör vara obyråkratiskt att radera korta artiklar. Det är ju väldig enkelt att skriva nytt. /Pieter Kuiper 2 juni 2008 kl. 19.08 (CEST)[svara]

Jag tror också att radering kommer att bli nödvändigt. Om det är dags nu, eller om ytterligare några veckor låter jag vara osagt. Efter att jag under april arbetade bort över tusen substubbar för finska byar (alla kortare än 160 bytes), så har jag i sex veckor kategoriserat substubbar veckovis. Jag har inte stressat, utan varje vecka lagt cirka 200 substubbar till den veckans kategori. Jag hittar dessa genom att jag går igenom de Special:Korta sidor. Hittills har jag gått igenom allt som är kortare än 140 bytes. Och då har jag ändå slagit samman stubbar om öar i Tjusts skärgård och stadsdelar i Rio de Janteiro, så allting magasineras inte in i kategorierna. Den äldsta veckan 2008-17 har sedan reducerats till ett fåtal kvarvarande stubbar, men därefter finns sex veckors kategorier som fortfarande har 200 artiklar vardera. När jag skriver att jag gått igenom alla sidor kortare än 140 bytes, så ska man ha i minne att när jag lägger till substub-märkning och ofta även stubkategori, så ökar artikelns längd med 10-30 bytes. De jag märkte upp när jag gick igenom 110-bytesidorna snubblar jag alltså över igen när jag går igenom 130-bytesidorna. Enbart uppmärkningen gör alltså att vi får längre sidor.
Den här beskrivningen kan låta som ett enormt Sisyfos-arbete, men jag ser ändå ljuset i slutet av tunneln. Många av de stubbar jag hittar har skapats för länge sedan av ett fåtal användare. MoRsE skapade 2005 många av Finlandsstubbarna, och även flera teknikstubbar om GPS-teknik. Rudolf 1922 har skapat massor av stubbar om olika kaster i Indien, men han gjorde det 2004-2005 så det är också preskriberat nu. Nu vet jag hur man grupperar ihop finska byar till finska kommuner, men kastväsendets hierarkier är mer än jag behärskar. Annars vore dessa Indienstubbar goda kandidater för effektiv sammanslagning. Jon Svensson (bidrag) skapade många ordboksliknande stubbar om företagsekonomi under några få dagar i april 2007, men sedan blev det inget mer. Det är ett fåtal entusiaster som sätter igång och skapar många substubbar. Jag tror redan vi har fått dem att inse det olämpliga i det, och därmed växer berget av stubbar inte längre. Alltså behöver vi bara städa rent, och sedan kommer det förhoppningsvis att förbli rent. Så länge som nu substub-mallen ligger kvar, så lyser den oranga skylten i ögonen på alla: Så här korta artiklar godkänner vi egentligen inte. Det du ser är inget mönster att ta efter.
Nyligen har maskineriet för databasdumpar stärkts upp. Det produceras nu 4-5 dumpar parallellt mot tidigare bara 2, och förmodligen har de värsta haverierna också upphört. Detta är mycket välkommet, för jag behöver databasdumpar för att göra vettiga analyser. Senaste dumpen av svwiki är nu två månader gammal och förhoppningsvis ska det inte dröja så många dagar till innan en ny kommer. Under tiden kan jag konstatera att danska Wikipedia också har arbetat med substubbar. Antalet sidor under 150 bytes var 372 stycken den 20 mars, men sjönk till 276 den 7 maj och bara 160 den 6 juni, alltså en halvering nu under våren. Ryska Wikipedia har 36 artiklar av denna längd, tyska Wikipedia har 43 och tjeckiska har 51, så där finns i princip inget att halvera. Norska Wikipedia har 226 och polska 283, så de är ungefär i klass med danskarna. Men svenska Wikipedia är extrem med 5622 sidor kortare än 150 bytes den 6 februari, vilket bara hade sjunkit till 4960 sidor den 6 april. Det finns idag över 1200 sidor i våra substub-kategorier (6 veckor x 200 artiklar), men bara 341 av dem är kortare än 150 bytes. Dock finns 358 sidor i längdintervallet 150-159 bytes. --LA2 6 juni 2008 kl. 03.45 (CEST)[svara]
Den danska insatsen består av att da:bruger:Broadbeer under april och maj har raderat eller slagit ihop substubbar, som här. --LA2 6 juni 2008 kl. 17.08 (CEST)[svara]
Ja, det finns många GPS-relaterade artiklar som bör raderas. Till exempel har Partiell momentan fasmätning skapats i denna serie, men efter omkategorisering har sambandet tappats bort. Texten själv säger inget om vilket teknikområde termen tillhör, det finns inget om hur man gör eller vad det är bra för. Området är så specialiserad att det finns få som kan infoga det i något större sammanhang. Man skulle kunna omdirigera till Fas (matematik), men jag tycker att det är bättre att radera. /Pieter Kuiper 6 juni 2008 kl. 08.59 (CEST)[svara]

En diskussion för bara ett halvår sedan: Wikipedia:Sidor föreslagna för radering/TP 54. Attityden mot substubbar har klart förbättrats sedan dess. /Pieter Kuiper 15 juni 2008 kl. 12.09 (CEST)[svara]

Det har börjat dyka upp en ny bra användning av substub märkning av nya artiklar, och med det nya infogningsprojektet så närmar vi oss att ordentligt kunna ta itu med subbstub märkta artiklar. Men det kommer ta tid. Jag tror kapaciteten är 20-30 artiklar i veckan, vilket mer än väl täcker uppmärkningar av nya artiklar. Men 450 artiklar i senaste veckokategorin är för mycket! Jag föreslår uppmärkning av korta äldre artiklar upphör nu en längre tid, eller åtminstone när alla kortare än 150 tecken uppmärkts. Wanpe 9 juni 2008 kl. 07.24 (CEST)[svara]

Det är huvudsakligen jag som substub-märker artiklar. Och ja, jag lade 553 artiklar i kategori:substubbar 2008-23 till skillnad från c:a 200 per vecka tidigare. Men jag har svårt att känna någon skuld i den här saken. Det är inte jag som producerar substubbar. Artiklarna är substubbar och därmed undermåliga, vare sig jag märker dem eller ej. Man kan lika gärna hitta dem via CatScan eller listan över korta sidor, som genom substub-märkningen.
Det är just nu cirka 1700 artiklar som är märkta, men flera tusen till behöver åtgärdas. Den nuvarande substub-märkningen började för sju veckor sedan. Men de flesta av dessa alltför korta artiklar är redan ett eller två år gamla. Det här projektet är dock definierat som att enbart bry sig om märkta substubbar, vilket alltså tvingar mig att märka dem för att synliggöra problemet. I februari och mars hävdades det att "det finns 233 substubbar", vilket jag reagerade emot (här ovan, "Galet projekt"). Jag tror jag har visat på att det finns betydligt fler än så. Och om vi vill värna och höja kvaliteten i svenska Wikipedia, så är det bäst för oss att vi hittar på en lösning på det problemet, ju förr desto bättre. Lyckligtvis är de flesta substubbar gamla. Det skapas inte så många nya. Vi städar undan de vi har, och är tydliga mot nykomlingar att det inte är OK att lämna substubbar efter sig. Alla substubbar som ligger omärkta utgör ett alibi för att fortsätta skriva lika dåliga artiklar.
Men bara för att vi har ett stort problem framför oss, så behöver vi ju inte slita hårt eller känna oss stressade. Vi måste hitta smartare utvägar. Till slut har vi alltid radering att tillgripa. Men eftersom projektet redan har tagit flera månader, så är det ingen panik om de uppmärkta substubbarna får ligga ytterligare några veckor. Under tiden får kanske fler läsare upp ögonen för de här oranga märkningarna och börjar utvidga stubbarna? Några stora kategorier, som öar i Lule skärgård, går fortfarande att slå ihop på ett rationellt sätt. Andra stora kategorier, som kaster i Indien, är förmodligen bortom all räddning, och väldigt få skulle sakna dem om de raderades. Kanske kan vi jämföra listan över substubbar med hur många besök varje sådan stubbe har haft, och på det viset ta fram en prioritering? --LA2 9 juni 2008 kl. 08.12 (CEST)[svara]
Att döma av den uppdaterade statistiktabellen på projektsidan, verkar den nuvarande arbetstakten vara att 40-50 äldre substubbar åtgärdas per vecka. Till detta får man lägga de som avverkas direkt när de blir märkta som substubbar och därför aldrig syns i statistiken, och det är gissningsvis 20-30 ytterligare. Det vara bara under två exceptionella veckor som 130 respektive 165 substubbar åtgärdades per vecka. Med en avverkningstakt om 50 per vecka skulle det ta 100 veckor eller två fulla år att avverka 5000 substubbar. Så länge orkar nog inte jag hålla ut. Så kanske får vi tillgripa radering efter 12 veckor, eller något i den stilen. --LA2 10 juni 2008 kl. 02.20 (CEST)[svara]

Idag kom det äntligen en ny databasdump av svenska Wikipedia. Dumparna har krånglat och det var mer än två månader sedan sist. Det är bara från dumparna som jag kan göra bra statistik över hur många korta artiklar vi har. Tabellen nedan visar framstegen. Antalet artiklar under 150 bytes har sjunkit från 4941 i april till 452 idag. Det är en enorm uppryckning. Rörande artiklarna under 150 bytes ligger vi nu i klass med danska och nynorska Wikipedia. Estniska och arabiska Wikipedia har nu högre andel substubbar än den svenska. Vi har fortfarande en god bit kvar till norska (bokmål), polska och andra språk av Wikipedia. Och vi har fortfarande en mycket hög andel artiklar i intervallet 150-250 bytes. Som synes är dessa nästan oförändrade med 2000-3000 artiklar per intervall. Men framstegen hittills är anmärkningsvärda. Vi är på rätt väg och till hösten behöver vi inte längre skämmas över våra substubbar. I tabellen nedan markerar ljusrosa det lägsta intervall som innehåller en promille av alla artiklar (mer än 280 stycken) och mörkrött det lägsta intervall som har tre promille av alla artiklar (mer än 3x280 = 840). Att rosa rutan har flyttat sig från 75..99 till 125..149 och mörkröda från 75..99 till 150..174 är stort. Tyska, ryska, finska och tjeckiska Wikipedia har dock inga sådana färgade rutor i intervallen under 250 bytes. --LA2 12 juni 2008 kl. 07.39 (CEST)[svara]

Datum Antal artiklar i olika längdintervall
0..24 25..49 50..74 75..99 100..124 125..149 150..174 175..199 200..224 225..249
20080206 18 8 37 794 2159 2589 2725 2967 3493 3389
20080310 17 5 21 709 1961 2454 2654 2874 3431 3336
20080406 1 1 9 674 1870 2386 2594 2816 3396 3272
20080612 2 4 4 12 45 385 2717 2731 2995 2932
Det var en glädjande förbättring som ger lite ny kraft att fortsätta förlänga stubbar. Kan ökningen av antalet artiklar i klassen 150-174 b bero på att många av de kortaste artiklarna fått substubb-mallar? /rrohdin 12 juni 2008 kl. 09.45 (CEST)[svara]
Jo, så är det nog. {{substub}} med ifyllt veckonummer och radbrytning blir precis 20 bytes. Men för många stubbar lägger jag också till stubbkategorier som {{geografistub-Västra Götaland}} så dessa kan gå från 140 till 190 bytes enbart genom att bli uppmärkta. Ökningen på grund av detta är nog flera hundra artiklar både i 150..174 och 175..199, men det försvinner också stubbar från dessa intervall genom utökning eller ihopslagning.
Tabellen nedan visar en jämförelse för några olika språk, och för svenska några olika datum. Klicka på fyrkanten för att sortera på olika kolumner. Som synes har vi gjort förbättringar även på 10-procentnivån, men ändå ligger vi i botten där. --LA2 12 juni 2008 kl. 10.06 (CEST)[svara]
Språk & datum En promille av
artiklarna är
kortare än (bytes)
En procent av
artiklarna är
kortare än (bytes)
Tio procent av
artiklarna är
kortare än (bytes)
arwiki-20080604 62 139 419
cswiki-20080605 213 413 917
dawiki-20080605 130 202 491
dewiki-20080607 280 484 1081
etwiki-20080607 81 143 411
fiwiki-20080611 137 348 698
frwiki-20080614 137 271 682
iswiki-20080604 116 205 519
huwiki-20080614 211 290 750
ltwiki-20080609 153 272 404
lvwiki-20080606 78 227 808
nnwiki-20080606 126 212 496
nowiki-20080610 143 239 495
plwiki-20080406 161 246 638
ruwiki-20080526 359 599 1305
svwiki-20080206 90 120 298
svwiki-20080310 91 124 306
svwiki-20080406 93 126 312
svwiki-20080612 145 171 349
Tabellen nedan visar hur de korta artiklarnas längdintervall fördelar sig på de veckovisa substub-kategorierna. Fält med mer än 30 observationer har färgats rosa, för att förtydliga tyngdvikten. Det finns en klar tendens mot att större substubbar märks upp när de minsta är avverkade. Men i intervallet 150..174 är två tredjedelar (1800 av 2700) ännu ej märkta som substubbar. --LA2 15 juni 2008 kl. 11.20 (CEST)[svara]
Stubbkategori Antal artiklar i olika längdintervall
0..24 25..49 50..74 75..99 100..124 125..149 150..174 175..199 200..224 225..249
v.17 1 4 1
v.18 17 67 32 5 3 5
v.19 1 89 135 9 7 5
v.20 52 62 19 13 11
v.21 55 64 9 2 2
v.22 4 156 42 3 3
v.23 3 295 198 15 4
v.24 150 175 12 1
ej substubbmärkta 2 4 4 12 27 115 1874 2348 2936 2900
SUMMA 2 4 4 12 45 385 2717 2731 2995 2932
Trevligt med denna förbättring. LEO JOHANNES 15 juni 2008 kl. 12.58 (CEST)[svara]
Vi har gjort stora framsteg med substubbarna. Men det är lätt att bli nedslagen om man skådar bortom substubbarna och jämför längdfördelningen av alla artiklar med hur det ser ut i andra språk. Då har vi framför oss ett berg av stubbar som är lite längre än 150 bytes. För att ta oss upp till nivån där bara 10% av artiklarna är kortare än 700 bytes, som är fallet med finska, franska och ungerska Wikipedia, skulle artiklarna under 700 bytes behöva reduceras från dagens 88.000 (30%) till 28.000 (10%). Det kan vi teoretiskt åstadkomma genom att bryskt radera 60.000 artiklar, men det vill vi ju knappast. Så hur ska det gå till? Hittills har vi metoder för att ta oss an 10-tals, 100-tals och 1000-tals artiklar, men hur orkar man åtgärda 10.000-tals artiklar och hur lång tid tar det? Om vi sänker ambitionen till den danska och norska nivån, så får 10% av artiklarna vara kortare än 500 bytes, men där har vi hur som helst 53.000 artiklar, så det blir i alla fall (53 - 28 =) 25.000 artiklar att åtgärda. --LA2 16 juni 2008 kl. 09.07 (CEST)[svara]
Jag tycker att vi första och främst koncentrerar oss på de riktigt korta artiklarna, som idag. Sedan, när vi väl kan konstatera att vi inte har någon substub, då kan detta projekt börja ta tag i de korta stubbarna. Allt behöver inte bli klart direkt, EMM. Sedan, det bästa sättet att ta hand om stubbarna är väl helt enkelt att anordna tävlingar? Där man får poäng per artikel man förlänger till 1500 byte, eller något?LEO JOHANNES 16 juni 2008 kl. 14.03 (CEST)[svara]
Mycket bra med såna här tabeller där man på ett överskådligt sätt kan se substubbarna och utvecklingen. Håller med Leo att vi nu först och främst koncentrerar oss på de allra kortaste och sedan successivt flyttar fram gränserna. / Elinnea 21 juni 2008 kl. 15.33 (CEST)[svara]

Årtalsartiklar

[redigera wikitext]

Det finns nu bara 452 artiklar som är kortare än 150 bytes, varav några är rena mätfel. Men 70 stycken av dem är årtalsartiklar. Vad gör man med dem? Tidigare i våras klarade vi att avskaffa 30 substubbar för "radioåret" före 1920, eftersom det knappast förekom några rundradioutsändningar då. Men så kan man ju inte angripa konståret och teknikåret. Det kanske är ett separat litet helgprojekt att utvidga dem bortom 200-bytesgränsen? Här följer hela listan! --LA2 12 juni 2008 kl. 11.21 (CEST)[svara]

Se även Wikipediadiskussion:Projekt infogningar, där EMM fortsatt diskussion helst tas. LEO JOHANNES 12 juni 2008 kl. 15.56 (CEST)[svara]
Använd CatScan och Förläng artiklar i kategorin Årtal på under 256 bytes. --LA2 17 juni 2008 kl. 08.42 (CEST)[svara]
Se även Wikipediadiskussion:Årskrönikor#Stubbstatistik. --LA2 13 augusti 2008 kl. 18.29 (CEST)[svara]

Substubbar med mycket iw

[redigera wikitext]

Bland de artiklarna under 150 byte som projektet nu går igenom, saknas ofta språklänkar. Att bara lägga till iw i Schweiz-stubbarna gör dessa artiklar ofta dubbelt så långa, men de blir inte bättre för det. Och det är bara de pinsamma substubbar med iw-länkar som är synliga för folk som bläddrar på andra wikipedior. Finns det ett sätt att göra catscans där man inte räknar med iw? /Pieter Kuiper 3 juli 2008 kl. 22.21 (CEST)[svara]

Det gäller inte bara iw-länkar. Även bilder, faktarutor (taxoboxar) och låtlistor (för albumstubbar) fyller ut utrymmet i bytes, trots att själva artikeltexten kan vara kort och dålig. Säkert borde dessa också åtgärdas. Men hittills har åtminstone jag fokuserat på "den lägst hängande frukten", dvs de artiklar vars längd i bytes är jättekort.
Det är bara artikellängden i bytes som kan sökas med CatScan. Andra analyser kan göras utifrån databasdumparna. Men har vi någon bra algoritm för att beräkna den "nyttiga längden" av artikeltexten för varje artikel? Vad mer än iw-länkarna ska rensas bort? Ska bilder (dvs [[bild: ...|...|bildtext]]) räknas som 0 nyttiga bytes eller kanske som 1/4 av sin längd i bytes, eller ska man räkna bildtexten som nyttig och bara filtrera bort resten? Ska punktlistor räknas som nyttiga i andra artiklar, men onyttiga i albumstubbar? Det blir massor av svåra gränsdragningar. Finns det någon standard? --LA2 7 juli 2008 kl. 17.30 (CEST)[svara]
Samtidigt tycker jag att faktaboxar, låtlistor, kategorier och interwikilänkar och så vidare förbättrar artikeln; artilarna blir bättre av det, inte innehållsmässigt, men ändock bättre. LEO JOHANNES 7 juli 2008 kl. 19.00 (CEST)[svara]
Nu handlar det ju inte om att mäta på ett enda sätt, utan de två måtten kan komplettera varandra. Just därför behöver man inte vara så känslig i vad man tar med. Jag gjorde ett försök att räkna textlängden exklusive interwiki, kategorier, bilder, mallar, rubriker och punktlistor. Det finns 60.559 sidor vars återstående text är kortare än 250 bytes (alltså mer än fem gånger fler än de 11.821 vars hela artikellängd understiger 250 bytes). De fördelar sig på längdintervall enligt tabellen nedan, allt enligt databasdumpen av 12 juni, som är den mest aktuella jag har.
Många av de extremt korta är årtalsartiklar, som ju ofta består enbart av mallar, kategorier, rubriker och punktlistor. Därför har jag sorterat ut och redovisar dem separat. Ett ovanligt exempel är Sportåret 1894 som totalt har 1354 bytes, men där den egentliga texten utanför punktlistorna faktiskt är hela 218 bytes.
Många listartiklar blir givetvis också korta, men deras antal överskuggas snart av artiklar om riktiga ämnen som helt enkelt saknar text.
Bland de ytterst korta vanliga artiklarna finns 167 kortare än 25 bytes och 64 kortare än 10 bytes: HelenOS (Operativsystem), HP Pavilion, Darren Currie, Kinas herrlandslag i ishockey, Waiting, Slaget vid Chemnitz, Slaget vid Jüterbog, 2999, Järnskogs församling, 2287, The Royale, Hammarkullens Folkets Hus Bio, Göta Bio, Volvo Sport, Armstrong Siddeley 12 HP, Armstrong Siddeley Long 15, Guldringen, Coming of Age, Symbiosis, Skillingmarks församling, When the Bough Breaks, Genesis (Star Trek), Seawolf (ubåtsklass), Slaget om Uppsala, Slaget vid Genevadsbro, Eric Godoy, Jaime Grondona, Armstrong Siddeley 16 HP, Nikolaus I, Five Miles Out, Rodrigo Ríos, Crises, The Killing Fields, Slaget vid Ebeltoftviken, Aktieägarförening, Too Short a Season, The Arsenal of Freedom, Home Soil, Heart of Glory, We'll Always Have Paris, Guitars, Slaget om Västerås, Voyager (Mike Oldfield-album), Slaget vid Tybrindvig, Slaget vid Wesenberg, AKS, Asci, Indiens militära historia, Sjöslaget vid Pommerska vallen, Héctor Mancilla, Muslimska sakrament, Abadir, Hertig av Norfolk, Anund, Saturn C-8, Svarta Maja (kortspel), Tyska furstehus, Hertig av Argyll, Johan IV, 3001, MK 101, Alex von Schwedler. --LA2 10 juli 2008 kl. 04.20 (CEST)[svara]
Längdinterall 0..24 25..49 50..74 75..99 100..124 125..149 150..174 175..199 200..224 225..249
Årtalsartiklar 1174 322 165 59 54 12 16 17 13 17
Lista över... 70 83 102 128 132 93 84 56 56 44
Varken årtal eller listor 167 422 1958 4912 7479 9962 8835 8143 8101 7883
TOTALT 1411 827 2225 5099 7665 10067 8935 8216 8170 7944


Våra kortaste artiklar

[redigera wikitext]

27 juni infördes sektionen "Våra kortaste stubbar" och idag, nästan precis en månad senare har vi klarat av dessa ca 150 substubbar under 150 bytes! Hipp hipp hurraaaa! Nu höjer vi ribban till 155 bytes, vilket ger 215 artiklar. Ska vi sätta upp ett delmål, tror ni att vi klarar av dem på en månad? / Elinnea 26 juli 2008 kl. 19.05 (CEST)[svara]

En månad: nja. Delmål: ja! Inga under 150 bytes: Jippie! LEO JOHANNES 27 juli 2008 kl. 13.23 (CEST)[svara]
Nej, det kanske blir lite för tufft... lade till ett delmål, 100 st den 10 augusti, ändra gärna om det inte är realistiskt. / Elinnea 27 juli 2008 kl. 14.29 (CEST)[svara]

Lanao del Norte

[redigera wikitext]

Jag förstår inte vad bilden och texten om Lanao del Norte har på den här projektsidan att göra. Den är ju ingen substub utan en ordinär stub. Ska man ha en illustration på den här sidan så ska det ju vara av en substub. / Elinnea 11 augusti 2008 kl. 10.18 (CEST)[svara]

Ja... Men en illustration är bättre än ingen alls... Någon som har lusta tt ta en skärmdump på en tvättäkta substub? LEO JOHANNES 11 augusti 2008 kl. 13.07 (CEST)[svara]
Poängen är väl att visa på vad som är en helt okej artikel, och att en sådan ändå är ganska kort, och att substubbar är extremt mkt kortare än en sådan ändå kort artikel. /Grillo 11 augusti 2008 kl. 14.17 (CEST)[svara]

Ändra ordningen på rubrikerna?

[redigera wikitext]

Jag har denna sida på min bevakningslista och noterar att den sektion som uppdateras oftast är "Våra kortaste artiklar just nu". Vad sägs om att lägga den som första rubrik? Jag brukar personligen tycka att det intressantaste på projektartiklar är syftet och hur det skall uppnås, därefter statistik över hur det går och sist vilka som deltar. Eftersom jag inte räknar mig själv som deltagare i projektet vill jag inte göra någon stor omflyttning efter eget huvud, men väcker härmed frågan om, i första hand, "våra kortaste artiklar just nu"-avsnittet kan flyttas upp på sidan för att lättare hittas.
Vill man ändra mer så kan man flytta rubrikerna enligt följande:

  1. Våra allra kortaste artiklar just nu
  2. Resultat
  3. Artiklar i Kategori:Substubbar
  4. Fördelning av arbetet eller Deltagare
  5. Deltagare eller Fördelning av arbetet

Jag vet inte hur mycket rubriken "Aktuellt" används, så den har jag ingen åsikt om. Den kan för min del ligga överst, underst, på diskussionssidan eller någon annanstans, jag räknar för tillfället inte med den. "Se även" skall givetvis även fortsatt ligga nederst. Vänliga hälsningar Åsa L 14 oktober 2008 kl. 14.45 (CEST)[svara]

Jag tror att det blev så att sidan byggts på efter hand och rubrikerna hamnat lite hur som helst. Inom de flesta wikipediaprojekt är det nog så att projektet presenteras först och sedan deltagarna och sedan vad man vill uppnå, det man jobbar med och sedan vad man uppnått. För min del spelar det ingen roll i vilken ordning rubrikerna ligger. / Elinnea 2 november 2008 kl. 22.21 (CET)[svara]