Hoppa till innehållet

Wikipediadiskussion:Okategoriserade sidor

Sidans innehåll stöds inte på andra språk.
Från Wikipedia

När jag skapade de här sidorna inför kategoriseringstävlingen i december 2005 fanns det 14 375 okategoriserade artiklar av totalt ungefär 120 000, vilket motsvarar 12 % okategoriserat. Nu är den siffran nere på 4 147 av drygt 190 000, vilket blir ungefär 2,2 %. Det är ett gott betyg åt alla er som ägnar er åt att gå igenom dessa listor och kategorisera. Bra jobbat! —CÆSAR 29 oktober 2006 kl. 12.57 (CET)[svara]

Okategoriserade artiklar (från Bybrunnen)[redigera wikitext]

Ibland hittar jag en artikel som helt saknar kategori, men där mina kunskaper inte är nog för att avgöra vilken/vilka den ska placeras i. Jag har svaga minnen av att det finns en kategori eller en mall för att märka ut sådana artiklar för andra. Någon som kan ge mer detaljer? --Bark 2 januari 2007 kl. 09.59 (CET)[svara]

Artiklar som saknar kategorier listas automatiskt på Special:Uncategorizedpages, men eftersom den är begränsad till 1 000 poster finns även Wikipedia:Okategoriserade sidor. Man behöver alltså inte märka upp artiklar som saknar kategorier på något särskilt sätt om man inte kommer på vad rätt kategori(er) för artikeln är. LX (diskussion, bidrag) 2 januari 2007 kl. 21.06 (CET)[svara]
Problemet är ariklar såsom Trefärgstryck som är kategorilös men inte klassas som sådan eftersom det finns en ugglanmall längst ner på sidan. /Lokal_Profil 3 januari 2007 kl. 04.06 (CET)[svara]
Eller för den delen alla dessa stubbar. Visst, de ligger förhoppningsvis någorlunda nära den kategori de borde vara i, men det är ändå ett problem eftersom det är svårt att kontrollera om alla artiklar i en viss kategori har en annan kategori.
andejons 3 januari 2007 kl. 14.06 (CET)[svara]
Nu vet jag inte exakt hur Caesars SQL-satser som han använder för att uppdatera WP:OS ser ut, men det borde inte vara omöjligt att räkna vissa kategorier som ickekategorier eller (kanske hellre) skapa en separat lista för artiklar som bara är stubb- eller ugglanmärka. Det är dock en diskussion som hör hemma på Wikipediadiskussion:Okategoriserade sidor. LX (diskussion, bidrag) 3 januari 2007 kl. 17.37 (CET)[svara]
Jag skulle tro att Caesars lista inkluderar artiklar som enbart innehåller en kategoriserande mall. /Grillo 3 januari 2007 kl. 21.55 (CET)[svara]
Vet du inte? SQL-raden står i klartext på sidan som du länkade till... ;-) För att göra en lång historia kort så använder sökningen tabellen categorylinks, som är samma tabell som används på kategorisidorna för att visa vilka artiklar som ingår i kategorin. Allt som är kategoriserat ingår därmed, inklusive artiklar med bara stub- eller ugglan-mall. Jag ska se om det går att ta bort stub- och ugglekategoriseringarna från sökningen. Och kvalitetskontroll, m.fl. Om någon SQL/MediaWiki-kunnig har ett förslag så skriv på Wikipediadiskussion:Okategoriserade sidor. —CÆSAR 4 januari 2007 kl. 09.25 (CET)[svara]

Nu tror jag iofs att Bark är ute efter en mall som han kan sätta in i artikeln för att påtala behovet av en kategorisering (ungefär som {{illustrationsbehov}} används för behov av illustration). Vad jag vet finns ingen sådan mall. //Knuckles...wha? 4 januari 2007 kl. 10.33 (CET)[svara]

Precis. Fast det var bra att veta att det fanns en specialsida så att inte artiklarna bara blir "försvunna". --Bark 4 januari 2007 kl. 10.43 (CET)[svara]

Halvkategoriserade sidor[redigera wikitext]

Det finns en handfull kategorier som inte borde räknas som del av artikelkategoriträdet. Denna grupp inkluderar stub- och kvalitetsrelaterade kategorier, av vilka de flesta är inkluderade via mallar. Jag har lite tankar kring hur detta ska genomföras som jag får testa när jag har tid. Om ni andra har förslag på förbättringar och praktiska lösningar så får ni gärna ge dem här! —CÆSAR 4 januari 2007 kl. 09.49 (CET)[svara]

En möjlighet är att söka i artikeltexten efter artiklar som inte innehåller koden [[Kategori:]] eller [[Category:]].
SELECT page_title 
  FROM Page, Text
 WHERE page_namespace = 0 
   AND page_is_redirect = 0
   AND page_latest = old_id
   AND old_text NOT REGEXP '\\[\\[(Kategori|Category):.*\\]\\]';
Det kan missa en del okategoriserade som innehåller [[Kategori:]] utan att sidan kategoriseras (inom nowiki-taggar, med otillåtna tecken, ...) och sidor där metakategorier läggs till utan någon mall. Att ställa en den frågan tar förmodligen lång tid.
Annars kan du försöka göra en lista över "riktiga kategorier". Då behövs något villkor för att avgöra om en kategori är en riktig kategori och vad som är en metakategori. Om alla metakategorier hade namn på formen Kategori:Wikipedia:X eller Kategori:Xstubbar, så skulle följande fungera
CREATE TEMPORARY TABLE Metacats
SELECT page_title
  FROM Page
 WHERE page_namespace = 14
   AND page_title REGEXP '(Wikipedia|stubbar)';
      
CREATE TEMPORARY TABLE Realcategorylinks 
SELECT cl_from, cl_to 
  FROM Categorylinks LEFT JOIN Metacats ON cl_to = page_title
 WHERE page_title IS NULL;

SELECT page_title 
  FROM Page LEFT JOIN Realcategorylinks ON page_id = cl_from
 WHERE cl_from IS NULL 
   AND page_namespace = 0 
   AND page_is_redirect = 0 
 ORDER BY page_title;
/82.212.68.183 4 januari 2007 kl. 15.02 (CET)[svara]
Tackar! Jag var inne på det sistnämnda spåret själv. Du verkar riktigt haj på det här! Om du har tillgång till MySQL och dumpar så får du gärna provskjuta (om du inte redan har gjort det?). Jag har själv inte tid förrän tidigast till helgen. Ska nog samtidigt passa på att får roboten att göra grovjobbet att ladda upp listorna åt mig.
För övrigt har jag några verktyg för att gå igenom XML-dumpen, och de klarar de flesta sökningar på en halv minut, så det är fullt rimligt att göra sådana fritextsökningar, med lite hackning kanske även rensa bort nowiki- och includeonly-taggar. —CÆSAR 4 januari 2007 kl. 16.05 (CET)[svara]

Nu klarar sidan att visa fler än 1 000 artiklar. Thoasp 11 januari 2007 kl. 17.45 (CET)[svara]

Då kanske det är dags att uppgradera utsökningen som ligger bakom dessa sidor enligt förslagen ovan så att WP:OS fortfarande är konkurrenskraftigt? //Essin 12 januari 2007 kl. 23.44 (CET)[svara]

Sidor som inte kategoriserats[redigera wikitext]

Från Bybrunnen habj 22 januari 2007 kl. 02.43 (CET)[svara]

Varför uppdaterar man inte sidan "Ej kategoriserade sidor" regelbundet? Nu är det flera veckor sen det gjordes senast, kan någon göra det? Hur är det vidare med "Wikipedia:Okategoriserade sidor", kan vem som helst uppdatera den eller måste någon administratör (e.d.?) göra det? Den har inte heller blivit uppdaterad på ett tag. BjörnF 22 december 2006 kl. 20.13 (CET)[svara]

Det där görs när utvecklarna (de som fipplar med våra servrar) kör något, och det gör de då och då med (o)regelbundna mellanrum. Om man vill påverka vad de gör är det smart att hänga i IRC-kanalen #mediawiki. Det brukar gå att få sånt kört lite snabbare om man kan uppföra sig och ber snällt, samt står ut med skämt om hur mycket det kostar att få det gjort. // habj 22 december 2006 kl. 20.55 (CET)[svara]
Faktum är att toolsservern ligger ner och många fiffiga verktyg kan inte användas eller uppdateras, bland annat specialsidorna (nu kan det ju vara så att jag är felinformerad...). sollentuna 22 december 2006 kl. 20.59 (CET)[svara]
Specialsidorna har inget med toolservern att göra. För Special:Uncategorizedpages är det som Habj säger. Wikipedia:Okategoriserade sidor är en vanlig sida i Wikipedianamnrymden som vem som helst kan redigera. Men för att uppdatera den sidan behöver man en ladda ner den senaste databasdumpen och använda SQL-frågor, så det krävs en del tekniskt kunskap. Det är Användare:Caesar som skött sidan hitills. /82.212.68.183 22 december 2006 kl. 21.09 (CET)[svara]
Jepp, jag har inte varit så aktiv på Wikipedia på sistone och har missat att uppdatera Wikipedia:Okategoriserade sidor-sidorna vid den senaste databasdumpen. Vem som helst kan i princip hitta datat och uppdatera sidorna, det kräver ”bara” lite hackervana och fri tillgång till en MySQL-databas. Jag började pilla på en bot som skulle uppdatera sidorna automatiskt, men jag har inte kommit så långt i det arbetet. Nu är det dock ett par dagar lediga, så kanske det kunde bli en julklapp till svwp ... :-) —CÆSAR 23 december 2006 kl. 00.52 (CET)[svara]

Sidan nedlagd[redigera wikitext]

Jag var djärv och lade ner sidan eftersom Special:Uncategorizedpages ska fungera korrekt nu. Om någon vill återuppliva sidan av någon anledning så går det naturligtvis bra. —CÆSAR 15 april 2007 kl. 21.16 (CEST)[svara]

Det nya skriptet räknar väl även stubbmärkta, men i övrigt okategoriserade sidor som okategoriserade, så den här sidan har väl en uppgift även i framtiden? //Essin 18 april 2007 kl. 05.38 (CEST)[svara]

"Alla" artiklar är nu kategoriserade[redigera wikitext]

(flyttat från Bybrunnen) /NH 23 maj 2007 kl. 14.01 (CEST)[svara]

Alla uppräknade artiklar på specialsidan "Ej kategoriserade sidor" finns nu i minst en kategori, vilket nog måste betraktas som en milstolpe i svenska Wikipedias historia (tycker åtminstone jag, som arbetat en hel del med kategorisering). Härefter bör det alltså finnas ett rimligt antal okategoriserade sidor listade på "Ej kategoriserade sidor" (jag har beräknat att omkring 50 st. artiklar per dag skapas och blir okategoriserade) som man borde hinna kategorisera innan sidan uppdateras med nya sådana. Finns det någon som kan hjälpa mig med detta kategoriserande? BjörnF 15 april 2007 kl. 21.59 (CEST)[svara]

Det finns fortfarande många artiklar som är markerade som stubbar och inte är kategoriserade, dessa kommer inte med på "Ej kategoriserade sidor". På undersidorna till Wikipedia:Okategoriserade sidor finns dessa med. Det finns fortfarande massor av okategoriserade artiklar kvar där, 0–9 och specialtecken samt A-E är klara, men från F och framåt finns det mycket kvar. Glöm inte att ta bort artiklarna på undersidorna när kategoriseringen är klar. Thoasp 15 april 2007 kl. 22.29 (CEST)[svara]
För att inte Björn ska känna sig totalt knäckt över detta får åtminstone jag ge sinnessjukt mycken beröm för uppgiften! Skitbra att nån orkar, jag hade inte gjort det. /Grillo 15 april 2007 kl. 22.33 (CEST)[svara]
Jag kan inte annat än hålla med. Själv har jag kikat in där ibland för att ganska omgående få svettningar av insikten vilket jobb det innebär. Tre stora tummar upp till Björn! --Strangnet (d, b) 15 april 2007 kl. 22.36 (CEST)[svara]
Instämmer i berömmet. Har bara 2 tummar lediga, men de är i luften ;)
/Ronny 15 april 2007 kl. 22.41 (CEST)[svara]
Mitt inlägg ovan är naturligtvis ingen kritik mot Björn, han har gjort ett jättejobb! Inlägget är snarare en önskan om hjälp att kategorisera sidorna som jag nämnde, det verkar som det bara är jag som gör det och får jag ingen hjälp kommer det att ta flera månader, kanske år! Thoasp 15 april 2007 kl. 22.43 (CEST)[svara]
Okej bara man hittar till WP:OS så kanske man kan kategorisera lite när man inte har något bättre för sig. Men jag undrar varför de festa(?) artiklar under Special:Uncategorizedpages är kategoriserade, är det för att den exempelvis uppdateras vid vissa tillfällen? /Moberg 15 april 2007 kl. 23.35 (CEST)[svara]
Japp, så om ett par dagar kommer den att krympa ganska rejält, tack vare BjörnF. /NH 15 april 2007 kl. 23.37 (CEST)[svara]
Längst upp står det "Sidan är hämtad ur ett cacheminne och uppdaterades senast 13 april 2007 kl. 20.52.". Det är ett bra jobb av BjörnF, och sånt jobb borde det göras mer av, jag försökte ge mig på att rensa Kategori:Svenska musikgrupper, och lägga dem efter genre istället, men det var skitsvårt, och nu är det några hundra artiklar kvar där ändå... //moralist 15 april 2007 kl. 23.41 (CEST)[svara]
Väl gjort & väl behövligt, dock får man hoppas att det här var en engångsföreteelse ang. uppmärksamhet. --Saber 15 april 2007 kl. 23.47 (CEST)[svara]
Jag hoppas att det där irrelevanta gnället var en engångsföreteelse. —CÆSAR 15 april 2007 kl. 23.54 (CEST)[svara]
Vad tillför /ditt/ gnäll? Har du något emot att jag gör Björn uppmärksam på något han missade kan du fanimig hålla det för dig själv. --Saber 16 april 2007 kl. 00.10 (CEST)[svara]
Finns det någon anledning till varför förgreningssidor hamnar på WP:OS? kategoriserade förgreningssidor vill säga. /Lokal_Profil 16 april 2007 kl. 01.32 (CEST)[svara]
Det var ett misstag av mig när jag skapade listorna. Jag tog med alla kategorier som innehöll delsträngarna "sidor", "wikipedia" eller "stubbar". Sedan tog jag bara bort Kategori:Förgreningssidor, men jag glömde bort övriga förgreningskategorier. /EnDumEn 16 april 2007 kl. 10.23 (CEST)[svara]

Jag tackar för berömmet. Appropå att orka ta hand om alla okategoriserade sidor, finns det alltså någon som regelbundet kan hjälpa, eller för tillfället hjälper, till med den kategorisering jag håller på med? Det har faktiskt varit tröttsamt att gå igenom så många sidor som det handlar om, speciellt som det kan kännas som om en majoritet handlar om nästan helt okända svenska och anglosaxiska skådespelare/sångare/musiker/musikgrupper. BjörnF 16 april 2007 kl. 07.08 (CEST)[svara]

Sidfråga. Okategoriserade kategorier hamna på en specialsida, och okategoriserade artiklar på en annan. Men okategoriserade mallar tycks inte finnas någonstans. Eller har jag bara inte hittat sidan? /Lokal_Profil 16 april 2007 kl. 17.02 (CEST)[svara]
Jag kan hjälpa till. Hjälper du mig med WP:OS? Thoasp 16 april 2007 kl. 16.59 (CEST)[svara]
Nej, det tycks bara finnas sådana specialsidor för kategorier, artiklar och bilder. Om det går skulle det vara mycket användbart om listor över okategoriserade mallar och sidor i Wikipedia-rymden kunde tas fram. sollentuna 16 april 2007 kl. 18.36 (CEST)[svara]
Tycker inte att det borde vara så mycket svårare att generera än okategoriserade bilder sidan, men vad vet jag, det finns antagligen en felrapport om det redan.
Björn, om du vill ha en push på kategoriseringsfronten så la jag märket till att det inte finns någon veckans tävling ännu./Lokal_Profil 16 april 2007 kl. 20.15 (CEST)[svara]

Svar till Användare:Thoasp och Användare:Servant Saber på respektives diskussionssida. BjörnF 21 april 2007 kl. 16.34 (CEST)[svara]

Fler artiklar att kategorisera[redigera wikitext]

Efter den senaste uppdateringen av Special:Uncategorizedpages så finns drygt 200 okategoriserade sidor att kategorisera. Dessutom finns listorna under Wikipedia:Okategoriserade sidor att gå igenom och sedan tömma. /Dewil 17 april 2007 kl. 10.38 (CEST)[svara]

När stubkategorierna räknas bort hur görs det? Undrar då jag lagt märket till att långt ifrån alla våra stubbmallar innehåller <div class="boilerplate metadata" id="stub">. Är detta något som borde införas i alla dessa mallar? /Lokal_Profil 17 april 2007 kl. 17.15 (CEST)[svara]
Om artiklar ska kunna ha flera olika stubmallar, så bör inte id="stub" användas. Då skapas felaktig HTML eftersom sidan då innehåller samma id flera gånger. Om id:t används för att få ett visst utseende via css så kan man istället använda class-attributet, t.ex. class="boilerplate metadata stub". /82.212.68.183 22 april 2007 kl. 21.06 (CEST)[svara]
Nu har det iofs varit praxis på svenska Wikipedia (till skillnad från en del andra språkversioner) att undvika multipla stubmallar, eftersom en artikel av stub-längd då lätt fullständigt domineras av sådana mallar. /dcastor 22 april 2007 kl. 22.58 (CEST)[svara]

(ny delfråga) Även om stubkategorier inte räknas så tycks det som att andra administrativa kategorier räknas, se t.ex. Unika partiet. Åtgärd? sollentuna 23 april 2007 kl. 21.30 (CEST)[svara]

Vad som behövs för att göra listan är ett kriterium för vilka kategorier som inte ska räknas. När jag skapade listan utgick jag bara från kategorinamnen och räknade bort kategorier med namn som innehåller "wikipedia", "sidor" eller "stubbar". Därför räknas kategorierna "Artiklar som ..." som riktiga kategorier i den listan. Jag kan göra en ny lista när nästa databasdump är färdig, och då räkna bort "artiklar"-kategorierna. /EnDumEn 23 april 2007 kl. 22.30 (CEST)[svara]
En sådan lista skulle väll kunna skapas som till exempel Wikipedia:Okategoriserade sidor/Icke-kategorier eller liknande. På så sätt så kan man lägga till kategorier som man upptäcker har blivit missade. /Lokal_Profil 3 maj 2007 kl. 13.31 (CEST)[svara]