Hoppa till innehållet

Wikipedia:Sortering

Från Wikipedia

Den här texten handlar om hur artiklar sorteras.

Det som sorteras i Wikipedia är kategoriserade artikelnamn. Till varje kategori X, finns en artikel "Kategori:X" som innehåller en lista över artiklar i kategorin. Dessa artikelnamn är det som sorteras.

Sortering och standardsortering

[redigera | redigera wikitext]

Sorteringen av artikelnamnen är alfabetisk – efter de principer som ligger i programvaran. Man kan för en viss sida avvika från denna sortering antingen genom att specificera en speciell sortering för en given kategori eller genom att ange en standardsortering, som gäller överallt där det inte har angivits något annat.

Genom att ange en annan sortering än som i artikelnamnet, kan man till exempel få personartiklar sorterade efter efternamn och inte efter förnamn, som annars skulle bli fallet. Detta är huvudorsaken för att man anger standardsortering i biografiska artiklar. Resultatet av sorteringen av biografiska artiklar ser man enklast i Kategori:Män eller Kategori:Kvinnor.

Målet med standardsortering

[redigera | redigera wikitext]

Målet med standardsorteringen av artiklar är att få artikelnamnen sorterade på ett intuitivt riktigt sätt. Det är artikelnamnen som visas på kategori-sidorna, inte det namn som står i artiklarnas standardsortering. Vad som är intuitivt riktigt kan självklart diskuteras. Att ta ett modernt uppslagsverk som Nationalencyklopedin till förebild är inte dumt.

Standarden för standardsortering av biografiska artiklar är "Släktnamn, Förnamn". Kommatecknet efter släktnamnet är viktigt eftersom det behandlas av sorteringsalgoritmen. Om det utelämnas kan artikeln få fel placering. Östasiatiska och isländska personnamn har egna svårigheter – mer om det senare.

Sorteringen skall bygga på artikelnamnet, inte på vad personen eller företeelsen "egentligen" heter. Standardsorterar man "Clark Olofsson" som "Demuynck, Daniel", som är hans namn i folkbokföringen idag, betyder detta att "Clark Olofsson" saknas under bokstaven O. I stället står det "Clark Olofsson" på den plats under D, där "Daniel Demuynck" skulle ha stått. Vill man sortera in någon under "egentligt" namn, så kan man lägga in kategorin även i en omdirigering. Detta används främst när ett artikelämne har fler än ett mycket känt namn som annars hamnar "långt" ifrån varandra i sorteringen. I artikelöversikten på kategorisidorna markeras sådana sidor med namnet i kursiv. För exempel, se Theodor Larsson och Julius Rosenberg i Kategori:Män.

För kungligheter och liknande namn med romerska ordningstal i artikelnamnen ersätts de romerska siffrorna med arabiska i standardsorteringen. Gustav II Adolf sorteras "Gustav 2 Adolf". Om kungligheten varit regent i ett annat land och där räknas med ett annat ordningstal, används detta i de relevanta kategorierna: Karl XIV Johan sorteras som "Karl 3 Johan" i kategorin för Norges regenter.

Sortering av personer från olika länder och kulturer

[redigera | redigera wikitext]

Personer med samma namn

[redigera | redigera wikitext]

Många namn bärs av flera personer. De åtskiljs i artikelnamnen med tillägg av yrke, geografisk bestämning eller årtal för födelse och död. Dessa tilläggsupplysningar skall inte läggas in i standardsorteringen. Orsaken är att sorteringsprogrammet inte kan skilja mellan sådana upplysningar och extra förnamn. Vill man att "Carl Larsson i By" skall sorteras tillsammans med "Carl Larsson" (=konstnären) och "Carl Larsson (politiker)", bör alla dessa standardsorteras som "Larsson, Carl". Sorteringsprogrammet ordnar sedan artiklar med samma standardsortering inbördes i strikt alfabetisk ordning.

Flera släktnamn

[redigera | redigera wikitext]

Personer med flera efternamn utan bindestreck behandlas olika i olika språk. Spansktalande har två efternamn som regel och sorteras efter det första.

Statistiska Centralbyrån räknar bara det sista efternamnet som efternamn och behandlar det eller de andra som förnamn (på samma sätt som patronymikon i den finska namnlagen). Detta stämmer också med engelskspråkig behandling av mellannamn. Det rimliga borde vara att sortera efter sista efternamnet för nutida personer som inte följer spanskt namnskick.

Många östasiatiska namn skrivs på de lokala språken med släktnamnet först. Samma namn kan i andra sammanhang också skrivas i västerländsk ordning. Om till exempel kinesen "Li Mingyuan" publicerar i en engelskspråkig vetenskaplig tidskrift, skriver han antagligen sitt namn "Mingyuan Li". Li är alltså "efternamnet". En artikel om en kines med namnet skrivet i västerländsk ordning standardsorteras på vanligt sätt som "Li, Mingyuan". För att artikeln skall kunna sorteras tillsammans med namn skrivna i originalspråkets ordning måste dessa skrivas i standardsorteringen på samma sätt, alltså med kommatecken efter efternamnet. En eventuell artikel med titeln "Li Mingyuan", skall alltså ha standardsorteringen "Li, Mingyuan".

Island, patronymikon och specialfall

[redigera | redigera wikitext]

På Island har nästan alla patronymikon som efternamn, som bildats efter faderns förnamn och som inte ärvs vidare. Sådana namn sorteras där efter förnamn. Sortering av isländska namn på (svenskspråkiga) Wikipedia har hittills skett inkonsekvent och utan någon tydlig rekommendation. Detta förklaras numera i huvudet på Kategori:Islänningar, där rekommendationen tills vidare är sortering efter förnamn. För svenskar sker sortering på förnamn tämligen konsekvent under äldre tider, mindre konsekvent för nyare. Även patronymikon på andra språk sorteras efter förnamn, som Dante Alighieri.

Även äldre namn med patronymikon bör sorteras efter förnamnet. Adelsprefix eller motsvarande är också ett område med speciella förutsättningar, men normalt sorteras de på första del av namnet som skrivs med versal. Prefix med liten bokstav (till exempel "af" och "von") skall inte inkluderas i sorteringssträngen, eftersom prefixen annars uppfattas som förnamn. "Fredrik von Rosen" och "Fredrik Ulrik von Rosen" skall därför sorteras som "Rosen, Fredrik" respektive "Rosen, Fredrik Ulrik".

Ovanliga tecken är ett känt problem. Hur namn med bindestreck hanteras är svårt att förstå. Till exempel sorteras "Ask-Upmark, Erik" före alla personer med efternamnet "Ask". Å andra sidan sorteras "Andersson, Per-Anders" efter "Andersson, Per Östen". Bägge resultaten är icke-intuitiva. I den bästa av världar borde kanske "Andersson, Per Anders" och "Andersson, Per-Anders" sorteras ihop. Detta får man om man utelämnar bindestrecket i förnamn i standardsorteringen.

Specialfall utgör också tillnamn. Huvudregeln är ganska enkel att förstå, men kan vara knepigare att reda ut i det enskilda fallet: om namnet skulle gå i arv, kan det sorteras på. Att Gorm den gamle skall sorteras på "Gorm" och att "den gamle" inte är något efternamn är tämligen lätt att se. Att Wilhelm av Köln inte är något adelsnamn utan enbart en beteckning att han var en målare från Köln är kanske också ganska lätt (här hjälper stavningsreformen 1906; stavas namnet med "af" i moderna verk är det troligen ett äkta efternamn). Andra namn kan dock vara svårare. Särskilt när det är utländska namn kan det bli besvärligt. "Da Vinci" i Leonardo da Vinci (Leonardo från Vinci) tolkas lätt som efternamn. Här är svenskspråkiga wikipedia idag inte konsekvent, Domenico Veneziano (Domenico från Venedig) är idag sorterad på V. Här är inte heller andra uppslagsverk alltid konsekventa. Albertus Pictor hette Albert och var målare, vilket på latin blir Albertus Pictor. Pictor är alltså inget efternamn och han skall sorteras på A. Andra fall är det enklare som i fallen Mårten stenmästare. Men även Gentile da Fabriano är ett sådant tillnamn och han bör sorteras på G. Andra exempel på tillnamn är Erik Röde, Harald Hårfager, Birger jarl med flera.

I kategorier som starkt domineras av personer som skall sorteras på förnamn underlättar det sökbarheten att sortera även personer med äkta släktnamn på förnamnet.

Familjekategorier

[redigera | redigera wikitext]

I kategorier som i huvudsak samlar medlemmar ur samma familj är sortering på familjenamnet mindre lyckad, eftersom alla då hamnar under samma bokstav. I dessa fall är det bättre att ange en separat sorteringsnyckel som utgår från förnamnet.

Fiktiva personer

[redigera | redigera wikitext]

Fiktiva personer sorteras traditionellt utan hänsyn till hur personnamn normalt sorteras: I Nordisk familjebok placeras Sherlock Holmes under "S" [1] och Don Quijote under "D" [2].

Inledande småord (verktitlar)

[redigera | redigera wikitext]

Många av Wikipedias artiklar inleds med "småord" av olika slag; framför allt gäller det bestämd eller obestämd artikel. Beroende på språk och sammanhang kan artiklarna sorteras både med eller utan hänsyn till det inledande småordet; vid återgivning på svenska kan man välja att följa ursprungsspråkets regler eller svenska regler. Här nedan följer standard i några olika språk:

  • Engelska: Sortering görs i regel på första ordet efter inledande artikel.[1]
  • Franska: Om första ordet är en bestämd artikel sorteras efter ord två. I Québec rekommenderas dock ofta en sortering efter svenskt mönster.[2]
  • Italienska: Sortering görs även enligt inledande artikel.
  • Katalanska: Sortering görs även enligt inledande artikel.[3]
  • Svenska: Sortering görs enligt inledande artikel.

Geografiska namn

[redigera | redigera wikitext]

I vissa språk, till exempel franska, inleds ofta namn på berg, sjöar etc med ett ord för "berg" eller "sjö", till exempel "Lac X" för franskspråkiga sjöar (kanadensiska myndigheter kallar detta ord "generic"). I sjökategorier hamnar då nästan alla artiklar under "Lac" om de inte sorteras på huvudordet eller frasen som börjar med stor bokstav och följer "Lac" och eventuella bindeord (det vill säga "Lac de l'X" sorteras som "X"). Särskilt praktiskt är det i språkligt blandade områden med olikspråkliga artikeltitlar där den generiska delen har olika form och placering, eftersom en sådan sortering är mindre känslig för valet av språk i artikeltitlar, eller om ett berg kan kallas både "Mount X" och "X Mountain". I kategorier som innehåller olika typer av geografiska objekt är det däremot lämpligt att sortera på hela artikeltiteln.

  1. ^ "Alphabetizing". chicagomanualofstyle.org. Läst 25 mars 2016. (engelska)
  2. ^ "Titres d'œuvres et d'ouvrages divers". gouv.qc.ca. Läst 25 mars 2016. (franska)
  3. ^ "Obres artístiques (majúscules)". esadir.cat. Läst 25 mars 2016. (katalanska)