Europeiska sorteringsordningen
Den europeiska sorteringsordningen, eller ESO (EOR, "European ordering rules", på engelska) är en anpassning av ISO/IEC 14651 (Information technology -- International string ordering and comparison -- Method for comparing character strings and description of the common template tailorable ordering).[1] ESO kan i sin tur anpassas för olika (europeiska) språk. Men i mellaneuropeiska sammanhang kan ESO:s sorteringsordning användas utan anpassning.
Metod
[redigera | redigera wikitext]Det här avsnittet behöver källhänvisningar för att kunna verifieras. (2017-07) Åtgärda genom att lägga till pålitliga källor (gärna som fotnoter). Uppgifter utan källhänvisning kan ifrågasättas och tas bort utan att det behöver diskuteras på diskussionssidan. |
Liksom för ISO/IEC 14651, som ESO är baserad på, har ESO fyra nivåer av vikter.
Nivå 1 sorterar bokstäverna. Följande latinska bokstäver berörs av denna nivå, i ordningsföljd:
- a b c d e f g h i j k l m n o p q r s t u v w x y z þ
Det grekiska alfabetet har följande bokstavsföljd i ESO:
- α β γ δ ε Ϝ Ϛ ζ η θ ι κ λ μ ν ξ Ϟ ο π ρ σ ς τ υ φ χ ψ ω Ϡ
Det kyrilliska alfabetet har följande bokstavsföljd i ESO:
- а ӑ ӓ ә ӛ ӕ б в г ғ ҕ д ђ ҙ е ӗ є ж ӝ җ з ӟ ӡ и ӥ і ї й ј к қ ӄ ҡ ҟ ҝ л љ м н ң ӊ ҥ њ о ӧ ө ӫ п ҧ р с ҫ т ҭ ћ у ў ӱ ӳ ү ұ ф х ҳ һ ц ҵ ч ӵ ҷ ӌ ҹ ҽ ҿ џ ш щ ъ ы ӹ ь э ю я ҩ Ӏ
Ordningsföljden för dessa tre alfabet är:
- Latinska alfabetet
- Grekiska alfabetet
- Kyrilliska alfabetet
De georgiska och armeniska alfabeten har ännu inte blivit inkluderade i ESO, men hanteras i CR 14400:2001 "European ordering rules -- Ordering for Latin, Greek, Cyrillic, Georgian and Armenian scripts". Notera också att alla skriftsystem som finns med i ISO/IEC 10646 och Unicode hanteras av ISO/IEC 14651:s CTT och Unicode Collation Algorithm:s DUCET. Dessa båda standarder med respektive datafil kan laddas ner gratis.
Nivå 2 är där olika tillägg, som diakritiska tecken och modifierade bokstäver, ordnas. Bokstäver med accenter (inklusive å, ä, ö och ø)[källa behövs] sorteras som varianter av grundbokstaven. æ, œ, ij och ŋ ordnas som modifieringar av ae, oe, ij och n respektive, likadant för liknande fall.
Nivå två fastställer följande ordningsföljd för diakritiska tecken och andra modifieringar:
- Akut accent (á)
- Grav accent (à)
- Brevis (ă)
- Cirkumflex (â)
- Hake (š)
- Ring (å)
- Trema (ä)
- Dubbel akut accent (ő)
- Tilde (ã)
- Punkt över (ż)
- Cedilj (ş)
- Svans (ą)
- Streck (ā)
- Med streck genom (ø)
- Modifierad(e) bokstav/bokstäver (æ)
Nivå 3 skiljer mellan stora och små bokstäver. Som i engelskans Polish (polska) och polish (polera).
Nivå 4 berör blanksteg och annan interpunktion. Den här nivån gör skillnad mellan till exempel "MacDonald" och "Mac Donald", "its" (dess) och "it's" (det är).
En femte nivå, som normalt utelämnas, berör den typografiska formen, vilket bland annat täcker om texten är kursiv, normal eller fet.
Se även
[redigera | redigera wikitext]Referenser
[redigera | redigera wikitext]- ^ ”ENV 13710 -- a "European Pre-Standard": European ordering rules”. Arkiverad från originalet den 14 maj 2011. https://web.archive.org/web/20110514101431/http://anubis.dkuug.dk/CEN/TC304/EOR/eorhome.html. Läst 30 augusti 2009.