De stora talens lag
De stora talens lag är en sats inom sannolikhetsteorin, som innebär att det aritmetiska medelvärdet av ett stort antal oberoende observationer av en slumpvariabel med stor sannolikhet ligger nära variabelns väntevärde. De stora talens lag kan sägas motsvara uttrycket "Det jämnar ut sig i det långa loppet", under vissa omständigheter.
Historia
[redigera | redigera wikitext]Bernoullis sats
[redigera | redigera wikitext]Den första versionen av stora talens lag formulerades och bevisades av Jacob Bernoulli i början på 1700-talet av, Bernoullis sats[1], men publicerades inte förrän åtta år efter hans död. Det Bernoulli visade motsvarar svaga stora talens lag, med fallet då de ingående stokastiska variablerna endast antar två värden. Egentligen behandlade han det omvända jämfört med hur stora talens lag idag brukar formuleras; givet ett utfall från N antal försök, hur kan vi då bestämma väntevärdet (Om vi tar upp N kulor ur en påse med enbart blåa och gula kulor, vad kan vi då säga om den totala fördelningen?)?
I sitt arbete beräknade Bernoulli även att det, exempelvis, krävs 25 500 observationer för att med säkerheten 1000/1001 landa på rätt svar +/- 1/50, om väntevärdet är 30/50.[2]
Generalisering
[redigera | redigera wikitext]Siméon Denis Poisson försökte på 1830-talet att generalisera Bernoullis sats, vilken dock blev omdiskuterad[2]. Sin nuvarande formulering fick de stora talens lag 1933 av Andrej Kolmogorov, även om det än idag presenteras nya varianter för olika specialfall.
Användning i praktiken
[redigera | redigera wikitext]Några användningsområden
[redigera | redigera wikitext]- Försäkringar: De stora talens lag är mycket användbar när det gäller försäkringar, då den kan ge en ungefärlig förutsägelse över framtida händelser utifrån tidigare år. Ju fler kunder ett försäkringsbolag har, desto mindre påverkar slumpen. Vid större förändringar och trender, till exempel klimatförändringar, är den dock åtminstone delvis oanvändbar.
- Spelbolag: Om ett spel i genomsnitt kommer att ge vinst åt arrangören, kommer även arrangören, efter tillräckligt många spelomgångar, att gå med vinst.
- Medicin: De stora talens lag minimerar ett slumpmässigt beteende av medicinska åtgärder.
- Naturvetenskap: Påverkan från icke regelmässiga mätfel kan minimeras genom att göra många mätningar.
En felaktig tolkning
[redigera | redigera wikitext]En vanlig misstolkning av de stora talens lag är att om man kastar tärning ett antal gånger, och får fler, säg, femmor än förväntat (dvs oftare än var sjätte gång), kommer tärningen framöver att tendera att visa färre femmor än förväntat (dvs mer sällan än var sjätte gång), för att den totala andelen ska kunna närma sig 1/6, i enlighet med De stora talens lag.
Detta är en helt felaktig tolkning. Detta strider mot förutsättningen att observationerna ska vara oberoende, det vill säga att de inte ska påverkas av tidigare utfall, vilket de ju gör i detta missförstånd.
Matematik
[redigera | redigera wikitext]De stora talens lag i svag form
[redigera | redigera wikitext]Låt X1, X2, X3 … vara oberoende stokastiska variabler med samma sannolikhetsfördelning, och låt, Sn och Mn vara summan respektive medelvärdet av de n variablerna:
- .
Om väntevärdet μ = E(Xi) är ändligt gäller för alla ε>0 att
- .
De stora talens lag i stark form
[redigera | redigera wikitext]Låt Mn vara samma stokastiska variabel som ovan och antag återigen att väntevärdet μ är ändligt. Då gäller att
Skillnaden mellan starka och svaga formen
[redigera | redigera wikitext]Den svaga formen säger att sannolikheten för att Mn ska konvergera mot μ går mot 1, då n går mot oändligheten. Den starka formen säger å sin sida att sannolikheten att Mn ska konvergera mot μ är 1.
Värt att notera är även att den starkare formen implicerar den svaga, medan den svaga inte implicerar den starka.
Bevis för ett specialfall
[redigera | redigera wikitext]Det här är ett bevis för svaga stora talens lag med specialfallet stokastiska variabler som enbart antar värdena 0 och 1 med sannolikheten 1/2 vardera, exempelvis en slantsingling. Då gäller alltså att väntevärdet E(Xi) = 1/2. Notationen med Sn och Mn används som ovan. Då väntevärdesoperatorn är linjär, gäller att
- samt
- .
Låt Zn = (Mn - 1/2)2, så att variansen hos Mn är Var(Mn) = E(Zn). Definiera sedan funktionen
- .
Här gäller Zn* ≤ Zn och därmed E(Zn*) ≤ E(Zn). Väntevärdet för denna funktion kan då skrivas
- .
Vi kan lösa ut att
- .
Om vi sedan konstaterar att |Mn - 1/2| ≥ ε om och endast om Zn ≥ ε2 får vi
Kan vi nu visa att högerledet i ovanstående olikhet går mot noll då n går mot oändligheten (alltså ett gränsvärde), har vi bevisat specialfallet. Definitionen av varians respektive Mn ger
_
Xi och Xj kan enbart anta värdena 0 resp 1. Då i = j (n olika fall) gäller alltså att
- .
Då i ≠ j gäller att sannolikheten för Xi = Xj respektive Xi ≠ Xj båda är 1/2, dvs produkten blir 1/4 resp -1/4 med sannolikhet 1/2 vardera. För väntevärdet gäller då
Sammanfattningsvis ser vi alltså att
och därmed att
vilket går mot 0 då n→∞. Därmed får vi, för alla ε > 0, att
- .
Därmed är specialfallet av svaga stora talens lag bevisad. Det är fullt möjligt att gå vidare och även bevisa starka stora talens lag för detta fall, och även för mer generella fall.
Se även
[redigera | redigera wikitext]Litteratur
[redigera | redigera wikitext]- Olle Häggström Slumpens skördar - Strövtåg i sannolikhetsteorin Lund: Studentlitteratur, 2004, ISBN 91-44-03017-7
- Andreas Svensson Är tärningen kastad? - Sannolikhetslära för vem som helst Trollhättan: Bombadil Publishing, 2008, ISBN 91-85765-02-3
Källor
[redigera | redigera wikitext]- ^ ”stora talens lag”. Nationalencyklopedin. http://ne.se/l%C3%A5ng/storatalenslag. Läst 27/3 2009.
- ^ [a b] Stephen M. Stigler The history of statistics: the measurement of uncertainty before 1900 Cambridge, Mass.: Harvard Univ. Press 1986, ISBN 0-674-40340-1