NORMAL FÖRDELNING: FORMEL, EGENSKAPER, EXEMPEL, TRÄNING - MATTE

Den normalfördelning eller Gaussfördelning är sannolikhetsfördelningen i en kontinuerlig variabel, där sannolikhetstätheten beskrives av en exponentiell funktion av kvadratiska och negativa argument, som ger upphov till en klockform.

Namnet på normalfördelning kommer från det faktum att denna distribution är den som gäller för det största antalet situationer där någon kontinuerlig slumpmässig variabel är involverad i en given grupp eller befolkning.

Figur 1. Normal fördelning N (x; μ, σ) och dess sannolikhetsdensitet f (s; μ, σ). (Egen utarbetande)

Exempel där normalfördelningen tillämpas är: höjden på män eller kvinnor, variationer i måtten på någon fysisk storlek eller i mätbara psykologiska eller sociologiska drag såsom den intellektuella kvoten eller konsumtionsvanor för en viss produkt.

Å andra sidan kallas det en Gauss-distribution eller Gauss-klocka, eftersom det är detta tyska matematiska geni som krediteras sin upptäckt för den användning han gav den för att beskriva det statistiska felet för astronomiska mätningar redan år 1800.

Det sägs emellertid att denna statistiska distribution tidigare publicerades av en annan stor matematiker av franskt ursprung, såsom Abraham de Moivre, redan 1733.

Formel

Den normala fördelningsfunktionen i den kontinuerliga variabeln x, med parametrarna μ och σ, betecknas med:

N (x; μ, σ)

och det är uttryckligen skrivet så här:

N (x; μ, σ) = ∫ _-∞ ^x f (s; μ, σ) ds

där f (u; μ, σ) är sannolikhetsdensitetsfunktionen:

f (s; μ, σ) = (1 / (σ√ (2π)) Exp (- s ² / (2σ ² ))

Konstanten som multiplicerar den exponentiella funktionen i sannolikhetsdensitetsfunktionen kallas normaliseringskonstanten, och den har valts på ett sådant sätt att:

N (+ ∞, μ, σ) = 1

Det föregående uttrycket säkerställer att sannolikheten för att den slumpmässiga variabeln är mellan -∞ och + ∞ är 1, det vill säga 100% sannolikhet.

Parametern μ är det aritmetiska medelvärdet för den kontinuerliga slumpmässiga variabeln x och σ standardavvikelsen eller kvadratroten för varianten för samma variabel. I fallet att μ = 0 och σ = 1 så har vi den normala normalfördelningen eller typisk normalfördelning:

N (x; μ = 0, σ = 1)

Egenskaper för normalfördelningen

1- Om en slumpmässig statistisk variabel följer en normalfördelning av sannolikhetsdensiteten f (s; μ, σ), grupperas de flesta av uppgifterna runt medelvärdet μ och är spridda runt den på ett sådant sätt att lite mer än ⅔ av data ligger mellan μ - σ och μ + σ.

2- Standardavvikelsen σ är alltid positiv.

3- Formen på densitetsfunktionen f liknar en klocka, varför denna funktion ofta kallas en Gauss-klocka eller Gauss-funktion.

4- I en Gaussisk fördelning sammanfaller medelvärdet, medianen och läget.

5- Böjningspunkterna för sannolikhetsdensitetsfunktionen är exakt vid μ - σ och μ + σ.

6- Funktionen f är symmetrisk med avseende på en axel som passerar genom sitt medelvärde μ och har asymptotiskt noll för x ⟶ + ∞ och x ⟶ -∞.

7- Ju högre värdet på σ, desto större spridning, brus eller avstånd för data runt medelvärdet. Med andra ord, ju högre σ är klockformen mer öppen. Å andra sidan indikerar σ små att tärningarna är nära medelvärdet och formen på klockan är mer stängd eller spetsig.

8- Distributionsfunktionen N (x; μ, σ) indikerar sannolikheten för att den slumpmässiga variabeln är mindre än eller lika med x. Till exempel i figur 1 (ovan) är sannolikheten P att variabeln x är mindre än eller lika med 1,5 84% och motsvarar området under sannolikhetsdensitetsfunktionen f (x; μ, σ) från -∞ till x.

Förtroendeintervaller

9- Om uppgifterna följer en normalfördelning är 68,26% av dessa mellan μ - σ och μ + σ.

10- 95,44% av uppgifterna som följer en normalfördelning är mellan μ - 2σ och μ + 2σ.

11- 99,74% av uppgifterna som följer en normalfördelning är mellan μ - 3σ och μ + 3σ.

12- Om en slumpmässig variabel följer en fördelning N (x; μ, σ), så är variabeln

z = (x - μ) / σ följer den normala normala fördelningen N (z; 0,1).

Ändringen av variabeln x till z kallas standardisering eller typisering och är mycket användbar när du använder tabellerna för standardfördelningen på data som följer en icke-standard normalfördelning.

Ansökningar om normalfördelning

För att tillämpa normalfördelningen är det nödvändigt att gå igenom beräkningen av integralen av sannolikhetstätheten, vilket ur analytisk synvinkel inte är lätt och det inte alltid finns ett datorprogram som tillåter dess numeriska beräkning. För detta ändamål används tabellerna med normaliserade eller standardiserade värden, vilket inte är mer än normalfördelningen i fallet μ = 0 och σ = 1.

Standardiserad normalfördelningstabell (del 1/2)

Standardiserad normalfördelningstabell (del 2/2)

Det bör noteras att dessa tabeller inte innehåller negativa värden. Men med användning av symmetriegenskaperna för den Gaussiska sannolikhetsdensitetsfunktionen kan motsvarande värden erhållas. Den lösta övningen som visas nedan visar användningen av tabellen i dessa fall.

Exempel

Anta att du har en uppsättning slumpmässiga data x som följer en normalfördelning av medelvärdet 10 och standardavvikelse 2. Du ombeds hitta sannolikheten för att:

a) Den slumpmässiga variabeln x är mindre än eller lika med 8.

b) Är mindre än eller lika med 10.

c) Att variabeln x är under 12.

d) Sannolikheten för att ett x-värde är mellan 8 och 12.

Lösning:

a) För att besvara den första frågan måste du bara beräkna:

N (x; μ, σ)

Med x = 8, μ = 10 och σ = 2. Vi inser att det är en integral som inte har en analytisk lösning i elementära funktioner, men lösningen uttrycks som en funktion av felfunktionen erf (x).

Å andra sidan finns det möjligheten att lösa integralen i numerisk form, vilket är vad många kalkylatorer, kalkylblad och datorprogram som GeoGebra gör. Följande figur visar den numeriska lösningen som motsvarar det första fallet:

Figur 2. Sannolikhetsdensitet f (x; μ, σ). Det skuggade området representerar P (x ≤ 8). (Egen utarbetande)

och svaret är att sannolikheten för att x är under 8 är:

P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0,1587

b) I detta fall försöker vi hitta sannolikheten för att den slumpmässiga variabeln är under medelvärdet, vilket i detta fall är värt 10. Svaret kräver ingen beräkning, eftersom vi vet att hälften av uppgifterna är under genomsnitt och den andra hälften över genomsnittet. Därför är svaret:

P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0,5

c) För att besvara denna fråga måste vi beräkna N (x = 12; μ = 10, σ = 2), vilket kan göras med en kalkylator som har statistiska funktioner eller genom mjukvara som GeoGebra:

Figur 3. Sannolikhetsdensitet f (x; μ, σ). Det skuggade området representerar P (x ≤ 12). (Egen utarbetande)

Svaret på del c kan ses i figur 3 och är:

P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0,8413.

d) För att hitta sannolikheten för att den slumpmässiga variabeln är mellan 8 och 12 kan vi använda resultaten från delarna a och c enligt följande:

P (8 <x <12) = P (x <12) - P (x <8) = 0,8413 - 0,1587 = 0,66826 = 68,26%.

Träningen löst

Genomsnittspriset för ett företags aktie är $ 25 med en standardavvikelse på $ 4. Bestäm sannolikheten för att:

a) En åtgärd kostar mindre än $ 20.

b) Det har en kostnad större än $ 30.

c) Priset är mellan $ 20 och $ 30.

Använd standardfördelningstabellerna för att hitta svaren.

Lösning:

För att använda tabellerna är det nödvändigt att gå till den normaliserade eller typade z-variabeln:

20 $ i den normaliserade variabeln är lika med z = ($ 20 - $ 25) / $ 4 = -5/4 = -1,25 och

30 $ i den normaliserade variabeln är lika med z = ($ 30 - $ 25) / $ 4 = +5/4 = +1,25.

a) $ 20 motsvarar -1,25 i den normaliserade variabeln, men tabellen har inte negativa värden, så vi placerar värdet +1,25 som ger värdet 0,8944.

Om 0,5 subtraheras från detta värde blir resultatet området mellan 0 och 1,25, som förresten är identiskt (med symmetri) till området mellan -1,25 och 0. Resultatet av subtraktionen är 0,8944 - 0,5 = 0,3944, vilket är området mellan -1,25 och 0.

Men området från -∞ till -1,25 är av intresse, vilket kommer att vara 0,5 - 0,3944 = 0,1056. Därför dras slutsatsen att sannolikheten för att en aktie ligger under $ 20 är 10,56%.

b) $ 30 i den typiska variabeln z är 1,25. För detta värde visar tabellen siffran 0,8944, vilket motsvarar området från -∞ till +1,25. Området mellan +1,25 och + ∞ är (1 - 0,8944) = 0,1056. Med andra ord, sannolikheten för att en aktie kostar mer än $ 30 är 10,56%.

c) Sannolikheten för att en åtgärd har en kostnad mellan $ 20 och $ 30 beräknas enligt följande:

100% -10,56% - 10,56% = 78,88%

referenser

Statistik och sannolikhet. Normal distribution. Återställd från: projectdescartes.org
GeoGebra. Klassisk geogebra, sannolikhetsberäkning. Återställs från geogebra.org
MathWorks. Gaussisk distribution. Återställd från: es.mathworks.com
Mendenhall, W. 1981. Statistik för ledning och ekonomi. 3:e. utgåva. Grupo Redaktion Iberoamérica.
Stat Trek. Lär dig själv statistik. Poisson Distribution. Återställd från: stattrek.com,
Triola, M. 2012. Elementary Statistics. 11th. Ed. Pearson utbildning.
University of Vigo. Huvudsakliga kontinuerliga distributioner. Återställd från: anapg.webs.uvigo.es
Wikipedia. Normal distribution. Återställd från: es.wikipedia.org

NORMAL FÖRDELNING: FORMEL, EGENSKAPER, EXEMPEL, TRÄNING - MATTE - 2026