- Formel och ekvationer
- Skillnader med binomialfördelningen
- exempel
- Praktiska tillämpningar
- Ungefärlig binomialfördelning med Poisson-distributionen
- Lösta övningar
- Övning 1
- Lösning c)
- Övning 2
- Lösning till)
- referenser
Den Poisson-fördelningen är en diskret sannolikhetsfördelning, med vilken det är möjligt att veta sannolikheten för att, inom en stor provstorlek och under ett visst intervall, en händelse vars sannolikhet är liten kommer att inträffa.
Ofta kan Poisson-distributionen användas istället för binomialfördelningen, så länge som följande villkor är uppfyllda: stort prov och liten sannolikhet.
Figur 1. Diagram över Poisson-distributionen för olika parametrar. Källa: Wikimedia Commons.
Siméon-Denis Poisson (1781-1840) skapade denna distribution som bär hans namn, mycket användbar när det gäller oförutsägbara händelser. Poisson publicerade sina resultat 1837, ett undersökningsarbete om sannolikheten för att felaktiga straffrättsliga domar inträffade.
Senare anpassade andra forskare distributionen i andra områden, till exempel antalet stjärnor som kunde hittas i en viss rymdvolym, eller sannolikheten för att en soldat skulle dö av en hästspark.
Formel och ekvationer
Den matematiska formen för Poisson-distributionen är som följer:
- μ (även ibland betecknat λ) är medelvärdet eller parametern för distributionen
- Euler nummer: e = 2.71828
- Sannolikheten för att erhålla y = k är P
- k är antalet framgångar 0, 1,2,3 …
- n är antalet tester eller händelser (provstorleken)
Diskreta slumpmässiga variabler, som deras namn antyder, beror på chansen och tar bara diskreta värden: 0, 1, 2, 3, 4 …, k.
Medelvärdet för fördelningen ges av:
Variansen σ, som mäter spridningen av data, är en annan viktig parameter. För Poisson-distributionen är det:
σ = μ
Poisson bestämde att när n → ∞, och p → 0, är genomsnittet μ - även kallad det förväntade värdet - en konstant:
-Händelserna eller händelserna som beaktas är oberoende av varandra och sker slumpmässigt.
-Sannolikheten P för en viss händelse som inträffar under en viss tidsperiod är mycket liten: P → 0.
-Sannolikheten för att mer än en händelse inträffar i tidsintervallet är 0.
-Medelvärdet approximerar en konstant som ges av: μ = np (n är provstorleken)
-Sedan dispersionen σ är lika med μ, eftersom den antar större värden, blir variationen också större.
-Events måste fördelas jämnt i det använda tidsintervallet.
-Sättningen av möjliga värden för händelsen y är: 0,1,2,3,4 ….
-Summan på i-variabler som följer en Poisson-distribution är också en annan Poisson-variabel. Dess medelvärde är summan av medelvärdena för dessa variabler.
Skillnader med binomialfördelningen
Poisson-distributionen skiljer sig från binomialfördelningen på följande viktiga sätt:
-Den binomialfördelningen påverkas av både provstorleken n och sannolikheten P, men Poisson-fördelningen påverkas endast av genomsnittet μ.
-I en binomialfördelning är de möjliga värdena för den slumpmässiga variabeln 0,1,2, …, N, medan det i Poisson-fördelningen inte finns någon övre gräns för dessa värden.
exempel
Poisson använde ursprungligen sin berömda distribution till rättsliga fall, men på industriell nivå var en av hans tidigaste användningsområden för bryggning av öl. I denna process används jästkulturer för jäsning.
Jäst består av levande celler vars befolkning varierar över tid. Vid tillverkning av öl är det nödvändigt att tillsätta den nödvändiga mängden, därför är det nödvändigt att känna till mängden celler som finns per volymenhet.
Under andra världskriget användes Poisson-distributionen för att ta reda på om tyskarna verkligen siktade mot London från Calais eller bara sköt slumpmässigt. Detta var viktigt för de allierade för att avgöra hur bra den teknik som var tillgänglig för nazisterna.
Praktiska tillämpningar
Tillämpningarna av Poisson-distributionen hänvisar alltid till räkningar i tid eller räkningar i rymden. Och eftersom sannolikheten för förekomst är liten är det också känt som "lagen om sällsynta händelser."
Här är en lista över händelser som faller in i en av dessa kategorier:
-Registrering av partiklarna i ett radioaktivt sönderfall, som liksom tillväxten av jästceller är en exponentiell funktion.
- Antal besök på en viss webbplats.
-Arrivning av människor till en linje för att betala eller delta (köteori).
-Antalet bilar som passerar en viss punkt på en väg under ett givet tidsintervall.
Bild 2. Antalet bilar som passerar genom en punkt följer ungefär en Poisson-distribution. Källa: Pixabay.
-Mutationer lidit i en viss DNA-kedja efter att ha utsatts för strålning.
-Antal meteoriter med en diameter större än 1 m fallet under ett år.
-Defekter per kvadratmeter av ett tyg.
-Kvantitet av blodceller i 1 kubikcentimeter.
-Kallar per minut till en telefonväxel.
-Chokladchips finns i 1 kg kakade smet.
-Antal träd infekterade av en viss parasit på 1 hektar skog.
Observera att dessa slumpmässiga variabler representerar antalet gånger en händelse inträffar under en fast tidsperiod (samtal per minut till telefonväxeln) eller ett visst utrymmeområde (tygdefekter per kvadratmeter).
Dessa händelser är, som redan har fastställts, oberoende av den tid som har gått sedan den senaste händelsen.
Ungefärlig binomialfördelning med Poisson-distributionen
Poisson-distributionen är en bra tillnärmning till binomialfördelningen så länge:
-Provets storlek är stor: n ≥ 100
-Sannolikheten p är liten: p ≤ 0,1
- μ är i storleksordningen: np ≤ 10
I sådana fall är Poisson-distributionen ett utmärkt verktyg, eftersom binomialfördelningen kan vara svår att applicera i dessa fall.
Lösta övningar
Övning 1
En seismologisk studie bestämde att det under de senaste 100 åren fanns 93 stora jordbävningar runt om i världen, av minst 6,0 i Richters skala - logaritmiska -. Anta att Poisson-distributionen är en lämplig modell i detta fall. Hitta:
a) Den genomsnittliga förekomsten av stora jordbävningar per år.
b) Om P (y) är sannolikheten för att jordbävningar inträffar under ett slumpmässigt utvalt år, hitta följande sannolikheter:
Det är ganska mindre än P (2).
Resultaten listas nedan:
P (0) = 0,395, P (1) = 0,367, P (2) = 0,171, P (3) = 0,0529, P (4) = 0,0123, P (5) = 0,00229, P (6) = 0,000355, P (7) = 0,0000471.
Vi kan till exempel säga att det är en sannolikhet på 39,5% att ingen större jordbävning kommer att inträffa under ett visst år. Eller att det finns 5,29% av 3 stora jordbävningar som inträffar under det året.
Lösning c)
c) Frekvenserna analyseras, multipliceras med n = 100 år:
39,5; 36,7; 17,1; 5,29; 1,23; 0,229; 0,0355 och 0,00471.
Till exempel:
- En frekvens på 39,5 indikerar att 0 stora jordbävningar inträffar under 39,5 av 100 år, vi kan säga att det är ganska nära det faktiska resultatet på 47 år utan någon stor jordbävning.
Låt oss jämföra ett annat Poisson-resultat med de faktiska resultaten:
- Det erhållna värdet på 36,7 innebär att det under en period av 37 år finns en stor jordbävning. Det faktiska resultatet är att det under 31 år fanns 1 större jordbävning, vilket är en bra matchning med modellen.
- 17,1 år förväntas med 2 stora jordbävningar och det är känt att det under 13 år, vilket är ett nära värde, verkligen fanns 2 stora jordbävningar.
Därför är Poisson-modellen acceptabel för detta fall.
Övning 2
Ett företag beräknar att antalet komponenter som misslyckas innan de når 100 driftstimmar följer en Poisson-distribution. Om det genomsnittliga antalet fel är 8 under den tiden, hitta följande sannolikheter:
a) Att en komponent misslyckas inom 25 timmar.
b) Fel på mindre än två komponenter på 50 timmar.
c) Minst tre komponenter misslyckas på 125 timmar.
Lösning till)
a) Det är känt att medelvärdet av misslyckanden på 100 timmar är 8, därför på 25 timmar förväntas en fjärdedel av misslyckanden, det vill säga 2 misslyckanden. Detta kommer att vara μ-parametern.
Sannolikheten för att 1 komponent misslyckas begärs, den slumpmässiga variabeln är "komponenter som misslyckas före 25 timmar" och dess värde är y = 1. Genom att ersätta sannolikhetsfunktionen:
Frågan är dock sannolikheten för att färre än två komponenter misslyckas på 50 timmar, inte att exakt två komponenter misslyckas på 50 timmar, därför måste vi lägga till sannolikheterna att:
-Inte misslyckas
- Misslyckande endast 1
Parametern μ för distributionen i detta fall är:
μ = 8 + 2 = 10 misslyckanden på 125 timmar.
P (3 eller flera komponenter misslyckas) = 1- P (0) - P (1) - P (2) =
referenser
- MathWorks. Poisson distribution. Återställd från: es.mathworks.com
- Mendenhall, W. 1981. Statistik för ledning och ekonomi. 3:e. utgåva. Grupo Redaktion Iberoamérica.
- Stat Trek. Lär dig själv statistik. Poisson Distribution. Återställd från: stattrek.com,
- Triola, M. 2012. Elementary Statistics. 11th. Ed. Pearson utbildning.
- Wikipedia. Poisson distribution. Återställd från: en.wikipedia.org