- Formler och ekvationer
- Viktiga statistiska variabler
- Modell och egenskaper
- Huvudegenskaperna hos den hypergeometriska fördelningen
- Ungefärlig användning av binomialfördelningen
- Exempel 2
- Lösta övningar
- Övning 1
- Lösning
- Övning 2
- Lösning
- Övning 3
- Lösning till
- Lösning c
- referenser
Den hypergeometriska fördelningen är en diskret statistisk funktion, lämplig för att beräkna sannolikheten i randomiserade experiment med två möjliga resultat. Villkoret som krävs för att tillämpa det är att det är små populationer där uttag inte ersätts och sannolikheten inte är konstant.
Därför, när ett element i befolkningen väljs för att känna till resultatet (sant eller falskt) av en viss egenskap, kan inte samma element väljas igen.
Figur 1. I en bultpopulation som denna finns det säkert defekta exemplar. Källa: Pixabay.
Visst är det att det nästa elementet som väljs är därför mer sannolikt att få ett riktigt resultat, om det föregående elementet hade ett negativt resultat. Detta innebär att sannolikheten varierar när element extraheras från provet.
De huvudsakliga tillämpningarna av den hypergeometriska fördelningen är: kvalitetskontroll i processer med liten befolkning och beräkning av sannolikheter i hasardspel.
När det gäller den matematiska funktionen som definierar den hypergeometriska fördelningen, består den av tre parametrar, som är:
- Antal befolkningselement (N)
- Provstorlek (m)
- Antal händelser i hela befolkningen med ett gynnsamt (eller ogynnsamt) resultat av den studerade karakteristiken (n).
Formler och ekvationer
Formeln för den hypergeometriska fördelningen ger sannolikheten P att x gynnsamma fall av en viss karakteristik inträffar. Sättet att skriva det matematiskt, baserat på kombinationsnummer är:
I det föregående uttrycket är N, n och m parametrar och x är själva variabeln.
- Den totala befolkningen är N.
-Antalet positiva resultat av en viss binäregenskap med avseende på den totala befolkningen är n.
-Mängden av element i provet är m.
I detta fall är X en slumpmässig variabel som tar värdet x och P (x) indikerar sannolikheten för förekomst av x gynnsamma fall av den studerade karakteristiken.
Viktiga statistiska variabler
Andra statistiska variabler för den hypergeometriska fördelningen är:
- Medel μ = m * n / N
- Varians σ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- Standardavvikelse σ som är varianternas kvadratrot.
Modell och egenskaper
För att komma fram till modellen för den hypergeometriska fördelningen, börjar vi från sannolikheten för att få x gynnsamma fall i ett prov av storlek m. Detta prov innehåller element som överensstämmer med fastigheten som studeras och element som inte gör det.
Kom ihåg att n representerar antalet gynnsamma fall i den totala populationen av N-element. Då skulle sannolikheten beräknas så här:
Följande ovan uttrycks i form av kombinatoriska nummer, uppnås följande sannolikhetsfördelningsmodell:
Huvudegenskaperna hos den hypergeometriska fördelningen
De är som följer:
- Urvalet måste alltid vara litet, även om befolkningen är stor.
- Elementet i provet extraheras en och en utan att integrera dem tillbaka i befolkningen.
- Egenskapen som ska studeras är binär, det vill säga den kan bara ta två värden: 1 eller 0 eller sant eller falskt.
I varje elementsextraktionssteg förändras sannolikheten beroende på tidigare resultat.
Ungefärlig användning av binomialfördelningen
En annan egenskap hos den hypergeometriska fördelningen är att den kan approximeras med binomialfördelningen, betecknad Bi, så länge populationen N är stor och minst 10 gånger större än provet m. I det här fallet ser det ut så här:
Sannolikheten för att x = 3 skruvar i provet är defekta är: P (500, 5, 60, 3) = 0.0129.
För sin del är sannolikheten för att x = 4 skruvar ur provets sextio är defekta: P (500, 5, 60; 4) = 0,0008.
Slutligen är sannolikheten för att x = 5 skruvar i det provet är defekta: P (500, 5, 60; 5) = 0.
Men om du vill veta sannolikheten för att det i det exemplet finns mer än 3 defekta skruvar, måste du få den kumulativa sannolikheten och lägga till:
Detta exempel illustreras i figur 2, erhållet med användning av GeoGebra, en fri programvara som används allmänt i skolor, institut och universitet.
Figur 2. Exempel på hypergeometrisk fördelning. Utarbetad av F. Zapata med GeoGebra.
Exempel 2
Ett spanskt däck har 40 kort, varav 10 har guld och de resterande 30 inte. Anta att sju kort dras slumpmässigt från det däcket, som inte återinkorporeras i däcket.
Om X är antalet guld som finns i de 7 korten som dras, ges sannolikheten för att du kommer att ha x guld i en 7-kortdragning med den hypergeometriska fördelningen P (40,10,7; x).
Låt oss se det här så här: för att beräkna sannolikheten för att ha 4 guld i en 7-kortsdragning använder vi formeln för den hypergeometriska fördelningen med följande värden:
Och resultatet är: 4,57% sannolikhet.
Men om du vill veta sannolikheten för att få mer än fyra kort, måste du lägga till:
Lösta övningar
Följande uppsättning övningar är avsedd att illustrera och assimilera de koncept som har presenterats i den här artikeln. Det är viktigt att läsaren försöker lösa dem på egen hand innan han tittar på lösningen.
Övning 1
En kondomfabrik har funnit att av varje 1000 kondomer som produceras av en viss maskin är 5 defekta. För kvalitetskontroll tas 100 kondomer slumpmässigt och partiet avvisas om det finns minst en eller flera defekta. Svar:
a) Vad är möjligheten att många 100 kommer att kasseras?
b) Är detta kriterium för kvalitetskontroll effektivt?
Lösning
I detta fall kommer mycket stora kombinatoriska nummer att visas. Beräkningen är svår, såvida du inte har ett lämpligt programvarupaket.
Men eftersom det är en stor population och provet är tio gånger mindre än den totala populationen, är det möjligt att använda approximationen av den hypergeometriska fördelningen med binomialfördelningen:
I ovanstående uttryck är C (100, x) ett kombinatoriskt nummer. Då beräknas sannolikheten för att ha mer än en defekt så här:
Det är en utmärkt approximation om den jämförs med värdet som erhålls genom att använda den hypergeometriska fördelningen: 0,4102
Det kan sägas att med en 40% sannolikhet bör ett parti av 100 profylaktiker kasseras, vilket inte är särskilt effektivt.
Men eftersom man är lite mindre krävande i kvalitetskontrollprocessen och kasserar partiet på 100 endast om det finns två eller flera defekter, skulle sannolikheten för att kassera partiet falla till bara 8%.
Övning 2
En plastblockmaskin fungerar på ett sådant sätt att en av varje tio stycken kommer ut deformerad. I ett prov på 5 stycken, hur troligt är det att bara en bit är defekt?
Lösning
Befolkning: N = 10
Antal n defekt för varje N: n = 1
Provstorlek: m = 5
Därför finns det en 50% sannolikhet för att ett prov på 5 kommer att deformeras.
Övning 3
I ett möte med unga gymnasieexaminerade finns 7 damer och 6 herrar. Bland flickorna studerar 4 humaniora och 3 vetenskap. I pojkegruppen studerar 1 humaniora och 5 vetenskap. Beräkna följande:
a) Att välja tre flickor slumpmässigt: hur troligt är det att de alla studerar humaniora?
b) Om tre deltagare på vänsmötet väljs slumpmässigt: Vad är möjligheten att tre av dem, oavsett kön, studerar vetenskap alla tre, eller humaniora också alla tre?
c) Välj nu två vänner slumpmässigt och kalla x den slumpmässiga variabeln "antal av de som studerar humaniora." Bestäm medelvärdet eller förväntat värde på x och variansen σ ^ 2 mellan de två valda.
Lösning till
Värdena som ska användas nu är:
-Folkning: N = 14
-Kvalitet som studerar bokstäver är: n = 6 och
- Storleken på provet: m = 3.
-Antal vänner som studerar humaniora: x
Enligt detta betyder x = 3 att alla tre studerar humaniora, men x = 0 betyder att ingen studerar humaniora. Sannolikheten för att alla tre studerar samma ges av summan:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0,0560 + 0,1539 = 0,2099
Då har vi 21% sannolikhet för att tre mötesdeltagare, valda slumpmässigt, ska studera samma sak.
Lösning c
Här har vi följande värden:
N = 14 totala befolkning av vänner, n = 6 totalt antal i befolkningen som studerar humaniora, provstorleken är m = 2.
Hoppet är:
E (x) = m * (n / N) = 2 * (6/14) = 0,8572
Och variansen:
σ (x) ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0,4521
referenser
- Diskreta sannolikhetsfördelningar. Återställd från: biplot.usal.es
- Statistik och sannolikhet. Hypergeometrisk fördelning. Återställd från: projectdescartes.org
- CDPYE-UGR. Hypergeometrisk fördelning. Återställd från: ugr.es
- GeoGebra. Klassisk geogebra, sannolikhetsberäkning. Återställs från geogebra.org
- Försök enkelt. Löst problem med hypergeometrisk distribution. Återställd från: probafacil.com
- Minitab. Hypergeometrisk fördelning. Återställs från: support.minitab.com
- University of Vigo. Huvudsakliga diskreta fördelningar. Återställd från: anapg.webs.uvigo.es
- Vitutor. Statistik och kombinatorik. Återställd från: vitutor.net
- Weisstein, Eric W. Hypergeometrisk distribution. Återställd från: mathworld.wolfram.com
- Wikipedia. Hypergeometrisk fördelning. Återställd från: es.wikipedia.com