- Provets storlek
- Fall 1: befolkningens storlek är okänd
- Konfidensnivåer och deras motsvarande Z-värden
- Fall 2: befolkningens storlek är känd
- exempel
- Undersökningar och enkäter
- QA
- Fördel
- nackdelar
- Träningen löst
- Lösning
- referenser
Den slumpmässiga provtagningen är hur man väljer ett statistiskt representativt urval från en given population. En del av principen att varje element i provet måste ha samma sannolikhet att bli vald.
Ett drag är ett exempel på slumpmässig sampling där varje medlem av deltagarpopulationen tilldelas ett nummer. För att välja siffrorna som motsvarar lotteripriserna (exemplet) används någon slumpmässig teknik, till exempel att extrahera från en brevlåda de nummer som har skrivits ned på identiska kort.

Figur 1. Vid slumpmässig provtagning dras provet från populationen slumpmässigt med hjälp av någon teknik som säkerställer att alla element har samma sannolikhet att väljas. Källa: netquest.com.
Vid slumpmässig provtagning är det viktigt att välja provstorlek på lämpligt sätt, eftersom ett icke-representativt urval av befolkningen kan leda till felaktiga slutsatser på grund av statistiska fluktuationer.
Provets storlek
Det finns formler för att bestämma den korrekta storleken på ett prov. Den viktigaste faktorn att tänka på är om befolkningsstorleken är känd eller inte. Låt oss titta på formlerna för att bestämma provstorleken:
Fall 1: befolkningens storlek är okänd
När befolkningsstorleken N är okänd är det möjligt att välja ett prov med adekvat storlek n för att bestämma om en viss hypotes är sann eller falsk.
För detta används följande formel:
Var:
-p är sannolikheten för att hypotesen är sann.
-q är sannolikheten för att det inte är det, därför är q = 1 - p.
-E är den relativa felmarginen, till exempel har ett fel på 5% en marginal på E = 0,05.
-Z har att göra med den nivå av förtroende som studien kräver.
I en standardiserad (eller normaliserad) normalfördelning har en konfidensnivå på 90% Z = 1 645, eftersom sannolikheten för att resultatet är mellan -1,645σ och + 1,645σ är 90%, där σ är standardavvikelsen .
Konfidensnivåer och deras motsvarande Z-värden
1.- 50% konfidensnivå motsvarar Z = 0,675.
2.- 68,3% konfidensnivå motsvarar Z = 1.
3.- 90% konfidensnivå motsvarar Z = 1.645.
4.- 95% konfidensnivå motsvarar Z = 1,96
5.- 95,5% konfidensnivå motsvarar Z = 2.
6.- 99,7% konfidensnivå motsvarar Z = 3.
Ett exempel där denna formel kan tillämpas skulle vara i en studie för att bestämma medelvikten på småsten på en strand.
Det är uppenbart att det inte är möjligt att studera och väga alla stenar på stranden, så det är lämpligt att ta ut ett prov så slumpmässigt som möjligt och med lämpligt antal element.

Bild 2. För att studera egenskaperna för småstenar på en strand är det nödvändigt att välja ett slumpmässigt prov med ett representativt antal av dem. (Källa: pixabay)
Fall 2: befolkningens storlek är känd
När antalet N av element som utgör en viss population (eller universum) är känt, om vi vill välja ett statistiskt signifikant urval av storlek n genom enkel slumpmässig sampling, är detta formeln:
Var:
-Z är koefficienten förknippad med konfidensnivån.
-p är sannolikheten för framgången för hypotesen.
-q är sannolikheten för misslyckande i hypotesen, p + q = 1.
-N är storleken på den totala befolkningen.
-E är det relativa felet i studieresultatet.
exempel
Metoden för att extrahera proverna beror mycket på vilken typ av studie som måste göras. Därför har slumpmässig provtagning ett oändligt antal applikationer:
Undersökningar och enkäter
I telefonundersökningar väljs till exempel de personer som ska konsulteras med en slumptalsgenerator som är tillämplig på den undersökta regionen.
Om du vill tillämpa ett frågeformulär på anställda i ett stort företag kan du ta till dig valet av de svarande genom deras anställds nummer eller identitetskortnummer.
Nämnda nummer måste också väljas slumpmässigt, till exempel med användning av en slumptalsgenerator.

Bild 3. Ett frågeformulär kan tillämpas genom att slumpmässigt välja deltagarna. Källa: Pixabay.
QA
I händelse av att studien handlar om delar som tillverkas av en maskin måste delar väljas slumpmässigt, men från partier tillverkade vid olika tidpunkter på dagen, eller på olika dagar eller veckor.
Fördel
Enkel slumpmässig sampling:
- Det gör det möjligt att minska kostnaderna för en statistisk studie, eftersom det inte är nödvändigt att studera den totala populationen för att få statistiskt tillförlitliga resultat, med de önskade konfidensnivåerna och felnivån som krävs i studien.
- Undvik förspänning: eftersom valet av de element som ska studeras är helt slumpmässigt återspeglar studien troget befolkningens egenskaper, även om endast en del av den studerades.
nackdelar
- Metoden är inte tillräcklig i de fall där du vill veta preferenser i olika grupper eller befolkningsskikt.
I detta fall är det att föredra att tidigare bestämma de grupper eller segment som studien ska genomföras på. När strata eller grupper har definierats, om det är bekvämt för var och en av dem att tillämpa slumpmässig sampling.
- Det är mycket osannolikt att information kommer att fås om minoritetssektorer, av vilka det ibland är nödvändigt att känna till deras egenskaper.
Om det till exempel handlar om kampanj för en dyr produkt är det nödvändigt att känna till de rikaste minoritetssektorernas preferenser.
Träningen löst
Vi vill studera befolkningens preferens för en viss coladrink, men det finns ingen tidigare studie i denna population, av vilken dess storlek är okänd.
Å andra sidan måste urvalet vara representativt med en minsta konfidensnivå på 90% och slutsatserna måste ha ett procentuellt fel på 2%.
-Hur bestämmer man provets storlek n?
-Vad skulle vara provstorleken om felmarginalen görs mer flexibel till 5%?
Lösning
Eftersom storleken på populationen är okänd, används ovan angivna formel för att bestämma provstorleken:
n = (Z 2 p q) / (E 2 )
Vi antar att det finns en lika sannolikhet för preferens (p) för vårt varumärke av läskedryck som av icke-preferens (q), så p = q = 0,5.
Å andra sidan, eftersom resultatet av studien måste ha ett procentuellt fel mindre än 2%, då kommer det relativa felet E att vara 0,02.
Slutligen ger ett Z-värde = 1 645 en konfidensnivå på 90%.
Sammanfattningsvis har vi följande värden:
Z = 1.645
p = 0,5
q = 0,5
E = 0,02
Med dessa data beräknas minsta provstorlek:
n = (1,645 2 0,5 0,5) / (0,02 2 ) = 1691,3
Detta innebär att studien med den erforderliga felmarginen och med den valda nivån av förtroende måste ha ett urval av respondenter på minst 1692 individer, valda genom enkel slumpmässig sampling.
Om du går från en felmarginal på 2% till 5%, är den nya provstorleken:
n = (1,645 2 0,5 0,5) / (0,05 2 ) = 271
Vilket är ett betydligt lägre antal individer. Sammanfattningsvis är provstorleken mycket känslig för den önskade felmarginen i studien.
referenser
- Berenson, M. 1985. Statistik för ledning och ekonomi, begrepp och tillämpningar. Redaktionell interamericana.
- Statistik. Slumpmässigt urval. Hämtad från: encyclopediaeconomica.com.
- Statistik. Provtagning. Återställd från: Estadistica.mat.uson.mx.
- Explorable. Slumpmässigt urval. Återställd från: explorable.com.
- Moore, D. 2005. Tillämpad grundstatistik. 2:a. Utgåva.
- Netquest. Slumpmässigt urval. Återställd från: netquest.com.
- Wikipedia. Statistisk provtagning. Återställd från: en.wikipedia.org
