- Formler och ekvationer
- Hur man beräknar provtagningsfel
- För en nivå av förtroende
- exempel
- - Exempel 1
- Lösning
- - Exempel 2
- Lösning
- - Exempel 3
- Lösning
- - Exempel 4
- Lösning
- - Övning 5
- Lösning
- referenser
Den samplingsfelet eller provtagning fel i statistiken är skillnaden mellan medelvärdet av ett prov och medelvärdet av den totala befolkningen. För att illustrera idén, låt oss föreställa oss att den totala befolkningen i en stad är en miljon människor, av vilka du vill ha den genomsnittliga skostorleken, för vilken man tar ett slumpmässigt urval av tusen människor.
Den genomsnittliga storleken som kommer ut ur provet kommer inte nödvändigtvis att sammanfalla med storleken på den totala populationen, även om om provet inte är partiskt måste värdet vara nära. Denna skillnad mellan urvalets medelvärde och det för den totala populationen är provtagningsfelet.
Figur 1. Eftersom provet är en delmängd av den totala populationen har provmedlet en marginal för fel. Källa: F. Zapata.
I allmänhet är medelvärdet för den totala populationen okänd, men det finns tekniker för att minska detta fel och formler för att uppskatta samplingsfelmarginalen som kommer att diskuteras i den här artikeln.
Formler och ekvationer
Låt oss säga att vi vill veta medelvärdet för en viss mätbar karakteristik x i en population av storlek N, men eftersom N är ett stort antal är det inte möjligt att genomföra studien på den totala populationen, då fortsätter vi att ta ett slumpmässigt urval av storlek n <
Provets medelvärde betecknas med
Anta att m-prover tas från den totala populationen N, alla av samma storlek n med medelvärden
Dessa medelvärden kommer inte att vara identiska med varandra och kommer alla att vara runt befolkningens medelvärde μ. Provtagningsmarginal E indikerar den förväntade separationen av medelvärdena
Standardfelmarginalen ε för provet med storlek n är:
ε = σ / √n
där σ är standardavvikelsen (variansens kvadratrot), som beräknas med följande formel:
σ = √
Betydelsen av standardfelmarginalen ε är som följer:
Medelvärde
Hur man beräknar provtagningsfel
I föregående avsnitt gavs formeln för att hitta standardfelmarginalen för ett prov med storlek n, där ordstandarden indikerar att det är en felmarginal med 68% konfidens.
Detta indikerar att om många prover av samma storlek n togs, kommer 68% av dem att ge medelvärden
Det finns en enkel regel, kallad 68-95-99.7-regeln, som gör att vi kan hitta samplingsfelmarginalen E för konfidensnivåer på 68%, 95% och 99,7%, eftersom denna marginal är 1⋅ ε, 2 ⋅ ε respektive 3⋅ ε.
För en nivå av förtroende
Om konfidensnivån γ inte är en av ovanstående är provtagningsfelet standardavvikelsen σ multiplicerad med faktorn Zy, som erhålls enligt följande procedur:
1.- Först bestäms signifikansnivån a, som beräknas utifrån konfidensnivån γ genom följande förhållande: α = 1 - γ
2.- Då måste vi beräkna värdet 1 - α / 2 = (1 + γ) / 2, vilket motsvarar den ackumulerade normala frekvensen mellan -∞ och Zγ, i en normal eller Gaussisk fördelning typ F (z), vars definition kan ses i figur 2.
3.- Ekvationen F (Zγ) = 1 - α / 2 löses med tabellerna för normalfördelningen (kumulativ) F, eller med hjälp av en datorapplikation som har den omvända gaussiska funktionen F -1 .
I det senare fallet har vi:
Zγ = G -1 (1 - α / 2).
4.- Slutligen används denna formel för samplingsfelet med en tillförlitlighetsnivå γ:
E = Zy ⋅ (σ / √n)
Figur 2. Tabell över normalfördelning. Källa: Wikimedia Commons.
exempel
- Exempel 1
Beräkna standardfelmarginalen i medelvikt för ett prov på 100 nyfödda. Beräkningen av medelvikten var
Lösning
Standardfelmarginalen är ε = σ / √n = (1 500 kg) / √100 = 0,15 kg. Detta innebär att med dessa data kan man dra slutsatsen att vikten hos 68% av de nyfödda är mellan 2 950 kg och 3,25 kg.
- Exempel 2
Bestäm marginalen för provtagningsfel E och viktområdet för 100 nyfödda med 95% konfidensnivå om medelvikten är 3 100 kg med standardavvikelse σ = 1 500 kg.
Lösning
Om regel 68 gäller; 95; 99,7 → 1 ε; 2⋅ ε; 3⋅ ε, vi har:
E = 2⋅ε = 2⋅0,15 kg = 0,30 kg
Med andra ord, 95% av nyfödda har vikter mellan 2 800 kg och 3 400 kg.
- Exempel 3
Bestäm intervallet med vikter hos de nyfödda i exempel 1 med en konfidensmarginal på 99,7%.
Lösning
Provtagningsfelet med 99,7% konfidens är 3 σ / √n, vilket för vårt exempel är E = 3 * 0,15 kg = 0,45 kg. Härifrån följer att 99,7% av nyfödda har vikter mellan 2 650 kg och 3 550 kg.
- Exempel 4
Bestäm faktorn Zy för en konfidensnivå på 75%. Bestäm marginalen för samplingsfel med denna nivå av tillförlitlighet för det fall som presenteras i exempel 1.
Lösning
Konfidensnivån är γ = 75% = 0,75, vilket är relaterat till signifikansnivån α genom förhållandet γ = (1 - α), så att signifikansnivån är α = 1 - 0,75 = 0 , 25
Detta innebär att den kumulativa normala sannolikheten mellan -∞ och Zy är:
P (Z <Zy) = 1 - 0,125 = 0,875
Vilket motsvarar ett Zy-värde på 1.1503, som visas i figur 3.
Figur 3. Bestämning av Zy-faktorn motsvarande en konfidensnivå på 75%. Källa: F. Zapata genom Geogebra.
Med andra ord är samplingsfelet E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
När den tillämpas på data från exempel 1 ger det ett fel på:
E = 1,15 * 0,15 kg = 0,17 kg
Med en konfidensnivå på 75%.
- Övning 5
Vad är konfidensnivån om Z α / 2 = 2,4?
Lösning
P (Z <Z α / 2 ) = 1 - α / 2
P (Z <2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Nivån av betydelse är:
a = 0,0164 = 1,64%
Och slutligen förblir förtroendegraden:
1- a = 1 - 0,0164 = 100% - 1,64% = 98,36%
referenser
- Canavos, G. 1988. Sannolikhet och statistik: Tillämpningar och metoder. McGraw Hill.
- Devore, J. 2012. Probability and Statistics for Engineering and Science. 8:e. Utgåva. Cengage.
- Levin, R. 1988. Statistik för administratörer. 2:a. Utgåva. Prentice Hall.
- Sudman, S. 1982. Ställa frågor: En praktisk guide till frågeformulärdesign. San Francisco. Jossey Bass.
- Walpole, R. 2007. Sannolikhet och statistik för teknik och vetenskap. Pearson.
- Wonnacott, TH och RJ Wonnacott. 1990. Inledande statistik. 5: e Ed Wiley
- Wikipedia. Provtagningsfel. Återställd från: en.wikipedia.com
- Wikipedia. Felmarginal. Återställd från: en.wikipedia.com