- Var kommer den empiriska regeln från?
- Tchebysjevs sats
- Normal distribution
- Hur tillämpar den empiriska regeln?
- 1- Konstruera intervall för regeln
- 2- Beräkna antalet studenter i varje intervall beroende på procenttal
- 3- Åldersintervall är associerade med antalet elever och tolkar
- Vad är tumregeln för?
- Lösta övningar
- Kaniner i reservatet
- Medelvikt för barn i ett land
- referenser
En tumregel är resultatet av praktisk erfarenhet och observation i verkligheten. Till exempel är det möjligt att veta vilka fåglarter som kan observeras på vissa platser varje gång på året och från den observationen kan en "regel" fastställas som beskriver livets livscykel för dessa fåglar.
I statistik hänvisar den empiriska regeln till gruppering av observationer kring ett centralt värde, medelvärdet eller genomsnittet, i enheter av standardavvikelse.
Anta att du har en grupp människor med en genomsnittlig höjd av 1,62 meter och en standardavvikelse på 0,25 meter, då skulle den empiriska regeln göra det möjligt för oss att definiera, till exempel, hur många personer som skulle vara i ett intervall av medelvärdet plus eller minus en standardavvikelse?
Enligt regeln är 68% av uppgifterna mer eller mindre en standardavvikelse från medelvärdet, det vill säga 68% av befolkningen i gruppen kommer att ha en höjd mellan 1,37 (1,62-0,25) och 1,87 (1,62 + 0,25) meter.
Var kommer den empiriska regeln från?
Den empiriska regeln är en generalisering av Tchebysjev-teoremet och den normala distributionen.
Tchebysjevs sats
Tchebysjevs teorem säger att: för ett värde av k> 1, är sannolikheten att en slumpmässig variabel ligger mellan medelvärdet minus k gånger standardavvikelsen, och medelvärdet plus k gånger, är standardavvikelsen större än eller lika med ( 1 - 1 / k 2 ).
Fördelen med detta teorem är att det tillämpas på diskreta eller kontinuerliga slumpmässiga variabler med någon sannolikhetsfördelning, men regeln som definieras utifrån den är inte alltid så exakt, eftersom det beror på symmetrin för distributionen. Ju mer asymmetrisk fördelningen av den slumpmässiga variabeln är, desto mindre anpassad till regeln är dess beteende.
Den empiriska regeln som definieras från detta teorem är:
Om k = √2 sägs 50% av uppgifterna vara i intervallet:
Om k = 2 sägs 75% av uppgifterna vara i intervallet:
Om k = 3 sägs 89% av uppgifterna vara i intervallet:
Normal distribution
Den normala fördelningen, eller Gaussisk klocka, gör det möjligt att fastställa empirisk regel eller regel 68 - 95 - 99.7.
Regeln är baserad på sannolikheterna för en slumpmässig variabel i intervaller mellan medelvärden minus en, två eller tre standardavvikelser och medelvärdet plus en, två eller tre standardavvikelser.
Den empiriska regeln definierar följande intervall:
68,27% av uppgifterna är i intervallet:
95,45% av uppgifterna är i intervallet:
99,73% av uppgifterna ligger i intervallet:
I figuren kan du se hur dessa intervall presenteras och förhållandet mellan dem när du ökar bredden på grafens bas.
Empirisk regel. Melikamp Standardiseringen av den slumpmässiga variabeln, det vill säga uttrycket av den slumpmässiga variabeln i termer av z eller standardnormalvariabel, förenklar användningen av den empiriska regeln, eftersom variabeln z har ett medelvärde lika med noll och en standardavvikelse lika med en .
Därför definierar tillämpningen av den empiriska regeln i skala för en vanlig normalvariabel, z, följande intervaller:
68,27% av uppgifterna är i intervallet:
95,45% av uppgifterna är i intervallet:
99,73% av uppgifterna ligger i intervallet:
Hur tillämpar den empiriska regeln?
Den empiriska regeln tillåter förkortade beräkningar när man arbetar med en normalfördelning.
Anta att en grupp på 100 högskolestudenter har en medelålder på 23 år, med en standardavvikelse på 2 år. Vilken information tillåter den empiriska regeln att få?
Att tillämpa den empiriska regeln innebär att följa stegen:
1- Konstruera intervall för regeln
Eftersom medelvärdet är 23 och standardavvikelsen är 2, är intervallen:
= =
= =
= =
2- Beräkna antalet studenter i varje intervall beroende på procenttal
(100) * 68,27% = 68 studenter ungefär
(100) * 95,45% = 95 studenter ungefär
(100) * 99,73% = 100 studenter ungefär
3- Åldersintervall är associerade med antalet elever och tolkar
Minst 68 elever är mellan 21 och 25 år.
Minst 95 studenter är mellan 19 och 27 år.
Nästan 100 studenter är mellan 17 och 29 år gamla.
Vad är tumregeln för?
Den empiriska regeln är ett snabbt och praktiskt sätt att analysera statistiska data och bli mer och mer tillförlitliga när distributionen närmar sig symmetri.
Användbarheten beror på fältet där det används och de frågor som presenteras. Det är mycket användbart att veta att förekomsten av värden för tre standardavvikelser under eller över medelvärdet är nästan osannolik, även för icke-normala fördelningsvariabler är minst 88,8% av fallen i tre sigma-intervallet.
Inom samhällsvetenskaperna är ett generellt slutgiltigt resultat intervallet för medelvärdet plus eller minus två sigma (95%), medan en ny effekt i partikelfysik kräver att fem sigmaintervall (99.99994%) betraktas som en upptäckt.
Lösta övningar
Kaniner i reservatet
I ett naturreservat uppskattas det att det finns i genomsnitt 16 000 kaniner med en standardavvikelse på 500 kaniner. Om fördelningen av variabeln "antal kaniner i reserven" är okänd, är det möjligt att uppskatta sannolikheten för att beståndet av kaniner är mellan 15 000 och 17 000 kaniner?
Intervallet kan presenteras i dessa termer:
15000 = 16000 - 1000 = 16000 - 2 (500) = µ - 2 s
17000 = 16000 + 1000 = 16000 + 2 (500) = µ + 2 s
Därför: =
Tillämpar Tchebyshevs teorem har vi en sannolikhet på minst 0,75 för att kaninbeståndet i naturreservatet är mellan 15 000 och 17 000 kaniner.
Medelvikt för barn i ett land
Medelvikten för ett år gamla barn i ett land fördelas normalt med ett medelvärde på 10 kg och en standardavvikelse på cirka 1 kg.
a) Uppskatta procentandelen ettåriga barn i landet som har en genomsnittlig vikt mellan 8 och 12 kg.
8 = 10 - 2 = 10 - 2 (1) = µ - 2 s
12 = 10 + 2 = 10 + 2 (1) = µ + 2 s
Därför: =
Enligt den empiriska regeln kan man säga att 68,27% av ettåriga barn i landet har mellan 8 och 12 kilo vikt.
b) Vad är sannolikheten för att hitta ett år gammalt barn som väger 7 kg eller mindre?
7 = 10 - 3 = 10 - 3 (1) = µ - 3 s
Det är känt att 7 kg vikt representerar värdet µ - 3s, liksom det är känt att 99,73% av barnen är mellan 7 och 13 kg vikt. Det lämnar endast 0,27% av de totala barnen för extremerna. Hälften av dem, 0,135%, är 7 kg eller mindre och den andra hälften, 0,135%, är 11 kg eller mer.
Så det kan dras slutsatsen att det finns en sannolikhet på 0,00135 att ett barn väger 7 kg eller mindre.
c) Om landets befolkning når 50 miljoner invånare och 1-åriga barn representerar 1% av landets befolkning, hur många ettåriga barn kommer att väga mellan 9 och 11 kilo?
9 = 10 - 1 = µ - s
11 = 10 + 1 = µ + s
Därför: =
Enligt den empiriska regeln är 68,27% av ettåringarna i landet i intervallet
Det finns 500 000 ettåringar i landet (1% av 50 miljoner), så 341,350 barn (68,27% av 500 000) väger mellan 9 och 11 kg.
referenser
- Abraira, V. (2002). Standardavvikelse och standardfel. Semergen Magazine. Återställs från web.archive.org.
- Freund, R .; Wilson, W .; Mohr, D. (2010). Statistiska metoder. Tredje upplagan Academic Press-Elsevier Inc.
- Alicante-server (2017). Empirisk regel (statistiska termer). Återställs från glosarios.servidor-alicante.com.
- Lind, D .; Marchal, W .; Wathen, S. (2012). Statistik tillämpad på näringsliv och ekonomi. Femtonde upplagan McGraw-Hill / Interamericana de México SA
- Salinas, H. (2010). Statistik och sannolikheter. Återställdes från uda.cl.
- Sokal, R .; Rohlf, F. (2009). Introduktion till biostatistik. Andra upplagan Dover-publikationer, Inc.
- Spiegel, M. (1976). Sannolikhet och statistik. Schaum-serien. McGraw-Hill / Interamericana de México SA
- Spiegel, M .; Stephens, L. (2008). Statistik. Fjärde upplagan McGraw-Hill / Interamericana de México SA
- Stat119 granskning (2019). Lösa empiriska regelfrågor. Återställs från stat119review.com.
- (2019). 68-95-99.7 regel. Återställs från en.wikipedia.org.