- Fördelar och nackdelar
- Nackdelar med räckvidd som ett mått på spridning
- Interquartile intervall, kvartiler och fungerade exempel
- - Beräkning av kvartiler
- Första kvartilen
- Andra kvartilen eller medianen
- Tredje kvartilen
- Arbetat exempel
- Lösning till
- Lösning b
- Lösning c
- referenser
Det intervall , intervallet eller amplitud, i statistik, är skillnaden (subtraktion) mellan det maximala värdet och det minimala värdet för en uppsättning data från ett prov eller en population. Om intervallet representeras av bokstaven R och data representeras av x är formeln för intervallet helt enkelt:
R = x max - x min
Där x max är det maximala värdet för data och x min är det minsta.
Figur 1. Dataintervall som motsvarar befolkningen i Cádiz under de senaste två århundradena. Källa: Wikimedia Commons.
Konceptet är mycket användbart som ett enkelt mått på spridning för att snabbt uppskatta variationen i data, eftersom det indikerar förlängningen eller längden på intervallet där dessa finns.
Anta till exempel att höjden hos en grupp av 25 manliga ingenjörsstudenter på ett universitet mäts. Den högsta studenten i gruppen är 1,93 m och den kortaste 1,67 m. Dessa är de extrema värdena för exempeldata, därför är deras väg:
R = 1,93 - 1,67 m = 0,26 m eller 26 cm.
Höjden på eleverna i denna grupp fördelas på detta område.
Fördelar och nackdelar
Område är, som vi sa tidigare, ett mått på hur spridd informationen är. Ett litet intervall indikerar att uppgifterna är mer eller mindre nära och spridningen är låg. Å andra sidan tyder ett större intervall på att uppgifterna är mer spridda.
Fördelarna med att beräkna intervallet är uppenbara: det är mycket enkelt och snabbt att hitta, eftersom det är en enkel skillnad.
Det har också samma enheter som de data som det fungerar med och konceptet är mycket lätt att tolka för alla observatörer.
I exemplet med höjden för ingenjörsstudenter, om intervallet hade varit 5 cm, skulle vi säga att alla är ungefär samma storlek. Men med ett intervall på 26 cm antar vi omedelbart att det finns elever i alla mellanhöjder i provet. Är detta antagande alltid korrekt?
Nackdelar med räckvidd som ett mått på spridning
Om vi tittar noga kan det hända att i vårt urval av 25 ingenjörsstudenter endast en av dem mäter 1,93 och de återstående 24 har höjder nära 1,67 m.
Och ändå är intervallet detsamma, även om det motsatta är helt möjligt: att majoritetens höjd är cirka 1,90 m och endast en är 1,67 m.
I båda fallen är datadistributionen helt annorlunda.
Nackdelarna med räckvidd som mått på spridning beror på att det bara använder extrema värden och ignorerar alla andra. Eftersom större delen av informationen går förlorad, har du ingen aning om hur exempeldata distribueras.
Ett annat viktigt kännetecken är att provets intervall aldrig minskar. Om vi lägger till mer information, det vill säga vi överväger mer data, intervallet ökar eller förblir detsamma.
Och i alla fall är det bara användbart när man arbetar med små prover, det rekommenderas inte att det endast används som ett mått på spridning i stora prover.
Det som måste göras är att komplettera det med beräkningen av andra mått på spridning som tar hänsyn till den information som tillhandahålls av den totala informationen: interkvartilt intervall, varians, standardavvikelse och variationskoefficient.
Interquartile intervall, kvartiler och fungerade exempel
Vi har insett att svagheten i intervallet som ett mått på spridning är att det bara utnyttjar de extrema värdena för datadistributionen, utesluter de andra.
För att undvika besväret används kvartiler: tre värden kända som positionsmått.
De distribuerar ogrupperade data i fyra delar (andra allmänt använda positionsmått är deciler och percentiler). Dessa är dess egenskaper:
-Den första kvartilen Q 1 är värdet på data så att 25% av dem alla är mindre än Q 1 .
-Den andra kvartilen Q 2 är medianen för distributionen, vilket innebär att hälften (50%) av data är mindre än detta värde.
-Äntligen, den tredje kvartilen Q 3 indikerar att 75% av uppgifterna är mindre än Q 3 .
Därefter definieras interkvartilintervallet eller interkvartilområdet som skillnaden mellan den tredje kvartilen Q 3 och den första kvartilen Q 1 av data:
Interkvartilt intervall = R Q = Q 3 - Q 1
På detta sätt påverkas inte värdet på intervallet RQ av extrema värden. Av detta skäl är det tillrådligt att använda det när man hanterar snedställda fördelningar, till exempel de för mycket höga eller mycket korta studenter som beskrivs ovan.
- Beräkning av kvartiler
Det finns flera sätt att beräkna dem, här kommer vi att föreslå ett, men i alla fall är det nödvändigt att känna till ordningsnumret "N o ", vilket är den plats som respektive kvartil upptar i distributionen.
Det är, om till exempel termen som motsvarar Q 1 är den andra, den tredje eller den fjärde och så vidare för distributionen.
Första kvartilen
N eller (Q 1 ) = (N + 1) / 4
Andra kvartilen eller medianen
N eller (Q 2 ) = (N + 1) / 2
Tredje kvartilen
N eller (Q 3 ) = 3 (N + 1) / 4
Där N är antalet data.
Medianen är det värde som är rätt i mitten av distributionen. Om antalet data är udda finns det inga problem att hitta den, men om den är jämn, är de två centrala värdena i genomsnitt för att bli en.
När ordernumret har beräknats följs en av dessa tre regler:
-Om det inte finns några decimaler söks de data som anges i distributionen och detta kommer att vara den sökta kvartilen.
-När ordningsnumret är halvvägs mellan två, är de data som indikeras av heltalets medelvärde med följande data, och resultatet är motsvarande kvartil.
-I alla andra fall är det avrundat till närmaste heltal och det är positionen för kvartilen.
Arbetat exempel
På en skala från 0 till 20 fick en grupp på 16 matte I-studenter följande poäng (poäng) på en halvtidsexamen:
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
Hitta:
a) Datorns intervall eller intervall.
b) Värdena på kvartilerna Q 1 och Q 3
c) Interkvartilområdet.
Figur 2. Har poängen på detta matematest så stor variation? Källa: Pixabay.
Lösning till
Det första du måste göra för att hitta rutten är att beställa data i ökande eller minskande ordning. Till exempel i ökande ordning har du:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
Använda formeln i början: R = x max - x min
R = 20 - 1 poäng = 19 poäng.
Enligt resultatet har dessa betyg en stor spridning.
Lösning b
N = 16
N eller (Q 1 ) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4,25
Det är ett tal med decimaler, vars heltal är 4. Sedan går vi till distributionen, vi letar efter de data som upptar fjärde platsen och dess värde är i genomsnitt med värdet för den femte positionen. Eftersom de båda är 9 är genomsnittet också 9 och så:
Q 1 = 9
Nu upprepar vi proceduren för att hitta Q 3 :
N eller (Q 3 ) = 3 (N + 1) / 4 = 3 (16 1) / 4 = 12,75
Återigen är det en decimal, men eftersom det inte är halvvägs avrundas det till 13. Den sökta kvartilen innehar den trettonde positionen och är:
Q 3 = 16
Lösning c
R Q = Q 3 - Q 1 = 16 - 9 = 7 poäng.
Som, som vi kan se, är mycket mindre än det dataområde som beräknas i avsnitt a) eftersom minsta poäng var 1 poäng, ett värde mycket längre från resten.
referenser
- Berenson, M. 1985. Statistik för ledning och ekonomi. Interamericana SA
- Canavos, G. 1988. Sannolikhet och statistik: Tillämpningar och metoder. McGraw Hill.
- Devore, J. 2012. Probability and Statistics for Engineering and Science. 8:e. Utgåva. Cengage.
- Exempel på kvartiler. Återställd från: matematicas10.net.
- Levin, R. 1988. Statistik för administratörer. 2:a. Utgåva. Prentice Hall.
- Walpole, R. 2007. Sannolikhet och statistik för teknik och vetenskap. Pearson.