- Frekvensfördelning
- Hur många klasser att tänka på?
- Hur erhålls det?
- Exempel
- Vad är det för?
- Exempel
- referenser
Den klass mark , även känd som mittpunkten, är värdet i mitten av en klass, som representerar alla de värden som finns i denna kategori. I grund och botten används klassmärket för att beräkna vissa parametrar, t.ex. det aritmetiska medelvärdet eller standardavvikelsen.
Så klassmärket är mittpunkten för varje intervall. Detta värde är också mycket användbart för att hitta variansen för en uppsättning data som redan har grupperats i klasser, vilket i sin tur tillåter oss att förstå hur långt från mitten dessa specifika data finns.

Frekvensfördelning
För att förstå vad ett klassmärke är, är begreppet frekvensfördelning nödvändigt. Med en uppsättning data är en frekvensfördelning en tabell som delar upp data i ett antal kategorier som kallas klasser.
Denna tabell visar antalet element som tillhör varje klass; det senare kallas frekvens.
Denna tabell offrar en del av informationen som vi får från uppgifterna, eftersom vi istället för att ha det enskilda värdet för varje element, vi bara vet att den tillhör den klassen.
Å andra sidan får vi en bättre förståelse av datauppsättningen, eftersom det på detta sätt är lättare att uppskatta etablerade mönster, vilket underlättar hanteringen av nämnda data.
Hur många klasser att tänka på?
För att utföra en frekvensfördelning måste vi först bestämma antalet klasser som vi vill ta och välja deras klassgränser.
Valet av hur många klasser som ska tas bör vara bekvämt, med hänsyn till att ett litet antal klasser kan dölja information om de data vi vill studera och en mycket stor kan generera för många detaljer som inte nödvändigtvis är användbara.
De faktorer som vi måste ta hänsyn till när vi väljer hur många klasser som ska tas är flera, men bland dessa två sticker ut: den första är att ta hänsyn till hur mycket data vi måste ta hänsyn till; den andra är att veta hur stort utbudet är (det vill säga skillnaden mellan den största och minsta observationen).
Efter att klasserna redan har definierats fortsätter vi att räkna hur mycket data som finns i varje klass. Detta nummer kallas frekvensen för klasser och betecknas med fi.
Som vi tidigare sagt har vi att en frekvensfördelning förlorar informationen som kommer individuellt från varje data eller observation. Av denna anledning söks ett värde som representerar hela klassen som det tillhör; detta värde är klassmärket.
Hur erhålls det?
Klassmärket är det kärnvärde som en klass representerar. Det erhålls genom att lägga till gränserna för intervallet och dela detta värde med två. Vi kan uttrycka detta matematiskt på följande sätt:
x i = (Nedre gräns + Övre gräns) / 2.
I detta uttryck betecknar x i märket för ith-klassen.
Exempel
Med tanke på följande datauppsättning, ge en representativ frekvensfördelning och få motsvarande klassmärke.

Eftersom data med det högsta numeriska värdet är 391 och det lägsta är 221, har vi att intervallet är 391 -221 = 170.
Vi kommer att välja 5 klasser, alla med samma storlek. Ett sätt att välja klasser är enligt följande:

Observera att varje data är i en klass, dessa är osammanhängande och har samma värde. Ett annat sätt att välja klasser är genom att betrakta uppgifterna som en del av en kontinuerlig variabel, som kan nå ett verkligt värde. I det här fallet kan vi överväga klasser av formen:
205-245, 245-285, 285-325, 325-365, 365-405
Detta sätt att gruppera data kan emellertid presentera vissa oklarheter med gränserna. Till exempel, i fallet 245, uppstår frågan: vilken klass tillhör den, den första eller den andra?
För att undvika denna förvirring görs en slutpunktkonvention. På detta sätt kommer den första klassen att vara intervallet (205.245], den andra (245.285] och så vidare.

När klasserna har definierats fortsätter vi att beräkna frekvensen och vi har följande tabell:

Efter att ha fått frekvensfördelningen av data fortsätter vi att hitta klassmärken för varje intervall. I själva verket måste vi:
x 1 = (205+ 245) / 2 = 225
x 2 = (245+ 285) / 2 = 265
x 3 = (285+ 325) / 2 = 305
x 4 = (325+ 365) / 2 = 345
x 5 = (365+ 405) / 2 = 385
Vi kan representera detta genom följande graf:

Vad är det för?
Som nämnts tidigare är klassmärket mycket funktionellt för att hitta det aritmetiska medelvärdet och variansen för en grupp data som redan har grupperats i olika klasser.
Vi kan definiera det aritmetiska medelvärdet som summan av observationerna som erhållits mellan provstorleken. Ur en fysisk synvinkel är dess tolkning som jämviktspunkten i en datamängd.
Att identifiera en hel datauppsättning med ett enda nummer kan vara riskabelt, så skillnaden mellan denna brytpunkt och faktiska uppgifter måste också beaktas. Dessa värden kallas avvikelse från det aritmetiska medelvärdet, och med dessa försöker vi bestämma hur mycket det aritmetiska medelvärdet av data varierar.
Det vanligaste sättet att hitta detta värde är genom varians, vilket är medelvärdet för kvadraten för avvikelserna från det aritmetiska medelvärdet.
För att beräkna det aritmetiska medelvärdet och variansen för en uppsättning data grupperade i en klass använder vi följande formler:

I dessa uttryck x i är den i: te klassen märket, f jag representerar den motsvarande frekvensen och k antalet klasser i vilket uppgifterna grupperade.
Exempel
Med hjälp av data som ges i föregående exempel måste vi att vi kan utöka lite mer data i frekvensfördelningstabellen. Du får följande:

Sedan, genom att ersätta data i formeln, sitter vi kvar med det aritmetiska medelvärdet som:

Dess varians och standardavvikelse är:

Av detta kan vi dra slutsatsen att originaldata har ett aritmetiskt medelvärde på 306,6 och en standardavvikelse på 39,56.
referenser
- Fernandez F. Santiago, Cordoba L. Alejandro, Cordero S. Jose M. Beskrivande statistik. Esic-redaktion.
- Jhonson Richard A. Miller och Freund Probability and Statesmen for Engineers. Pearson Education.
- Miller I & Freund J. Sannolikhet och statsmän för ingenjörer. ÅTERGÅ.
- Sarabia A. Jose Maria, Pascual Marta. Grundläggande statistikkurs för företag
- Llinás S. Humberto, Rojas A. Carlos Beskrivande statistik och sannolikhetsfördelningar, Universidad del Norte Redaktion
