Den Tukey testet är en metod som syftar till att jämföra individuella medel från en variansanalys av flera prover som utsatts för olika behandlingar.
Testet, presenterat 1949 av John.W. Tukey, tillåter oss att urskilja om de erhållna resultaten är väsentligt olika eller inte. Det är också känt som Tukeys ärligt signifikanta skillnadstest (Tukeys HSD-test).
Bild 1. Tukey-testet tillåter oss att urskilja om skillnaderna i resultat mellan tre eller flera olika behandlingar som tillämpas på tre eller flera grupper med samma egenskaper, har väsentligt och ärligt olika medelvärden.
I experiment där tre eller flera olika behandlingar tillämpade på samma antal prover jämförs är det nödvändigt att urskilja om resultaten är signifikant olika eller inte.
Ett experiment sägs vara balanserat när storleken på alla statistiska prover är densamma för varje behandling. När storleken på proverna är olika för varje behandling, genomfördes ett obalanserat experiment.
Ibland räcker det inte med en variansanalys (ANOVA) att veta om de i jämförelse mellan olika behandlingar (eller experiment) som tillämpas på flera prover uppfyller nollhypotesen (Ho: "alla behandlingar är lika") eller tvärtom, uppfyller den alternativa hypotesen (Ha: "åtminstone en av behandlingarna är annorlunda").
Tukeys test är inte unikt, det finns många fler test för att jämföra provmedel, men detta är ett av de mest kända och tillämpade.
Tukey-komparator och tabell
Vid tillämpningen av detta test beräknas ett värde w, som kallas Tukey-komparatorn, vars definition är som följer:
w = q √ (MSE / r)
Där faktorn q erhålls från en tabell (Tukey's Table), som består av rader med q-värden för olika antal behandlingar eller experiment. Kolumnerna anger värdet på faktor q för olika frihetsgrader. Vanligtvis har tillgängliga tabeller en relativ betydelse av 0,05 och 0,01.
I denna formel, inom kvadratroten, visas MSE-faktorn (medelkvadrat för fel) dividerat med r, vilket indikerar antalet upprepningar. MSE är ett nummer som normalt erhålls från en variansanalys (ANOVA).
När skillnaden mellan två medelvärden överstiger värdet w (Tukey-komparator), dras slutsatsen att de är olika medelvärden, men om skillnaden är mindre än Tukey-antalet är det två prover med statistiskt identiskt medelvärde .
Siffran w är också känd som HSD-numret (Honestly Significant Difference).
Detta enda jämförande antal kan tillämpas om antalet prover som applicerats för testet för varje behandling är detsamma i var och en av dem.
Obalanserade experiment
När storleken på proverna av någon anledning är olika i varje behandling som ska jämföras, skiljer sig proceduren ovan ovan något och kallas Tukey-Kramer-testet.
Nu erhålls ett komparatornummer w för varje behandlingspar i, j:
w (i, j) = q √ (½ MSE / (ri + rj))
I denna formel erhålles faktorn q från Tukeys tabell. Denna faktor q beror på antalet behandlingar och graden av felfrihet. r i är antalet upprepningar i behandling i, medan r j är antalet upprepningar i behandling j.
Exempelfall
En kaninförädlare vill göra en tillförlitlig statistisk studie som säger honom vilket av de fyra märkena med kaninuppfödningsmedel som är det mest effektiva. För studien bildade han fyra grupper med sex en och en halv månad gamla kaniner som fram till dess hade samma utfodringsförhållanden.
Orsakerna var att i grupperna A1 och A4 inträffade dödsfall på grund av orsaker som inte kunde hänföras till mat, eftersom en av kaninerna var biten av ett insekt och i det andra fallet dödsfallet troligen var orsaken till en medfödd defekt. Så grupperna är obalanserade och då är det nödvändigt att tillämpa Tukey-Kramer-testet.
Träningen löst
För att inte förlänga beräkningarna för länge kommer ett balanserat experimentfall att tas som en löst övning. Följande kommer att tas som data:
I detta fall finns det fyra grupper som motsvarar fyra olika behandlingar. Vi observerar dock att alla grupper har samma antal data, så det är då ett balanserat fall.
För att utföra ANOVA-analysen har verktyget som är integrerat i Libreoffice-kalkylbladet använts. Andra kalkylblad som Excel har det här verktyget integrerat för dataanalys. Nedan följer en sammanfattningstabell som har resulterat efter att analysen av varians (ANOVA) har utförts:
Från variansanalysen har vi också P-värdet, som för exemplet är 2.24E-6, långt under 0,05-nivån av betydelse, vilket direkt leder till att avvisa nollhypotesen: Alla behandlingar är lika.
Det är, bland behandlingarna, vissa har olika medelvärden, men det är nödvändigt att veta vilka som är de signifikant och ärligt olika (HSD) från statistisk synvinkel med Tukey-testet.
För att hitta antalet wo, som HSD-numret också är känt, måste vi hitta medelkvadratet för felet MSE. Från ANOVA-analysen erhålls att summan av kvadrater inom grupperna är SS = 0,2; och antalet frihetsgrader inom grupperna är df = 16 med dessa data kan vi hitta MSE:
MSE = SS / df = 0,2 / 16 = 0,0125
Det krävs också att hitta Tukeys faktor q med hjälp av tabellen. Kolumn 4, som motsvarar de fyra grupperna eller behandlingarna som ska jämföras, och rad 16 sökas, eftersom ANOVA-analysen gav 16 frihetsgrader inom grupperna. Detta leder oss till ett värde av q lika med: q = 4,33 motsvarande 0,05 av betydelse eller 95% av tillförlitligheten. Slutligen hittas värdet för den "ärligt signifikanta skillnaden":
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
För att veta vilka är ärligt olika grupper eller behandlingar måste du veta medelvärdena för varje behandling:
Det är också nödvändigt att känna till skillnaderna mellan medelvärdena för behandlingspar som visas i följande tabell:
Det dras slutsatsen att de bästa behandlingarna, när det gäller att maximera resultatet, är T1 eller T3, som är likgiltiga ur statistisk synvinkel. För att välja T1 och T3, måste man leta efter andra faktorer utanför analysen som presenteras här. Till exempel pris, tillgänglighet etc.
referenser
- Cochran William och Cox Gertrude. 1974. Experimentella mönster. Tröskning. Mexico. Tredje tryckning. 661p.
- Snedecor, GW och Cochran, WG 1980. Statistiska metoder. Sjunde ed. Iowa, The Iowa State University Press. 507p.
- Steel, RGD och Torrie, JH 1980. Principer och förfaranden för statistik: A Biometrical Approach (2nd Ed.). McGraw-Hill, New York. 629p.
- Tukey, JW 1949. Jämförelse av individuella medel i analysen av varians. Biometri, 5: 99-114.
- Wikipedia. Tukey's test. Återställd från: en.wikipedia.com