Tukeyn testi on menetelmä, joka pyrkii verrata yksittäisten keinoilla varianssi analyysi useita näytteitä altistettiin eri hoitoja.
Testi, jonka John.W. esitteli vuonna 1949. Tukey, antaa meille mahdollisuuden selvittää, ovatko saadut tulokset huomattavasti erilaisia vai eivät. Se tunnetaan myös Tukeyn rehellisesti merkittävänä erotestinä (Tukeyn HSD-testi).

Kuva 1. Tukey-testi antaa meille mahdollisuuden selvittää, onko kolmella tai useammalla samanlaisilla ryhmillä varustetuissa ryhmissä sovellettujen tulosten eroilla kolmella tai useammalla erilaisella käsittelyllä, joilla on merkitsevästi ja rehellisesti erilaiset keskiarvot.
Kokeissa, joissa verrataan kolmea tai useampaa eri käsittelyä, joita on sovellettu samaan määrään näytteitä, on tarpeen selvittää, ovatko tulokset merkittävästi erilaisia vai eivät.
Kokeen sanotaan olevan tasapainossa, kun kaikkien tilastollisten näytteiden koko on sama jokaisessa käsittelyssä. Kun näytteiden koko on erilainen jokaisella käsittelyllä, suoritetaan epätasapainoinen koe.
Joskus ei riitä varianssianalyysillä (ANOVA) tietää, täyttyvätkö useisiin näytteisiin sovelletut eri hoitomenetelmät (tai kokeet) nollahypoteesin (Ho: ”kaikki hoidot ovat tasa-arvoisia”) vai päinvastoin, täyttää vaihtoehtoisen hypoteesin (Ha: "ainakin yksi hoidoista on erilainen").
Tukeyn testi ei ole ainutlaatuinen, näytteen keskiarvojen vertaamiseksi on paljon enemmän testejä, mutta tämä on yksi tunnetuimmista ja sovelletuimmista.
Tukey-vertailu ja pöytä
Tätä testiä käytettäessä lasketaan arvo w, jota kutsutaan Tukey-vertailijaksi, jonka määritelmä on seuraava:
w = q √ (MSE / r)
Kun kerroin q saadaan taulukosta (Tukeyn taulukko), joka koostuu rivistä q-arvoja erilaisille käsittelyille tai kokeille. Sarakkeet osoittavat tekijän q arvon erilaisille vapausasteille. Käytettävissä olevien taulukoiden suhteellinen merkitsevyys on yleensä 0,05 ja 0,01.

Tässä kaavassa neliöjuuren sisällä näkyy MSE-tekijä (keskimääräinen virhe neliö) jaettuna r: llä, joka osoittaa toistojen lukumäärän. MSE on luku, joka saadaan normaalisti varianssianalyysistä (ANOVA).

Kun kahden keskiarvon välinen ero ylittää w-arvon (Tukey-vertailija), päätellään, että ne ovat erilaisia keskiarvoja, mutta jos ero on pienempi kuin Tukey-luku, niin se on kaksi näytettä, joiden keskimääräinen arvo on tilastollisesti samanlainen.
Luku w tunnetaan myös nimellä HSD (Rehellisesti Merkittävä Ero) numero.
Tätä yhtä vertailulukua voidaan käyttää, jos kunkin käsittelyn testiä varten käytettyjen näytteiden lukumäärä on sama jokaisessa.
Tasapainottomat kokeet
Kun näytteiden koko on jostain syystä erilainen kussakin vertailtavassa käsittelyssä, niin edellä kuvattu menetelmä eroaa hieman ja tunnetaan nimellä Tukey-Kramer-testi.
Nyt saadaan vertailuluku w jokaiselle käsittelyparille i, j:
w (i, j) = q √ (½ MSE / (ri + rj))
Tässä kaavassa kerroin q saadaan Tukeyn taulukosta. Tämä kerroin q riippuu käsittelyjen lukumäärästä ja virheen vapauden asteista. r i on toistojen lukumäärä hoidossa i, kun taas r j on toistojen lukumäärä hoidossa j.
Esimerkki
Kanin kasvattaja haluaa tehdä luotettavan tilastotutkimuksen, joka kertoo hänelle, mikä kanin lihotusruoan neljästä tuotemerkistä on tehokkain. Tutkimusta varten hän muodosti neljä ryhmää, joissa oli kuusi puolitoista kuukautta vanhoja kaneja, joilla oli siihen asti samat ruokintaolosuhteet.

Syyt olivat siihen, että ryhmissä A1 ja A4 kuolemat tapahtuivat syistä, jotka eivät johdu ruoasta, koska hyönteinen puree yhtä kaneista ja toisessa tapauksessa kuolema oli varmasti synnynnäisen vian syy. Joten ryhmät ovat epätasapainossa ja sitten on tarpeen soveltaa Tukey-Kramer-testiä.
Harjoitus ratkaistu
Jotta vältetään laskelmien tekeminen liian pitkiksi, tasapainoinen koetapaus otetaan ratkaistuksi tehtäväksi. Tietoja pidetään seuraavina:

Tässä tapauksessa on neljä ryhmää, jotka vastaavat neljää erilaista käsittelyä. Huomaamme kuitenkin, että kaikilla ryhmillä on sama määrä tietoa, joten kyseessä on tasapainoinen tapaus.
ANOVA-analyysin suorittamiseen on käytetty Libreoffice-laskentataulukkoon sisällytettyä työkalua. Tämä työkalu on sisällytetty muihin laskentataulukoihin, kuten Excel, tietojen analysointia varten. Alla on yhteenvetotaulukko, joka on saatu varianssianalyysin (ANOVA) suorittamisen jälkeen:

Varianssianalyysistä on myös P-arvo, joka esimerkissä on 2.24E-6, selvästi alle 0,05-merkitsevyystason, mikä johtaa suoraan nollahypoteesin hylkäämiseen: Kaikki hoidot ovat tasa-arvoisia.
Eli hoitojen joukossa joillakin on keskiarvot erilaiset, mutta Tukey-testin avulla on tiedettävä, mitkä ovat tilastollisesti merkitsevästi ja rehellisesti erilaiset (HSD).
Luvun wo löytämiseksi, koska myös HSD-numero tunnetaan, meidän on löydettävä virheen MSE keskimääräinen neliö. ANOVA-analyysistä saadaan, että ryhmien neliöiden summa on SS = 0,2; ja ryhmien sisällä olevien vapausasteiden lukumäärä on df = 16 näillä tiedoilla löytyy MSE:
MSE = SS / df = 0,2 / 16 = 0,0125
Lisäksi on löydettävä Tukeyn tekijä q taulukon avulla. Pylväästä 4, joka vastaa 4 vertailtavaa ryhmää tai käsittelyä, ja riviltä 16 etsitään, koska ANOVA-analyysi antoi 16 vapauden astetta ryhmissä. Tämä johtaa meidät arvoon q, joka on yhtä suuri kuin: q = 4,33, joka vastaa 0,05 merkitsevyyttä tai 95% luotettavuudesta. Lopuksi "rehellisesti merkittävän eron" arvo löytyy:
w = HSD = q √ (MSE / r) = 4,33 √ (0,0125 / 5) = 0,2165
Jos haluat tietää, mitkä ovat rehellisesti eri ryhmät tai hoidot, sinun on tiedettävä kunkin hoidon keskiarvot:

On myös tiedettävä erot hoitoparien keskiarvojen välillä, jotka esitetään seuraavassa taulukossa:

Johtopäätöksenä on, että parhaat hoidot tuloksen maksimoimiseksi ovat T1 tai T3, jotka ovat välinpitämättömiä tilastolliselta kannalta. Jos haluat valita T1: n ja T3: n välillä, on etsittävä muita tekijöitä tässä esitetyn analyysin ulkopuolelle. Esimerkiksi hinta, saatavuus jne.
Viitteet
- Cochran William ja Cox Gertrude. 1974. Kokeelliset mallit. Puimassa. Meksiko. Kolmas uusintapainos. 661p.
- Snedecor, GW ja Cochran, WG 1980. Tilastolliset menetelmät. Seitsemäs toimittaja Iowa, The Iowa State University Press. 507p.
- Steel, RGD ja Torrie, JH 1980. Tilastojen periaatteet ja menettelyt: Biometrinen lähestymistapa (2. painos). McGraw-Hill, New York. 629p.
- Tukey, JW 1949. Yksittäisten keinojen vertailu varianssianalyysissä. Biometrics, 5: 99-114.
- Wikipedia. Tukeyn testi. Palautettu osoitteesta: en.wikipedia.com
