- Lause ongelmasta Mann-Whitney U -testissä
- Laadulliset muuttujat verrattuna kvantitatiivisiin muuttujiin
- Normaali tapaus
- Tapauksessa ei-normaali trendi
- Parilliset tai parittomat näytteet
- Mann Whitney U -testin ominaispiirteet
- Mann - Whitney-kaava
- Kokeen soveltamisen vaiheet
- Käytännön esimerkki
- - Vaihe 1
- - Vaihe 2
- Alue A
- Alue B
- Vaihe 3
- Vaihe 4
- Vertailuperusteet
- Online-laskimet Mann - Whitney U -testille
- Viitteet
Mann - Whitney U -testillä haetaan vertailu kahden itsenäisen näytteen, kun niillä on vain vähän tietoa tai ne eivät ole normaalijakaumaa. Tällä tavalla sitä pidetään ei-parametrisena testinä, toisin kuin homologisessa Studentin t-testissä, jota käytetään, kun näyte on riittävän suuri ja seuraa normaalia jakaumaa.
Frank Wilcoxon ehdotti sitä ensimmäistä kertaa vuonna 1945 samankokoisille näytteille, mutta kaksi vuotta myöhemmin sitä jatkettiin Henry Mannin ja DR Whitneyn erikokoisille näytteille.

Kuva 1. Mann-Whitney U -testiä käytetään riippumattomien näytteiden vertailuun. Lähde: Pixabay.
Testiä käytetään usein tarkistamaan, onko laadullisen ja kvantitatiivisen muuttujan välillä suhdetta.
Havainnollistava esimerkki on ottaa joukko hypertensioisia ihmisiä ja erottaa kaksi ryhmää, joilta päivittäiset verenpainetiedot kirjataan yhden kuukauden ajan.
Hoitoa A sovelletaan yhteen ryhmään ja hoitoa B. Toiseen verenpaine on kvantitatiivinen muuttuja ja hoidon tyyppi on laadullinen.
Haluamme tietää, onko mitattujen arvojen mediaani eikä keskiarvo tilastollisesti sama tai erilainen, jotta voidaan selvittää, onko molemmissa käsittelyissä eroa. Vastauksen saamiseksi käytetään Wilcoxon-tilastoa tai Mann - Whitney U -testiä.
Lause ongelmasta Mann-Whitney U -testissä
Toinen esimerkki, jossa testiä voidaan soveltaa, on seuraava:
Oletetaan, että haluat tietää, eroaako virvoitusjuomien kulutus huomattavasti maan kahdella alueella.
Yksi niistä on nimeltään alue A ja toinen alue B. Viikoittain kuluneista litroista pidetään kirjaa kahdessa näytteessä: yksi kymmenestä henkilöstä alueen A ja toinen 5 henkilöstä alueen B osalta.
Tiedot ovat seuraavat:
-Alue A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-Alue B: 12,14, 11, 30, 10
Seuraava kysymys nousee esiin:
Laadulliset muuttujat verrattuna kvantitatiivisiin muuttujiin
-Laatumuuttuja X: alue
-Määrällinen muuttuja Y: virvoitusjuomien kulutus
Jos kulutettu litramäärä on sama molemmilla alueilla, johtopäätöksenä on, että näiden kahden muuttujan välillä ei ole riippuvuutta. Tapa saada selville on verrata näiden kahden alueen keskimääräistä tai mediaanisuuntausta.
Normaali tapaus
Jos tiedot seuraavat normaalia jakaumaa, ehdotetaan kahta hypoteesia: nolla H0 ja vaihtoehtoinen H1 vertaamalla keskiarvoja:
- H0: Kahden alueen keskiarvon välillä ei ole eroa.
- H1: Molempien alueiden keskiarvot ovat erilaisia.
Tapauksessa ei-normaali trendi
Päinvastoin, jos tiedot eivät noudata normaalia jakaumaa tai otos on yksinkertaisesti liian pieni sen tietääkseen, keskiarvon vertaamisen sijasta verrataan kahden alueen mediaania.
- H0: kahden alueen mediaanin välillä ei ole eroa.
- H1: Molempien alueiden mediaanit ovat erilaisia.
Jos mediaanit osuvat yhteen, nollahypoteesi täyttyy: virvoitusjuomien kulutuksen ja alueen välillä ei ole yhteyttä.
Ja jos tapahtuu päinvastainen, vaihtoehtoinen hypoteesi on totta: kulutuksen ja alueen välillä on yhteys.
Mann - Whitney U -testi on tarkoitettu näihin tapauksiin.
Parilliset tai parittomat näytteet
Seuraava tärkeä kysymys päätettäessä Mann Whitney U -testin käytöstä on se, onko tietojen lukumäärä molemmissa näytteissä identtinen, toisin sanoen niiden arvo on par.
Jos kaksi näytettä muodostuu pariksi, alkuperäistä Wilcoxon-versiota sovelletaan. Mutta jos ei, kuten esimerkissä, niin käytetään muutettua Wilcoxon-testiä, joka on tarkalleen Mann Whitney U -testi.
Mann Whitney U -testin ominaispiirteet
Mann - Whitney U -testi on ei-parametrinen testi, jota voidaan käyttää näytteisiin, jotka eivät seuraa normaalia jakaumaa tai joilla on vähän tietoja. Sillä on seuraavat ominaisuudet:
1.- Vertaa mediaaneja
2.- Se toimii tilatuilla alueilla
3.- Se on vähemmän voimakas, mikä tarkoittaa, että voima on todennäköisyys hylätä nollahypoteesi, kun se on todella väärä.
Kun otetaan huomioon nämä ominaisuudet, Mann - Whitney U -testiä käytetään, kun:
-Tiedot ovat riippumattomia
- He eivät noudata normaalia jakaumaa
-Tuloshypoteesi H0 hyväksytään, jos kahden näytteen mediaanit ovat samat: Ma = Mb
-Vaihtoehtoinen hypoteesi H1 hyväksytään, jos kahden näytteen mediaanit eroavat toisistaan: Ma ≠ Mb
Mann - Whitney-kaava
Muuttuja U on Mann - Whitney-testissä käytetty kontrastitilasto, joka määritetään seuraavasti:
Tämä tarkoittaa, että U on pienin arvoista Ua ja Ub, joita sovelletaan kuhunkin ryhmään. Esimerkissämme se olisi jokaiselle alueelle: A tai B.
Muuttujat Ua ja Ub määritetään ja lasketaan seuraavan kaavan mukaan:
Ua = Na Nb + Na (Na +1) / 2 - Ra
Ub = Na Nb + Nb (Nb + 1) / 2 - Rb
Na- ja Nb-arvot ovat tässä näytteiden kokoja, jotka vastaavat vastaavasti alueita A ja B, ja puolestaan Ra ja Rb ovat sarjasummat, jotka määrittelemme jäljempänä.
Kokeen soveltamisen vaiheet
1.- Järjestä kahden näytteen arvot.
2.- Määritä tilausjärjestys jokaiselle arvolle.
3.- Korjaa tietojen olemassa olevat siteet (toistetut arvot).
4.- Laske Ra = näytteen A joukkojen summa.
5.- Löydä Rb = näytteen B joukkojen summa.
6.- Määritä arvot Ua ja Ub edellisessä osassa annettujen kaavojen mukaan.
7. - Vertaa Ua: ta ja Ub: tä, ja niistä kumpaakin pienempi osoitetaan kokeelliselle U-tilastolle (eli tiedolle), jota verrataan teoreettiseen tai normaaliin U-tilastoon.
Käytännön esimerkki
Nyt sovellamme edellä mainittua virvoitusjuoma-ongelmaan, joka korostettiin aiemmin:
Alue A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
Alue B: 12,14, 11, 30, 10
Riippumatta siitä, ovatko molempien näytteiden keskiarvot tilastollisesti samoja vai erilaisia, nollahypoteesi hyväksytään tai hylätään: muuttujien Y ja X välillä ei ole yhteyttä, ts. Virvoitusjuomien kulutus ei riipu alueesta:
H0: Ma = Mb
H1: Ma ≠ Mb

Kuva 2. Virvoitusjuomien kulutustiedot alueilla A ja B. Lähde: F. Zapata.
- Vaihe 1
Jatkamme tilaamalla tiedot kahdelle näytteelle yhdessä, tilaamalla arvot alimmasta korkeimpaan:

Huomaa, että arvo 11 näkyy 2 kertaa (kerran jokaisessa näytteessä). Alun perin sillä on sijainnit tai alueet 3 ja 4, mutta jotakin yliarvioida tai aliarvioida yhtä tai toista, keskiarvo valitaan alueeksi, ts. 3.5.
Samalla tavoin jatkamme arvoa 12, joka toistetaan kolme kertaa alueilla 5, 6 ja 7.
No, arvolle 12 on annettu keskimääräinen alue 6 = (5 + 6 + 7) / 3. Ja sama arvolle 14, jolla on ligatuuri (esiintyy molemmissa näytteissä) asemissa 8 ja 9, sille osoitetaan keskimääräinen alue 8,5 = (8 + 9) / 2.
- Vaihe 2
Seuraavaksi alueen A ja B tiedot erotetaan uudelleen, mutta nyt niiden vastaavat alueet on osoitettu toisessa rivissä:
Alue A

Alue B

Alueet Ra ja Rb saadaan toisen rivin elementtien summista kussakin tapauksessa tai alueella.
Vaihe 3
Vastaavat Ua- ja Ub-arvot lasketaan:
Ua = 10 × 5 + 10 (10 + 1) / 2 - 86 = 19
Ub = 10 × 5 + 5 (5 + 1) / 2 - 34 = 31
Kokeellinen arvo U = min (19, 31) = 19
Vaihe 4
Oletetaan, että teoreettinen U seuraa normaalia jakaumaa N parametrien perusteella, jotka yksinoikeudella määritetään näytteiden koosta:
N ((na⋅nb) / 2, √)
Kokeellisesti saadun muuttujan U vertailemiseksi teoreettiseen U: n kanssa on tehtävä muuttuja. Siirtymme kokeellisesta muuttujasta U sen standardisoituun arvoon, jota kutsutaan Z: ksi, jotta voimme tehdä vertailun standardoidun normaalijakauman vastaavaan.
Muuttujan muutos on seuraava:
Z = (U - na.nb / 2) / √
On huomattava, että muuttujan muutokseen käytettiin U: n teoreettisen jakauman parametreja. Sitten uusi muuttuja Z, joka on hybridi teoreettisen U: n ja kokeellisen U: n välillä, on vastakohtana standardoidulle normaalijakaumalle N (0,1).).
Vertailuperusteet
Jos Z ≤ Zα ⇒, nollahypoteesi H0 hyväksytään
Jos Z> Zα ⇒ hylkää nollahypoteesin H0
Standardisoidut Za-kriittiset arvot riippuvat vaaditusta luotettavuustasosta, esimerkiksi luotettavuustasolle α = 0,95 = 95%, joka on tavallisin, saadaan kriittinen arvo Zα = 1,96.
Tässä esitetyt tiedot:
Z = (U - ei nb / 2) / √ = -0,73
Mikä on alle kriittisen arvon 1,96.
Joten lopullinen johtopäätös on, että nollahypoteesi H0 hyväksytään:
Online-laskimet Mann - Whitney U -testille
Tilastollisia laskelmia varten on olemassa erityisohjelmia, kuten SPSS ja MINITAB, mutta nämä ohjelmat ovat maksettuja, ja niiden käyttö ei aina ole helppoa. Tämä johtuu siitä, että ne tarjoavat niin monia vaihtoehtoja, että niiden käyttö on käytännössä varattu vain tilastoinnin asiantuntijoille.
Onneksi on olemassa joukko erittäin tarkkoja, ilmaisia ja helppokäyttöisiä online-ohjelmia, joiden avulla voit suorittaa mm. Mann-Whitney U -testin.
Nämä ohjelmat ovat:
-Sosiaalitiedetilastot (socscistatistics.com), jolla on sekä Mann-Whitney U -testi että Wilcoxon-testi, kun kyseessä on tasapainoinen tai parillinen näyte.
-AI Therapy Statistics (ai-therapy.com), jolla on useita tavanomaisia kuvailevien tilastojen testejä.
-Statistinen käyttö (fysiikka.csbsju.edu/stats), yksi vanhimmista, joten sen käyttöliittymä voi näyttää vanhentuneelta, vaikka se on silti erittäin tehokas ilmainen ohjelma.
Viitteet
- Dietrichson. Määrälliset menetelmät: sijoituskoe. Palautettu sivustolta: bookdown.org
- Marín J P. SPSS Guide: Analyysi ja menettelyt ei-parametristen testien yhteydessä. Palautettu: halweb.uc3m.es
- USAL MOOC. Ei-parametriset testit: Mann-Whitney U. Palautettu osoitteesta: youtube.com
- Wikipedia. Mann-Whitney U-testi. Palautettu osoitteesta: es.wikipedia.com
- XLSTAT. Ohjekeskus. Mann - Whitney-testin opetusohjelma Excelissä. Palautettu osoitteesta help.xlsat.com
