- esimerkit
- Luokkamuuttujien luokittelu
- Nimellisluokat
- Tavallinen kategorinen
- Binääriset luokat
- Tilastot kategorisilla muuttujilla
- Kategoristen muuttujien graafinen esitys
- Ratkaistuja harjoituksia
- Harjoitus 1
- Esimerkki 2
- Esimerkki 3
- Viitteet
Kategorinen muuttuja on yksi käytetään tilastojen määrittää ei-numeerinen tai laadullisia ominaispiirre tai ominaisuus ja jonkin kohteen yksilön, yhteisön, kunto tai menettelyä. On mahdollista määritellä kaikenlaisia kategorisia muuttujia kunkin tarpeen mukaan.
Esimerkkejä kategorisista muuttujista ovat: väri, sukupuoli, veriryhmä, siviilisääty, aineistotyyppi, maksutapa tai pankkitilin tyyppi, ja niitä käytetään paljon päivittäin.

Kuva 1: Väri on kategorinen muuttuja. Lähde: pixabay
Yllä olevat ovat muuttujia, mutta niiden mahdolliset arvot ovat laadullisia, ts. Laatua tai ominaisuutta, eivät numeerista mittausta. Esimerkiksi muuttuvan sukupuolen mahdolliset arvot ovat: uros, h embra.
Kun tämä muuttuja tallennetaan tietokoneohjelmaan, se voidaan julistaa tekstimuuttujaksi ja ainoat hyväksytyt arvot ovat jo nimetyt: Mies, Nainen.
Sama muuttuva sukupuoli voidaan kuitenkin ilmoittaa ja tallentaa kokonaislukuna, jos miehelle annetaan 1 ja naiselle arvo 2. Tästä syystä kategorisiin muuttujiin viitataan joskus lueteltuina tyypeinä.
Kategoristen muuttujien pääpiirteenä on, että toisin kuin muut muuttujat, kuten jatkuvat ja diskreetit, niiden kanssa ei ole mahdollista tehdä aritmeettista. Tilastot voidaan kuitenkin tehdä heidän kanssaan, kuten myöhemmin nähdään.
esimerkit
Huomaa seuraavat esimerkit kategorisista muuttujista ja niiden mahdollisista arvoista:
- Ryhmä_Sanguíneo, Arvoalue: A, B, AB, O
- Civil_Status, Luokkaarvot: Yksi (A), Naimisissa (B), Leski (C), Eronnut (D).
- Tipo_de_Materiaali, luokat tai arvot: 1 = puu, 2 = metalli, 3 = muovi
-Maksu-lomake, arvopaperit tai luokat: (1) käteisvarat, (2) veloitus, (3) siirto, (4) luotto
Edellisissä esimerkeissä numero on liitetty kuhunkin luokkaan täysin mielivaltaisella tavalla.
Sitten voitaisiin ajatella, että tämä mielivaltainen numeerinen assosiaatio tekee siitä vastaavan erillisen kvantitatiivisen muuttujan kanssa, mutta se ei ole, koska aritmeettista operaatiota ei voida suorittaa näillä numeroilla.
Idean havainnollistamiseksi muuttujalla Form_of_Payment summan operaatiolla ei ole merkitystä:
(1) Cash + (2) Veloitus ei koskaan ole yhtä suuri (3) Siirto
Luokkamuuttujien luokittelu
Ranking perustuu siihen, onko niillä epäsuora hierarkia vai onko mahdollisten lopputulosten lukumäärä yli kaksi tai kaksi.
Kategorinen muuttuja, jolla on vain yksi mahdollinen tulos, ei ole muuttuja, se on kategorinen vakio.
Nimellisluokat
Kun niitä ei voi edustaa numero tai heillä ei ole mitään järjestystä. Esimerkiksi muuttujalla: Type_of_Material on nimellisarvot (puu, metalli, muovi), niillä ei ole hierarkiaa tai järjestystä, vaikka jokaiselle vastaukselle tai luokalle on annettu mielivaltainen luku.
Tavallinen kategorinen
Muuttuja: akateeminen_suorituskyky
Nimellisarvot: korkea, keskitaso, matala
Vaikka tämän muuttujan arvot eivät ole numeerisia, niillä on implisiittinen järjestys tai hierarkia.
Binääriset luokat
Nämä ovat nimellismuuttujia, joilla on kaksi mahdollista vastausta, esimerkiksi:
-Muuttuva: Vastaus
-Nominaaliset arvot: totta, vääriä
Huomaa, että Response-muuttujalla ei ole implisiittistä hierarkiaa ja sillä on vain kaksi mahdollista tulosta, joten se on binaarinen kategorinen muuttuja.
Jotkut kirjoittajat kutsuvat tätä tyyppiä binaarimuuttujaksi, eivätkä katso, että se kuuluisi kategorisiin muuttujiin, jotka ovat rajoitettuja niihin, joissa on enemmän kuin kolme mahdollista luokkaa.
Tilastot kategorisilla muuttujilla
Tilastot voidaan tehdä kategorioilla muuttujilla, vaikka ne eivät olisi numeerisia tai kvantitatiivisia muuttujia. Esimerkiksi, jos haluat tietää kategorisen muuttujan trendin tai todennäköisimmän arvon, valitaan tila.
Tila on tässä tapauksessa kategorisen muuttujan toistuvin tulos tai arvo. Luokkamuuttujille ei ole mahdollista laskea keskiarvoa tai mediaania.
Keskiarvoa ei voida laskea, koska et voi tehdä aritmeettista luokkimuuttujia. Myöskään mediaani ei ole, koska kvantitatiivisilla tai kategorioilla muuttujilla ei ole järjestystä tai hierarkiaa, joten keskeistä arvoa ei voida määrittää.
Kategoristen muuttujien graafinen esitys
Tietyn kategorisen muuttujan perusteella voidaan löytää taajuus tai kuinka monta kertaa kyseisen muuttujan tulos toistetaan. Jos tämä tehdään jokaiselle tulokselle, voidaan tehdä kuvaaja taajuudesta kutakin luokkaa tai tulosta kohti.
Tässä on esimerkkejä siitä, kuinka kategoriset muuttujat voidaan esittää graafisesti.
Ratkaistuja harjoituksia
Harjoitus 1
Yrityksellä on tietoja 170 työntekijän tiedoista. Yksi muuttujista, joka on näissä tietueissa, on: Estado_Civil. Tällä muuttujalla on neljä luokkaa tai mahdollisia arvoja:
Sinkku (A), naimisissa (B), leski (C), eronnut (D).
Vaikka se on ei-numeerinen muuttuja, on mahdollista tietää, kuinka moni tietueista on tietyssä luokassa ja esitetään pylväskaaviossa seuraavan kuvan mukaisesti:

Kuva 2. Kategorisen muuttujan tulosten esitys. Lähde: itse tehty
Esimerkki 2
Kenkäkauppa seuraa myyntiä. Tietueita hallitsevien muuttujien joukossa on kunkin mallin kenkäväri. Muuttuja:
Color_Shoe_Model_AW3
Se on luokkatyyppi ja sillä on viisi luokkaa tai mahdolliset arvot. Jokaiselle tämän muuttujan luokalle myydään kokonaismäärä ja määritetään prosenttiosuus myynnistä. Tulokset on esitetty seuraavan kuvan kaaviossa:

Kuva 3. Kategorinen muuttuja Väri_kenkä. Tässä muuttujassa tila on valkoinen. Lähde: itse tehty.
Sitten voidaan sanoa, että muodissa olevasta AW3-kenkämallista myydään eniten Valkoinen, jota seuraa tiiviisti Musta.
Voidaan myös sanoa, että 70% todennäköisyydellä seuraava tämän mallin myytävä kenkä on valkoinen tai musta.
Nämä tiedot voivat olla hyödyllisiä myymälölle uusien tilausten tekemisessä tai ne voivat jopa alennuksia vähiten myytyihin väreihin ylimääräisen varaston vuoksi.
Esimerkki 3
Tietyn verenluovuttajien populaation osalta haluat edustaa tiettyyn veriryhmään kuuluvien ihmisten lukumäärää. Graafinen tapa visualisoida tulokset on piktogrammin avulla, joka on taulukon alareunassa.
Ensimmäinen sarake edustaa ryhmä_sanguíneo-muuttujaa ja sen mahdollisia tuloksia tai luokkia. Toisessa sarakkeessa on kukin luokka edustavien ihmisten lukumäärä ikonissa tai kuvassa. Esimerkissämme punaista pisaraa käytetään kuvakkeena, joka kukin edustaa 10 henkilöä.

Kuva 4. Piktogrammi. Lähde: itse tehty
Viitteet
- Khan-akatemia. Luokittelevien tietojen analysointi. Palautettu osoitteesta: khanacademy.org
- Universumin kaavat. Laadullinen muuttuja. Palautettu osoitteesta: univesoformulas.com
- Minitab. Mitkä ovat kategorisia, erillisiä ja jatkuvia muuttujia. Palautettu osoitteesta: support.minitab.com
- Excel-opetusohjelma. Muuttujien karakterisointi. Palautettu osoitteesta help.xlslat.com.
- Wikipedia. Tilastollinen muuttuja. Palautettu osoitteesta wikipedia.com
- Wikipedia. Kategorinen muuttuja. Palautettu osoitteesta wikipedia.com
- Wikipedia. Kategorinen muuttuja. Palautettu osoitteesta wikipedia.com
