Sääntö Sturges on kriteeri, jota käytetään määrittämään luokkien määrä tai alueet, jotka ovat välttämättömiä piirtämällä joukko tilastollisia tietoja. Saksalainen matemaatikko Herbert Sturges ilmoitti tämän säännön vuonna 1926.
Sturges ehdotti yksinkertaista menetelmää, joka perustuu näytteiden lukumäärään x ja jonka avulla voimme löytää luokkien lukumäärän ja niiden alueen leveyden. Sturgesin sääntöä käytetään laajalti, etenkin tilastojen alalla, erityisesti taajuushistogrammien muodostamiseen.

Selitys
Sturgesin sääntö on empiirinen menetelmä, jota käytetään laajasti kuvaavissa tilastoissa niiden luokkien määrän määrittämiseksi, joiden on oltava taajuushiogrammissa, jotta voidaan luokitella tietojoukko, joka edustaa otosta tai populaatiota.
Periaatteessa tämä sääntö määrittelee graafisten säiliöiden, taajuushistogrammien leveyden.
Herbert Sturges piti sääntönsä määrittämistä ihanteellisena taajuuskaaviona, joka koostuu K-väleistä, jolloin i: nväli sisältää tietyn määrän näytteitä (i = 0,… k - 1), jotka esitetään:

Tämä näytteiden lukumäärä annetaan monella tapaa, jolla joukon osajoukko voidaan erottaa; toisin sanoen binomikertoimella, joka ilmaistaan seuraavasti:


Lausekkeen yksinkertaistamiseksi hän sovelsi logaritmien ominaisuuksia yhtälön molemmissa osissa:

Siten Sturges totesi, että väliajojen k optimaalinen lukumäärä k saadaan lausekkeella:

Se voidaan ilmaista myös seuraavasti:

Tässä ilmaisussa:
- k on luokkien lukumäärä.
- N on näytteen havaintojen kokonaismäärä.
- Loki on kannan 10 yleinen logaritmi.
Esimerkiksi rakentaaksesi taajuushiogrammin, joka ilmaisee satunnaisen näytteen 142 lasten korkeudesta, jakaumalla olevien intervallien tai luokkien lukumäärä on:
k = 1 + 3.322 * log 10 (N)
k = 1 + 3 322 * loki (142)
k = 1 + 3,3322 * 2,1523
k = 8,14 - 8
Siten jakauma tapahtuu kahdeksan välin välillä.
Jaksojen lukumäärän on aina oltava edustaa kokonaislukuina. Tapauksissa, joissa arvo on desimaali, on tehtävä likiarvo lähimpään kokonaislukuun.
Sovellukset
Sturgesin sääntöä sovelletaan pääasiassa tilastoihin, koska se mahdollistaa taajuuden jakautumisen laskemalla luokkien lukumäärän (k) ja niiden kunkin pituuden, joka tunnetaan myös amplitudina.
Amplitudi on luokan ylä- ja alarajan ero jaettuna luokkien lukumäärällä, ja se ilmaistaan:

On olemassa monia nyrkkisääntöjä, jotka sallivat taajuuden jakautumisen. Sturgesin sääntöä käytetään kuitenkin yleisesti, koska se arvioi luokkien lukumäärää, joka yleensä vaihtelee välillä 5-15.
Siksi se pitää arvoa, joka edustaa riittävästi otosta tai populaatiota; toisin sanoen, lähentäminen ei edusta äärimmäisiä ryhmittymiä, eikä se toimi liian suuren määrän luokkien kanssa, jotka eivät salli näytteen tiivistämistä.
esimerkki
Taajuushistogrammi on tehtävä annettujen tietojen mukaan, jotka vastaavat ikää, joka on saatu paikallisessa kuntosalilla liikkuvien miesten tutkimuksessa.

Aikavälien määrittämiseksi on tiedettävä näytteen koko tai havaintojen lukumäärä; tässä tapauksessa niitä on 30.
Silloin Sturgesin sääntöä sovelletaan:
k = 1 + 3.322 * log 10 (N)
k = 1 + 3 322 * loki (30)
k = 1 + 3,3322 * 1,4771
k = 5,90 ≈ 6 aikaväliä.
Jaksojen lukumäärän perusteella voidaan laskea niiden amplitudi; ts. kunkin taajuushiogrammissa esitetyn palkin leveys:

Alarajaa pidetään datan pienimmänä arvona ja ylärajana suurinta arvoa. Ylä- ja alarajojen erotusta kutsutaan muuttujan alueeksi tai alueeksi (R).
Taulukosta löytyy, että yläraja on 46 ja alaraja on 13; siten jokaisen luokan amplitudi on:

Välit muodostuvat ylä- ja alarajasta. Näiden välien määrittämiseksi aloitamme laskemalla alarajasta ja lisäämällä tähän säännön (6) määrittämä amplitudi seuraavalla tavalla:

Sitten absoluuttinen taajuus lasketaan kunkin ajanjakson vastaavien miesten lukumäärän määrittämiseksi; tässä tapauksessa se on:
- Väli 1: 13 - 18 = 9
- Väli 2: 19 - 24 = 9
- Väli 3: 25 - 30 = 5
- Väli 4: 31 - 36 = 2
- Väli 5: 37 - 42 = 2
- Väli 6: 43 - 48 = 3
Kun lisätään kunkin luokan absoluuttinen taajuus, sen on oltava yhtä suuri kuin näytteen kokonaismäärä; tässä tapauksessa 30.
Seuraavaksi lasketaan kunkin aikavälin suhteellinen taajuus jakamalla sen absoluuttinen taajuus havaintojen kokonaismäärällä:

- Väli 1: fi = 9 ÷ 30 = 0,30
- Väli 2: fi = 9 ÷ 30 = 0,30
- Intervalli 3: fi = 5 ÷ 30 = 0,1666
- Intervalli 4: fi = 2 ÷ 30 = 0,0666
- Intervalli 5: fi = 2 ÷ 30 = 0,0666
- Intervalli 4: fi = 3 ÷ 30 = 0,10
Sitten voit tehdä taulukon, joka heijastaa tietoja, ja myös kaavion suhteellisesta taajuudesta suhteessa saatuihin aikaväleihin, kuten seuraavista kuvista voidaan nähdä:


Tällä tavalla Sturges-sääntö sallii luokkien tai intervallien määrän määrittämisen, joihin otos voidaan jakaa, jotta data-näyte voidaan tiivistää laatimalla taulukoita ja kuvaajia.
Viitteet
- Alfonso Urquía, MV (2013). Diskreetien tapahtumien mallintaminen ja simulointi. UNED,.
- Altman Naomi, MK (2015). "Yksinkertainen lineaarinen regressio." Luontomenetelmät.
- Antúnez, RJ (2014). Koulutustilastot. Digitaalinen yksikkö.
- Fox, J. (1997.). Sovellettu regressioanalyysi, lineaariset mallit ja niihin liittyvät menetelmät. SAGE-julkaisut.
- Humberto Llinás Solano, CR (2005). Kuvailevat tilastot ja todennäköisyysjakaumat. Pohjoinen yliopisto.
- Panteleeva, OV (2005). Todennäköisyyden ja tilastotieteen perusteet.
- O. Kuehl, MO (2001). Kokeilujen suunnittelu: Tutkimuksen suunnittelun ja analyysin tilastolliset periaatteet. Thomson-toimittajat.
