- Kuinka laskea määrityskerroin?
- Havainnollistava tapaus
- Tulkinta
- esimerkit
- - Esimerkki 1
- Ratkaisu
- - Esimerkki 2
- Ratkaisu
- - Esimerkki 3
- Ratkaisu
- Sovita vertailu
- johtopäätökset
- Viitteet
Determinaatiokertoimen on numero välillä 0 ja 1, joka edustaa murto-osa pistettä (X, Y), jotka seuraavat regressiolinjan sopivuuden datajoukon, jossa on kaksi muuttujaa.
Sitä kutsutaan myös sopivuuden hyväksi ja sitä merkitään R2: lla. Sen laskemiseksi otetaan regressiomallilla estimoidun datan varianssin Ŷi ja datan kutakin Xi: tä vastaavan datan Yi varianssin välinen osamäärä.
R 2 = sy / Sy

Kuva 1. Korrelaatiokerroin neljälle dataparille. Lähde: F. Zapata.
Jos 100% tiedoista on regressiofunktion linjalla, määrityskerroin on 1.
Päinvastoin, jos tietojoukolle ja tietylle sovitustoiminnolle kerroin R 2 on yhtä suuri kuin 0,5, voidaan sanoa, että sopivuus on 50% tyydyttävä tai hyvä.
Vastaavasti, kun regressiomalli saannot R 2 -arvot alle 0,5, tämä osoittaa, että valittu säätö ei sopeutua tyydyttävästi tietoja, jolloin on tarpeen etsiä toisen säätötoiminto.
Ja kun kovarianssi tai korrelaatiokerroin on taipuvainen nollaan, niin datamuuttujat X ja Y eivät liity toisiinsa, ja siksi myös R2: lla on taipumus nollautua.
Kuinka laskea määrityskerroin?
Edellisessä osassa sanottiin, että määrityskerroin lasketaan etsimällä varianssi:
- Arvioitu muuttujan Y regressiofunktiolla
- Se muuttuja Yi, joka vastaa N dataparin kutakin muuttujaa Xi.
Matemaattisesti sanottuna se näyttää tältä:
R 2 = sy / Sy
Tämän kaava seuraa, että R 2 edustaa osuus varianssi selittää regressiomallin. Vaihtoehtoisesti R 2 voidaan laskea seuraavaa kaavaa käyttäen, täysin vastaa edellisen:
R 2 = 1 - (Sε / Sy)
Kun Sε edustaa jäännösten varianssia εi = Ŷi - Yi, kun taas Sy on datan Yi-arvojoukon varianssi. Determinei: n määrittämiseksi käytetään regressiofunktiota, joka tarkoittaa vahvistaa, että Ŷi = f (Xi).
Tietojoukon Yi varianssi, jossa i on 1 - N, lasketaan tällä tavalla:
Sy =
Ja jatka sitten samalla tavalla Sŷ: lle tai Sε: lle.
Havainnollistava tapaus
Osoitamme seuraavaa neljän parin tietoryhmää osoittaaksesi yksityiskohdat siitä, kuinka määrityskerroin lasketaan:
(X, Y): {(1, 1); (2,3); (3, 6) ja (4, 7)}.
Tälle tietojoukolle ehdotetaan lineaarista regressiosovitusta, joka saadaan käyttämällä pienimmän neliösumman menetelmää:
f (x) = 2,1 x - 1
Tätä säätötoimintoa käyttämällä vääntömomentit saadaan:
(X, Ŷ): {(1, 1,1); (2, 3,2); (3, 5.3) ja (4, 7.4)}.
Sitten lasketaan X: n ja Y: n aritmeettinen keskiarvo:
Variance Sy
Sy = / (4-1) =
= = 7 583
Varianssi Sŷ
Sŷ = / (4-1) =
= = 7,35
Määrityskerroin R 2
R 2 = sy / Sy = 7,35 / 7,58 = 0,97
Tulkinta
Edellisessä segmentissä tarkastellun havainnollistavan tapauksen määrityskerroin osoittautui 0,98. Toisin sanoen lineaarinen säätö toiminnon kautta:
f (x) = 2,1x - 1
Se on 98% luotettava selittäessään tietoja, joilla se on saatu pienimmän neliösumman menetelmällä.
Määrityskertoimen lisäksi on lineaarinen korrelaatiokerroin tai tunnetaan myös nimellä Pearsonin kerroin. Tämä kerroin, jota merkitään r, lasketaan seuraavalla suhteella:
r = seksikäs / (Sx Sy)
Laskuri edustaa tässä muuttujien X ja Y välistä kovarianssia, kun taas nimittäjä on muuttujan X keskihajonnan ja muuttujan Y keskihajonnan tulos.
Pearsonin kerroin voi ottaa arvot välillä -1 ja +1. Kun tällä kertoimella on taipumus +1, X: n ja Y: n välillä on suora lineaarinen korrelaatio. Jos se pyrkii sen sijaan arvoon -1, on lineaarinen korrelaatio, mutta kun X kasvaa, Y vähenee. Lopuksi, se on lähellä nollaa, kahden muuttujan välillä ei ole korrelaatiota.
On huomattava, että määrityskerroin osuu Pearson-kertoimen neliön kanssa vain, kun ensimmäinen on laskettu lineaarisen sovituksen perusteella, mutta tämä tasa-arvo ei koske muita epälineaarisia sovuuksia.
esimerkit
- Esimerkki 1
Ryhmä lukiolaisia ryhtyi määrittelemään empiirinen laki heilurikaudelle sen pituuden funktiona. Tämän tavoitteen saavuttamiseksi he suorittavat mittaussarjan, jossa he mittaavat heilurin värähtelyajan eri pituuksille saadakseen seuraavat arvot:
| Pituus (m) | Jakso (t) |
|---|---|
| 0,1 | 0,6 |
| 0,4 | 1,31 |
| 0,7 | 1,78 |
| yksi | 1,93 |
| 1.3 | 2.19 |
| 1,6 | 2,66 |
| 1.9 | 2,77 |
| 3 | 3,62 |
Pyydetään tekemään sirontakaavio tiedoista ja suorittamaan lineaarinen sovitus regression kautta. Näytä myös regressioyhtälö ja sen määrityskerroin.
Ratkaisu

Kuva 2. Ratkaisukaavio harjoitukselle 1. Lähde: F. Zapata.
Voidaan havaita melko korkea määrityskerroin (95%), joten voitaisiin ajatella, että lineaarinen sopivuus on optimaalinen. Kuitenkin, jos pisteitä tarkastellaan yhdessä, niillä näyttää olevan taipumus kaareutua alaspäin. Tätä yksityiskohtaa ei harkita lineaarisessa mallissa.
- Esimerkki 2
Suorita datan sirontakaavio samoille tiedoille esimerkissä 1. Tällöin, toisin kuin esimerkissä 1, regression säätöä pyydetään potentiaalista funktiota käyttämällä.

Kuva 3. Harjoituksen 2 ratkaisukaavio. Lähde: F. Zapata.
Näytä myös sopivuusfunktio ja sen määrityskerroin R 2.
Ratkaisu
Potentiaalifunktio on muodossa f (x) = Akseli B, jossa A ja B ovat vakioita, jotka määritetään pienimmän neliösumman menetelmällä.
Edellisessä kuvassa on esitetty potentiaalinen funktio ja sen parametrit sekä määrityskerroin erittäin korkealla, 99%: n arvolla. Huomaa, että tiedot seuraavat trendilinjan kaarevuutta.
- Esimerkki 3
Suorita toisen asteen polynominen sovitus käyttämällä samoja tietoja esimerkistä 1 ja esimerkistä 2. Näytä kuvaaja, sopiva polynomi ja vastaava määrityskerroin R 2.
Ratkaisu

Kuva 4. Harjoituksen 3 ratkaisukaavio. Lähde: F. Zapata.
Toisen asteen polynomisella sovituksella voit nähdä trendin, joka sopii hyvin datan kaarevuuteen. Myös määrityskerroin on lineaarisen sovituksen yläpuolella ja potentiaalisen sovituksen alapuolella.
Sovita vertailu
Näytetyistä kolmesta sopivuudesta korkein määrityskerroin on potentiaalisovitus (esimerkki 2).
Mahdollisuussovitus sopii yhteen heilurin fysikaalisen teorian kanssa, joka, kuten tiedetään, osoittaa, että heilurijakso on verrannollinen sen pituuden neliöjuureen, suhteellisuusvakio on 2π / √g, missä g on painovoiman kiihtyvyys.
Tämän tyyppisellä potentiaalisovituksella ei ole vain korkein määrityskerroin, vaan eksponentti ja suhteellisuusvakio vastaavat fyysistä mallia.
johtopäätökset
- Regression säätö määrittää funktion parametrit, jolla pyritään selittämään data pienimmän neliösumman menetelmällä. Tämä menetelmä käsittää asteikon Y-arvon ja datan Yi-arvon välisen kvadraattisen eron summan minimoimisen datan Xi-arvoille. Tämä määrittää viritystoiminnon parametrit.
- Kuten olemme nähneet, yleisin säätöfunktio on viiva, mutta se ei ole ainoa, koska säädöt voivat olla myös polynomia, potentiaalisia, eksponentiaalisia, logaritmisia ja muita.
- Joka tapauksessa määrityskerroin riippuu tiedoista ja säätötyypistä ja on osoitus tehdyn säädön hyvyydestä.
- Viimeiseksi määrityskerroin ilmaisee prosentuaalisen osuuden datan Y-arvon välisestä kokonaismuuttuvuudesta suhteessa annetun X: n säädön Ŷ-arvoon.
Viitteet
- González C. Yleiset tilastot. Palautettu osoitteesta: tarwi.lamolina.edu.pe
- IACS. Aragonese Health Sciences Institute. Palautettu osoitteesta: ics-aragon.com
- Salazar C. ja Castillo S. Tilastojen perusperiaatteet. (2018). Palautettu osoitteesta: dspace.uce.edu.ec
- Superprof. Määrityskerroin. Palautettu: superprof.es
- USAC. Kuvaileva tilasto-ohje. (2011). Palautettu: statistika.ingenieria.usac.edu.gt.
- Wikipedia. Määrityskerroin. Palautettu osoitteesta: es.wikipedia.com.
