- Kaavat ja yhtälöt
- Kuinka laskea näytteenottovirhe
- Luottamustasolle
- esimerkit
- - Esimerkki 1
- Ratkaisu
- - Esimerkki 2
- Ratkaisu
- - Esimerkki 3
- Ratkaisu
- - Esimerkki 4
- Ratkaisu
- - Harjoitus 5
- Ratkaisu
- Viitteet
Näytteenotto virhe tai näytteenotto virheen tilastotiedot on ero keskiarvon näytteen ja keskiarvo koko väestöstä. Idean havainnollistamiseksi kuvitellaan, että kaupungin kokonaisväkiluku on miljoona ihmistä, joista haluat sen keskimääräisen kenkäkoon, josta otetaan satunnainen näyte tuhatta ihmistä.
Otoksesta syntyvä keskikoko ei välttämättä ole sama kuin koko populaation koko, vaikka arvon on oltava lähellä, jos otosta ei ole puolueellisesti painottu. Tämä ero näytteen keskiarvon ja koko populaation välillä on näytteenottovirhe.

Kuva 1. Koska otos on osajoukko kokonaispopulaatiosta, näytteen keskiarvolla on virhe. Lähde: F. Zapata.
Koko populaation keskiarvo ei yleensä ole tiedossa, mutta on olemassa tekniikoita tämän virheen vähentämiseksi ja kaavat näytteenottovirhemarginaalin arvioimiseksi, joista keskustellaan tässä artikkelissa.
Kaavat ja yhtälöt
Oletetaan, että haluamme tietää tietyn mitattavissa olevan ominaisuuden x keskiarvon N-kokoisessa populaatiossa, mutta koska N on suuri lukumäärä, tutkimusta ei ole mahdollista suorittaa koko väestöstä, sitten otamme satunnaisen näytteen koko n <
Näytteen keskiarvo merkitään
Oletetaan, että m näytteitä otetaan koko populaatiosta N, kaikki yhtä suuret n keskiarvoineen
Nämä keskiarvot eivät ole identtisiä toistensa kanssa ja ne ovat kaikki populaation keskiarvon μ ympärillä. Näytteenottovirhemarginaali E osoittaa keskiarvojen odotetun erottelun
Koko n näytteen vakiovirhemarginaali ε on:
ε = σ / √n
missä σ on keskihajonta (varianssin neliöjuuri), joka lasketaan seuraavan kaavan avulla:
σ = √
Vakiovirhemarginaalin ε merkitys on seuraava:
Keskiarvo
Kuinka laskea näytteenottovirhe
Edellisessä osassa annettiin kaava koon n näytteen vakiovirhemäärän löytämiseksi, jossa sana standardi osoittaa, että se on virhemarginaali 68%: n varmuudella.
Tämä osoittaa, että jos otettaisiin useita samankokoisia n näytteitä, 68% niistä antaa keskiarvot
On olemassa yksinkertainen sääntö, nimeltään 68-95-99.7 -sääntö, jonka avulla voimme löytää näytteenottovirheen E marginaalin luotettavuustasoille 68%, 95% ja 99,7%, koska tämä marginaali on 1⋅ ε, 2 ⋅ ε ja 3⋅ ε, vastaavasti.
Luottamustasolle
Jos luotettavuustaso γ ei ole yksi edellä mainituista, näytteenottovirhe on keskihajonta σ kerrottuna kertoimella Zγ, joka saadaan seuraavalla menettelyllä:
1.- Ensin määritetään merkitsevyystaso α, joka lasketaan luotettavuustasolta γ seuraavan suhteen kautta: α = 1 - γ
2.- Sitten meidän on laskettava arvo 1 - α / 2 = (1 + γ) / 2, joka vastaa kertynyttä normaalitaajuutta -∞: n ja Zγ: n välillä normaalissa tai Gaussin jakaumassa, jolla on tyyppi F (z), jonka määritelmä voidaan nähdä kuvasta 2.
3.- Yhtälö F (Zγ) = 1 - α / 2 ratkaistaan normaalijakauman (kumulatiivisen) F taulukoilla tai tietokoneohjelmalla, jolla on käänteinen Gauss-funktio F -1.
Jälkimmäisessä tapauksessa meillä on:
Zy = G- 1 (1- a / 2).
4.- Lopuksi tätä kaavaa käytetään näytteenottovirheeseen luotettavuustasolla γ:
E = Zγ ⋅ (σ / √n)

Kuva 2. Normaalijakauman taulukko. Lähde: Wikimedia Commons.
esimerkit
- Esimerkki 1
Laske vakiovirhemarginaali 100 vastasyntyneen näytteen keskimääräisestä painosta. Keskimääräinen paino laskettiin
Ratkaisu
Vakiovirhemarginaali on ε = σ / √n = (1 500 kg) / √100 = 0,15 kg. Tämä tarkoittaa, että näiden tietojen perusteella voidaan päätellä, että 68% vastasyntyneistä on paino välillä 2 950 kg - 3,25 kg.
- Esimerkki 2
Määritä näytteenottomarginaali virheestä E ja 100 vastasyntyneen painoalueelta 95%: n luotettavuustasolla, jos keskimääräinen paino on 3 100 kg ja keskihajonta σ = 1 500 kg.
Ratkaisu
Jos sääntöä 68 sovelletaan; 95; 99,7 - 1 1 ε; 2 'e; 3⋅ ε, meillä on:
E = 2⋅ε = 2 ± 0,15 kg = 0,30 kg
Toisin sanoen 95 prosentilla vastasyntyneistä paino on 2 800–3 400 kg.
- Esimerkki 3
Määritä vastasyntyneiden painoalue esimerkissä 1 luottamusmarginaalilla 99,7%.
Ratkaisu
Näytteenottovirhe 99,7%: n luottavuudella on 3 σ / √n, joka esimerkissämme on E = 3 * 0,15 kg = 0,45 kg. Tästä seuraa, että 99,7 prosentilla vastasyntyneistä on paino 2 650–350 kg.
- Esimerkki 4
Määritä tekijä Zγ luotettavuustasolle 75%. Määritä näytteenottovirheen marginaali tällä luotettavuustasolla esimerkissä 1 esitetylle tapaukselle.
Ratkaisu
Luotettavuustaso on γ = 75% = 0,75, joka liittyy merkitsevyystasoon α suhteen γ = (1 - α) kautta siten, että merkitsevyystaso on α = 1 - 0,75 = 0, 25.
Tämä tarkoittaa, että kumulatiivinen normaali todennäköisyys välillä -∞ ja Zγ on:
P (Z <Zy) = 1 - 0,125 = 0,875
Mikä vastaa Zy-arvoa 1,1503, kuten kuviossa 3 esitetään.

Kuvio 3. Zγ-tekijän määritys, joka vastaa 75%: n luottaustasoa. Lähde: F. Zapata Geogebran kautta.
Toisin sanoen, näytteenottovirhe on E = Zγ ⋅ (σ / √n) = 1,15 ⋅ (σ / √n).
Kun sitä käytetään esimerkin 1 tietoihin, se antaa virheen:
E = 1,15 * 0,15 kg = 0,17 kg
Luotettavuustasolla 75%.
- Harjoitus 5
Mikä on luotettavuustaso, jos Z α / 2 = 2,4?
Ratkaisu
P (Z ≤ Z a / 2) = 1- a / 2
P (Z ≤ 2,4) = 1 - α / 2 = 0,9918 → α / 2 = 1 - 0,9918 = 0,0082 → α = 0,0164
Merkitysaste on:
α = 0,0164 = 1,64%
Ja lopuksi, luottamustaso säilyy:
1- α = 1 - 0,0164 = 100% - 1,64% = 98,36%
Viitteet
- Canavos, G. 1988. Todennäköisyys ja tilastot: Sovellukset ja menetelmät. McGraw Hill.
- Devore, J. 2012. Todennäköisyys ja tilastotiede tekniikan ja tieteen suhteen. 8. päivä. Painos. Cengage.
- Levin, R. 1988. Järjestelmänvalvojien tilastot. 2nd. Painos. Prentice Hall.
- Sudman, S. 1982. Kysymysten esittäminen: Käytännöllinen opas kyselylomakkeen suunnitteluun. San Francisco. Jossey Bass.
- Walpole, R. 2007. Tekniikan ja tieteiden todennäköisyys ja tilastot. Pearson.
- Wonnacott, TH ja RJ Wonnacott. 1990. Alustavat tilastot. 5. toim. Wiley
- Wikipedia. Näytteenottovirhe. Palautettu osoitteesta: en.wikipedia.com
- Wikipedia. Virhemarginaali. Palautettu osoitteesta: en.wikipedia.com
