TUME II / TILASTOLLINEN OSUUS
TILASTOAINEISTON HANKINTA
SEPPO RÄSÄNEN
SAVONIA-AMK
TERVEYSALA KUOPIO
KEVÄT 2008 * TYTUT21 *
TUME II / TILASTOLLINEN OSUUS
TILASTOAINEISTON HANKINTA
SEPPO RÄSÄNEN
SAVONIA-AMK
TERVEYSALA KUOPIO
KEVÄT 2008 * TYTUT21 *
Tilastoaineiston hankinta… Perusjoukko sisältää siis kaikki tilastoyksiköt, jotka liittyvät tutkimukseen
Jos kaikkia tilastoyksiköitä ei voida tutkia, muodostetaan perusjoukon osajoukko.
Osajoukko on otos, jos jokaisella perusjoukkoon kuuluvalla tilastoyksiköllä on sama mahdollisuus tulla valituksi otokseen
Osajoukko on näyte, jos valituksi tuleminen ei tapahdu satunnaisesti
Rajattu perusjoukko on nimeltään kehikko
Otoksen koko vaikuttaa tutkimuksen luotettavuuteen ja virhemarginaaliin * *
Tilastoaineiston hankinta… Todennäköisyyteen perustuvat otantamenetelmät otos
Yksinkertainen satunnaisotanta
Systemaattinen otanta
Ositettu otanta
Ryväsotanta
Muut menetelmät näyte
Harkinnanvarainen otanta
Kiintiöotanta * *
Tilastoaineiston hankinta… Yksinkertainen satunnaisotanta (simple random sampling), satunnaisotanta
Otantayksiköt poimitaan satunnaisesti, jokainen valittu otantayksikkö voi tulla samalla todennäköisyydellä valituksi
Arpomalla tai satunnaislukumenetelmällä
Kehikon muodostaa perusjoukon otantayksiköt
Kehikon otantayksiköt numeroidaan juoksevalla numerolla
Päätetään, kuinka monta otetaan otoskoko
Arvotaan satunnaislukuja otoskoon verran ja valitaan otantayksiköt
Esim. Tehdään Tertan opiskelijoista tutkimus jonkin viitekehyksen näkökulmasta. Opiskelijoilla on juokseva opinto-oikeusnumero. Määritetään vaikkapa 100 opiskelijaa tutkimukseen, joten arvotaan opiskelijanumeron mukaisesta numeroavaruudesta 100 numero. Arpaonnen mukaiset henkilöt saavat kyselylomakkeen.
* *
Tilastoaineiston hankinta… Systemaattinen otanta (systematic sampling)
Kehikon muodostaa perusjoukko ja otantayksiköt numeroidaan järjestykseen.
Järjestetystä listasta poimitaan tasavälein olevat numerot
Poimintaväli (k) lasketaan kaavasta k=N/n ja tulos pyöristetään kokonaisluvuksi
Ensimmäinen otokseen kuuluva otantayksikkö arvotaan väliltä k-1 ja seuraavat valitaan k yksikön välein
Esim. Tertan opiskelijat… jos opiskelijamäärä on 1000 ja tutkimukseen halutaan 100 opiskelijaa, niin poimintavälin on 10. Arvonnan perusteella on valittu ensimmäiseksi opiskelijanumeroksi 10105, joten seuraavat opiskelijanrot ovat 10115, 10125, 10135, jne * *
Tilastoaineiston hankinta… Ositettu otanta (stratified sampling)
Perusjoukko jaetaan toistensa poissulkeviin osiin ositteet
Ositteiden tulee olla homogeenisiä tutkittavan asian suhteen
Ositteista poimitaan omat otokset satunnaisotannalla tai systemaattisella otannalla
Otoskoon jakamista eri ositteiden kesken kutsutaan kiintiöinniksi
Esim. Tertan opiskelijatutkimus… Opiskelijoilla on erilaisia taustakoulutuksia. Opiskelijat jaetaan lukio-ositteeseen, terveysalan ammatilliseen-ositteeseen, muun alan ammatilliseen ositteeseen. Nyt jokaisesta ositteesta otetaan kiintiön mukainen määrä otoksia vaikkapa satunnaisotannalla.
* *
Tilastoaineiston hankinta… Ryväsotanta (cluster sampling)
Perusjoukko jaetaan toistensa poissulkeviin osiin, ryppäisiin
Jokainen rypäs on kuten perusjoukko eli ryppäässä olevat otantayksiköt vaihtelevat ominaisuuksiltaan toisiinsa verrattuna
Ryppäistä valitaan joku, joka toimii tutkimusyksikkönä
Ryppäissä voidaan tehdä kokonaistutkimus tai otantatutkimus
Esim. Tertan opiskelijat… Muodostetaan vaikkapa 5 perusjoukon mukaista ryvästä. Ryppäissä on eri sukupuolia, eri koulutustaustan henkilöitä, eri ikäisiä, jne eli ryväs on pienoiskoossa oleva perusjoukko. Nyt arvotaan, mikä ryväs jatkaa tutkimuksessa. Valitun ryppään sisällä voidaan tehdä kokonaistutkimus tai vaikkapa satunnaisotanta.
* *
Tilastoaineiston hankinta… Harkinnanvarainen otanta (convenience sampling)
Haastattelija valitsee haastateltavansa, paikkana tyypillisesti ostoskeskukset
Harkinnanvaraisesta otannasta ei tule edustavaa otosta, sillä esim. Prismassa ei käy kaikki Tertan opiskelijat
Esim. Tertan ruokalan edessä tehdään haastattelu ruokailijoiden ruokailutottumuksesta, tai uuden ruuan lisäämisestä ruokalistaan
* *
Tilastoaineiston hankinta… Kiintiöotanta (quota sampling)
Perusjoukko jaetaan toistensa poissulkeviin osiin jonkin asian perusteella, vaikkapa sukupuoli
Samalla määritetään otantayksiköiden suhteellinen osuus tai absoluuttinen määrä eri kiintiöille
Poimitaan otantayksiköt jokaisen kiintiön mukaan täyteen
Esim. Kiintiöidään Tertan opiskelijat eri koulutusalojen mukaan. Jokaisesta koulutusalasta poimitaan suhteellisten osuuksien mukaan opiskelijoita ja tehdään heille kyseinen haastattelu * *
Tilastoaineiston hankinta… * Otoskoko
Otoskoko on oltava riittävän iso, jotta otos on edustava
Otoskoko voidaan laskea kaavalla n=z2*(p*(1-p))/e2) , missä z=riskitasoon liittyvä normaalijakauman arvo, p=otoksen laskettu osuus, e=suurin sallittu virhe
Otoskokoa voi arvioida valmiiden taulukoiden avulla, josta valitaan riskitaso (tyypillisesti 5%) sekä ilmiön esiintymisen prosenttiosuus (esim. kroonista kipua kokee 20% väestöstä)
Otantasuhde ilmoittaa prosentteina, paljonko otoksen koko on perusjoukosta. Esim. Perusjoukossa on 1054 henkilöä ja siitä tehdään 100 henkilön otos.
Otantasuhde = 100/1054 ≈ 0,095 ≈ 9,5 % * erehtymisriski 5% 1% 0,1% z 1,96 2,58 3,30 Mikä on otoskoko, kun koulutusohjelmaan
osallistuvien määrä on 20%, virhemarginaali
saa olla 2% ja erehtymisriski on 5%?
n=1,962*(0,20*(1-0,20))/0,022=1537
eli otoskoko on 1550
Tilastoaineiston hankinta… Virhelähteet otantatutkimuksessa
Kokonaisvirhe
Otantavirhe (esim. sopimaton otantamenetelmä, otos ei ole edustava, otoskoko pieni)
Muu kuin otantavirhe
Vastaamiseen liittyvä virhe
Vastaajasta johtuva virhe (esim. vastaaja ymmärtää kysymyksen väärin)
Haastattelijasta johtuva virhe (esim. vastauksen väärin kirjaaminen, vastaajan auttaminen)
Tutkijasta johtuva virhe (esim. huono tavoitteiden määrittely, väärä kohderyhmä, puutteet kyselylomakkeessa)
Vastaamattomuudesta johtuva virhe (tahallinen tai tahaton)
Tavoittamattomuudesta johtuva virhe
Vastaamattomuus ja tavoittamattomuus muodostaa kadon * *
Tilastoaineiston hankinta… Kyselylomake
Tehdään, kun tutkimusongelma ja tietotarve on määritelty
Kysymyksessä kysytään VAIN yhtä asiaa
Vastausvaihtoehdot selkeitä
Lomake testataan (testikysely) ennen kyselyä
Käytetään sopivia kysymystyyppejä, huom. avointen kysymysten tulkinta tilastollisesti voi olla hankalaa
Lomakkeella voi olla jollakin tavalla koodattu tieto, joka kuvastaa vastaajaryhmää, vastaajan tietoja, jne... joita vastaaja ei osaa arvata (onko tullut kirje, että et ole vastannut kyselyymme, toivomme pikaista vastausta?)
Kysymysten määrä harkittava (laaja kysely aiheuttaa katoa)
Kyselyssä olisi hyvä näkyä aika, jonka kysely vie
Tietokonepohjaisissa kyselyissä olisi hyvä näkyä navigointi, missä vaiheessa vastaaja on
Kuvaa julkaisussasi, miten olet testannut, että kysely mittaa sitä asiaa, mitä on tarkoituskin mitata * *
Tilastoaineiston hankinta… Kysymystyyppien ryhmittely Kysymyksen
muoto Skaalattu
kysymys Suljettu
kysymys Avoin
kysymys Skaalattu kysymys,
jossa vaihtoehdot
skaalattu verbaalisesti Skaalattu kysymys
ilman tulkintaa Vaihtoehdot luetteleva
suljettu kysymys Kaksiarvoinen
kysymys Lisätietoja pyytävä,
syventävä Ei vastausohjetta * *
Harjoitus… Harjoitus 1
Perusjoukon koko on 1400 tilastoyksikköä ja siitä tehdään 150 :kpl:n otos systemaattisella otannalla. Määrää poimintaväli.
Perusjoukossa on 1860 nuorta, 2735 keski-ikäistä ja 1520 vanhusta. Kuinka monta henkilöä eri ikäryhmistä poimitaan 200 henkilön otokseen, kun käytetään ositettua otantaa ja suhteellista kiintiöintiä ?
Harjoitus 2
Olet tekemässä tutkimusta opiskelijoiden opintomenestyksestä opiskelun aikana. Tutkimuksessa selvitetään, onko iällä, sukupuolella, tausta koulutuksella, opiskeluun käytettävällä ajalla (opiskelua tunteina / vko),
Mieti muuttujat ja muuttujien mitta-asteikot
Minkä tyyppisiä kysymyksiä tutkimukseesi tulee?
Harjoitus 3
Avaa tutkimusdata ”ratsastuskoulu.xls”, tiedostossa on valmiina Excel-toteutus ratsastuskoulua käyvien henkilöiden otantatutkimukselle
Minkä tyyppisiä kysymykset ovat?
* *
Comments