MCA eli luokitteluanalyysi YTT Pertti Jokivuori / JY
26.3.2009
Monimuuttujamenetelmäkurssi
25.–27.3.2009
Tampere
MCA eli luokitteluanalyysi YTT Pertti Jokivuori / JY
26.3.2009
Monimuuttujamenetelmäkurssi
25.–27.3.2009
Tampere
Ilmiön selittäminen, lineaariset mallit
Paul Lazarsfeld puhuu todellisesta yhteydestä tai kausaalisuhteesta, jos muuttujien välinen riippuvuus säilyy suhteessa kaikkiin mahdollisiin kausaalisesti edeltäviin muuttujiin
Columbian koulukunnan survey-analyysissa käsiteltiin ja esitettiin seikkaperäisesti niitä ehtoja ja edellytyksiä, jotka tutkijan on osoitettava täytetyksi, ennen kuin hän voi väittää että muuttuja X vaikuttaa muuttujaan Y.
Varsinaisia välttämättömiä edellytyksiä Columbian yliopiston koulukunta esitteli kolme:
● X ja Y ovat tilastollisesti riippuvaisia, niiden välillä on yhteys, assosiaatio
● X-muuttujan arvot edeltävät kausaalisesti Y-muuttujan arvoja
● X:n ja Y:n välinen tilastollinen riippuvuus säilyy, vaikka molempia muuttujia kausaalisesti edeltävien muiden muuttujien vaikutus on kontrolloitu
MCA, moniluokitteluanalyysi:
Multiple Classification Analysis, suomeksi moniluokitteluanalyysi
yhdistää varianssi- ja regressioanalyysin keskeiset piirteet
tarkoitettu yhden jatkuvan muuttujan vaihtelun tarkasteluun
Menetelmän avulla otetaan huomioon usean eri taustamuuttujan samanaikainen vaikutus
Tällöin on mahdollista tarkastella, miten selittäjämuuttujien sisältämien ryhmien keskiarvot muuttuvat, kun malliin otetaan mukaan rinnakkaisia taustamuuttujia. Toisten muuttujien vaikutuksen huomioimisella, elaboroinnilla, pyritään vakioimaan niiden vaikutus ja erottamaan todelliset yhteydet näennäisyhteyksistä
MCA, Multiple Classification Analysis:
MC-analyysi on monimuuttujamenetelmä, jossa useilla riippumattomilla muuttujilla pyritään selittämään yhden riippuvan muuttujan vaihtelua
Muistuttaa monimuuttujaista regressioanalyysiä, mutta sallii myös järjestysasteikollisten ja luokitteluasteikollisten riippumattomien muuttujien käytön
Tarkastellaan, miten ryhmittäiset erot muuttuvat, kun malliin otetaan mukaan useampi taustamuuttuja
MCA tulokset ilmoitetaan yleensä taulukkomuodossa seuraavilla tunnusluvuilla:
Taustamuuttujat ja niiden mukaiset havaintomäärät eri osaryhmissä (N)
Ryhmäkeskiarvojen poikkeama kokonaiskeskiarvosta (+ -)
Korjatut ryhmäkeskiarvojen poikkeamat kokonaiskeskiarvosta, kun muiden selittäjien vaikutus on otettu huomioon
MCA tulokset ilmoitetaan yleensä taulukkomuodossa seuraavilla tunnusluvuilla:
Eta-kerroin, joka on analoginen korrelaatiokertoimelle
se kuvaa kunkin taustamuuttujan yhteyttä selitettävään muuttujaan
etan neliö kertoo kuinka paljon kukin riippumaton muuttuja pystyy yksin selittämään riippuvan muuttujan vaihtelusta
MCA tulokset ilmoitetaan yleensä taulukkomuodossa seuraavilla tunnusluvuilla:
Yhteiskorrelaatiokertoimen (R) neliö
joka kertoo koko mallin selitysasteen (R2)
selitysaste ilmaisee kuinka paljon riippumattomat muuttujat yhdessä selittävät tai kuinka paljon malli selittää riippuvan muuttujan varianssista Beta-kerroin
joka on analoginen standardoiduille regressiokertoimille
sen avulla voidaan verrata eri muuttujien suhteellista selityskykyä
MCA:n käyttö SPSS:ssä
Vaatii syntax-komentojen käyttöä
ANOVA Y BY X1(0,1) X2(1,2) X3(1,3) X4(1,4) /METHOD=EXPERIMENTAL /MAXORDERS=NONE /STATISTICS=ALL.
MCA:n käyttö SPSS:ssä
Y = selitettävä muuttuja (jatkuva)
X1-X4 = Selittävät muuttujat (tulevat aina komennon BY jälkeen). Muuttujien täytyy olla luokiteltuja, jatkuvat muuttujat eivät käy sellaisenaan
MCA:n käyttö SPSS:ssä
METHOD=EXPERIMENTAL = Klassinen kokeellinen neliösummien laskutapa
MAXORDERS = Määritellään yhdysvaikutusten taso, ts. lasketaanko 2 asteen yhdysvaikutukset mukaan. Tässä tapauksessa yhdysvaikutuksia ei lasketa (NONE), koska MCA:n oletuksena on, ettei yhdysvaikutuksia ole
MCA:n käyttö SPSS:ssä
STATISTICS = Valitaan vaihtoehto ALL, koska tällöin saadaan näkyviin ns. Grand Mean, jonka suhteen poikkeamat on laskettu
Löytyy tulostuksessa laatikosta CELL MEANS
Itse Multiple Classification Analysis tulostus löytyy laatikosta MCA
MCA:n käyttö SPSS:ssä
MCA tulostuksessa esitetään ensin ennustetut keskiarvot suoraan (Unadjusted) ja ottaen huomioon muiden selittäjien vaikutus (Adjusted for factors)
Sama koskee poikkeamien laskua yleiskeskiarvosta. Tulokset esitetään yleensä juuri poikkeamina yleiskeskiarvosta (GRAND MEAN)
MCA:n käyttö SPSS:ssä
Laatikosta FACTOR SUMMARY löytyy muuttujien ETA ja BETA kertoimet
Laatikosta MODEL GOODNESS OF FIT löytyy mallin selitysaste (R squared)
Anova taulusta luetaan yksittäisten muuttujien ja mallin tilastolliset merkitsevyydet, kuten tavallisessa varianssianalyysissä
Comments