Università degli Studi di Cagliari Metodi di analisi multivariata Corso di Laurea in Scienze Psicologiche Anno Accademico 2010/2011 Prof. Eraldo Nicotra
Dott. Paola Grassi
Università degli Studi di Cagliari Metodi di analisi multivariata Corso di Laurea in Scienze Psicologiche Anno Accademico 2010/2011 Prof. Eraldo Nicotra
Dott. Paola Grassi
Argomenti della lezione Il modello algebrico lineare Il modello statistico lineare La regressione lineare semplice
Alcuni aspetti generali
X Y In una relazione diretta viene ad instaurarsi un legame tra una ben definita variabile X ed un’altra variabile Y e tale legame relazionale non è mediato da nessuna altra variabile Z Relazione diretta Ciò che accade ad Y è diretta conseguenza dei fatti che caratterizzano il comportamento di X.
Sotto queste condizioni: Y dipende funzionalmente da X tramite f. X Y f In condizioni sperimentali controllate è possibile osservare una dipendenza univoca di Y dagli stati differenti che caratterizzano X. Sicché, è possibile dire che Y dipende funzionalmente da X quando, essendo noti i valori numerici che X può assumere i valori numerici ottenuti dalla variabile Y possono essere calcolati in maniera univoca a partire dai valori di X che vengono opportunamente trasformati utilizzando una regola, o algoritmo di trasformazione, che indicheremo con f.
X Y In altre condizioni sperimentali, non è possibile osservare una completa dipendenza di Y dai fatti che caratterizzano X. E’ però possibile dire che Y dipende funzionalmente da X a meno dell’influenza diretta esercitata su Y da una terza variabile Z. Questa influenza potrà essere stimata tramite una funzione g(Z) dato però per certo che tra X e Z non sussista alcuna relazione funzionale k che sia nota a priori. In altri termini: non deve esistere un effetto indiretto (gk)(X) della variabile X sulla variabile Y tramite l’effetto diretto della variabile Z quantificato tramite g. g Z f In generale vale Y=f(X) + g(Z) + (gk)(X) k Non esistendo però alcuna funzione tra X e Z l’espressione si riduce a: Y=f(X) + g(Z)
Il modello algebrico lineare
L’algebra del modello lineare Il modello algebrico lineare è rappresentabile con una equazione della forma: Y= a + bX. Questo modello individua una collezione di coppie (x,y) di valori numerici, presenti sul piano cartesiano X Y, ottenute tramite una condizione di dipendenza funzionale di Y in rapporto ad X. Questa dipendenza funzionale ci permette di disporre tali coppie (x,y) lungo un ente geometrico detto retta.
Per dipendenza funzionale va intesa la condizione in base alla quale prescelto un qualsiasi valore x dall’insieme X questo stesso valore permette, in maniera univoca, di conoscere il valore y di Y da assegnare alla coppia (x,y) in modo che questa giaccia sulla retta. Variabile dipendente Variabile indipendente
Possiamo rappresentare il modello anche in forma funzionale con l’espressione: Y=f(X; a,b) e riscrivere la regola funzionale f nella seguente maniera: f a + b • (X) In maniera algoritmica avremo: + a b X • Y= a + b • (X) Significato: aggiungi a al prodotto tra b ed il valore x ottenuto come determinazione della variabile X.
Il modello lineare assume quindi l’esistenza di una dipendenza funzionale dei secondi termini delle coppie a partire dalla conoscenza dei valori assunti dai primi termini e dalla conoscenza dei parametri funzionali a e b noti al modello. In questo modo è sempre possibile individuare una qualsiasi coppia sul piano cartesiano X Y che risulti composta funzionalmente nel seguente modo:
(x,y) = (x, (a+bx) = y) Re2. Sotto queste circostanze il grafico della funzione apparirà composto da punti in X Y allineati lungo una retta. Re2
Y X (xi, (yi=a+bxi)) x1 x2 y1 y2 min(X) min f(X) = a Grafico della funzione Y=a+b(X) f(x,y) Re2 xi yi
Y X (x,(y=a+bx)) f(x,y) Re2 x1 x2 y1 y2 min(X) (y|x0 = min f(X)) = a a = minimo della variabile Y in corrispondenza del valore minimo della variabile X. Interpretazione dei valori a e b del modello b = incremento costante in Y per incremento costante in X:
b=(y2-y1)/(x2-x1) in Y=f (X; a,b) b x0
L’espressione b=(y2-y1)/(x2-x1) permette di riconoscere come l’incremento nella variabile Y dal valore y1 al valore y2 sia rapportabile all’incremento della variabile X dal valore x1 al valore x2. Inoltre, il valore di b è costante per qualsiasi coppia di valori (yi, yj) ed (xi, xj) vengano scelti dai rispettivi insiemi. Y X a y2-y1 x2-x1 b c b=(y2-y1)/ (x2-x1) x1 x2 y1 y2 Retta passante per due punti noti (y2-y1) = b (x2-x1) y1y2 x1x2
Y X Retta passante per l’origine o y1 x2 x3 p1 p2 p3 I punti sulla retta possono essere identificati tramite le loro coordinate sui due assi X e Y all’interno dello spazio euclideo Re2. Re2 p1=(x1,y1) p2=(x2,y2) p3=(x3,y3) y2 y3 x1
Y X o y1 x2 x3 p1 p2 p3 Re2 y2 y3 x1 I rapporti tra le lunghezze dei segmenti, ottenuti come proiezioni delle coppie (x,y) sulla variabile X e sulla variabile Y rispettivamente, ci permettono di valutare come tale insieme di valori si mantenga costante e come il risultato comune sia uguale a b. Retta passante per l’origine
La costante b viene anche detta coefficiente angolare e permette di calcolare l'inclinazione (o la pendenza) che la retta ha quando essa ha come punto d’origine l’intersezione tra i due assi rappresentanti le variabili X ed Y. Essendo quindi si ha che b o Y X
Possiamo riscontrare che se la retta con origine in o sta nel I o nel III quadrante, il suo coefficiente angolare b è positivo. Se la retta sta nel II o nel IV quadrante, il suo coefficiente angolare b è negativo (-b). I II III IV b b -b -b o
In generale possiamo rappresentare il segno algebrico (+ o -) che il valore parametrico b assume in funzione dei segni algebrici che le variabili X ed Y ottengono all’interno dei quattro quadranti cartesiani. (+,+) (-,+) (+,-) (-,-) b -b b -b Re2
Retta non passante per l'origine Se indichiamo con o’= (min(X), a) il punto in cui r’ incontra l'asse Y, e tracciamo un nuovo asse parallelo ad X che chiamiamo con X’ avremo eseguito una traslazione sul punto di ordinata a dell’asse X sul nuovo asse X’. Questa traslazione ci permette di trasferire l'origine o nel nuovo sistema di riferimento X’o’Y. In questa circostanza dobbiamo riscrivere l’equazione della retta r’ sul sistema di riferimento degli assi XoY nella seguente maniera: Y=a+b(X); mentre in riferimento al sistema X’o’Y si ha Y=a+b(X’)-a = b(X’).
a a a o o’ X X’ Y r’ r a
Verifica o o’ X X’ Y=Y’ y’= b x’ a y’=y-a x=x’ y’ y Per sostituzione: x’=x y’= b x’ y - a = b x y= b x + a
Comments