CorrelazioneIl coefficiente di correlazione r è un indice campionario del grado e del tipo di associazione lineare.
Il segno di tale coefficiente indica il tipo (positivo se la variazione è concorde, negativo quando, all’aumentare di una variabile l’altra decresce), il valore assoluto ne specifica invece il grado.
Il valore della correlazione varia tra -1 e +1.
Il coefficiente r non è in grado di rilevare un’eventuale correlazione di tipo non lineare.
Correlazione
Il coefficiente di correlazione r è un indice campionario del grado e del tipo di associazione lineare.
Il segno di tale coefficiente indica il tipo (positivo se la variazione è concorde, negativo quando, all’aumentare di una variabile l’altra decresce), il valore assoluto ne specifica invece il grado.
Il valore della correlazione varia tra -1 e +1.
Il coefficiente r non è in grado di rilevare un’eventuale correlazione di tipo non lineare.
Esempi di r
r = x y 1.000 r = x y 1.000 r = x y 1.000 r = x y 0.562 r = x y 0.625 r = x y 0.500 Perfetta correlazione positiva Debole correlazione positiva
Esempi di r
Associazione lineare non significativa Vari gradi di correlazione negativa r = x y -0.079 r = x y 0.026 r = x y 0.078 r = x y -0.544 r = x y -0.931 r = x y -1.000
ESERCIZIO 52
La concentrazione plasmatica di sodio (mmol/L) e la pressione arteriosa sistolica (mmHg) sono state misurate contemporaneamente in un campione di 12 pazienti. I dati sono riportati nella seguente tabella.
Rappresentare i dati mediante un diagramma di dispersione e calcolare il coefficiente di correlazione.
La correlazione lineare suggerita dal diagramma a dispersione è molto forte. All’aumentare della concentrazione di sodio aumenta in modo lineare la pressione sanguigna.
ESERCIZIO 53
Si consideri la distribuzione chi-quadrato con due gradi di libertà.
a) Quale proporzione dell'area sotto la curva giace a destra di 9.21?
b) Quale valore di delimita il 10% superiore della distribuzione?
a)
b)
Test chi quadrato
Quando le variabili sono qualitative e i dati da confrontare indipendenti si utilizza il Test c2
Per l'applicazione di questo test è opportuno costruire una tavola di contingenza che contenga il numero di casi osservati (O) in ogni combinazione delle modalità delle due variabili analizzate, e di casi attesi (A), cioè il numero di casi che ci si potrebbe aspettare se non fosse presente la differenza studiata.
Esempio
Si studia l’effetto di un farmaco antiinfiammatorio nella cura dell’artrite reumatoide.
A 62 pazienti viene somministrato il farmaco e a 11 un placebo. La frequenza di rigidità articolare rilevata nei due gruppi è riportata nella tabella sottostante:
73 11 62 Totale 54 6 48 Non rigidità 19 5 14 Rigidità Totale placebo farmaco
Il p-value non è significativo e non supporta quindi l’efficacia di tale farmaco. Risultato (Excel) Calcolo attesi: la probabilità di rigidità articolare in tutto il campione indipendentemente dal trattamento è 19 su 73. Se non ci fosse effetto del trattamento mi aspetterei la stessa proporzione di casi di rigidità nei due gruppi, cioè:
(19/73)*62=16,14 e (19/73)*11=2.86
ESERCIZIO 54
Un gruppo di cardiologi conduce uno studio per accertare l'associazione che esiste tra metodo contraccettivo e ipertensione. Di 40 donne che usano contraccettivi orali e 60 donne che usano altri metodi, rispettivamente 8 e 15 sono ipertese. Testare l'ipotesi che tra il tipo di contraccettivo e ipertensione esista associazione ad un livello di significatività dell'1%. Ipertese
8
15
23
Non ipertese
32
45
77
Tot
40
60
100
Orali
Altro
Tot
frequenze
osservate Ipertese
9.2
13.8
23
Non ipertese
30.8
46.2
77
Tot
40
60
100
Orali
Altro
Tot
frequenze
attese
ESERCIZIO 55
Saggiate ad un livello di significatività del 5% se il sesso e l'età sono significativamente associati.
20-44 anni
45-64 anni
65 anni
maschi
femmine
36
52
109
117
126
160
maschi
femmine
Tot
20-44
36 (39.7)
52 (48.3)
88
45-64
109 (102.1)
117 (123.9)
226
65
126 (129.2)
160 (156.8)
286
Tot
271
329
600
Tabella osservati e attesi
ESERCIZIO 56
Un farmaco per il trattamento del raffreddore è stato somministrato a metà di un gruppo di malati selezionati casualmente. All'altra metà dei pazienti con raffreddore è stato somministrato un placebo. I risultati ottenuti sono riportati nella seguente tabella:
Verificare se l'opinione del paziente è indipendente dal trattamento ricevuto ammettendo un errore del I° tipo del 5%.
Farmaco
16
30
104
Nocivo
Nessun effetto
Utile
Placebo
20
42
88
Farmaco
16 (18)
30 (36)
104 (96)
150
Placebo
20(18)
42 (36)
88 (96)
150
Tot
36
72
192
300
Nocivo
Nessun effetto
Utile
Tot
=0.05 Poichè (3.778<5.99) non ci sono motivi per affermare che vi sia una relazione tra opinione dei pazienti e tipo di trattamento. Il test non è significativo ad un livello del 5%.
ESERCIZIO 57
La distribuzione percentuale, in accordo allo stato civile, della popolazione USA al di sopra dei 18 anni nel 1968 è la seguente: celibe/nubile=21.6, coniugato/a=62.9, vedovo/a=7.7, divorziato/a=7.8.
Un campione casuale di 400 persone, di età superiore ai 18 anni (selezionato nel 1990) ha mostrato che 102 di queste sono celibi/nubili, 220 coniugate, 35 vedove e 43 divorziate. Saggiate, ad un livello di significatività del 5%, se in questo periodo è cambiata la distribuzione percentuale dello stato civile della popolazione USA di età superiore ai 18 anni.
Single
Cng
Ved.
Div.
Tot
Osservati
%Attese
Attesi
102
21.6
86.4
220
62.9
251.6
35
7.7
30.8
43
7.8
31.2
400
400
=0.05
Poichè (11.822>7.815) si può affermare che dal 1968 vi è stato un mutamento nella struttura dello stato civile in USA.
ESERCIZIO 58
Una ditta ha 500 dipendenti. Di questi 300 sono uomini e 280 sono coniugati/e. Dei 300 uomini, 190 sono coniugati. Se un soggetto di questa ditta è selezionato a caso, qual è la probabilità che sia:
a) una donna
b) un uomo sapendo che è coniugato
c) Si può ritenere che tra i dipendenti vi sia associazione tra sesso e stato civile (=0.05).
Uomini
110
190
300
Donne
110
90
200
Tot
220
280
500
OSSERVATI
Single
Cng.
Tot
a)
b) c) =0.05 Uomini
132
168
300
Donne
88
112
200
Tot
220
280
500
ATTESI
Single
Cng.
Tot
Poichè (16.37>3.84) ci sono motivi per affermare che vi sia una relazione tra sesso e stato civile tra i dipendenti della fabbrica considerata.
ESERCIZIO 59
500 maschi sono classificati secondo l'età in anni compiuti e il numero dei fratelli. I risultati ottenuti sono riportati nella seguente tabella: 0
68
32
36
89
1
9
57
24
60
1-5
6-10
11-13
14-18
2
59
25
20
21
a) con quale misura di dispersione è possibile confrontare la variabilità delle due variabili prese in considerazione, cioè l’età ed il numero di fratelli (non fare i calcoli)?
b) calcolare per la variabile età una opportuna misura di posizione e una di dispersione.
c) calcolare per la variabile N° di fratelli una opportuna misura di posizione e una di dispersione.
d) quale è la probabilità che un soggetto estratto a caso abbia uno o più di un fratello?
e) gli eventi "essere in età prescolare" ed "avere un solo fratello" sono mutualmente esclusivi? Dimostrarlo con il calcolo delle probabilità.
f) verificare se esiste un’associazione tra età e numero di fratelli.
a) Il coefficiente di variazione
a) con quale misura di dispersione è possibile confrontare la variabilità delle due variabili prese in considerazione, cioè l’età ed il numero di fratelli (non fare i calcoli)? b)
b) calcolare per la variabile età una opportuna misura di posizione e una di dispersione. c) calcolare per la variabile N° di fratelli una opportuna misura di posizione e una di dispersione. c) Moda=0 Range=2-0=2
d) quale è la probabilità che un soggetto estratto a caso abbia uno o più di un fratello? d)
Comments