Un valore medio rappresenta una distribuzione ma non da informazioni circa i singoli dati
5, 5, 5, 5, 5
1, 3, 5, 7, 9
1, 1, 1,1, 21 X = 5
1, 2, 3, 4,15
La variabilità
Variabilità nell’individuo
statura nell’età evolutiva
Variabilità nel gruppo
statura in un gruppo
di individui della stessa età È la capacità di un fenomeno di assumere valori quantitativi o caratteri qualitativi diversi
La variabilità
Occorre un criterio per quantificare la variabilità delle misure rispetto a un termine di riferimento (indice di tendenza centrale)
La forma della variabilità è visibile ponendo su un piano cartesiano i valori della distribuzione
La variabilità delle misure può essere valutata in base alla loro dispersione rispetto ai valori medi e misurata dagli indici di dispersione
LA VARIABILITÀ
X
0 x1 x2... ..... x i ..... x n
L’indice di variabilità rappresenta quanto ciascun termine è
distante, in media, da X
Indici di variabilità
La più elementare misura di dispersione è l’intervallo di variazione (range): differenza tra valore più alto e più basso
Es: la statura di 5 persone adulte in cm.
150 168 170 171 172
R = 22
Intervallo di variazione
Lo scarto indica la dimensione della variabilità ma non fornisce informazioni circa la variabilità della distribuzione
Considera solo i dati estremi e non informa circa i valori intermedi
Scarsamente utile, utilizzata solo in alcuni casi (es. temperature)
Scarto medio semplice assoluto
Dati n valori xi di media aritmetica x , si chiama scarto
semplice medio assoluto la media aritmetica dei valori
assoluti degli scarti xi – x
Devianza
Per superare il problema dei valori negativi alle differenze dalla media si possono elevare al quadrato i valori
La devianza è un indice di valutazione della variabilità di una distribuzione
Da essa discendono la Varianza e la Deviazione Standard
Varianza
La devianza non contiene l’informazione sul numero di osservazioni utilizzato per il calcolo
La varianza è una devianza media che si rapporta al numero di osservazioni
Essa da informazioni circa la variabilità dei singoli valori invece che per quella complessiva
Varianza corretta
In campo biostatistico la formula viene modificata in considerazione della minore numerosità delle distribuzioni che penalizzerebbero l’informazione sulla variabilità
Viene introdotto il concetto di gradi di libertà nel denominatore per valutare al massimo il grado di dispersione
I gradi di libertà rappresentano il numero di osservazioni indipendenti della distribuzione
( N-1) poiché sui dati disponibili è già stata calcolata la media
I gradi di libertà
Date 6 osservazioni vincolate dalla media x =25
N. misura attribuzione arbitraria
1 1 54
2 2 - 9
3 . ... 11
4 ..... 86
5 N – 1 1
6 N ?
54 – 9+11+86+1=143
La sesta misura si ricava indirettamente
Allora Σx= N x = 6 25 =150
Pertanto considerati i valori arbitrari la sesta misura sarà
X6=150 – 143=7
Deviazione standardo Scarto Quadratico Medio
E’ più conveniente esprimere la variabilità nello stesso ordine di grandezza dei dati e della loro media
La varianza è espressa con un ordine di grandezza al quadrato rispetto ai dati originali
Per esprimere la variabilità nello stesso ordine di grandezza si applica alla varianza la trasformazione inversa al quadrato: la radice quadrata
Esempi di variabilità di distribuzioni
Modalità 1 2 3
Frequenze 3 5 3 si ha x =
s =
Modalità 0 2 4
frequenze 3 5 3 si ha x =2
s =
Calcolo e interpretazione di s2
5 reparti di un ospedale secondo il numero di posti letto
12 60 42 54 32
X = (12 + 60 + 42 + 54 + 32) / 5 = 200 / 5 = 40
Se tutti i reparti avessero lo stesso numero di posti letto, avrebbero 40
posti letto ciascuno
Dev.=(12 – 40)2 + (60 -40)2 + (42 – 40)2 + (54 - 40)2 + (32 – 40)2 =1448
s2 = 1448 / 5 = 289,6 s = 289,6 = 17
Ciascun reparto ha un numero di posti letto che è diverso da quello
medio (40) in media di 17
Coefficiente di variazione
La variabilità del peso degli adulti è inferiore
Es: una popolazione di adulti ha un peso medio di 75 Kg.
una di neonati con peso medio 3.2Kg.
s adulti = 4 Kg s neonati = 0.6
Si può affermare che la variabilità per gli adulti è maggiore rispetto a quella dei neonati?
Si possono confrontare i rapporti con le medie
Coefficiente di variazione
Gli indici di variabilità sono espressi nella stessa unità di misura delle osservazioni
Non consento confronti fra la variabilità di due distribuzioni espresse in unità di misura diverse
Non consentono il confronto di distribuzioni che hanno medie diverse: sono influenzate dall’intensità del carattere
Il coefficiente di variazione può essere definito come il rapporto tra la deviazione standard e la media
Coefficiente di variazione
La statura è il carattere
che presenta una minore
variabilità ES : Si considerino i dati relativi a un gruppo di studenti a cui siano stati rilevati la statura e il peso. Conoscendo media e scarto quadratico medio si vuole stabilire quale fra i caratteri in studio ha minore variabilità
Carattere media deviazione standard
statura 168,59 6,49
peso 64,48 7,27
C.V.(statura)
C.V(peso)
Comments