Questionario eAnalisi UnivariataMetodi Quantitativi per Economia, Finanza e ManagementEsercitazione n°2
Questionario eAnalisi Univariata
Metodi Quantitativi per Economia, Finanza e ManagementEsercitazione n°2
Questionario
Per redigere un questionario è necessario tener presenti i seguenti punti: ogni questionario somministrato deve avere un codice identificativo univoco
solo domande chiuse (cioè con un insieme di modalità definite)
sono ammesse le domande a risposta multipla
raccogliere informazioni di carattere quantitativo (necessario per costruire modelli statistici consistenti)
tipologia dei dati
strutturali (che descrivono l’intervistato, ad esempio l’età)
di indagine
Dal questionario al Data Set
Costruire la variabile n_questionario che associa un codice univoco ad ogni intervistato.
Identificare ogni variabile con un nome facilmente riconducibile alla domanda corrispondente (ad esempio la domanda n°1 corrisponde alla variabile D_1).
Nel caso di domande a risposte multiple andranno create un numero di variabili dicotomiche (0/1) pari al numero di modalità definite nella risposta.
Data Entry: controllo correttezza dei dati inseriti e analisi delle distribuzioni delle variabili (con valenza di controllo e valenza interpretativa).
Domande a risposte multiple
17. Per quale motivo utilizza il telefono cellulare? (possibile fornire massimo 3 risposte)
1) Lavoro
2) Studio
3) Comunicare con famigliari
4) Comunicare con il partner
5) Piacere/tempo libero
6) Altro D_17_1 D_17_2 D_17_3 D_17_4 D_17_5 D_17_6 … … … … … … … … 0 0 1 1 0 1 …. 45 D_17_6 D_17_5 D_17_4 D_17_3 D_17_2 D_17_1 … n_questionario
Esempio di questionario
Obiettivo di analisi: studiare il comportamento di consumo del campione rilevato (dai 14 ai 32 anni) in relazione all’utilizzo del servizio “tariffa telefonica”.
I dati raccolti sono relativi ad un indagine di mercato realizzata nei mesi Aprile-Maggio 2007
I questionari sono stati somministrati in forma cartacea presso alcune scuole superiori/università o per via telematica (e-mail)
Le interviste raccolte e analizzate sono in totale 243
Analisi Univariata
PROC FREQ - Descrizione
La PROC FREQ permette di calcolare le distribuzioni di frequenza univariate per variabili qualitative e quantitative discrete
PROC FREQ – Sintassi generale 1/2
Distribuzione di frequenza univariata OPTIONS:
noprint non mostra i risultati nella finestra di output
/missing considera anche i missing nel calcolo delle frequenze
proc freq data= dataset option(s);
tables variabile /option(s);
run;
PROC FREQ – Sintassi generale 2/2
Distribuzione di frequenza univariata con variabile di classificazione proc freq data= dataset option(s); by variabile_1;
tables variabile_2 /option(s);
run;
Frequenza assoluta: consiste nell’associare a ciascuna categoria, o modalità, il numero di volte in cui compare nei dati Frequenza relativa: rapporto tra la frequenza assoluta ed il numero complessivo delle osservazioni effettuate Frequenze
cumulate 100.00 236 6.36 15 Wind 93.64 221 65.25 154 Vodafone 28.39 67 23.31 55 Tim 5.08 12 5.08 12 3 CumulativePercent CumulativeFrequency Percent Frequency operatore
PROC FREQ: Esempio 2
proc freq data=corso.telefonia;
table fisso_g;
run; Variabile quantitativa discreta:
numero medio giorni utilizzo alla settimana telefono fisso
proc freq data=corso.telefonia;
table motivo_utilizzo_2 / missing;
run; Variabile qualitativa:
secondo motivo utilizzo mezzi di comunicazione OPZIONE missing: considera anche i missing nel calcolo delle frequenze
proc sort data=corso.telefonia;
by sesso;
run;
proc freq data=corso.telefonia;
by sesso;
tables operatore;
run; Distribuzione di frequenza univariata con variabile di classificazione PROC SORT: ordinare le osservazioni in base alla variabile di by
La PROC UNIVARIATE permette di calcolare
distribuzioni di frequenza univariate per variabili quantitative continue
misure di sintesi di posizione, variabilità, forma per variabili quantitative continue
Distribuzione di frequenza univariata PROC UNIVARIATE – Sintassi 1/2 OPTIONS:
noprint non mostra i risultati nella finestra di output
proc univariate data= dataset option(s);
var variabile;
run;
PROC UNIVARIATE – Sintassi 2/2
Distribuzione di frequenza univariata con variabile di classificazione proc univariate data= dataset option(s);
class variabile_1 (option(s));
var variabile_2;
run; OPTIONS:
noprint non mostra i risultati nella finestra di output
(missing) considera anche la categoria “missing” (contenente tutti i valori mancanti) della variabile di classificazione
Comments