Økonometri 1 Specifikation, og dataproblemer
10. april 2003
Økonometri 1 Specifikation, og dataproblemer
10. april 2003
Dagens program
Emnet for denne forelæsning er specifikation (Wooldridge kap. 9.2-9.4)
Proxy variable
Målefejl
Manglende observationer
Dataudvælgelse
Ekstreme observationer
Proxy variable
Proxy variable kan bruges, når den variabel, som man egentlig er interesseret i, er uobserverbar
Proxy variablen er så en erstatning for den ”sande” variabel
Ideen med at inkludere variablen er at fjerne/minimere problemet med udeladte variable bias
Eksempel: Indkomst - helbred
Proxy variable
Eksempel: Lønrelation (på US data)
Se tabel 9.2
I alle lønestimationer er der problemer med, at ”evner” ikke medtaget – altså udeladte variable
Dette vil sandsynligvis give ikke middelrette/konsistente estimater (specielt problem med uddannelse)
IQ bruges som en proxy for evner
Resultaterne viser, at estimatet på uddannelse falder, når proxyen medtages
Er det som forventet?
Proxy variable
Opgave
Antag at den sande model er
Hvordan skal modellen estimeres?
Proxy
Laggede variable som proxy
I nogle tilfælde kan man kontrollere for udeladte variable ved at korrigere laggede variable af den afhængige variabel
Den laggede afhængige variabel kan opfattes som en proxy for udeladte variable
Målefejl
Der er ofte målefejl i økonomiske data
Grunde til at målefejl opstår
Spørgeskemaundersøgelser – retrospektiv information
Den præcise information findes ikke
Data indsamlet ved spørgeskema 1 og 2
Husleje
Indkomst
Målefejl i den afhængige variabel
Antag følgende model
Denne model opfylder MLR 1-MLR 4
Desværre observerer man ikke y*, i stedet observeres y
hvor e kan opfattes som en målefejl
Målefejl i den afhængige variabel
For at kunne estimere modellen skal y* erstattes med y:
Fejlleddet i den ”nye” model er u+e
Denne model kan nu estimeres
Målefejl i den afhængige variabel
Hvornår vil OLS give middelrette og konsistente estimater af ?
Under antagelserne
Middelværdien af målefejlene er 0
Målefejlene er uafhængige med de øvrige forklarende variable
Hvis disse antagelser er opfyldt, vil den ”nye” model med y opfylde MLR1-MLR 4, og derfor er OLS middelret og konsistent
Målefejl i den afhængige variabel
Er det oplagt, at de to antagelser om målefejl er opfyldt?
Hvis målefejlene ikke har middelværdi 0, men stadig er uafhængige af de øvrige forklarende variable, vil OLS give et ikke middelret estimat af
Målefejl i den afhængige variabel
Variansen i det nye fejlled
Normalt antager man, at variansen af fejlleddet er konstant. Så er antagelsen MLR 5 også opfyldt
.. Hvis ikke giver det anledning til heteroskedasticitet
Hvis målefejlene og u er uafhængige, er variansen
Variansen er større med målefejl -> større varians af parameterestimaterne
Målefejl i den afhængige variabel
Multiplikative målefejl
Målefejl som er proportionale med den afhængige variabel
Hvis den afhængige variabel transformeres med log fås
Målefejl i de forklarende variable
Antag følgende model
x* er uobserverbar, og i stedet observeres x, som er givet ved
Antagelserne om målefejl
X kan opfattes som en proxy for x*
OLS er middelret og konsistent
Målefejl i de forklarende variable
Antagelsen om, at målefejlen er ukorreleret med x, er ofte urealistisk
Klassiske målefejl
Antagelser
Disse antagelser er mere naturlige, når man opfatter
Målefejl i de forklarende variable
Egenskaber ved OLS estimatoren
OLS ikke konsistent
Bevis (se tavlegennemgang)
Data problemer
Indtil nu har vi antaget, at MLR 2 altid er opfyldt
Dvs. vi har antaget, at data stammer fra en tilfældig stikprøve
Der er mange grunde til, at denne antagelse ikke er opfyldt
Manglende observationer
Ikke tilfældige data
Manglende observationer
Er manglende observationer for en eller flere variable et problem?
Manglende observationer vil reducere antallet af observationer i analysen
Det afgørende for, om manglende observationer giver alvorlige problemer, er hvorfor observationerne mangler
Hvis observationerne mangler ”tilfældigt”, er det et mindre problem -> mere upræcise estimater
Ikke tilfældig stikprøve
Der er forskellige måder hvorpå stikprøven ikke er tilfældig (dvs. antagelse MLR 2 ikke er opfyldt):
Eksogen dataudvælgelse
Endogen dataudvælgelse
Stratificeret dataudvælgelse
Det er ikke alle typer af ikke tilfældig dataudvælgelse, som giver anledning til ikke middelrette og ikke konsistente OLS estimater
Ikke tilfældig stikprøve
Eksogen dataudvælgelse
Dataudvælgelse baseret på en af de forklarende variable
Denne type af dataudvælgelse vil under forudsætninger af nok variation i de forklarende variable stadig give middelrette og konsistente OLS etimater
Dataudvælgelse baseret på variable, som er uafhængige af fejlleddet, giver stadig, at OLS estimaterne er middelrette og konsistente
Comments