Ein Beispiel

Wir haben im Skript ein kleines Beispiel mit der Lernzeit als (kausale) Determinante der Punktezahl bei einem Test diskutiert. Die Nichtberücksichtigung einer relevanten Variable (Fähigkeiten) führte zu einer negativen Korrelation zwischen der Lernzeit und der erreichten Punktezahl. Falls eine geeignete Instrumentvariable zur Verfügung steht, die mit der Lernzeit korreliert ist (also relevant ist), aber ausschließlich über die Lernzeit auf die Punktezahl wirkt (d.h. nicht mit den Störtermen korreliert ist, also exogen ist), kann der kausale Effekt konsistent geschätzt werden.

Die kausale Interpretation ist nur zulässig, wenn die Instrumentvariable tatsächlich diese Eigenschaften (Relevanz und Exogenität) aufweist! Insbesondere die zweite Annahme kann aber kaum empirisch überprüft werden!

Im Beispiel haben wir argumentiert, dass das Wetter eine mögliche IV sein könnte. Wir können die Koeffizienten 2-stufig schätzen. Dies gibt uns zwar die korrekten Koeffizienten, aber falsche Standardfehler und ein falsches \(R^2\), wie das folgende Beispiel zeigt!

Deshalb sollte für IV-Schätzungen immer auf die geeigneten Funktionen der Programme zurückgegriffen werden! Für R stellt das AER package von A. Zeileis eine solche Funktion zur Verfügung, nämlich ivreg().

rm(list = ls())
dat <- read.csv("https://www.hsto.info/econometrics/data/iv_bsp_pkt_lz.csv", 
                header = TRUE)
## OLS
eq_ols <- lm(Pkt ~ LZ, data = dat)

## 2 stufige Schätzung:
# 1. Stufe: 
eq_2sls_1 <- lm(LZ ~ W, data = dat)
# 2. Stufe: 
LZ_dach <- fitted(eq_2sls_1)
eq_2sls_2 <- lm(Pkt ~ LZ_dach, data = dat)

## Residuen der zweiten Stufe beziehen sich auf LZ_dach statt LZ!
## korrekte IV Residuen:
resid_iv <- dat$Pkt - coef(eq_2sls_2)[1] - coef(eq_2sls_2)[2]*dat$LZ

## IV Schätzung 
library(AER)

eq_iv <- ivreg(Pkt ~ LZ | W, data = dat)

library(stargazer)
stargazer(eq_ols, eq_2sls_2, eq_iv, type = "html", intercept.bottom = FALSE)
Dependent variable:
Pkt
OLS instrumental
variable
(1) (2) (3)
Constant 157.404*** 93.407*** 93.407***
(6.004) (9.314) (19.917)
LZ -1.701** 7.351**
(0.807) (2.777)
LZ_dach 7.351***
(1.299)
Observations 60 60 60
R2 0.071 0.356 -1.946
Adjusted R2 0.055 0.345 -1.996
Residual Std. Error (df = 58) 14.541 12.110 25.895
F Statistic (df = 1; 58) 4.446** 32.037***
Note: p<0.1; p<0.05; p<0.01

Wie schon erwähnt liefert das 2-stufige Vorgehen zwar die korrekten Koeffizienten, aber falsche Standardfehler und ein falsches Bestimmtheitsmaß!

Der Grund dafür ist, dass die Residuen der zweiten Stufe für die gefittete \(\widehat{\text{LZ}}\) berechnet werden anstatt fürdie tatsächliche \(\text{LZ}\)! Außerdem wird in der zweiten Stufe nicht berücksichtigt, dass durch die Schätzung der ersten Stufe Freiheitsgrade verloren gingen!

Das \(R^2\) einer IV Schätzung darf nicht als Anteil der durch die Regressoren erklärte Streuung interpretiert werden! Wie dieses Beispiel zeigt kann das \(R^2\) einer IV Schätzung sogar negativ werden.

Also immer die entsprechenden IV-Befehle verwenden!

In multiplen Regressionen müssen in der Instrumentenliste des ivreg() Befehls sowohl alle exogenen Regressoren und die Instrumentvariablen angegeben werden, wenn z.B. nur \(x_2\) potentiell endogen ist und zwei Instrumente \(z_1,~ z_2\) zur Verfügung stehen

eq_iv <- ivreg(y ~ x_2 + x3 + x_4 | x_3 + x_4 + z_1 + z_2)

Damit eine IV Lösung existiert muss für jeden potentiell endogenen Regressor mindestens eine Instrumentvariable zur Verfügung stehen!

Schwache Instrumente

Wie schon mehrfach erwähnt müssen Instrumentvariablen relevant und exogen sein. Die Exogenität läßt sich empirisch kaum überprüfen, aber für die Relevanz der Instrumente ist prinzipiell überprüfbar, wenngleich die Theorie dahinter ziemlich schwierig ist (siehe Literatur zu weak instruments, insbesondere von Stock & Watson).

Eingebürgert hat sich eine einfache Faustregel von Stock & Watson: die F-Statistik der “excluded instruments” sollte mindestens den Wert 10 haben!

Im obigen Beispiel mit der endogenen Variable \(x_2\) wäre die 1. Stufe:
eq_1 <- lm(x_2 ~ x_3 + x_4 + z_1 + z_2)

Um die F-Statistik der “excluded instruments” zu überprüfen würden wir die restringierte Gleichung
eq_restr <- lm(x_2 ~ x_3 + x_4)
schätzen und mit
anova(eq_1, eq_restr)
überprüfen, ob die F-Statistik größer als 10 ist.

Im obigen Lernzeit – Beispiel haben wir lediglich ein Instrument (W) und einen potentiell endogenen Regressor, LZ. Die Schätzung der 1. Stufe gibt

eq_1st <- lm(LZ ~ W, data = dat)
stargazer(eq_1st, type = "html", intercept.bottom = FALSE)
Dependent variable:
LZ
Constant 9.389***
(0.568)
W -0.820***
(0.178)
Observations 60
R2 0.268
Adjusted R2 0.255
Residual Std. Error 2.026 (df = 58)
F Statistic 21.183*** (df = 1; 58)
Note: p<0.1; p<0.05; p<0.01
Da wir hier nur ein Instrument und einen endogenen Regressor haben können wir direkt die ausgegebene F-Statistik verwenden, die in diesem Fall zumindest ad hoc keine Probleme mit der Relevanz erkennen läßt.

 

Aber wie gesagt, dies ist lediglich eine Faustregel, es gibt eine Reihe von genaueren Tests, die diesen zugrunde liegende Theorie ist allerdings etwas schwieriger.