El efecto de los hospitales
|
|||
---|---|---|---|
Grupo | N | Salud (0-5) | Error estándar |
Hospitalizados | 7,774 | 3.21 | 0.014 |
No hospitalizados | 90,049 | 3.93 | 0.003 |
Diferencia | 0.72 | ||
(t) | (58.9) |
Inferencia Causal
Irvin Rojas
rojasirvin.com
Centro de Investigación y Docencia Económicas División de Economía
El efecto de los hospitales
|
|||
---|---|---|---|
Grupo | N | Salud (0-5) | Error estándar |
Hospitalizados | 7,774 | 3.21 | 0.014 |
No hospitalizados | 90,049 | 3.93 | 0.003 |
Diferencia | 0.72 | ||
(t) | (58.9) |
\[y_{i}=\begin{cases} y_{1i}=1\quad\text{si }D_i=1\\ y_{0i}=0 \quad \text{si } D_i=0 \end{cases}\]
\[y_i=y_{0i}+(y_{1i}-y_{0i})D_i\]
\[ \begin{aligned} E(y_i|D_i=1)-E(y_i|D_i=0)=&E(y_{1i}|D_i=1)-E(y_{oi}|D_i=0)+\\& \underbrace{E(y_{0i}|D_i=1)-E(y_{0i}|D_i=1)}_0 \end{aligned} \]
\[ \begin{aligned} E(y_i|D_i=1)-E(y_i|D_i=0)=&\overbrace{ E(y_{1i}|D_i=1)-E(y_{0i}|D_i=1)}^{\text{Efecto promedio en los tratados}}+\\& \underbrace{E(y_{0i}|D_i=1)-E(y_{oi}|D_i=0)}_{\text{Sesgo de selección}} \end{aligned} \]
\[ \begin{aligned} E(y_i|D_i=1)-E(y_i|D_i=0)=&E(y_{1i}|D_i=1)-E(y_{0i}|D_i=0) \end{aligned} \]
\[ \begin{aligned} E(y_i|D_i=1)-E(y_i|D_i=0)&=E(y_{1i}|D_i=1)-E(y_{0i}|D_i=1) \\ & =E(y_{1i}-y_{0i}|D_i=1) \\ & =\underbrace{E(y_{1i}-y_{0i})}_{\text{Efecto causal}} \end{aligned} \]
Balance de observables
|
||||
---|---|---|---|---|
Variable | \(T_1\) | \(C\)` | \(T_2\) | \(p\) |
Lunch gratis | 0.47 | 0.48 | 0.5 | 0.09 |
Blanco / asiático | 0.68 | 0.67 | 0.66 | 0.26 |
Edad (1985) | 5.44 | 5.43 | 5.42 | 0.32 |
Atrición | 0.49 | 0.52 | 0.53 | 0.02 |
Tamaño de clase | 15.1 | 22.4 | 22.8 | 0 |
Calificación | 54.7 | 48.9 | 50 | 0 |
Nota: Tomada de Angrist y Pischke (2009), Tabla 2.2.1. |
A veces es posible hacer experimentos, a veces es muy difícil y a veces es imposible
Usando métodos no experimentales, Angrist y Lavy (1999) encuentran resultados parecidos (pero con otros métodos)
Con fines de simplificación, asumamos un efecto de tratamiento constante: \(y_{1i}-y_{0i}=\rho\)
Consideremos el valor observado para un individuo \[y_i=y_{0i}+(y_{1i}-y_{0i})D_i\]
Sumemos y restemos \(E(y_{0i})\):
\[ \begin{aligned} y_i&=E(y_{0i})+(y_{1i}-y_{0i})D_i+y_{0i}-E(y_{0i}) \\ &=\underbrace{\alpha}_{E(y_{0i})}+\underbrace{\rho}_{(y_{1i}-y_{0i})} D_i + \underbrace{\nu_i}_{y_{0i}-E(y_{0i})} \end{aligned} \]
\[ \begin{aligned} &E(y|D_i=1)=\alpha+\rho+E(\nu_i|D_i=1) \\ &E(y|D_i=0)=\alpha+E(\nu_i|D_i=0) \end{aligned} \]
\[ \begin{aligned} E(y|D_i=1)-E(y|D_i=0)&=\rho+\overbrace{E(\nu_i|D_i=1)-E(\nu_i|D_i=0)}^{\text{Sesgo de selección}} \\ &=\rho+E(y_{0i}|D_i=1)-E(y_{0i}|D_i=0) \end{aligned} \]
Es decir, el sesgo de selección es igual a la correlación entre el término de error y \(D_i\)
Y, de acuerdo a la segunda línea, también es igual a la diferencia en el resultado potencial (de no tratamiento), entre aquellos que son tratados y los que no son tratados
En nuestro ejemplo del hospital, es muy probable que el sesgo de selección sea negativo porque los tratados son quienes tienen peor salud (en el estado no tratado)
Como vimos antes, con asignación aleatoria, el sesgo de selección desaparece, por lo que una regresión de \(y_i\) en \(D_i\) estima el efecto causal \(\rho\)
Usaremos muy frecuentemente la regresión para la estimación de efectos causales
La interpretación causal de los estimadores no surge de la herramienta, sino del diseño
Debemos tener en mente siempre si los estimadores están o no libres del sesgo de selección
Antes vimos que en el experimento STAR las medias de las calificaciones entre grupos eran distintas
La regresión nos servirá para hacer esencialmente lo mismo: comparación de \(y_i\) entre grupos
La Tabla 2.2.2 en MHE muestra los efectos de tratamiento estimados con regresión:
\[calificacion_i=\alpha+\beta_1 T_{1i} + \beta_2 T_{2i} + B'X_i + u_i\]
Efectos experimentales del tamaño del grupo en las calificaciones
|
||||
---|---|---|---|---|
Variable explicativa | (1) | (2) | (3) | (4) |
\(T_1\): Clase pequeña | 4.82 | 5.37 | 5.36 | 5.37 |
(2.19) | (1.26) | (1.21) | (1.19) | |
\(T_2\): Clase pequeña y asistente | 0.12 | 0.29 | 0.53 | 0.31 |
(2.23) | (1.13) | (1.09) | (1.07) | |
Efectos fijos de escuela | No | Sí | Sí | Sí |
Controles | No | No | \(X_1\) | \( X_1 + X_2 \) |
Nota: Tabla 2.2.2 en Angrist y Pischke (2009) |
\[y_i=\alpha+\beta T_i + u_i\]
Es muy común, sin embargo, usar controles
Si una serie de características \(X\) no está correlacionada con \(T_i\), se puede incluir en una versión larga de la regresión antes descrita:
\[y_i=\alpha+\beta T_i + X_i'\gamma + u_i\]
El valor numérico de \(\hat{\beta}\) en la regresión larga será muy cercano al obtenido con la regresión corta, pero se incrementa la precisión de los parámetros estimados
Dado que emplearemos regresión ampliamente en este curso, es necesario fijar algunas ideas sobre cómo entendemos y cómo usamos la regresión en la práctica
Material de clase en versión preliminar.
No reproducir, no distribuir, no citar.