Inferencia Causal: diseño y econometría

Inferencia Causal

Irvin Rojas

rojasirvin.com

Centro de Investigación y Docencia Económicas División de Economía

Agenda

  1. Presentación mía y de ustedes
  2. Descripción general del curso
  3. El papel de la teoría, el diseño y la econometría
  4. ¿Qué utilidad tiene el curso en su formación?

Descripción general del curso

  1. Programa
  2. Tareas (entregadas en Teams sin comprimir)
  3. Laboratorios
  4. Presentaciones
  5. Proyecto final
  6. Usaré Teams para administrar tareas, exámenes y calificaciones

Inferencia Causal: diseño y econometría

Inferencia Causal

  • Este curso está enfocado en métodos para identificar relaciones causales
  • Entre ellas están las relaciones que surgen por la implementación deliberada de programas públicos
  • Pero no nos limitamos a este tipo de acciones: nos interesa comprender la teoría y la práctica para dar respuesta a relaciones que surgen
    • De la legislación nacional o subnacional
    • De fenómenos naturales
    • Del funcionamiento de los mercados y las instituciones
  • En el curso enfatizaremos lo siguiente:
    1. La importancia de las preguntas
    2. El diseño para responder dichas preguntas
    3. Las técnicas apropiadas para implementar el diseño

1. La importancia de las preguntas

Las preguntas

  • Podemos estimar relaciones causales casi de cualquier cosa
  • Pero no todas las relaciones causales son de interés
  • Y muchas cosas que son de interés son difíciles de estudiar desde el punto de vista de las relaciones causales

La importancia de la teoría

  • En este curso enfatizaremos el uso de datos para revelar la relación entre dos variables
  • Para los economistas, los datos no hablan solos
  • La teoría es necesaria para establecer la relación entre \(x\) y \(y\)
  • Tenemos la fortuna de disponer cada vez de mejores datos
  • Mejores datos nos permiten probar mejor modelos cada vez más ricos

Series de tiempo vs microeconometría

  • Teoría económica usaba modelos y deducía de ellos los efectos de cambios de política
  • O usaba series de tiempo agregadas que trataban de ser ligadas a modelos con consumidores o empresas representativas
  • Cosas que han cambiado:
    • Disponibilidad de microdatos
    • Demanda por probar empíricamente modelos más ricos
    • Capacidad de cómputo
  • De hecho, algunos macroeconomistas están volteando a ver los métodos de la microeconomía aplicada:
    • Estudios de evento
    • Controles sintéticos

Tipos de problemas de inferencia

  1. Efectos de tratamiento
  • ¿Cuál es el efecto de \(T\) sobre los participantes o no participantes de cierta política?
  • ¿Funciona un determinado programa?
  • Se requieren condiciones débiles
  • No es fácil extrapolar las conclusiones a otros contextos
  1. Estimación estructural
  • ¿Cuál es el efecto potencial de un nuevo \(T\) en una población?
  • Problema parecido a determinar la demanda de un bien recién introducido al mercado
  • Se imponen condiciones fuertes
  • Se trata de estimar una serie de parámetros que caracterizan las preferencias y tecnología de individuos, hogares y empresas

Ejemplo: impuestos

  • Consideremos el cambio en la tasa del impuesto al ingreso \(t\)
  • La oferta es función del salario \(W\), de características observadas \(X\) y de inobservables \(U\):
    \(H=\phi(W,X,U)\)
  • La pregunta de evaluación es encontrar la magnitud de
    \(\phi(W(1-t'),X,U)-\phi(W(1-t),X,U)\) para cada individuo
  • Tenemos tres posibles tipos de evaluaciones, dependiendo del tipo de impuesto y dónde se va a implementar:
    1. Un impuesto que ya ha existido antes en una población y queremos saber su efecto en la misma población, caracterizada por su distribución de \((W,X,U)\)
    2. El impuesto ha existido antes, pero queremos conocer su efecto en una población distinta, con una distribución distinta de \((W,X,U)\)
    3. El impuesto nunca ha sido implementado y queremos predecir su efecto en la población usada para estimar la oferta laboral o en otra población

Caso 1. Un impuesto ya conocido en la misma población

  • Supongamos que la población ha vivido distintos regímenes de impuestos \(t_j\), con \(j=1,\ldots, J\) y tenemos datos sobre la oferta laboral bajo estos regímenes
  • Este es un problema relativamente simple pues tenemos los datos para calcular la oferta laboral esperada para cada impuesto:
    \[E(H|W,X,t)=\int\phi(W(1-t_j),X,U)dG(U|X,W)\]
  • No necesitamos un contrafactual pues podemos esperar que lo ocurrido antes aplique para el futuro si \(\phi(\cdot)\) y \(G(\cdot)\) no cambiaron

Caso 2. Decir algo sobre una política en un nuevo contexto

  • Problema mucho más complicado
  • Debemos estimar \(\phi'(\cdot)\) y \(G'(\cdot)\) en el nuevo ambiente, o tratar de determinar la relación entre \(\phi\) y \(\phi'\) y entre \(G\) y \(G'\)

“La existencia de un problema radica en que el futuro es distinto que el pasado, mientras que la posibilidad de una solución depende de que el futuro se parezca al pasado.”

— Knight (1921)

  • Este es el tipo de problemas en donde la estimación estructural es de gran valor

Caso 3. Mucho más complicado

  • ¿Qué pasa si nunca ha existido un impuesto similar en el país de interés?
  • ¿Podemos identificar el efecto del impuesto a partir de variaciones en el salario?
  • Solo si asumimos que el efecto del impuesto actúa vía el salario

2. El diseño para responder las preguntas

Causalidad e inferencia

  • Los diseños experimentales han puesto pie firme como el gold standard para la inferencia causal
  • Los investigadores pelean por fondos de gobiernos, ONGs y think tanks para evaluar políticas realizando asignaciones experimentales de tratamientos
  • Esther Duflo, Michael Kremer y Abhijit Banerjee ganaron el Nobel de Economía en 2019 por sus contribuciones a la lucha contra la pobreza, donde los experimentos tienen un papel primordial
  • El modelo de causal de Rubin o de resultados potenciales permite conceptualizar la mayoría de los problemas de inferencia pensando en qué resultado obtendría una unidad con y sin intervención
  • Sin embargo, el problema fundamental de la inferencia causal implica que solo podemos observar a cada unidad en uno de los estados posibles

Sesgo de selección

  • En la práctica tenemos que comparar entre unidades que han recibido y que no han recibido el tratamiento
  • Esto da original al sesgo de selección, es decir, a la existencia de factores que afectan tanto la asignación del tratamiento como del resultado mismo
  • Veremos cómo la experimentación resuelve el sesgo de selección
  • Pero también estudiaremos una amplia literatura que recae en una serie de supuestos bajo los cuales la asignación del tratamiento aproxima a una asignación aleatoria
  • Esta literatura incluye métodos muy estudiados como las técnicas de matching y el uso de variables instrumentales

Nuevas avenidas

  • Nuevas avenidas en la investigación han dado lugar a nuevas estrategias de identificación
  • Diseños de regresión discontinua
    • Pliegues en regresión
    • Discontinuidades geográficas
  • Diferencia y diferencias y control sintético
  • Efectos de tratamiento con tratamiento multivariado y con intensidad de tratamiento
  • Efectos en el largo plazo
  • Papel para machine learning y big data

3. Las técnicas apropiadas para implementar el diseño

La econometría como herramienta

  • Nuestras preguntas requieren diseño
  • Y nuestros diseños requieren una implementación apropiada
  • Parte importante de nuestro curso será:
    1. Conocer la teoría que permite la identificación de efectos de tratamiento en los distintos diseños
    2. Implementar las estrategias empíricas con datos en R

Algunos temas que abordaremos en el curso incluyen

  • Regresión por MCO, variables instrumentales y modelos no lineales
  • Errores estándar robustos y agrupados
  • Rutinas bootstrap
  • Análisis con placebos
  • Pruebas de hipótesis
  • Métodos no paramétricos
  • Métodos de optimización

Habilidades de economista

Espero que al final del curso puedan

  • Identificar relaciones causales
  • Usar datos y programar sus estrategias empíricas
  • Identificar literatura relevante, huecos en ella y avenidas para investigación futura
  • Argumentar y presentar ideas de forma oral y escrita

Pendientes

¿Se vale probar?

  • ¡Sí!
  • Se vale que estén en el curso el tiempo máximo que las reglas del CIDE permiten para dar de baja cursos e inscribirse en otros
  • Les pido la cortesía de enviarme un correo si deciden dar de baja el curso
  • Como ven, nuestro plan de exposiciones dependerá del número de estudiantes que estén inscritos
  • Entre más pronto podamos conocer el número final de estudiantes, mejor para todos

Acuerdos

  • Horas de oficina (propuesta)
    • Busquemos una cita
  • Fecha de examen parcial: 6 de octubre
  • Fecha de examen final: decídanla lo más pronto posible
  • Busquen un espacio para exponer los temas que les interesen
  • Tengamos una sesión especial de R y Quarto

Próxima sesión

  • Freedman (1991) sobre la importancia del diseño
  • MHE, Capítulo 2 nos da las bases de un modelo conceptual pensar los problemas causales como si fueran experimentos
  • A lo largo del curso vamos a profundizar en los diseños experimentales, pero vamos también a ser críticos sobre ellos y a estudiar otros métodos igual de importantes y útiles
  • Nos importan más las preguntas y la teoría detrás de ellas, por eso aprenderemos distintos métodos y trataremos de usar el mejor

Material de clase en versión preliminar.

No reproducir, no distribuir, no citar.