Suponga que para un experimento en un laboratorio se asignó a un grupo pacientes a un brazo de tratamiento o a uno de control. Antes de comenzar el experimento se recolectaron una serie de características \(x_{ji}\), \(j=1,\ldots 10\), de cada paciente. Se busca medir el efecto del tratamiento sobre una variable de resultados \(y_i\). En el experimento, se trabaja con \(\alpha=0.10\).
[5 puntos] El investigador A quedó a cargo de comprobar el balance de la asignación del tratamiento y le reporta lo siguiente:
Para verificar que la aleatorización fue exitosa, tomé la serie de variables pre-intervención y la dummy de asignación al tratamiento \(T_i\) para correr la siguiente regresión: \[T_i=\alpha+\sum_{j=1}^{10}x_{ji}'\beta +\varepsilon_i\]
Después realicé una prueba \(F\) de significancia conjunta sobre los coeficientes \(\beta_j\) que resultó tener un valor \(p\) de 0.043.
Explique cuál es la hipótesis nula en la prueba realizada y qué se esperaría de haberse logrado una aleatorización exitosa del tratamiento.
Si la integridad del diseño se mantuvo durante el experimento, se esperaría que las características observables no predijeran el estado de tratamiento. En otras palabras, esperaríamos que los coeficientes en su conjunto no fueran significativos. Es decir, \(H_0: \beta_1=\beta_2=\ldots=\beta_k=0\).
[5 puntos] ¿Qué concluye a partir de lo que le reporta el investigador A?
En este caso, el valor \(p\) indica una baja probabilidad de observar el estadístico \(F\), es decir, un valor de \(F\) que no es consistente con la hipótesis nula. Por tanto, se concluye que los coeficientes no son iguales que cero al mismo tiempo o que hay características que permiten predecir el estatus de tratamiento.
[5 puntos] Por otro lado, el investigador B le reporta lo siguiente:
Yo realicé un análisis para determinar el balance en la asignación del tratamiento. Para cada una de las características \(x_{ji}\) corrí la siguiente regresión: \[x_{ji}=\gamma+\pi T_i+u_i\] A continuación, le reporto una tabla con los valores p asociados al coeficiente estimado de \(\pi\) en cada una de las 10 regresiones.
\(x_{1i}\) |
0.025 |
|
\(x_{6i}\) |
0.015 |
\(x_{2i}\) |
0.012 |
|
\(x_{7i}\) |
0.033 |
\(x_{3i}\) |
0.027 |
|
\(x_{8i}\) |
0.019 |
\(x_{4i}\) |
0.076 |
|
\(x_{9i}\) |
0.028 |
\(x_{5i}\) |
0.002 |
|
\(x_{10i}\) |
0.017 |
Explique la hipótesis nula detrás de las pruebas que realizó el investigador B y qué se esperaría de haberse logrado una aleatorización exitosa del tratamiento,
Otra forma de proveer evidencia de la integridad del tratamiento es analizando el balance de las características observadas entre grupos de tratamiento. En este caso, si las medias de cada \(x_{ij}\) entre los grupos de tratados y de control son iguales, esperaríamos que el coeficiente \(\pi\) fuera no significativo, es decir \(H_0: \pi=0\). Con el nivel de significancia de \(\alpha=0.10\), rechazamos la \(H_0\) en todos los casos, por lo que se concluye que las característias no están balanceadas entre los grupos de tratamiento.
[5 puntos] ¿Cómo reconcilia la evidencia encontrada por el investigador A y el B y qué concluye sobre el balance en la asignación del tratamiento? ¿Qué características tendría una diferencia de medias de \(y_i\) después del tratamiento como estimador del impacto de este?
Ambos investigadores aportan evidencia que indica que la asignación aleatoria estuvo comprometida y que no se crearon grupos similares entre los grupos de tratamiento y control. Por lo tanto, una comparación de medias de la variable de resultados entre los grupos de tratamiento y control sería un estimador sesgado e inconsistente para el valor poblacional de dicha diferencia.