Mortalidad y matrimonio en Inglaterra 1866–1911
Table of Contents
Los datos
Los datos de este ejercicio corresponden a la mortalidad anual y la proporción de matrimonios eclesiásticos en Inglaterra entre 1866 y 1911
Fuente: Ejercicio proporcionado por el Prof. Miguel Jerez
Std_mortality
- Mortalidad anual por cada 1000 personas. Serie estandarizada.
Proportion_marriages
- Proporción de matrimonios eclesiásticos anuales por cada 1000 personas.
d_Std_mortality
- Primera diferencia de
Std_mortality
. d_Proportion_marriages
- Primera diferencia de
Proportion_marriages
.
open mortality-marriages.gdt
- Ficheros https://github.com/mbujosab/EconometriaAplicada-SRC/tree/main/Ejercicios
- Versión en pdf
- Datos: mortality-marriages.gdt
- Guión de gretl: mortality-marriages.inp
Datos en nivel de la serie de mortalidad
Gráfico de la serie temporal y su correlograma
gnuplot Std_mortality --time-series --with-lines --output="mortality.png" corrgm Std_mortality 9 --plot="mortalityACF-PACF.png"
Estimación de un modelo univariante para la serie de mortalidad
arima 1 0 2 ; Std_mortality
Evaluaciones de la función: 289 Evaluaciones del gradiente: 80 Modelo 2: ARMA, usando las observaciones 1866-1911 (T = 46) Estimado usando AS 197 (MV exacta) Variable dependiente: Std_mortality Desviaciones típicas basadas en el Hessiano coeficiente Desv. típica z valor p ---------------------------------------------------------- const 18,0782 3,69647 4,891 1,00e-06 *** phi_1 0,996455 0,00501938 198,5 0,0000 *** theta_1 0,401166 0,171108 2,345 0,0191 ** theta_2 0,345176 0,108887 3,170 0,0015 *** Media de la vble. dep. 18,32174 D.T. de la vble. dep. 2,135615 Media de innovaciones -0,094657 D.T. innovaciones 0,185241 R-cuadrado 0,994379 R-cuadrado corregido 0,994117 Log-verosimilitud 9,085184 Criterio de Akaike -8,170368 Criterio de Schwarz 0,972839 Crit. de Hannan-Quinn -4,745268 Real Imaginaria Módulo Frecuencia ----------------------------------------------------------- AR Raíz 1 1,0036 0,0000 1,0036 0,0000 MA Raíz 1 -0,5811 -1,5998 1,7021 -0,3055 Raíz 2 -0,5811 1,5998 1,7021 0,3055 -----------------------------------------------------------
Contraste de cointegración
coint 9 Std_mortality Proportion_marriages --test-down
Etapa 1: contrastando la existencia de una raíz unitaria en Std_mortality Contraste aumentado de Dickey-Fuller para Std_mortality contrastar hacia abajo desde 9 retardos, con el criterio AIC tamaño muestral 45 la hipótesis nula de raíz unitaria es: [a = 1] contraste con constante incluyendo 0 retardos de (1-L)Std_mortality modelo: (1-L)y = b0 + (a-1)*y(-1) + e valor estimado de (a - 1): 0,00678121 estadístico de contraste: tau_c(1) = 0,615887 valor p asintótico 0,9902 Coef. de autocorrelación de primer orden de e: 0,085 Etapa 2: contrastando la existencia de una raíz unitaria en Proportion_marriages Contraste aumentado de Dickey-Fuller para Proportion_marriages contrastar hacia abajo desde 9 retardos, con el criterio AIC tamaño muestral 39 la hipótesis nula de raíz unitaria es: [a = 1] contraste con constante incluyendo 6 retardos de (1-L)Proportion_marriages modelo: (1-L)y = b0 + (a-1)*y(-1) + ... + e valor estimado de (a - 1): 0,0831149 estadístico de contraste: tau_c(1) = 1,04236 valor p asintótico 0,9971 Coef. de autocorrelación de primer orden de e: -0,068 diferencias retardadas: F(6, 31) = 3,197 [0,0147] Etapa 3: regresión cointegrante Regresión cointegrante - MCO, usando las observaciones 1866-1911 (T = 46) Variable dependiente: Std_mortality coeficiente Desv. típica Estadístico t valor p ---------------------------------------------------------------------- const -10,8466 1,42447 -7,614 1,45e-09 *** Proportion_marri~ 0,418536 0,0203914 20,53 3,67e-24 *** Media de la vble. dep. 18,32174 D.T. de la vble. dep. 2,135615 Suma de cuad. residuos 19,40865 D.T. de la regresión 0,664158 R-cuadrado 0,905434 R-cuadrado corregido 0,903284 Log-verosimilitud -45,42395 Criterio de Akaike 94,84790 Criterio de Schwarz 98,50518 Crit. de Hannan-Quinn 96,21794 rho 0,228283 Durbin-Watson 1,535570 Etapa 4: contrastando la existencia de una raíz unitaria en uhat Contraste aumentado de Dickey-Fuller para uhat contrastar hacia abajo desde 9 retardos, con el criterio AIC tamaño muestral 45 la hipótesis nula de raíz unitaria es: [a = 1] contraste sin constante incluyendo 0 retardos de (1-L)uhat modelo: (1-L)y = (a-1)*y(-1) + e valor estimado de (a - 1): -0,771717 estadístico de contraste: tau_c(2) = -5,22784 valor p asintótico 5,236e-05 Coef. de autocorrelación de primer orden de e: 0,023 Hay evidencia de una relación cointegrante si: (a) La hipótesis de existencia de raíz unitaria no se rechaza para las variables individuales y (b) La hipótesis de existencia de raíz unitaria se rechaza para los residuos (uhat) de la regresión cointegrante.
Regresión de la mortalidad sobre la proporción de matrimonios eclesiásticos
ols Std_mortality 0 Proportion_marriages modtest --normality --quiet modtest --white --quiet modtest --autocorr 5 --quiet
Modelo 6: MCO, usando las observaciones 1866-1911 (T = 46) Variable dependiente: Std_mortality coeficiente Desv. típica Estadístico t valor p ---------------------------------------------------------------------- const -10,8466 1,42447 -7,614 1,45e-09 *** Proportion_marri~ 0,418536 0,0203914 20,53 3,67e-24 *** Media de la vble. dep. 18,32174 D.T. de la vble. dep. 2,135615 Suma de cuad. residuos 19,40865 D.T. de la regresión 0,664158 R-cuadrado 0,905434 R-cuadrado corregido 0,903284 F(1, 44) 421,2815 Valor p (de F) 3,67e-24 Log-verosimilitud -45,42395 Criterio de Akaike 94,84790 Criterio de Schwarz 98,50518 Crit. de Hannan-Quinn 96,21794 rho 0,228283 Durbin-Watson 1,535570 Contraste de la hipótesis nula de distribución Normal: Chi-cuadrado(2) = 0,260 con valor p 0,87796 Contraste de heterocedasticidad de White Estadístico de contraste: TR^2 = 1,729996, con valor p = P(Chi-cuadrado(2) > 1,729996) = 0,421052 Contraste de Breusch-Godfrey para autocorrelación hasta el orden 5 Estadístico de contraste: LMF = 1,947454, con valor p = P(F(5,39) > 1,94745) = 0,108 Estadístico alternativo: TR^2 = 9,190388, con valor p = P(Chi-cuadrado(5) > 9,19039) = 0,102 Ljung-Box Q' = 9,05845, con valor p = P(Chi-cuadrado(5) > 9,05845) = 0,107
Regresión en primeras diferencias
diff Std_mortality Proportion_marriages ols d_Std_mortality 0 d_Proportion_marriages modtest --normality --quiet modtest --white --quiet modtest --autocorr 5 --quiet
Modelo 8: MCO, usando las observaciones 1867-1911 (T = 45) Variable dependiente: d_Std_mortality coeficiente Desv. típica Estadístico t valor p ---------------------------------------------------------------------- const -0,172792 0,0230316 -7,502 2,43e-09 *** d_Proportion_mar~ 0,00142536 0,0117781 0,1210 0,9042 Media de la vble. dep. -0,173333 D.T. de la vble. dep. 0,149848 Suma de cuad. residuos 0,987664 D.T. de la regresión 0,151555 R-cuadrado 0,000340 R-cuadrado corregido -0,022907 F(1, 43) 0,014645 Valor p (de F) 0,904241 Log-verosimilitud 22,07697 Criterio de Akaike -40,15393 Criterio de Schwarz -36,54061 Crit. de Hannan-Quinn -38,80692 rho 0,089193 Durbin-Watson 1,806988 Contraste de la hipótesis nula de distribución Normal: Chi-cuadrado(2) = 14,808 con valor p 0,00061 Contraste de heterocedasticidad de White Estadístico de contraste: TR^2 = 2,149006, con valor p = P(Chi-cuadrado(2) > 2,149006) = 0,341467 Contraste de Breusch-Godfrey para autocorrelación hasta el orden 5 Estadístico de contraste: LMF = 0,589588, con valor p = P(F(5,38) > 0,589588) = 0,708 Estadístico alternativo: TR^2 = 3,239657, con valor p = P(Chi-cuadrado(5) > 3,23966) = 0,663 Ljung-Box Q' = 4,0454, con valor p = P(Chi-cuadrado(5) > 4,0454) = 0,543
Preguntas
Pregunta 1
Discuta de todas las formas posibles si la serie temporal de
mortalidad (Std_mortality
) es estacionaria en media (i.e., la
realización de un proceso estocástico estacionario), usando para ello
los resultados de los apartados Datos en nivel de la serie de mortalidad y Contraste de cointegración.
Pregunta 2
Discuta si las series de mortalidad y proporción de matrimonios eclesiásticos están cointegradas, a partir de los resultados del apartado Contraste de cointegración.
Pregunta 3
Sin embargo, ¿qué sugieren los resultados de las secciones Regresión de la mortalidad sobre la proporción de matrimonios eclesiásticos y
Regresión en primeras diferencias respecto a la relación entre
Std_mortality
y Proportion_marriages
?
Pregunta 4
Los listados en Regresión de la mortalidad sobre la proporción de matrimonios eclesiásticos y Regresión en primeras diferencias muestran los principales resultados obtenidos al estimar por MCO dos modelos de regresión que relacionan las dos variables consideradas en este ejercicio. Resuma y comente los resultados de estimación y diagnosis que le parezcan más relevantes. Si detecta alguna desviación del cumplimiento de las hipótesis habituales, discuta sus consecuencias sobre las propiedades del estimador MCO y sugiera una forma de tratarla.
Pregunta 5
Interprete la pendiente de la regresión cointegrante estimada en la Etapa 3 del Contraste de cointegración.
Pregunta 6
Indique cuáles de las siguientes expresiones representan el modelo de la sección Estimación de un modelo univariante para la serie de mortalidad, con un redondeo a tres decimales
- \(\left( 1 - 0.997 \, \mathsf{B} \right) \, \left(X_t - 18.078 \right) = \left( 1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 \right) \hat U_t\)
- \(\left( 1 - 0.997 \, \mathsf{B} \right) \, \left(X_t - 18.078 \right) = \left( 1 - 0.401 \, \mathsf{B} - 0.345 \, \mathsf{B}^2 \right) \hat U_t\)
- \(\left( 1 + 0.997 \, \mathsf{B} \right) \, \left(X_t - 18.078 \right) = \left( 1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 \right) \hat U_t\)
- \(\,{X_t} = 18.078 + \frac{ 1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 }{ 1 - 0.997 \, \mathsf{B} } \hat U_t\)
- \(\,{X_t} = -18.078 + \frac{ 1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 }{ 1 - 0.997 \, \mathsf{B} } \hat U_t\)
- \(\,{X_t} = 18.078 + \frac{ 1 - 0.401 \, \mathsf{B} - 0.345 \, \mathsf{B}^2 }{ 1 - 0.997 \, \mathsf{B} } \hat U_t\)
- \(\,{X_t} = 18.078 + \frac{ 1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 }{ 1 + 0.997 \, \mathsf{B} } \hat U_t\)
- \(\frac{ 1 - 0.997 \, \mathsf{B} }{1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 } \, \left(X_t - 18.078 \right)= \hat U_t\)
- \(\frac{ 1 - 0.997 \, \mathsf{B} }{1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 } \, X_t = 18.078 + \hat U_t\)
- \(\frac{ 1 - 0.997 \, \mathsf{B} }{1 - 0.401 \, \mathsf{B} - 0.345 \, \mathsf{B}^2 } \, \left(X_t - 18.078 \right)= \hat U_t\)
Pregunta 7
A la luz de la Estimación de un modelo univariante para la serie de mortalidad, si tuviera que clasificar el proceso estocástico subyacente del que la serie temporal es una realización ¿diría que es invertible? ¿O que no lo es? ¿diría que es estacionario? ¿O que no lo es? Explique su respuesta.
Pregunta 8
¿Cuáles de los modelos de más arriba considera aceptables? ¿O qué mejoras sugeriría para ellos?
Respuestas
Respuesta 1
La serie temporal Std_mortality
NO es estacionaria en media, como se
aprecia en las secciones:
- Gráfico de la serie temporal y su correlograma.
- El gráfico de la serie muestra una tendencia decreciente.
- La FAC muestra mucha persistencia, los coeficientes decrecen a un ritmo aproximadamente lineal; y el primer coeficiente de la PACF está próximo a uno.
- Estimación de un modelo univariante para la serie de mortalidad: El modelo univariante estimado tiene una raíz AR aproximadamente igual a \(1\).
- Contraste de cointegración: El test ADF calculado en la Etapa 1 no
rechaza la hipótesis (raíz unitaria) con un p-valor de
0.9902
Respuesta 2
Las conclusiones de las distintas etapas del test de cointegración son los siguientes:
- Etapa 1
- El test ADF no rechaza que la serie de mortalidad sea
I(1).
(valor p asintótico 0,9902)
- Etapa 2
- El test ADF no rechaza que la serie de proporción de
matrimonios eclesiásticos sea I(1).
(valor p asintótico 0,9971)
- Etapa 3
- La regresión (cointegrante) de mortalidad sobre la
proporción de matrimonios eclesiásticos es significativa (parámetros
significativos y elevado \(R^2\)
(0,905434)
. - Etapa 4
- El test ADF rechaza contundentemente que los residuos de
la regresión cointegrante sean I(1).
(valor p asintótico 5,236e-05)
Consecuentemente, el test indica que ambas series están cointegradas (pero, como sugiere tanto el sentido común como la Regresión en primeras diferencias la relación es espuria, véase la pregunta 3).
Respuesta 3
Aunque el modelo de Regresión de la mortalidad sobre la proporción de matrimonios eclesiásticos muestra un buen ajuste (un elevado \(R^2\)) y los parámetros estimados son muy significativos, la relación entre ambas variables se desvanece al diferenciar los datos para lograr la estacionariedad. Ello sugiere, al igual que el sentido común, que la relación es espuria.
Respuesta 4
- Modelo de regresión MCO para datos en nivel
- (Regresión de la mortalidad sobre la proporción de matrimonios eclesiásticos): Todos los coeficientes son muy significativos. El ajuste del modelo, medido por el valor del \(R^2\) es muy elevado. Los contrastes sobre los residuos no rechazan (ni al 1%, ni al 5% ni al 10% de significación) las hipótesis nulas de normalidad, homoscedasticidad y ausencia de autocorrelación. Es decir, de la salida de Gretl no se puede inferir que haya ningún problema con este modelo.
- Modelo para datos en primeras diferencias
(Regresión en primeras diferencias): El único coeficiente significativo es el término constante. El ajuste del modelo, medido por el valor del \(R^2\), es prácticamente nulo. Los contrastes residuales rechazan la hipótesis nula de normalidad, aunque no rechazan las de homoscedasticidad y ausencia de autocorrelación.
Si las perturbaciones no tienen distribución normal las estimaciones no serán eficientes en el sentido máximo-verosímil (aunque sí en el de Gauss-Markov) y la distribución de los estadísticos habituales será distinta de la teórica bajo el supuesto de normalidad de las perturbaciones (por ejemplo, los estadísticos de la \(t\) no tendrán exactamente una distribución t de student).
No obstante, dado que la relación entre variables es espuria, ninguno de estos modelos de regresión es válido como explicación de la tasa de mortalidad.
Respuesta 5
La pendiente de la regresión estimada en la Etapa 3 (que es la misma que la de la sección de la regresión en niveles) indica que un aumento de un uno por mil en la proporción de matrimonios eclesiásticos da lugar a un aumento de un 0.419 por mil en la mortalidad esperada (pero, dado que la relación es espuria, interpretar este resultado carece de sentido).
Respuesta 6
Recuerde que signo de los parámetros MA en las salidas de Gretl tienen
el signo cambiado respecto a convenio habitual en los manuales de
series temporales, es decir, para los polinomios AR
\((1-\phi_1\mathsf{B}-\cdots-\phi_p\mathsf{B}^p)\), tenemos que phi_j
es "\(\phi_j\)" (es decir, al escribir el modelo el signo del parámetro
phi_j
aparece con un menos delante); pero para los MA
\((1-\theta_1\mathsf{B}-\cdots-\theta_p\mathsf{B}^p)\), tenemos que
theta_j
es "\(-\theta_j\)" (es decir, al escribir no cambiamos el
signo de parámetro theta_j
pues ya lleva el "\(-\)" incorporado).
Además, const
es la estimación del valor esperado \(\mu\) del proceso
\(\boldsymbol{X}\), es decir, que \((X_t-\mu\mid t\in\mathbb{Z})\) es un
proceso ARMA de media cero.
Por tanto, las expresiones correctas son:
- Expresión 1
- modelo ARMA(\(1,2\)): \(\;\boldsymbol{\phi}(\mathsf{B})({X_t}-\mu)=\boldsymbol{\theta}(\mathsf{B}){U_t}\)
- Expresión 4
- su representación MA(\(\infty\)): \(\;({X_t}-\mu)=\frac{\boldsymbol{\theta}}{\boldsymbol{\phi}}(\mathsf{B}){U_t}\;\rightarrow\;{X_t}=\mu+\frac{\boldsymbol{\theta}}{\boldsymbol{\phi}}(\mathsf{B}){U_t}\)
- Expresión 8
- su representación AR(\(\infty\)): \(\;\frac{\boldsymbol{\phi}}{\boldsymbol{\theta}}(\mathsf{B})({X_t}-\mu)={U_t}\)
¡Ojo, la cuarta expresión solo es posible porque \(\phi_1\) no es exactamente 1! Si fuera 1, el polinomio autorregresivo \(1-\mathsf{B}\) no tendría una inversa sumable y, por tanto, ni el proceso sería estacionario, ni habría una representación del proceso como media móvil infinita como la Expresión 4.
Respuesta 7
La raíz AR estimada está muy próxima a 1, por lo que cabe pensar que la serie proviene de un proceso estocástico NO estacionario. Sin embargo, las raíces del polinomio MA tienen un módulo claramente mayor que uno, por lo que el modelo tiene claramente una representación AR(\(\infty\)), es decir, es invertible.
Respuesta 8
¿Cuáles de los modelos de más arriba considera aceptables? ¿O qué mejoras sugeriría para ellos?
- En cuanto al modelo univariante
- Probablemente debería incorporar una diferencia ordinaria, en lugar de un término AR(1).
- En cuanto a los modelos de regresión
En el modelo de las serie en diferencias hay, probablemente, un problema de autocorrelación dado el elevado valor del estadístico Durbin-Watson (es próximo a 2), por lo que quizá debería ser estimado por mínimos cuadrados generalizados asumiendo un modelo autorregresivo AR(1) para el error.
No obstante, el modelo en diferencias (y el sentido común) sugiere que la relación entre ambas variables es espuria. Consecuentemente, ninguna de las dos regresiones (en niveles o en diferencias) arrojará un modelo aceptable ni siquiera con las mejoras sugeridas.