Mortalidad y matrimonio en Inglaterra 1866–1911

Los datos

Los datos de este ejercicio corresponden a la mortalidad anual y la proporción de matrimonios eclesiásticos en Inglaterra entre 1866 y 1911

Fuente: Ejercicio proporcionado por el Prof. Miguel Jerez

Std_mortality: Mortalidad anual por cada 1000 personas. Serie estandarizada.
Proportion_marriages: Proporción de matrimonios eclesiásticos anuales por cada 1000 personas.
d_Std_mortality: Primera diferencia de Std_mortality.
d_Proportion_marriages: Primera diferencia de Proportion_marriages.

open ../../datos/mortality-marriages.gdt

Ficheros:

Versión del ejercicio en pdf; html.

Datos: mortality-marriages.gdt
Guión de gretl: Examen-mortality-marriages.inp

Gráficos de las series y correlogramas

gnuplot Std_mortality --time-series --with-lines --output="mortality.png"
corrgm Std_mortality 9 --plot="mortalityACF-PACF.png"
gnuplot Proportion_marriages --time-series --with-lines --output="marriages.png"
corrgm Proportion_marriages 9 --plot="marriagesACF-PACF.png"

Datos en nivel de la serie de mortalidad

Estimación de un modelo univariante para la serie de mortalidad

arima 1 0 2 ; Std_mortality

Function evaluations: 289
Evaluations of gradient: 80

Model 1: ARMA, using observations 1866-1911 (T = 46)
Estimated using AS 197 (exact ML)
Dependent variable: Std_mortality
Standard errors based on Hessian

             coefficient   std. error      z      p-value 
  --------------------------------------------------------
  const       18.0782      3.69647        4.891   1.00e-06 ***
  phi_1        0.996455    0.00501938   198.5     0.0000   ***
  theta_1      0.401166    0.171108       2.345   0.0191   **
  theta_2      0.345176    0.108887       3.170   0.0015   ***

Mean dependent var   18.32174   S.D. dependent var   2.135615
Mean of innovations -0.094657   S.D. of innovations  0.185241
R-squared            0.994379   Adjusted R-squared   0.994117
Log-likelihood       9.085184   Akaike criterion    -8.170368
Schwarz criterion    0.972839   Hannan-Quinn        -4.745268

                        Real  Imaginary    Modulus  Frequency
  -----------------------------------------------------------
  AR
    Root  1           1.0036     0.0000     1.0036     0.0000
  MA
    Root  1          -0.5811    -1.5998     1.7021    -0.3055
    Root  2          -0.5811     1.5998     1.7021     0.3055
  -----------------------------------------------------------

Contraste de cointegración

coint 9 Std_mortality Proportion_marriages --test-down

Step 1: testing for a unit root in Std_mortality

Augmented Dickey-Fuller test for Std_mortality
testing down from 9 lags, criterion AIC
sample size 45
unit-root null hypothesis: a = 1

  test with constant 
  including 0 lags of (1-L)Std_mortality
  model: (1-L)y = b0 + (a-1)*y(-1) + e
  estimated value of (a - 1): 0.00678121
  test statistic: tau_c(1) = 0.615887
  asymptotic p-value 0.9902
  1st-order autocorrelation coeff. for e: 0.085

Step 2: testing for a unit root in Proportion_marriages

Augmented Dickey-Fuller test for Proportion_marriages
testing down from 9 lags, criterion AIC
sample size 39
unit-root null hypothesis: a = 1

  test with constant 
  including 6 lags of (1-L)Proportion_marriages
  model: (1-L)y = b0 + (a-1)*y(-1) + ... + e
  estimated value of (a - 1): 0.0831149
  test statistic: tau_c(1) = 1.04236
  asymptotic p-value 0.9971
  1st-order autocorrelation coeff. for e: -0.068
  lagged differences: F(6, 31) = 3.197 [0.0147]

Step 3: cointegrating regression

Cointegrating regression - 
OLS, using observations 1866-1911 (T = 46)
Dependent variable: Std_mortality

                      coefficient  std. error  t-ratio  p-value 
  --------------------------------------------------------------
  const               -10.8466     1.42447     -7.614   1.45e-09 ***
  Proportion_marri~     0.418536   0.0203914   20.53    3.67e-24 ***

Mean dependent var   18.32174   S.D. dependent var   2.135615
Sum squared resid    19.40865   S.E. of regression   0.664158
R-squared            0.905434   Adjusted R-squared   0.903284
Log-likelihood      -45.42395   Akaike criterion     94.84790
Schwarz criterion    98.50518   Hannan-Quinn         96.21794
rho                  0.228283   Durbin-Watson        1.535570

Step 4: testing for a unit root in uhat

Augmented Dickey-Fuller test for uhat
testing down from 9 lags, criterion AIC
sample size 45
unit-root null hypothesis: a = 1

  test without constant 
  including 0 lags of (1-L)uhat
  model: (1-L)y = (a-1)*y(-1) + e
  estimated value of (a - 1): -0.771717
  test statistic: tau_c(2) = -5.22784
  asymptotic p-value 5.236e-05
  1st-order autocorrelation coeff. for e: 0.023

There is evidence for a cointegrating relationship if:
(a) The unit-root hypothesis is not rejected for the individual variables, and
(b) the unit-root hypothesis is rejected for the residuals (uhat) from the 
    cointegrating regression.

Regresión de la mortalidad sobre la proporción de matrimonios eclesiásticos

ols Std_mortality 0 Proportion_marriages
modtest --normality --quiet
modtest --white --quiet
modtest --autocorr 5 --quiet

Model 3: OLS, using observations 1866-1911 (T = 46)
Dependent variable: Std_mortality

                      coefficient  std. error  t-ratio  p-value 
  --------------------------------------------------------------
  const               -10.8466     1.42447     -7.614   1.45e-09 ***
  Proportion_marri~     0.418536   0.0203914   20.53    3.67e-24 ***

Mean dependent var   18.32174   S.D. dependent var   2.135615
Sum squared resid    19.40865   S.E. of regression   0.664158
R-squared            0.905434   Adjusted R-squared   0.903284
F(1, 44)             421.2815   P-value(F)           3.67e-24
Log-likelihood      -45.42395   Akaike criterion     94.84790
Schwarz criterion    98.50518   Hannan-Quinn         96.21794
rho                  0.228283   Durbin-Watson        1.535570


Test for null hypothesis of normal distribution:
Chi-square(2) = 0.260 with p-value 0.87796


White's test for heteroskedasticity

Test statistic: TR^2 = 1.729996,
with p-value = P(Chi-square(2) > 1.729996) = 0.421052


Breusch-Godfrey test for autocorrelation up to order 5

Test statistic: LMF = 1.947454,
with p-value = P(F(5,39) > 1.94745) = 0.108

Alternative statistic: TR^2 = 9.190388,
with p-value = P(Chi-square(5) > 9.19039) = 0.102

Ljung-Box Q' = 9.05845,
with p-value = P(Chi-square(5) > 9.05845) = 0.107

Regresión en primeras diferencias

diff Std_mortality Proportion_marriages
ols d_Std_mortality 0 d_Proportion_marriages
modtest --normality --quiet
modtest --white --quiet
modtest --autocorr 5 --quiet

Model 4: OLS, using observations 1867-1911 (T = 45)
Dependent variable: d_Std_mortality

                      coefficient  std. error  t-ratio  p-value 
  --------------------------------------------------------------
  const               -0.172792    0.0230316   -7.502   2.43e-09 ***
  d_Proportion_mar~    0.00142536  0.0117781    0.1210  0.9042  

Mean dependent var  -0.173333   S.D. dependent var   0.149848
Sum squared resid    0.987664   S.E. of regression   0.151555
R-squared            0.000340   Adjusted R-squared  -0.022907
F(1, 43)             0.014645   P-value(F)           0.904241
Log-likelihood       22.07697   Akaike criterion    -40.15393
Schwarz criterion   -36.54061   Hannan-Quinn        -38.80692
rho                  0.089193   Durbin-Watson        1.806988


Test for null hypothesis of normal distribution:
Chi-square(2) = 14.808 with p-value 0.00061


White's test for heteroskedasticity

Test statistic: TR^2 = 2.149006,
with p-value = P(Chi-square(2) > 2.149006) = 0.341467


Breusch-Godfrey test for autocorrelation up to order 5

Test statistic: LMF = 0.589588,
with p-value = P(F(5,38) > 0.589588) = 0.708

Alternative statistic: TR^2 = 3.239657,
with p-value = P(Chi-square(5) > 3.23966) = 0.663

Ljung-Box Q' = 4.0454,
with p-value = P(Chi-square(5) > 4.0454) = 0.543

Preguntas

Pregunta 1

Discuta de todas las formas posibles si la serie temporal de mortalidad (Std_mortality) es estacionaria en media (i.e., la realización de un proceso estocástico estacionario), usando para ello los resultados de los apartados Datos en nivel de la serie de mortalidad y No description for this link.

(Respuesta 1)

Pregunta 2

Discuta si las series de mortalidad y proporción de matrimonios eclesiásticos están cointegradas a partir de los resultados del apartado No description for this link.

(Respuesta 2)

Pregunta 3

Sin embargo, ¿qué sugieren los resultados de las secciones Regresión de la mortalidad sobre la proporción de matrimonios eclesiásticos y Regresión en primeras diferencias respecto a la relación entre Std_mortality y Proportion_marriages?

(Respuesta 3)

Pregunta 4

Los listados en Regresión de la mortalidad sobre la proporción de matrimonios eclesiásticos y Regresión en primeras diferencias muestran los principales resultados obtenidos al estimar por MCO dos modelos de regresión que relacionan las dos variables consideradas en este ejercicio. Resuma y comente los resultados de estimación y diagnosis que le parezcan más relevantes. Si detecta alguna desviación del cumplimiento de las hipótesis habituales, discuta sus consecuencias sobre las propiedades del estimador MCO y sugiera una forma de tratarla.

(Respuesta 4)

Pregunta 5

Interprete la pendiente de la regresión cointegrante estimada en la Etapa 3 del No description for this link.

(Respuesta 5)

Pregunta 6

Indique cuáles de las siguientes expresiones representan el modelo de la sección Estimación de un modelo univariante para la serie de mortalidad, con un redondeo a tres decimales.

\(\left( 1 - 0.997 \, \mathsf{B} \right) \, \left(X_t - 18.078 \right) = \left( 1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 \right) \hat U_t\)
\(\left( 1 - 0.997 \, \mathsf{B} \right) \, \left(X_t - 18.078 \right) = \left( 1 - 0.401 \, \mathsf{B} - 0.345 \, \mathsf{B}^2 \right) \hat U_t\)
\(\left( 1 + 0.997 \, \mathsf{B} \right) \, \left(X_t - 18.078 \right) = \left( 1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 \right) \hat U_t\)
\(\,{X_t} = 18.078 + \frac{ 1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 }{ 1 - 0.997 \, \mathsf{B} } \hat U_t\)
\(\,{X_t} = -18.078 + \frac{ 1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 }{ 1 - 0.997 \, \mathsf{B} } \hat U_t\)
\(\,{X_t} = 18.078 + \frac{ 1 - 0.401 \, \mathsf{B} - 0.345 \, \mathsf{B}^2 }{ 1 - 0.997 \, \mathsf{B} } \hat U_t\)
\(\,{X_t} = 18.078 + \frac{ 1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 }{ 1 + 0.997 \, \mathsf{B} } \hat U_t\)
\(\frac{ 1 - 0.997 \, \mathsf{B} }{1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 } \, \left(X_t - 18.078 \right)= \hat U_t\)
\(\frac{ 1 - 0.997 \, \mathsf{B} }{1 + 0.401 \, \mathsf{B} + 0.345 \, \mathsf{B}^2 } \, X_t = 18.078 + \hat U_t\)
\(\frac{ 1 - 0.997 \, \mathsf{B} }{1 - 0.401 \, \mathsf{B} - 0.345 \, \mathsf{B}^2 } \, \left(X_t - 18.078 \right)= \hat U_t\)

(Respuesta 6)

Pregunta 7

A la luz de la Estimación de un modelo univariante para la serie de mortalidad, si tuviera que clasificar el proceso estocástico subyacente del que la serie temporal es una realización ¿diría que es invertible? ¿O que no lo es? ¿Diría que es estacionario? ¿O que no lo es? Explique su respuesta.

(Respuesta 7)

Pregunta 8

¿Cuáles de los modelos de más arriba considera aceptables? ¿O qué mejoras sugeriría para ellos?

(Respuesta 8)

Respuestas

Respuesta 1

La serie temporal Std_mortality NO es estacionaria en media, como se aprecia en las secciones:

Gráficos de las series y correlogramas.
- El gráfico de la serie muestra una tendencia decreciente.
- La FAC muestra mucha persistencia, los coeficientes decrecen a un ritmo aproximadamente lineal; y el primer coeficiente de la PACF está próximo a uno.
Estimación de un modelo univariante para la serie de mortalidad: El modelo univariante estimado tiene una raíz AR aproximadamente igual a \(1\).
No description for this link: El test ADF calculado en la Etapa 1 no rechaza la hipótesis (raíz unitaria) con un p-valor de 0.9902

(Pregunta 1)

Respuesta 2

Las conclusiones de las distintas etapas del test de cointegración son los siguientes:

Etapa 1: El test ADF no rechaza que la serie de mortalidad sea I(1). (valor p asintótico 0,9902)
Etapa 2: El test ADF no rechaza que la serie de proporción de matrimonios eclesiásticos sea I(1). (valor p asintótico 0,9971)
Etapa 3: La regresión (cointegrante) de mortalidad sobre la proporción de matrimonios eclesiásticos es significativa (parámetros significativos y elevado \(R^2\) (0,905434).
Etapa 4: El test ADF rechaza contundentemente que los residuos de la regresión cointegrante sean I(1). (valor p asintótico 5,236e-05)

Consecuentemente, el test indica que ambas series están cointegradas (pero, como sugiere tanto el sentido común como la Regresión en primeras diferencias la relación es espuria, véase la pregunta 3).

(Pregunta 2)

Respuesta 3

Aunque el modelo de Regresión de la mortalidad sobre la proporción de matrimonios eclesiásticos muestra un buen ajuste (un elevado \(R^2\)) y los parámetros estimados son muy significativos, la relación entre ambas variables se desvanece al diferenciar los datos para lograr la estacionariedad. Ello sugiere, al igual que el sentido común, que la relación es espuria.

(Pregunta 3)

Respuesta 4

Modelo de regresión MCO para datos en nivel

(Regresión de la mortalidad sobre la proporción de matrimonios eclesiásticos): Todos los coeficientes son muy significativos. El ajuste del modelo, medido por el valor del \(R^2\) es muy elevado. Los contrastes sobre los residuos no rechazan (ni al 1%, ni al 5% ni al 10% de significación) las hipótesis nulas de normalidad, homoscedasticidad y ausencia de autocorrelación. Es decir, de la salida de Gretl no se puede inferir que haya ningún problema con este modelo.

Modelo para datos en primeras diferencias

(Regresión en primeras diferencias): El único coeficiente significativo es el término constante. El ajuste del modelo, medido por el valor del \(R^2\), es prácticamente nulo. Los contrastes residuales rechazan la hipótesis nula de normalidad, aunque no rechazan las de homoscedasticidad y ausencia de autocorrelación.

Si las perturbaciones no tienen distribución normal las estimaciones no serán eficientes en el sentido máximo-verosímil (aunque sí en el de Gauss-Markov) y la distribución de los estadísticos habituales será distinta de la teórica bajo el supuesto de normalidad de las perturbaciones (por ejemplo, los estadísticos de la \(t\) no tendrán exactamente una distribución t de student).

No obstante, dado que la relación entre variables es espuria, ninguno de estos modelos de regresión es válido como explicación de la tasa de mortalidad.

(Pregunta 4)

Respuesta 5

La pendiente de la regresión estimada en la Etapa 3 (que es la misma que la de la sección de la regresión en niveles) indica que un aumento de un uno por mil en la proporción de matrimonios eclesiásticos da lugar a un aumento de un 0.419 por mil en la mortalidad esperada (pero, dado que la relación es espuria, interpretar este resultado carece de sentido).

(Pregunta 5)

Respuesta 6

Recuerde que signo de los parámetros MA en las salidas de Gretl tienen el signo cambiado respecto a convenio habitual en los manuales de series temporales, es decir, para los polinomios AR \((1-\phi_1\mathsf{B}-\cdots-\phi_p\mathsf{B}^p)\), tenemos que phi_j es "\(\phi_j\)" (es decir, al escribir el modelo el signo del parámetro phi_j aparece con un menos delante); pero para los MA \((1-\theta_1\mathsf{B}-\cdots-\theta_p\mathsf{B}^p)\) tenemos que theta_j es "\(-\theta_j\)" (es decir, al escribir no cambiamos el signo de parámetro theta_j pues ya lleva el "\(-\)" incorporado). Además, const es la estimación del valor esperado \(\mu\) del proceso \(\boldsymbol{X}\), es decir, que \((X_t-\mu\mid t\in\mathbb{Z})\) es un proceso ARMA de media cero.

Por tanto, las expresiones correctas son:

Expresión 1: modelo ARMA(\(1,2\)): \(\;\boldsymbol{\phi}(\mathsf{B})({X_t}-\mu)=\boldsymbol{\theta}(\mathsf{B}){U_t}\)
Expresión 4: su representación MA(\(\infty\)): \(\;({X_t}-\mu)=\frac{\boldsymbol{\theta}}{\boldsymbol{\phi}}(\mathsf{B}){U_t}\;\rightarrow\;{X_t}=\mu+\frac{\boldsymbol{\theta}}{\boldsymbol{\phi}}(\mathsf{B}){U_t}\)
Expresión 8: su representación AR(\(\infty\)): \(\;\frac{\boldsymbol{\phi}}{\boldsymbol{\theta}}(\mathsf{B})({X_t}-\mu)={U_t}\)

¡Ojo, la cuarta expresión solo es posible porque \(\phi_1\) no es exactamente 1! Si fuera 1, el polinomio autorregresivo \(1-\mathsf{B}\) no tendría una inversa sumable y, por tanto, ni el proceso sería estacionario, ni habría una representación del proceso como media móvil infinita como la Expresión 4.

(Pregunta 6)

Respuesta 7

La raíz AR estimada está muy próxima a 1, por lo que cabe pensar que la serie proviene de un proceso estocástico NO estacionario. Sin embargo, las raíces del polinomio MA tienen un módulo claramente mayor que uno, por lo que el modelo tiene claramente una representación AR(\(\infty\)), es decir, es invertible.

(Pregunta 7)

Respuesta 8

¿Cuáles de los modelos de más arriba considera aceptables? ¿O qué mejoras sugeriría para ellos?

En cuanto al modelo univariante

Probablemente debería incorporar una diferencia ordinaria, en lugar de un término AR(1).

En cuanto a los modelos de regresión

En el modelo de las serie en diferencias hay, probablemente, un problema de autocorrelación dado el elevado valor del estadístico Durbin-Watson (es próximo a 2), por lo que quizá debería ser estimado por mínimos cuadrados generalizados asumiendo un modelo autorregresivo AR(1) para el error.

No obstante, el modelo en diferencias (y el sentido común) sugiere que la relación entre ambas variables es espuria. Consecuentemente, ninguna de las dos regresiones (en niveles o en diferencias) arrojará un modelo aceptable ni siquiera con las mejoras sugeridas.

(Pregunta 8)