Índice de precios de viviendas nuevas y de segunda mano
Índice
Los datos
Los datos de este ejercicio corresponden a los índices de precios de vivienda nueva y de segunda mano con base 2015. La muestra disponible incluye 64 observaciones trimestrales, comprendidas entre el primer trimestre de 2007 y el cuarto de 2022. Fuente: Instituto Nacional de Estadística.
open ../datos/IndicePreciosViviendasNuevasYdeSegundaMano.gdt
IPVN
- Índice de precios de vivienda nueva, base 2015.
IPV2M
- Índice de precios de vivienda de segunda mano, base 2015.
A partir de esta muestra, se calculan las tasas de variación anual:
\(T4IPVN_t=100\times\left(\frac{IPVN_t}{IPVN_{t-1}}-1\right);\quad\) | \(T4IPV2M_t=100\times\left(\frac{IPV2M_t}{IPV2M_{t-1}}-1\right)\). |
T4IPVN
- Tasa de variación anual de
IPVN
. T4IPV2M
- Tasa de variación anual de
IPV2M
.
- Ficheros
- Versiones: pdf; html.
- Datos: Examen-IndicePreciosViviendasNuevasYdeSegundaMano.gdt
- Guión de gretl: Examen-IndicePreciosViviendasNuevasYdeSegundaMano.inp
Gráfico de las tasas de variación los índices de precios
gnuplot T4IPVN T4IPV2M --time-series --with-lines --output="TasasDeVariacionAnual.png"
El perfil de las series que se muestran en la figura anterior sugiere que ambas podrían estar cointegradas. Para estudiar esta posibilidad se estiman:
- modelos ARIMA para las series
T4IPVN
yT4IPV2M
, así como - un modelo AR(1) para la serie
T4IPVN
conT4IPV2M
y como input exógeno.
Modelos ARIMA
Vivienda nueva
Se ajusta el siguiente modelo estacional para T4IPVN
:
ARIMA_T4IPVN <- arima 0 1 0 ; 0 0 1 ; T4IPVN --nc
modtest --normality --quiet
modtest --arch --quiet
modtest --autocorr 15 --quiet
Function evaluations: 16 Evaluations of gradient: 9 ARIMA_T4IPVN: ARIMA, using observations 2008:2-2022:4 (T = 59) Estimated using AS 197 (exact ML) Dependent variable: (1-L) T4IPVN Standard errors based on Hessian coefficient std. error z p-value ------------------------------------------------------ Theta_1 -0.352053 0.161467 -2.180 0.0292 ** Mean dependent var -0.016781 S.D. dependent var 2.324958 Mean of innovations -0.003088 S.D. of innovations 2.208917 R-squared 0.889602 Adjusted R-squared 0.889602 Log-likelihood -130.7397 Akaike criterion 265.4793 Schwarz criterion 269.6344 Hannan-Quinn 267.1013 Real Imaginary Modulus Frequency ----------------------------------------------------------- MA (seasonal) Root 1 2.8405 0.0000 2.8405 0.0000 ----------------------------------------------------------- ARIMA_T4IPVN saved Test for null hypothesis of normal distribution: Chi-square(2) = 0.287 with p-value 0.86644 Test for ARCH of order 4 Test statistic: TR^2 = 2.096460, with p-value = P(Chi-square(4) > 2.096460) = 0.718023 Test for autocorrelation up to order 15 Ljung-Box Q' = 12.8016, with p-value = P(Chi-square(14) > 12.8016) = 0.5422
Vivienda de segunda mano
Se ajusta el siguiente modelo estacional para T4IPV2M
:
ARIMA_T4IPV2M <- arima 2 1 0 ; 0 0 1 ; T4IPV2M --nc
modtest --normality --quiet
modtest --arch --quiet
modtest --autocorr 15 --quiet
Function evaluations: 37 Evaluations of gradient: 14 ARIMA_T4IPV2M: ARIMA, using observations 2008:2-2022:4 (T = 59) Estimated using AS 197 (exact ML) Dependent variable: (1-L) T4IPV2M Standard errors based on Hessian coefficient std. error z p-value ------------------------------------------------------- phi_1 0.290799 0.118903 2.446 0.0145 ** phi_2 0.510969 0.149725 3.413 0.0006 *** Theta_1 -0.843988 0.177320 -4.760 1.94e-06 *** Mean dependent var 0.100821 S.D. dependent var 2.138823 Mean of innovations 0.069384 S.D. of innovations 1.521217 R-squared 0.957548 Adjusted R-squared 0.956032 Log-likelihood -110.6874 Akaike criterion 229.3748 Schwarz criterion 237.6849 Hannan-Quinn 232.6187 Real Imaginary Modulus Frequency ----------------------------------------------------------- AR Root 1 1.1430 0.0000 1.1430 0.0000 Root 2 -1.7122 0.0000 1.7122 0.5000 MA (seasonal) Root 1 1.1849 0.0000 1.1849 0.0000 ----------------------------------------------------------- ARIMA_T4IPV2M saved Test for null hypothesis of normal distribution: Chi-square(2) = 1.017 with p-value 0.60142 Test for ARCH of order 4 Test statistic: TR^2 = 0.710542, with p-value = P(Chi-square(4) > 0.710542) = 0.950023 Test for autocorrelation up to order 15 Ljung-Box Q' = 19.2946, with p-value = P(Chi-square(12) > 19.2946) = 0.08166
Modelo ARMAX
Se ajusta el siguiente modelo autorregresivo para T4IPVN
, con una
constante y T4IPV2M
como variables exógenas:
ARMAX_T4IPVN <- arima 1 0 0 ; T4IPVN T4IPV2M 0
modtest --normality --quiet
modtest --arch --quiet
modtest --autocorr 15 --quiet
Function evaluations: 18 Evaluations of gradient: 8 ARMAX_T4IPVN: ARMAX, using observations 2008:1-2022:4 (T = 60) Estimated using AS 197 (exact ML) Dependent variable: T4IPVN Standard errors based on Hessian coefficient std. error z p-value ------------------------------------------------------ const 2.36047 1.32670 1.779 0.0752 * phi_1 0.821915 0.0858539 9.573 1.03e-21 *** T4IPV2M 0.612342 0.126633 4.836 1.33e-06 *** Mean dependent var 1.368477 S.D. dependent var 6.683657 Mean of innovations -0.108356 S.D. of innovations 1.943328 R-squared 0.917639 Adjusted R-squared 0.916219 Log-likelihood -125.5632 Akaike criterion 259.1265 Schwarz criterion 267.5038 Hannan-Quinn 262.4033 Real Imaginary Modulus Frequency ----------------------------------------------------------- AR Root 1 1.2167 0.0000 1.2167 0.0000 ----------------------------------------------------------- ARMAX_T4IPVN saved Test for null hypothesis of normal distribution: Chi-square(2) = 0.050 with p-value 0.97554 Test for ARCH of order 4 Test statistic: TR^2 = 5.586830, with p-value = P(Chi-square(4) > 5.586830) = 0.232202 Test for autocorrelation up to order 15 Ljung-Box Q' = 9.64319, with p-value = P(Chi-square(14) > 9.64319) = 0.7878
Intervalo de confianza de los parámetros estimados
Los intervalos de confianza al 95 para los coeficientes del modelo anterior se muestra a continuación.
z(0,025) = 1,9600 VARIABLE COEFICIENTE INTERVALO DE CONFIANZA 95% const 2,36047 -0,239821 4,96075 phi_1 0,821915 0,653645 0,990186 T4IPV2M 0,612342 0,364146 0,860538
Preguntas
Pregunta 1
Comente exhaustivamente los resultados de estimación y diagnosis de los modelos ARIMA estimados.
Pregunta 2
Compare de todas las formas posibles los modelos ARIMA y ARMAX de la
variable T4IPVN
. ¿Cuál de los dos modelos
- ajusta mejor la muestra?
- cabe esperar que produzca mejores previsiones extra-muestrales? (suponiendo que se conoce el valor de la variable explicativa en el caso del modelo ARMAX)
- cabe esperar que esté mejor especificado?
Argumente su respuesta de todas las formas posibles.
Pregunta 3
- Suponga que los modelos ARIMA (para
T4IPVN
yT4IPV2M
) y ARMAX (paraT4IPVN
) están correctamente identificados y estimados. Considerando las estimaciones puntuales que se muestran, discuta detalladamente si las seriesT4IPVN
yT4IPV2M
están cointegradas (en este caso indique cuál es el vector de cointegración) o si, por el contrario, no lo están. - Los intervalos de confianza de los parámetros estimados ¿Introducen algún matiz en su respuesta previa? ¿O no la afectan en absoluto?
Pregunta 4
Indique cuáles de las siguientes expresiones representan el modelo ARIMA ajustado a T4IPV2M
con un redondeo a tres decimales.
Indique cuáles de las siguientes expresiones NO están bien definidas.
- Expresión 1
- \(\nabla x_t = \frac{1-0.844 \, \mathsf{B}^4}{1 - 0.291 \mathsf{B} -0.511 \mathsf{B}^2} \hat{a}_t\)
- Expresión 2
- \(\nabla x_t = \frac{1-0.844 \, \mathsf{B}^4}{1 + 0.291 \mathsf{B} +0.511 \mathsf{B}^2} \hat{a}_t\)
- Expresión 3
- \(\nabla x_t = \frac{1+0.844 \, \mathsf{B}^4}{1 - 0.291 \mathsf{B} -0.511 \mathsf{B}^2} \hat{a}_t\)
- Expresión 4
- \(x_t = \frac{1+0.844 \, \mathsf{B}^4}{\nabla(1 + 0.291 \mathsf{B} +0.511 \mathsf{B}^2)} \hat{a}_t\)
- Expresión 5
- \(x_t = \frac{1-0.844 \, \mathsf{B}^4}{\nabla(1 + 0.291 \mathsf{B} +0.511 \mathsf{B}^2)} \hat{a}_t\)
- Expresión 6
- \(x_t-X_{t-1} = \frac{1-0.844 \, \mathsf{B}^4}{1 - 0.291 \mathsf{B} -0.511 \mathsf{B}^2} \hat{a}_t\)
- Expresión 7
- \(x_t-X_{t-1} = \frac{1-0.844 \, \mathsf{B}^4}{1 + 0.291 \mathsf{B} +0.511 \mathsf{B}^2} \hat{a}_t\)
- Expresión 8
- \(x_t+X_{t-1} = \frac{1+0.844 \, \mathsf{B}^4}{1 - 0.291 \mathsf{B} -0.511 \mathsf{B}^2} \hat{a}_t\)
- Expresión 9
- \(\nabla (1 - 0.291 \mathsf{B} - 0.511 \mathsf{B}^2) x_t = (1 - 0.844 \mathsf{B}^4) \hat{a}_t\)
- Expresión 10
- \(\nabla (1 + 0.291 \mathsf{B} + 0.511 \mathsf{B}^2) x_t = (1 - 0.844 \mathsf{B}^4) \hat{a}_t\)
- Expresión 11
- \(\nabla (1 - 0.291 \mathsf{B} - 0.511 \mathsf{B}^2) x_t = (1 + 0.844 \mathsf{B}^4) \hat{a}_t\)
- Expresión 12
- \(\frac{1 -0.291 \mathsf{B} - 0.511 \mathsf{B}^2}{1 - 0.844 \mathsf{B}^4}\nabla x_t = \hat{a}_t\)
- Expresión 13
- \(\frac{1}{1 - 0.844 \mathsf{B}^4}\nabla x_t = \frac{1}{1 -0.291 \mathsf{B} - 0.511 \mathsf{B}^2} \hat{a}_t\)
- Expresión 14
- \(\frac{1}{1 + 0.844 \mathsf{B}^4} x_t = \frac{1}{\nabla(1 -0.291 \mathsf{B} - 0.511 \mathsf{B}^2)} \hat{a}_t\)
- Expresión 15
\(\frac{1}{1 - 0.844 \mathsf{B}^4} x_t = \frac{1}{\nabla(1 +0.291 \mathsf{B} + 0.511 \mathsf{B}^2)} \hat{a}_t\)
Pregunta 5
Indique cuáles de las siguientes expresiones representan el modelo ARMAX ajustado a T4IPVN
con un redondeo a tres decimales.
- Expresión 1
- \(T4IPVN_t = 2.361 + 0.612 \, (T4IPV2M_t) + \frac{1}{1 + 0.822 \mathsf{B}} \hat{a}_t\)
- Expresión 2
- \(T4IPVN_t = 2.361 + 0.612 \, (T4IPV2M_t) + \frac{1}{1 - 0.822 \mathsf{B}} \hat{a}_t\)
- Expresión 3
- \((1 - 0.822 \mathsf{B}) T4IPVN_t = 2.361 + 0.612 \, (T4IPV2M_t) + \hat{a}_t\)
- Expresión 4
- \((1 - 0.822 \mathsf{B}) (T4IPVN_t - 2.361) = 0.612 \, (T4IPV2M_t) + \hat{a}_t\)
- Expresión 5
- \((1 - 0.822 \mathsf{B}) \big(T4IPVN_t - 0.612 \, (T4IPV2M_t) - 2.361\big) = \hat{a}_t\)
Pregunta 6
Pregunta 7
Indique si es cierta o no la siguiente afirmación:
La pendiente estimada de la variable
T4IPV2M
en el modelo ARMAX indica que, si aumenta en un1%
la tasa anual de variación del índice de precios de la vivienda de segunda manoT4IPV2M
, cabe esperar que la tasa de variación del índice de precios de la vivienda nuevaT4IPVN_t
aumente en un0.612%
.
Pregunta 8
Indique si es cierta o no la siguiente afirmación:
La pendiente estimada de la variable
T4IPV2M
en el modelo ARMAX indica que, si aumenta en un punto porcentual la tasa anual de variación del índice de precios de la vivienda de segunda manoT4IPV2M
, cabe esperar que la tasa de variación del índice de precios de la vivienda nuevaT4IPVN
aumente en0.612
puntos.
Pregunta 9
Indique si es cierta o no la siguiente afirmación:
Los resultados que se muestran en la tabla de intervalos de confianza indican que debe rechazarse la hipótesis nula de que el parámetro \(\phi_1\) sea igual a 1 con un 10% de significación.
Pregunta 10
Indique si es cierta o no la siguiente afirmación:
Los resultados que se muestran en la tabla de intervalos de confianza sugieren que probablemente no se rechazaría la hipótesis nula de que el parámetro \(phi_1\) sea igual a 1 con un 1% de significación.
Respuestas
Respuesta 1
En ambos modelos
- todos los coeficientes estimados son significativos a los niveles de confianza habituales, y
- los contrastes residuales no rechazan a los niveles de confianza habituales las hipótesis nulas de
- normalidad,
- homoscedasticidad (ausencia de efectos ARCH) y
- ausencia de autocorrelación.
- En ambos casos son modelos ARIMA no estacionarios.
Respuesta 2
El modelo ARMAX se ajusta mejor la muestra ya que
- tiene coeficientes de determinación más elevados; tanto el
ordinario, \(R^2\), (
0,917639
frente a0,889602
) como el corregido por los grados de libertad (0,916219
frente a0,889602
) y - tiene una menor desviación típica de las innovaciones (
1,943328
frente a2,208917
).
Por otra parte, los criterios de información del modelo ARMAX toman un valor menores, es decir, son mejores, por lo que
- cabe esperar que este modelo prediga mejor fuera de la muestra (criterios de Akaike y Hannan-Quinn), y también
- cabe esperar que esté mejor especificado (criterio de Schwarz).
Respuesta 3
Los modelos estimados sugieren que las series
T4IPVN
yT4IPV2M
están cointegradas, con un vector de cointegración[1 - 0.612]
. Esta respuesta se apoya en que- los modelos ARIMA para las series
T4IPVN
yT4IPV2M
son ARIMA\((0,1,0)\times(0,0,1)_{12}\) y ARIMA\((2,1,0)\times(0,0,1)_{12}\), respectivamente, por lo que ambas series son integradas de primer orden, y - el modelo ARMAX tiene un término de error estacionario, ya que la
raíz del término AR(1) está fuera del círculo de radio unidad
(
1,2167
) y el correlograma de los residuos refuerza la hipótesis de que los residuos son estacionarios.
Por tanto, al relacionar ambas series mediante un modelo lineal, es razonable asumir que los errores de la relación son estacionarios en media.
- los modelos ARIMA para las series
- Las estimaciones puntuales del modelo ARMAX sugieren que los
residuos son estacionarios. Sin embargo, al mirar los intervalos de
confianza de los parámetros estimados se ve que el límite superior
del intervalo de confianza al 95% para el coeficiente
autorregresivo es
0,990186
por lo que, aunque un contraste al 5% de significación rechaza la hipótesis de una raíz unitaria, no cabe descartar que el valor del coeficiente pueda ser1
cuando empleamos un nivel de confianza ligeramente mayor (digamos un 97%, i.e., un \(\alpha\) al 3%); en tal caso no podríamos concluir que las series están cointegradas, pues los residuos de la relación encontrada no serían \(I(0)\)).
Respuesta 4
Recuerde que signo de los parámetros MA en las salidas de Gretl tienen
el signo cambiado respecto a convenio habitual en los manuales de
series temporales, es decir, para los polinomios AR
\((1-\phi_1\mathsf{B}-\cdots-\phi_p\mathsf{B}^p)\), tenemos que phi_j
es "\(\phi_j\)" (es decir, al escribir el modelo el signo del parámetro
phi_j
aparece con un menos delante); pero para los MA
\((1-\theta_1\mathsf{B}-\cdots-\theta_p\mathsf{B}^p)\), tenemos que
theta_j
es "\(-\theta_j\)"; es decir, al escribir no cambiamos el
signo de parámetro theta_j
pues ya lleva el "\(-\)" incorporado, ya
que Gretl escribe asume que los modelos ARIMA se representan del
siguiente modo:
\[(1-\phi_1\mathsf{B}-\cdots-\phi_p\mathsf{B}^p)X_t= (1+\theta_1\mathsf{B}+\cdots+\theta_p\mathsf{B}^p)U_t.\]
en lugar del habitual
\[(1-\phi_1\mathsf{B}-\cdots-\phi_p\mathsf{B}^p)X_t= (1-\theta_1\mathsf{B}-\cdots-\theta_p\mathsf{B}^p)U_t.\]
Por tanto,
- Expresiones correctas
- son
- Expresión 1
- Representación en forma MA\((\infty)\) de \(\nabla x_t\): \(\qquad \nabla x_t = \frac{1-0.844 \, \mathsf{B}^4}{1 - 0.291 \mathsf{B} -0.511 \mathsf{B}^2} \hat{a}_t\)
- Expresión 6
- Representación en forma MA\((\infty)\) de \(\nabla x_t\): \(\qquad x_t-x_{t-1} = \frac{1-0.844 \, \mathsf{B}^4}{1 - 0.291 \mathsf{B} -0.511 \mathsf{B}^2} \hat{a}_t\)
- Expresión 9
- Representación en forma ARIMA\((2,1,0)\times(0,0,1)_4\) de \(x_t\): \(\qquad (1 - 0.291 \mathsf{B} - 0.511 \mathsf{B}^2)\nabla x_t = (1 - 0.844 \mathsf{B}^4) \hat{a}_t\)
- Expresión 12
- Representación en forma AR\((\infty)\) de \(\nabla x_t\): \(\qquad \frac{1 -0.291 \mathsf{B} - 0.511 \mathsf{B}^2}{1 - 0.844 \mathsf{B}^4}\nabla x_t = \hat{a}_t\)
- Expresión 13
- Representación en forma ARMA\((\infty,\infty)\) de \(\nabla x_t\): \(\qquad\frac{1}{1 - 0.844 \mathsf{B}^4}\nabla x_t = \frac{1}{1 -0.291 \mathsf{B} - 0.511 \mathsf{B}^2} \hat{a}_t\)
- Expresiones que carecen de sentido
- (por no estar definidas) son las expresiones 4, 5, 14 y 15 (fíjese que en las cuatro expresiones \(\nabla=(1-\mathsf{B})\) aparece en el denominador, es decir, que en el denominador aparece un polinomio con una raíz 1).
¡Ojo! aunque estas expresiones son relativamente habituales en algunos textos, debe recordar que son un incorrecto abuso de notación, ya que la expresión \(\;x_t=\frac{\theta(\mathsf{B})}{\phi(\mathsf{B})}\hat{a}_t\;\) significa que \(\;\boldsymbol{x}=\frac{1}{\boldsymbol{\phi}}*\boldsymbol{\theta}*\hat{\boldsymbol{a}}\;\) donde \(\frac{1}{\boldsymbol{\phi}}\) es una secuencia absolutamente sumable tal que \(\frac{1}{\boldsymbol{\phi}}*\boldsymbol{\phi}=1\). Pero cuando \(\boldsymbol{\phi}\) es un polinomio con raíces de módulo uno, una secuencia \(\frac{1}{\boldsymbol{\phi}}\) con dichas características NO existe.
Respuesta 5
Son correctas
- la expresión 2, donde, teniendo en cuenta que Gretl devuelve la estimación de \(\phi_1\) del modelo del error, el modelo puede escribirse tal como indica el enunciado.
- la expresión 5, donde la constante y el término causal de regresión se han pasado al lado izquierdo de la igualdad y, en la expresión resultante, el inverso (sumable) del polinomio AR aparece multiplicando el lado izquierdo (es decir, el último sumando es una media móvil infinita).
Respuesta 6
Falso. Los criterios de información no son comparables ya que
corresponden a ajustes de modelos para variables endógenas distintas
(el primero es un modelo para T4IPVN
y el segundo un modelo para
T4IPV2M
)
Respuesta 7
Falso. Sería correcto si las variables dependiente y explicativa fueran tasas logarítmicas anuales, en cuyo caso el coeficiente podría interpretarse como una elasticidad. Como se trata de tasas porcentuales ordinarias, la interpretación no es correcta.
Respuesta 8
Verdadero. Las variables dependiente y explicativa son tasas porcentuales de variación anual y la pendiente, por tanto, se interpreta como el aumento esperado en la variable endógena cuando la explicativa crece en una unidad.
Respuesta 9
Verdadero. El intervalo de confianza indica que la hipótesis nula \(H_0:\; \phi_1=1\) se rechaza con un nivel de significación del 5%. Consecuentemente, también se rechaza si se aumenta el nivel de significación al 10% ya que el correspondiente intervalo de confianza al 90% es aún más reducido.
Respuesta 10
Cierto. El valor 1
queda fuera del del intervalo de confianza al
95%, pero está muy, muy próximo al límite superior de dicho intervalo.
Por tanto, una ligera ampliación del intervalo de confianza hará que
1
acabe dentro del nuevo intervalo. Y como reducir la significación
al 1% supone ampliar el intervalo de confianza asociado (pues ahora
corresponderá a una confianza del 99%) es previsible que al 1% no se
rechace \(H_0:\; \phi_1=1\) (de hecho lo puede comprobar si quiere
abriendo la base de datos en Gretl).