Consumo de petroleo y frecuencia del nombre Óscar

Datos

Ejemplo obtenido de https://tylervigen.com/spurious/correlation/8118_popularity-of-the-first-name-oscar_correlates-with_petroluem-consumption-in-greece

Datos anuales. Muestra: 1980–2022

Consumo de petroleo en Grecia ConsumoPetroleo

Título detallado de la variable
Volume of petroluem consumption consumed in Greece in millions of barrels per day
Fuente
Energy Information Administration

Popularidad del nombre Óscar en EEUU FrecuenciaOscar

Título detallado de la variable
Babies of all sexes born in the US named Óscar
Fuente
US Social Security Administration
gnuplot ConsumoPetroleo FrecuenciaOscar  --time-series --with-lines --output="PetroleoOscar.png"

PetroleoOscar.png

Ficheros:
Versión del ejercicio en pdf; html.

Datos en nivel del consumo de petroleo en Grecia

Gráfico de la serie temporal y su correlograma

gnuplot ConsumoPetroleo --time-series --with-lines --output="consumoPetroleo.png"
corrgm ConsumoPetroleo 9 --plot="consumoPetroleoACF-PACF.png"

consumoPetroleo.pngconsumoPetroleoACF-PACF.png

Estimación de un primer modelo univariante para la serie de consumo de petroleo

arima 1 0 1 ; ConsumoPetroleo
Function evaluations: 41
Evaluations of gradient: 14

Model 1: ARMA, using observations 1980-2022 (T = 43)
Estimated using AS 197 (exact ML)
Dependent variable: ConsumoPetroleo
Standard errors based on Hessian

             coefficient   std. error     z      p-value 
  -------------------------------------------------------
  const      313.739       39.2711       7.989   1.36e-15 ***
  phi_1        0.930826     0.0477685   19.49    1.44e-84 ***
  theta_1      0.289746     0.135530     2.138   0.0325   **

Mean dependent var   329.9135   S.D. dependent var   65.44053
Mean of innovations  1.463908   S.D. of innovations  17.36101
R-squared            0.928461   Adjusted R-squared   0.926717
Log-likelihood      -185.0353   Akaike criterion     378.0707
Schwarz criterion    385.1155   Hannan-Quinn         380.6686

                        Real  Imaginary    Modulus  Frequency
  -----------------------------------------------------------
  AR
    Root  1           1.0743     0.0000     1.0743     0.0000
  MA
    Root  1          -3.4513     0.0000     3.4513     0.5000
  -----------------------------------------------------------
series res1petroleo = $uhat
corrgm res1petroleo
Autocorrelation function for res1petroleo
***, **, * indicate significance at the 1%, 5%, 10% levels
using standard error 1/T^0.5

  LAG      ACF          PACF         Q-stat. [p-value]

    1   0.0578        0.0578          0.1541  [0.695]
    2   0.1870        0.1843          1.8052  [0.406]
    3   0.1131        0.0972          2.4237  [0.489]
    4   0.0677        0.0264          2.6511  [0.618]
    5  -0.0189       -0.0630          2.6693  [0.751]
    6  -0.0371       -0.0659          2.7412  [0.841]
    7  -0.0590       -0.0547          2.9286  [0.892]
    8   0.2206        0.2638 *        5.6184  [0.690]

Estimación de un segundo modelo univariante para la serie de consumo de petroleo

arima 1 1 0 --nc ; ConsumoPetroleo
Function evaluations: 12
Evaluations of gradient: 3

Model 2: ARIMA, using observations 1981-2022 (T = 42)
Estimated using AS 197 (exact ML)
Dependent variable: (1-L) ConsumoPetroleo
Standard errors based on Hessian

             coefficient   std. error     z     p-value
  -----------------------------------------------------
  phi_1       0.334680      0.151047    2.216   0.0267  **

Mean dependent var   1.020476   S.D. dependent var   18.74413
Mean of innovations  0.981800   S.D. of innovations  17.53257
R-squared            0.930469   Adjusted R-squared   0.930469
Log-likelihood      -179.9453   Akaike criterion     363.8907
Schwarz criterion    367.3660   Hannan-Quinn         365.1645

                        Real  Imaginary    Modulus  Frequency
  -----------------------------------------------------------
  AR
    Root  1           2.9879     0.0000     2.9879     0.0000
  -----------------------------------------------------------
series res2petroleo = $uhat
corrgm res2petroleo
Autocorrelation function for res2petroleo
***, **, * indicate significance at the 1%, 5%, 10% levels
using standard error 1/T^0.5

  LAG      ACF          PACF         Q-stat. [p-value]

    1  -0.0280       -0.0280          0.0354  [0.851]
    2   0.0692        0.0685          0.2567  [0.880]
    3   0.0756        0.0798          0.5278  [0.913]
    4   0.0412        0.0414          0.6102  [0.962]
    5  -0.0247       -0.0332          0.6406  [0.986]
    6  -0.0681       -0.0831          0.8788  [0.990]
    7  -0.0347       -0.0433          0.9423  [0.996]
    8   0.2664  *     0.2839 *        4.8001  [0.779]

Datos en nivel de la popularidad del nombre Óscar en EEUU

Gráfico de la serie temporal y su correlograma

gnuplot FrecuenciaOscar --time-series --with-lines --output="consumoOscar.png"
corrgm FrecuenciaOscar --plot="consumoOscarACF-PACF.png"

consumoOscar.png

consumoOscarACF-PACF.png

Estimación de un primer modelo univariante para la serie de popularidad del nombre Óscar

arima 1 0 1 ; FrecuenciaOscar
Function evaluations: 37
Evaluations of gradient: 15

Model 3: ARMA, using observations 1980-2022 (T = 43)
Estimated using AS 197 (exact ML)
Dependent variable: FrecuenciaOscar
Standard errors based on Hessian

             coefficient   std. error      z       p-value 
  ---------------------------------------------------------
  const      2083.23       517.026        4.029   5.60e-05  ***
  phi_1         0.951550     0.0384860   24.72    5.82e-135 ***
  theta_1       0.567719     0.127542     4.451   8.54e-06  ***

Mean dependent var   2443.651   S.D. dependent var   702.2265
Mean of innovations  16.93553   S.D. of innovations  138.9316
R-squared            0.960578   Adjusted R-squared   0.959616
Log-likelihood      -274.9813   Akaike criterion     557.9626
Schwarz criterion    565.0074   Hannan-Quinn         560.5605

                        Real  Imaginary    Modulus  Frequency
  -----------------------------------------------------------
  AR
    Root  1           1.0509     0.0000     1.0509     0.0000
  MA
    Root  1          -1.7614     0.0000     1.7614     0.5000
  -----------------------------------------------------------
series res1Oscar = $uhat
corrgm res1Oscar
Autocorrelation function for res1Oscar
***, **, * indicate significance at the 1%, 5%, 10% levels
using standard error 1/T^0.5

  LAG      ACF          PACF         Q-stat. [p-value]

    1   0.0528        0.0528          0.1285  [0.720]
    2   0.2011        0.1988          2.0367  [0.361]
    3   0.2208        0.2107          4.3958  [0.222]
    4  -0.0966       -0.1595          4.8584  [0.302]
    5  -0.0753       -0.1733          5.1471  [0.398]
    6   0.1358        0.1690          6.1122  [0.411]
    7  -0.0222        0.0998          6.1386  [0.524]
    8   0.1386        0.1208          7.2006  [0.515]

Estimación de un segundo modelo univariante para la serie de popularidad del nombre Óscar

arima 1 1 0 --nc ; FrecuenciaOscar
Function evaluations: 11
Evaluations of gradient: 4

Model 4: ARIMA, using observations 1981-2022 (T = 42)
Estimated using AS 197 (exact ML)
Dependent variable: (1-L) FrecuenciaOscar
Standard errors based on Hessian

             coefficient   std. error     z     p-value 
  ------------------------------------------------------
  phi_1       0.535976      0.129413    4.142   3.45e-05 ***

Mean dependent var   11.14286   S.D. dependent var   166.6352
Mean of innovations  7.336036   S.D. of innovations  138.9468
R-squared            0.961704   Adjusted R-squared   0.961704
Log-likelihood      -266.9966   Akaike criterion     537.9932
Schwarz criterion    541.4685   Hannan-Quinn         539.2670

                        Real  Imaginary    Modulus  Frequency
  -----------------------------------------------------------
  AR
    Root  1           1.8658     0.0000     1.8658     0.0000
  -----------------------------------------------------------
series res2Oscar = $uhat
corrgm res2Oscar
Autocorrelation function for res2Oscar
***, **, * indicate significance at the 1%, 5%, 10% levels
using standard error 1/T^0.5

  LAG      ACF          PACF         Q-stat. [p-value]

    1   0.0027        0.0027          0.0003  [0.986]
    2  -0.0436       -0.0436          0.0881  [0.957]
    3   0.2378        0.2385          2.7683  [0.429]
    4  -0.1974       -0.2158          4.6634  [0.324]
    5  -0.1357       -0.1103          5.5826  [0.349]
    6   0.1327        0.0768          6.4862  [0.371]
    7  -0.0229        0.0634          6.5140  [0.481]
    8   0.1196        0.1581          7.2920  [0.505]

Contraste de cointegración

coint 2 ConsumoPetroleo FrecuenciaOscar --test-down
Step 1: testing for a unit root in ConsumoPetroleo

Augmented Dickey-Fuller test for ConsumoPetroleo
testing down from 2 lags, criterion AIC
sample size 41
unit-root null hypothesis: a = 1

  test with constant 
  including one lag of (1-L)ConsumoPetroleo
  model: (1-L)y = b0 + (a-1)*y(-1) + ... + e
  estimated value of (a - 1): -0.0697783
  test statistic: tau_c(1) = -1.6299
  asymptotic p-value 0.4672
  1st-order autocorrelation coeff. for e: -0.087

Step 2: testing for a unit root in FrecuenciaOscar

Augmented Dickey-Fuller test for FrecuenciaOscar
testing down from 2 lags, criterion AIC
sample size 41
unit-root null hypothesis: a = 1

  test with constant 
  including one lag of (1-L)FrecuenciaOscar
  model: (1-L)y = b0 + (a-1)*y(-1) + ... + e
  estimated value of (a - 1): -0.0550591
  test statistic: tau_c(1) = -1.71873
  asymptotic p-value 0.4218
  1st-order autocorrelation coeff. for e: -0.038

Step 3: cointegrating regression

Cointegrating regression - 
OLS, using observations 1980-2022 (T = 43)
Dependent variable: ConsumoPetroleo

                    coefficient   std. error   t-ratio   p-value 
  ---------------------------------------------------------------
  const             109.882       9.52812       11.53    1.90e-14 ***
  FrecuenciaOscar     0.0900421   0.00375080    24.01    9.21e-26 ***

Mean dependent var   329.9135   S.D. dependent var   65.44053
Sum squared resid    11946.32   S.E. of regression   17.06967
R-squared            0.933581   Adjusted R-squared   0.931961
Log-likelihood      -181.9944   Akaike criterion     367.9888
Schwarz criterion    371.5112   Hannan-Quinn         369.2878
rho                  0.538577   Durbin-Watson        0.872979

Step 4: testing for a unit root in uhat

Augmented Dickey-Fuller test for uhat
testing down from 2 lags, criterion AIC
sample size 42
unit-root null hypothesis: a = 1

  test without constant 
  including 0 lags of (1-L)uhat
  model: (1-L)y = (a-1)*y(-1) + e
  estimated value of (a - 1): -0.461423
  test statistic: tau_c(2) = -3.49843
  asymptotic p-value 0.03258
  1st-order autocorrelation coeff. for e: 0.094

There is evidence for a cointegrating relationship if:
(a) The unit-root hypothesis is not rejected for the individual variables, and
(b) the unit-root hypothesis is rejected for the residuals (uhat) from the 
    cointegrating regression.

Regresión del consumo de petroleo sobre la popularidad del nombre Óscar

Primer modelo

ols ConsumoPetroleo 0 FrecuenciaOscar
modtest --normality --quiet
modtest --white --quiet
modtest --autocorr 1 --quiet
Model 6: OLS, using observations 1980-2022 (T = 43)
Dependent variable: ConsumoPetroleo

                    coefficient   std. error   t-ratio   p-value 
  ---------------------------------------------------------------
  const             109.882       9.52812       11.53    1.90e-14 ***
  FrecuenciaOscar     0.0900421   0.00375080    24.01    9.21e-26 ***

Mean dependent var   329.9135   S.D. dependent var   65.44053
Sum squared resid    11946.32   S.E. of regression   17.06967
R-squared            0.933581   Adjusted R-squared   0.931961
F(1, 41)             576.2946   P-value(F)           9.21e-26
Log-likelihood      -181.9944   Akaike criterion     367.9888
Schwarz criterion    371.5112   Hannan-Quinn         369.2878
rho                  0.538577   Durbin-Watson        0.872979


Test for null hypothesis of normal distribution:
Chi-square(2) = 1.252 with p-value 0.53467


White's test for heteroskedasticity

Test statistic: TR^2 = 6.078609,
with p-value = P(Chi-square(2) > 6.078609) = 0.047868


Breusch-Godfrey test for first-order autocorrelation

Test statistic: LMF = 15.083365,
with p-value = P(F(1,40) > 15.0834) = 0.000377

Alternative statistic: TR^2 = 11.774602,
with p-value = P(Chi-square(1) > 11.7746) = 0.0006

Ljung-Box Q' = 11.8733,
with p-value = P(Chi-square(1) > 11.8733) = 0.000569

Segundo modelo: regresión del consumo de petroleo sobre la popularidad del nombre Óscar con modelo de corrección de error AR1

ar1 ConsumoPetroleo 0 FrecuenciaOscar
modtest --normality --quiet
Performing iterative calculation of rho...

                 ITER       RHO        ESS
                   1      0.53858   8017.53
                   2      0.54713   8016.59
                   3      0.54824   8016.58
                   4      0.54839   8016.57
                   5      0.54841   8016.57

Model 7: Cochrane-Orcutt, using observations 1981-2022 (T = 42)
Dependent variable: ConsumoPetroleo
rho = 0.548406

                    coefficient   std. error    t-ratio   p-value 
  ----------------------------------------------------------------
  const             113.543       17.3686        6.537    8.31e-08 ***
  FrecuenciaOscar     0.0883312    0.00672160   13.14     4.24e-16 ***

Statistics based on the rho-differenced data:

Sum squared resid    8016.575   S.E. of regression   14.15678
R-squared            0.954670   Adjusted R-squared   0.953537
F(1, 40)             172.6961   P-value(F)           4.24e-16
rho                  0.093481   Durbin-Watson        1.760243

Statistics based on the original data:

Mean dependent var   331.5210   S.D. dependent var   65.36890


Test for null hypothesis of normal distribution:
Chi-square(2) = 1.743 with p-value 0.41841

Regresión en primeras diferencias

Primer modelo

diff ConsumoPetroleo FrecuenciaOscar
ols d_ConsumoPetroleo 0 d_FrecuenciaOscar
modtest --normality --quiet
modtest --white --quiet
modtest --autocorr 2 --quiet
Model 8: OLS, using observations 1981-2022 (T = 42)
Dependent variable: d_ConsumoPetroleo

                      coefficient   std. error   t-ratio   p-value 
  -----------------------------------------------------------------
  const                0.302707     2.40604      0.1258    0.9005  
  d_FrecuenciaOscar    0.0644152    0.0145806    4.418     7.40e-05 ***

Mean dependent var   1.020476   S.D. dependent var   18.74413
Sum squared resid    9681.208   S.E. of regression   15.55732
R-squared            0.327929   Adjusted R-squared   0.311127
F(1, 40)             19.51752   P-value(F)           0.000074
Log-likelihood      -173.8411   Akaike criterion     351.6823
Schwarz criterion    355.1576   Hannan-Quinn         352.9561
rho                 -0.041431   Durbin-Watson        2.000828


Test for null hypothesis of normal distribution:
Chi-square(2) = 6.890 with p-value 0.03191


White's test for heteroskedasticity

Test statistic: TR^2 = 2.712262,
with p-value = P(Chi-square(2) > 2.712262) = 0.257656


Breusch-Godfrey test for autocorrelation up to order 2

Test statistic: LMF = 0.162094,
with p-value = P(F(2,38) > 0.162094) = 0.851

Alternative statistic: TR^2 = 0.355283,
with p-value = P(Chi-square(2) > 0.355283) = 0.837

Ljung-Box Q' = 0.314886,
with p-value = P(Chi-square(2) > 0.314886) = 0.854

Segundo modelo: Regresión en primeras diferencias con intervención en el año 2020

Dado que hubo una caída muy acusada en el consumo de petroleo del año 20 debido al confinamiento por la Covid19 (circunstancia que no afectó de manera particular a la popularidad del nombre "Óscar"), el siguiente modelo introduce una variable ficticia para el año 2020 (se introduce en primeras diferencias como el resto de variables del modelo).

diff ConsumoPetroleo FrecuenciaOscar Covid
ols d_ConsumoPetroleo 0 d_FrecuenciaOscar d_Covid
modtest --normality --quiet
modtest --white --quiet
modtest --autocorr 2 --quiet
Model 9: OLS, using observations 1981-2022 (T = 42)
Dependent variable: d_ConsumoPetroleo

                      coefficient   std. error   t-ratio   p-value 
  -----------------------------------------------------------------
  const                 0.320457    2.07979       0.1541   0.8783  
  d_FrecuenciaOscar     0.0628222   0.0126104     4.982    1.33e-05 ***
  d_Covid             -36.2714      9.51424      -3.812    0.0005   ***

Mean dependent var   1.020476   S.D. dependent var   18.74413
Sum squared resid    7052.862   S.E. of regression   13.44777
R-squared            0.510389   Adjusted R-squared   0.485281
F(2, 39)             20.32755   P-value(F)           8.96e-07
Log-likelihood      -167.1893   Akaike criterion     340.3786
Schwarz criterion    345.5917   Hannan-Quinn         342.2894
rho                  0.100646   Durbin-Watson        1.708340


Test for null hypothesis of normal distribution:
Chi-square(2) = 1.097 with p-value 0.57793


White's test for heteroskedasticity

Test statistic: TR^2 = 2.155325,
with p-value = P(Chi-square(4) > 2.155325) = 0.707216


Breusch-Godfrey test for autocorrelation up to order 2

Test statistic: LMF = 0.271314,
with p-value = P(F(2,37) > 0.271314) = 0.764

Alternative statistic: TR^2 = 0.607052,
with p-value = P(Chi-square(2) > 0.607052) = 0.738

Ljung-Box Q' = 0.464447,
with p-value = P(Chi-square(2) > 0.464447) = 0.793

Preguntas

Pregunta 1

Discuta de todas las formas posibles si las series temporales de consumo de petroleo (ConsumoPetroleo) y popularidad del nombre Óscar (FrecuenciaOscar) son estacionarias en media (i.e., son la realización de procesos estocásticos estacionarios), usando para ello los resultados de los apartados Datos en nivel del consumo de petroleo en Grecia, Datos en nivel de la popularidad del nombre Óscar en EEUU y No description for this link.

(Respuesta 1)

Pregunta 2

Discuta si las series temporales ConsumoPetroleo y FrecuenciaOscar están cointegradas, a partir de los resultados del apartado No description for this link.

(Respuesta 2)

Pregunta 3

¿Contradice la No description for this link la posibilidad de que están relacionados el consumo de petroleo en Grecia y la popularidad del nombre de pila Oscar en los EEUU?

(Respuesta 3)

Pregunta 4

Los listados de la Regresión del consumo de petroleo sobre la popularidad del nombre Óscar y la No description for this link muestran los principales resultados obtenidos al estimar por MCO dos modelos de regresión que relacionan las dos variables consideradas en este ejercicio (dichos modelos están referidos como "primeros modelos").

Resuma y comente los resultados de estimación y diagnosis que le parezcan más relevantes de esos dos primeros modelos en niveles y en diferencias.

Si detecta alguna desviación del cumplimiento de las hipótesis habituales, discuta sus consecuencias sobre las propiedades del estimador MCO y sugiera alguna forma de tratarla.

(Respuesta 4)

Pregunta 5

Tanto en el caso de las regresiones en niveles como en el caso de las regresiones en primeras diferencias, también se muestra los resultados de un segundo modelo de regresión.

Explique en cada caso si ese segundo modelo responde a algún posible tratamiento que haya indicado en la pregunta anterior y por qué (o si dicho tratamiento no tiene nada que ver con lo que usted dijo). En cualquier caso, señale (en cada caso) si considera que ese segundo modelo es mejor o peor que el primero, y en qué aspectos.

(Respuesta 5)

Pregunta 6

En la Sección Datos en nivel del consumo de petroleo en Grecia aparecen dos modelos univariantes. Compare los resultados he indique si alguno de ellos es preferible y por qué.

(Respuesta 6)

Pregunta 7

En la Sección Datos en nivel de la popularidad del nombre Óscar en EEUU aparecen dos modelos univariantes. Compare los resultados he indique si alguno de ellos es preferible y por qué.

(Pregunta 7)

Pregunta 8

¿Cuáles de los modelos de más arriba considera aceptables? ¿O qué mejoras sugeriría para ellos?

(Respuesta 8)

Respuestas

Respuesta 1

Ambas series (ConsumoPetroleo y FrecuenciaOscar) parecen ser NO estacionarias en media,

(Pregunta 1)

Respuesta 2

Las conclusiones de las distintas etapas del test de cointegración son:

Etapa 1
El test ADF no rechaza que la serie ConsumoPetroleo sea I(1) para niveles de significación inferiores al 40% (p-valor asintótico 0,4672).
Etapa 2
El test ADF no rechaza que la serie FrecuenciaOscar sea I(1) para niveles de significación inferiores al 40% (p-valor asintótico 0,4218).
Etapa 3
En la regresión (cointegrante) de mortalidad sobre la proporción de matrimonios eclesiásticos ambos parámetros (constante y pendiente) resultan ser muy significativos, y el \(R^2\) está próximo a 1.
Etapa 4
El test ADF rechaza que los residuos de la regresión cointegrante sean I(1) tanto al 10% como al 5% de significación (p-valor asintótico 0,03258)

Consecuentemente, el test NO rechaza la cointegración de ambas series (en contra de lo que sugiere el sentido común).

(Pregunta 2)

Respuesta 3

La relación NO se desvanece al diferenciar los datos para lograr la estacionariedad; que es precisamente lo que cabe esperar cuando la relación existe, pues si \[ \boldsymbol{y}=\beta_1 \boldsymbol{1} + \beta_2 \boldsymbol{x} + \boldsymbol{u} \] Entonces también debe ser cierto que \[ \nabla\boldsymbol{y}= \beta_2 \nabla\boldsymbol{x} + \nabla\boldsymbol{u} \]

Sorprendentemente, en la No description for this link la constante es NO significativa, la pendiente es muy significativa y el \(R^2\) no es, en absoluto, despreciable (R-cuadrado 0,327929). Es decir, la No description for this link no contradice la posibilidad de que ambas variables estén relacionadas.

Comentario y moraleja: Pese a los resultados estadísticos, la relación entre ConsumoPetroleo y FrecuenciaOscar es evidentemente espuria (es imposible argumentar con algún fundamento que la frecuencia del nombre Óscar en EEUU tenga ninguna influencia sobre el consumo de petroleo en Grecia… o viceversa). ¡Ojo con interpretar los resultados estadísticos sin un mínimo espíritu crítico!

(Pregunta 3)

Respuesta 4

Primer modelo para datos en nivel

(Regresión del consumo de petroleo sobre la popularidad del nombre Óscar): Todos los coeficientes son muy significativos. El ajuste del modelo, medido por el valor del \(R^2\) es muy elevado. Los contrastes sobre los residuos no rechazan la hipótesis nula de normalidad, pero si rechazan la hipótesis de homocedasticidad y de ausencia de autocorrelación.

En cuanto a la heterocedasticidad, sería conveniente estimar indicando la opción de desviaciones típicas robustas, pues los p-valores están mal calculados en presencia de heterocedasticidad. Más importante es la presencia de autocorrelación; dado que hay indicios de autocorrelación de orden 1 en los errores de ajuste, sería conveniente estimar el modelo incorporando un modelo AR(1) para el error.

Primer modelo para datos en primeras diferencias

(No description for this link): El único coeficiente significativo es la pendiente (es decir, al diferenciar las series NO ha desaparecido la relación entre ellas), y el ajuste del modelo, medido por el valor del \(R^2\), es superior al 30%. Los contrastes residuales rechazan la hipótesis nula de normalidad, pero no rechazan las de homocedasticidad y ausencia de autocorrelación.

Si las perturbaciones no tienen distribución normal las estimaciones no serán eficientes en el sentido máximo-verosímil (aunque sí en el de Gauss-Markov) y la distribución de los estadísticos habituales será distinta de la teórica bajo el supuesto de normalidad de las perturbaciones (por ejemplo, los estadísticos de la \(t\) no tendrán exactamente una distribución t de student). En la práctica esto no ocasiona un problema grave en general.

(Pregunta 4)

Respuesta 5

Segundo modelo para datos en nivel
(Regresión del consumo de petroleo sobre la popularidad del nombre Óscar): El segundo modelo corresponde a una regresión con modelo AR(1) para el error (tal y como se sugería en la pregunta anterior). La estimación ha convergido en 5 iteraciones, los parámetros son muy significativos y el \(R^2\) ajustado es superior al del primer modelo. Tampoco en este caso se rechaza la hipótesis de normalidad en los residuos del ajuste. Todo ello sugiere que este segundo modelo sería ligeramente superior al primero (si no fuera porque la relación es evidentemente espuria y, por tanto, ninguno de estos modelos es aceptable).
Segundo modelo para datos en primeras diferencias

(No description for this link): El segundo modelo incluye un nuevo regresor para captar la caída de consumo de petroleo del año 2020 debida al confinamiento por la Covid19. Por tanto, esta modificación no tiene nada que ver con lo indicado en la pregunta anterior.

No obstante, este modelo parece superior al primero. Los parámetros correspondientes a d_FrecuenciaOscar y d_Covid son muy significativos, el \(R^2\) ajustado es claramente superior y los criterios de información han mejorado ligeramente (i.e., ahora toman valores más bajos). Además, gracias a la intervención del año atípico 2020, los residuos pasan todos los contrastes (incluido el de normalidad).

(Pregunta 5)

Respuesta 6

El primer modelo es un ARMA(\(1,1\)) con media distinta de cero, y los tres parámetros estimados son muy significativos. El mayor inconveniente es que la raíz autorregresiva es prácticamente \(1\). Dado que hay una fuerte evidencia de que el proceso NO es estacionario en media, es preferible diferenciar la serie e identificar un proceso ARIMA.

El segundo modelo es un ARIMA(1,1,0) con media cero. Su principal ventaja es que el modelo estimado corresponde a un proceso que (una vez diferenciado) es invertible y estacionario (pues no tiene polinomio MA, y el módulo de la raíz AR es 2,9879 \(>1\)).

Pese a que tiene menos parámetros estimados, el ajuste y los criterios de información son ligeramente mejores. Además, los p-valores de los estadísticos Q de Ljung-Box son más elevados en este segundo modelo, por lo que sus residuos tienen una mayor apariencia de "ruido blanco". En resumen, este segundo modelo parece mejor que el primero.

(Pregunta 6)

Respuesta 7

Como en el caso anterior, el primer modelo es un ARMA(\(1,1\)) con media distinta de cero, y los tres parámetros estimados son muy significativos. De nuevo, el mayor inconveniente es que la raíz autorregresiva es prácticamente \(1\). Dado que hay una fuerte evidencia de que el proceso NO es estacionario en media, es preferible diferenciar la serie e identificar un proceso ARIMA.

El segundo modelo es un ARIMA(1,1,0) con media cero. Su principal ventaja es que el modelo estimado corresponde a un proceso que (una vez diferenciado) es invertible y estacionario (pues no tiene polinomio MA, y el módulo de la raíz AR es 1,8658 \(>1\)).

Pese a que tiene menos parámetros estimados, el ajuste y los criterios de información son ligeramente mejores. Además, los p-valores de los estadísticos Q de Ljung-Box son más elevados en este segundo modelo, por lo que sus residuos tienen una mayor apariencia de "ruido blanco". En resumen, este segundo modelo parece mejor que el primero.

(Pregunta 6)

Respuesta 8

En cuanto a los modelos univariantes
Como se ha dicho, para ambas series, el segundo modelo es mejor que el primero. En ambos casos corresponde a un proceso invertible y estacionario, el parámetro estimado es significativo y (según los estadísticos Q de Ljung-Box) los residuos parecen ruido blanco.
En cuanto a los modelos de regresión
Los cuatro modelos intentan modelizar una relación evidentemente espuria: nada tiene que ver la popularidad del nombre Óscar en EEUU con el consumo de petroleo en Grecia. Consecuentemente ninguna de estas regresiones ofrece un modelo aceptable o, siquiera, razonable.

(Pregunta 8)

Created: 2025-11-07 Fri 16:51