Tutorial

Discretizar el tiempo para mejorar el análisis econométrico

Procesar una nueva variable para distinguir los períodos de la crisis financiera de 2008 mejora la relación estadística entre las Tasas Hipotecarias (MR) y la Inflación (IPC).

Gráfico de dispersión que muestra las relaciones entre IPC y MR por fase

Si no hubiéramos distinguido los períodos, tendríamos que concluir que no hay relación entre MR e IPC.

Relación semanal entre IPC y MR

La relación muestra un patrón más similar a un dragón que a cualquier tipo de relación lineal.

Sin embargo, crear una nueva característica no es la única transformación que hemos aplicado a los datos.

Preguntas

  1. ¿Por qué remuestrear el tiempo de semanas a meses mejora el análisis de correlación?
  2. ¿Cuánto mejora la puntuación \(R^2\) después de agregar la característica de período?
  3. ¿Por qué disminuyó la MR cuando el IPC aumentó antes de la crisis?

Datos

Para cada semana entre 2007-06-01 y 2009-06-01, tenemos el Índice de Precios al Consumidor (IPC), también conocido como Inflación, y las Tasas Hipotecarias (MR).

Descarga el dataset y practica con este tutorial.

import pandas as pd

df = pd.read_excel('CPI_MR_2008.xlsx', index_col=0)
df

IPC y MR semanales

El objetivo es medir la influencia del IPC en la MR.

En otras palabras, ¿cuánto aumentará la MR si el IPC aumenta un 1%?

Análisis

Enfoque simple con datos sin procesar

Obviamente, la línea no se ajusta a la relación:

import plotly.express as px

px.scatter(df, x="CPI", y="MR", trendline="ols")

Estimación OLS entre IPC y MR

La puntuación \(R^2\) es 0.287, lo que significa que el modelo explica el 28.7% de la varianza de la MR.

Uno de los problemas es que los datos son demasiado granulares: un punto de datos por cada semana, lo que causa ruido para el modelo.

Remuestrear los datos en períodos más pequeños

Si remuestreamos los datos en meses, la diferencia general de la línea a los puntos de datos (también conocida como los residuos) es menor. Por lo tanto, la puntuación \(R^2\) es mayor: 0.338.

df = df.resample('M').mean()
px.scatter(df, x="CPI", y="MR", trendline="ols")

Estimación OLS mensual entre IPC y MR

Sin embargo, la relación todavía no es lineal porque los puntos de datos no están alineados con la línea.

¿Qué más podemos hacer?

Discretizar los datos en períodos

La crisis financiera de 2008 tuvo 3 períodos.

Por lo tanto, si creamos una nueva característica (columna) para distinguirlos, la relación se vuelve lineal para cada uno.

dates = ['2007-06-01', '2008-01-01', '2008-09-01', '2010-01-01']
dates = pd.to_datetime(dates)

periods = pd.cut(df.index, bins=dates,
    labels=['Antes', 'Durante', 'Después'], right=False)

df['Period'] = periods

px.scatter(df, x="CPI", y="MR",
    trendline="ols", color='Period')

Gráfico de dispersión que muestra las relaciones entre IPC y MR por fase

Ahora que los puntos de datos están alineados:

  1. ¿Cuánto mejora la puntuación \(R^2\)?
  2. Por cada aumento del 1% en el IPC, ¿cuánto aumenta la MR?

Interpretando los resultados de la regresión OLS

En el último modelo que calculamos, la puntuación \(R^2\) fue 0.338. Después de agregar la característica de período, el \(R^2\) varía entre 0.625 y 0.935, entre las 3 fases.

Es curioso que antes de la crisis (2007), por cada aumento del 1% en el IPC, la MR disminuye un 1.84%.

Teóricamente, el IPC debería aumentar la MR porque los bancos centrales aumentan las tasas de interés para controlar la inflación. Por lo tanto, la MR también debería aumentar.

Sin embargo, los desequilibrios financieros globales y las prácticas de préstamos agresivas durante un mercado inmobiliario en auge, hicieron que la MR disminuyera.

Una vez que comenzó la crisis, el IPC y la MR empezaron a aumentar juntos.

df_result = (px
 .get_trendline_results(fig)
 .set_index('Period')
 )

for period, row in df_result.iterrows():
    result = row['px_fit_results']
    summary = result.summary(
        yname='Mortgage Rate',
        xname=['Intercept', 'Inflation'],
        slim=True
    )

    print(summary)

Resultados OLS de IPC vs MR por período

Conclusión

  1. Remuestrear los datos de semanas a meses mejora el análisis de correlación.
  2. Discretizar los datos en períodos mejora el análisis de correlación aún más.
  3. El IPC y la MR están correlacionados positivamente, excepto durante el período anterior a la crisis.

Suscríbete a nuestro newsletter

Recibe insights semanales sobre datos, automatización e IA.

© 2025 Datons. All rights reserved.