La paradoja Bloom-Rodoreda Julia Montejo
Los datos son fundamentales para entender nuestro mundo cada vez más complejo y muchos de ellos tienen un orden cronológico, describiendo una evolución temporal. Este tipo de datos tiene sus particularidades. Tal como veremos, a menudo son el resultado de una superposición de diferentes patrones, que a veces hay que despiezar para poder sacar algo en claro mediante su visualización.
Recientemente el INE actualizó la estadística sobre transporte ferroviario en España con los datos del tercer trimestre de este año. Consultando y visualizando en su web la evolución trimestral de los viajeros transportados, se observa una tendencia al alza, interrumpida por el descalabro de la pandemia de COVID-19, así como un claro patrón que se repite anualmente, caracterizado por un menor número en el tercer trimestre de cada año:
Viajeros ferroviarios transportados por trimestre en España
Dado que el tercer trimestre del año es el en que se centra la mayor parte de las vacaciones, como explicación se perfila un descenso en los desplazamientos al trabajo, sobre todo en trenes de cercanías, que pesa más que el aumento de los viajes en trenes de largo recorrido a los destinos vacacionales.
Estas variaciones periódicas y predecibles se conocen como estacionalidad. Están presentes en muchas series temporales y aunque el término alude a las estaciones del año, la periodicidad también puede ser otra. Si tuviéramos datos diarios del número de viajeros, seguramente observaríamos también una clara estacionalidad semanal, con marcados descensos los fines de semana. De igual modo, con datos horarios afloraría una estacionalidad diaria, con picos en las horas punta de mañana y tarde.
La estacionalidad no debe confundirse con las variaciones cíclicas, que carecen de una periodicidad fija y que suelen ser muchos más difíciles de predecir. Un ejemplo son los ciclos económicos de crecimiento, estancamiento o recesión, que se ven reflejados en la evolución de muchos indicadores socioeconómicos. En el caso de los viajeros transportados, la pandemia marca un claro ciclo extraordinario.
Frecuentemente nuestro interés se centra en estos ciclos, si es que los hay, así como en una posible tendencia, que se refiere a la evolución a largo plazo, más que en la estacionalidad, que sigue unos patrones bien conocidos. Siendo así, la estacionalidad incluso puede ser un estorbo, al ofuscar los otros patrones, sobre todo si es más pronunciada que los cambios de un año a otro. En nuestro gráfico, el ciclo pandémico con su desplome y posterior rebote salta a la vista, pero el resto de la evolución está dominado por la estacionalidad.
Por eso existen técnicas de desestacionalización de series temporales, que pretenden eliminar su componente estacional. Por ejemplo, en noviembre el empleo en España bajó ligeramente, pero como en ese mes suele disminuir bastante más, en términos desestacionalizados supuso una subida.
También hay una forma más básica de eliminar las variaciones estacionales, al alcance de cualquiera que sepa manejar una hoja de cálculo. Si tomamos en cada trimestre no solo el número de viajeros transportados en ese mismo trimestre sino también en los tres anteriores, es decir, la suma de viajeros transportados en los últimos cuatro trimestres, cada dato abarca los cuatro tipos de trimestre, con lo que se neutraliza la estacionalidad. Por ejemplo, el dato correspondiente al tercer trimestre de 2025 sería la suma del cuarto trimestre de 2024 y de los primeros tres de 2025.
Los datos son fundamentales para entender nuestro mundo cada vez más complejo. A menudo son el resultado de una superposición de diferentes patrones, que a veces hay que despiezar para poder sacar algo en claro mediante su visualización
La incidencia acumulada de siete días de COVID-19 que se publicaba a diario durante la pandemia seguía este método. En este caso se sumaban cada día los casos detectados por cada 100.000 habitantes de los últimos siete días, para eliminar la estacionalidad semanal causada fundamentalmente por la menor actividad diagnóstica los fines de semana.
También lo apliqué en un reciente artículo en este periódico sobre la evolución de la cara más terrible de la violencia de género en España, sumando para cada mes las víctimas mortales por cada millón de mujeres de los últimos doce meses. Volveremos a ello un poco más adelante.
Lo que ocurre es que, al tomar la suma, cambian las magnitudes de los valores. En el caso de los números de viajeros, ya no se corresponden con trimestres sino con periodos de un año de duración. Si queremos conservar los periodos de referencia originales, podemos agregar los datos tomando la media aritmética en lugar de la suma, o, que es lo mismo, dividir la suma entre el número de datos sumados, es decir, entre cuatro en este caso.
Esta técnica se conoce como media móvil, ya que el intervalo temporal sobre el que se toma la media se va moviendo de un periodo a otro. El siguiente gráfico muestra el resultado para la evolución de los viajeros. Tomando en cada trimestre la media móvil de los últimos cuatro trimestres, la serie desestacionalizada tendría un retardo frente a la serie original, por lo que en su lugar he usado la media móvil central, basada en datos anteriores y posteriores (véase la nota al final del artículo para los detalles).
Obtenemos una curva muy suavizada que nos permite ver con más claridad la evolución a medio y largo plazo, con la reciente ralentización del crecimiento tras la recuperación pospandémica. Eso sí, la agregación suaviza todas las variaciones de corto plazo, no solo las estacionales, cosa que se hace muy evidente en el ciclo pandémico. Su repentina caída queda sustituida por un descenso más repartido, lo que puede dar una visión distorsionada de la realidad.
No obstante, en muchos otros casos esta suavización de todo tipo de oscilaciones de corto plazo puede ser un efecto deseado. Y es que aparte de los ya mencionados patrones (tendencia, ciclos y estacionalidad), las series temporales suelen contar con una componente irregular que se considera aleatoria por lo que carece de interés. Tiende a disminuir con la magnitud de los números de la serie original, por lo que no es apreciable en los gráficos anteriores, donde los viajeros trimestrales se cuentan por decenas de millones.
Pero si lo es en el siguiente gráfico, basado en mi mencionado artículo sobre la evolución de los asesinatos machistas. Los números mensuales de la serie histórica oscilan de forma errática (entre 0 y 11), eclipsando totalmente cualquier patrón de la evolución. Aun con la agregación de los datos de doce meses en el gráfico sigue siendo muy notorio, si bien se modera lo suficiente para vislumbrar la (dolorosamente lenta) tendencia a la baja. Esta imprescindible suavización de las enormes oscilaciones aleatorias es el principal beneficio de la agregación en este caso, por encima de la eliminación de la estacionalidad.
Nota sobre la media móvil central: En el caso de datos diarios con estacionalidad semanal, en lugar de tomar para cada día la media de los últimos 7, se toma la de los 3 días previos, del propio día al que se refiere el dato, y de los tres 3 posteriores. De esta forma el día de referencia siempre está en el centro del intervalo sobre el que se toma la media.
Si el número de datos a promediar es par, como en el caso de los 4 trimestres o los 12 meses del año, hay que modificar el procedimiento para conseguir esta centralidad. Por ejemplo, para el segundo trimestre de 2024 se incluiría en la media también el primer y el tercer trimestre, y el cuarto valor que entra sería la media entre los valores de los cuartos trimestres de 2023 y de 2024, ya que ambos están a la misma distancia del trimestre de referencia.
Dado que en la media móvil central entran datos anteriores y posteriores, no puede calcularse para los primeros y los últimos dos trimestres de la serie temporal, al igual que en el caso anterior no se puede calcular para los primeros y los últimos tres días.
____________________
Ansgar Seyfferth es director para España de la empresa alemana STAT-UP Statistical Consulting & Data Science Services, profesor de estadística y de gestión y visualización de datos, y colaborador de la Fundación Alternativas.
Lo más...
Lo más...
LeídoTu cita diaria con el periodismo que importa. Un avance exclusivo de las informaciones y opiniones que marcarán la agenda del día, seleccionado por la dirección de infoLibre.
Quiero recibirlaAna María Shua y su 'Cuerpo roto'
Doña María Moliner: 'Hasta que empieza a brillar'
Cartas de Maruja Mallo
¡Hola, !
Gracias por sumarte. Ahora formas parte de la comunidad de infoLibre que hace posible un periodismo de investigación riguroso y honesto.
En tu perfil puedes elegir qué boletines recibir, modificar tus datos personales y tu cuota.