Estadística y manipulación: el uso engañoso de la media

Ansgar Seyfferth (@ASeyfferth)

Presumir de sus controvertidas rebajas fiscales se ha convertido en una seña de identidad de la Comunidad de Madrid. A menudo, sobre todo en época electoral, nos llegan afirmaciones sobre lo que se ahorra “cada madrileño” gracias a ellas. Recientemente un titular lo cifró en 557 euros anuales, y en octubre la presidenta de la Comunidad lo elevó a 6.700 euros durante todos los años de su gobierno. Al margen de la veracidad de los números concretos –y de lo caro que el supuesto ahorro puede salir si implica la degradación de servicios públicos tan esenciales como la sanidad– es obvio que ese tipo de afirmaciones son falsas. Lo que se ahorra “cada madrileño” depende, y mucho, de los impuestos que paga, que a su vez dependen de sus circunstancias económicas. Se omite que en todo caso se trata de lo que de media se ahorra cada (contribuyente) madrileño. Y esto no es una matización quisquillosa, porque estamos ante un caso de manual donde la media aritmética se desvía mucho de la realidad de la mayoría de la población, de modo que no es representativa. Y aquí lo es menos aún, al mezclarse diferentes tipos de impuestos, algunos de los cuales solo afectan a una pequeña minoría de contribuyentes.

Antes de repasarlo más detenidamente, conviene aclarar algunas propiedades de la media aritmética, para ver en qué circunstancias hay que tener una especial cautela en su interpretación. Suelo comentar en mis clases una anécdota de Avinyonet del Penedès, un pueblo agrícola de unos 1.700 habitantes en la provincia de Barcelona, cuya renta bruta media se disparó en 2017 hasta casi 58 mil euros, la segunda mayor de todos los municipios españoles mayores de 1.000 habitantes aquel año, más que duplicando los valores de 2016 y de 2018. Aplicando la lógica de los citados titulares, habría que concluir que cada vecino ingresó más del doble en 2017, pero estaríamos muy equivocados. Recuérdese que la media es lo que tocaría a cada declarante si la renta agregada de todos ellos se repartiera a partes iguales. Pues debido al empadronamiento temporal en el municipio de una persona extremadamente rica, nieto del fundador de la empresa Danone, esa renta agregada se disparó lo suficiente para subir la media de una manera que ya poco tenía que ver con la realidad de la mayoría de los declarantes. 

Compárese esto con el impacto que tendría el empadronamiento de una persona gigante en la altura media de los habitantes del pueblo. Ni tratándose de la persona más alta del mundo podría alterar notablemente la media, porque todas las estaturas son del mismo orden de magnitud. Se trata de una variable mucho más acotada, físicamente restringida, lo que da una mayor robustez a su media. La gran volatilidad de la media observada en el ejemplo anterior, con un gran desvío causado por un solo valor extremo, es una característica propia de las variables cuya magnitud puede variar enormemente, y que el ensayista y estadístico Nassim Taleb llama escalables. La renta, el patrimonio, los impuestos que uno paga o el tamaño poblacional de los municipios son algunos ejemplos.

Las variables de este tipo suelen caracterizarse además por una marcada asimetría, muy relevante para la interpretación de la media. Se observa en el siguiente gráfico de la distribución salarial española de 2020, que indica cómo de frecuente fue cada salario aquel año. Muestra una concentración de la mayoría de los asalariados en la parte de la izquierda, en salarios relativamente modestos. Hacia la izquierda la curva decae de forma brusca, ya que los salarios están acotados por abajo, dado que no pueden ser negativos. No lo están en cambio hacia arriba, dada la escalabilidad, lo que da lugar a una prolongadísima cola hacia la derecha (que sería más pronunciada aún si se consideraran también otros tipos de ingresos, no salariales). Pero la representación gráfica hay que cortarla en un determinado punto, cosa que aquí se hace en 100.000 euros, y el repunte final refleja la frecuencia acumulada de todos los salarios superiores a esa cantidad.

Si lo dibujáramos sobre cartón y recortáramos el área entre el eje horizontal y la curva, la media sería el punto de equilibrio en el eje donde podríamos balancear el área recortada, es decir, el centro de gravedad de la distribución. Debido a la ley de la palanca, la larga cola de la derecha, correspondiente a esa pequeña minoría de valores extremadamente altos, desvía este punto notablemente hacia la derecha, alejándolo de la mayoría, situada en el lado de la izquierda. Por ello la media deja la mayor parte del área debajo de la curva a su izquierda, lo cual quiere decir que la mayoría de los asalariados gana menos que el salario medio. Por tanto, la media es superior al valor más central de la distribución, denominado mediana, que divide el área debajo de la curva en dos partes iguales, con la mitad de los asalariados ganando menos y la mitad ganando más. Y más aún se aleja del salario más frecuente, denominado moda, para el que la curva alcanza su máximo. (En cambio, en una distribución simétrica, con una forma parecida a la campana de Gauss, estas tres medidas de tendencia central serían idénticas, situadas todas en el eje de simetría de la curva.)

Volviendo a las rebajas fiscales de la Comunidad de Madrid, aquí este efecto es todavía más pronunciado, debido a un peso mayor aún de los valores extremos, y acentuado además por una trampa. Los supuestos 6.700 euros de ahorro de cada madrileño durante el mandato de Díaz Ayuso son el resultado de dividir los más de 23.000 millones de euros que según datos facilitados por la Comunidad se dejaron de ingresar entre 2019 y 2022, entre los aproximadamente 3,5 millones de declarantes del impuesto sobre la renta de las personas físicas (IRPF) en la región en 2020. Pero según los propios datos de la Comunidad, menos de la sexta parte de ese importe se debe a rebajas del IRPF. El grueso se lo llevan las bonificaciones de los impuestos sobre el patrimonio, y sobre sucesiones y donaciones. Veamos el ejemplo del impuesto sobre el patrimonio de 2020, en el que 18.225 habitantes ricos de la región se ahorraron unos 992 millones de euros en total, más de 54.400 euros de media cada uno, solo en 2020, mientras para los demás el ahorro fue obviamente 0, ya que a la inmensa mayoría ese impuesto no le afecta. No obstante, a efectos del relato, esos 992 millones de euros se dividen igualmente entre los 3,5 millones de declarantes de IRPF para sumar un ahorro de unos 280 euros de “cada madrileño”. Con este razonamiento podríamos contabilizar la masa salarial de 242 millones de euros anuales de la plantilla de fútbol del Real Madrid como un ingreso de unos 70 euros anuales de cada declarante madrileño. 

Aun limitándonos a las rebajas del IRPF –que según estimaciones de la Comunidad de Madrid ascienden a 1.177 millones en 2022–, la mayoría se ahorra bastante menos que esa media, mientras una pequeña minoría se ahorra muchísimo más

Pero aun limitándonos a las rebajas del IRPF –que según las estimaciones de la Comunidad ascienden a 1.177 millones de euros en 2022, lo que (con el número de declarantes de 2020) da una rebaja media de unos 334 euros anuales por declarante– otra vez más estamos ante el mismo patrón: la mayoría se ahorra bastante menos que esa media, mientras que una pequeña minoría se ahorra muchísimo más, como puede comprobarse con la calculadora IRPF de la Comunidad. Lo haremos con el ejemplo de un contribuyente de 40 años con dos hijos (menores de 25 pero mayores de 3 años), en declaración individual. Con unos ingresos brutos anuales de 1 millón de euros, se beneficiaría de una rebaja anual de más de 33.000 euros, multiplicando casi por 100 la rebaja media de 334 euros. En cambio, ganando el salario medio madrileño de 2020, que no llega a 29.000 euros, su rebaja ya se sitúa notablemente por debajo de la media, en unos 250 euros. Pero tal como vimos, la mayoría de los asalariados gana menos que el salario medio. Con el salario mediano, de unos 23.200 euros, el ahorro anual se queda en unos 150 euros. Y con el salario más frecuente (a nivel nacional, ya que para la moda no hay datos publicados por Comunidades Autónomas), de algo menos de 18.500 euros, el ahorro ya ni llega a 73 euros, poco más de 6 euros mensuales. La calculadora, que también compara con la carga fiscal en las demás Comunidades Autónomas, revela que este último perfil de contribuyente paga de hecho más en Madrid que en algunas otras Comunidades, entre ellas la Valenciana, tachada a veces de “infierno fiscal”, ya que es donde más tributan las rentas más altas.

____________________

Ansgar Seyfferth es director para España de la empresa STAT-UP Statistical Consulting & Data Science Services, profesor de estadística y de visualización de datos, y colaborador de la Fundación Alternativas

Más sobre este tema
stats