Mis notas para esta página:

Mentir con las estadísticas: ¿Es realmente posible? Y si es así ¿cómo?

Diapositiva 0

Hola y bienvenidos a todos y todas. Hoy vamos a analizar si las estadísticas pueden utilizarse para mentir y cómo. Tal vez la palabra "mentira" sea demasiado dura. Pero el hecho es que no es raro encontrarse con representaciones o interpretaciones de los datos empíricos que nos atraen hacia un determinado punto de vista. Pero abordemos el problema -como siempre- paso a paso.

Diapositiva 1

Estadística. Esto incluye siempre la forma correcta de tratar las estadísticas. No es fácil, porque las cosas pueden describirse, destacarse, presentarse e interpretarse de muchas maneras diferentes. A veces esto puede ser caprichoso, a veces no tiene sentido y a veces incluso puede ser visto como una mentira.

Vamos. Veamos algunos ejemplos. Nos fijaremos en tres áreas que pueden servir de ejemplo.

Diapositiva 2

Empecemos con los números absolutos y relativos.

Esa es precisamente la idea: Es indispensable incluir no sólo los valores relativos sino también los números absolutos en la evaluación coherente de una situación.

Diapositiva 3

El siguiente ejemplo procede de un trabajo del psicólogo Gerd Gigerenzer y sus colegas y se basa en un incidente real. En 1995, una autoridad británica advirtió que un determinado fármaco duplicaba la probabilidad de que se formaran coágulos en los pulmones o las piernas.

Eso suena a miedo, sin duda.

Diapositiva 4

¿Qué le parece? ¿No debería retirarse inmediatamente del mercado un medicamento así?

Diapositiva 5

Veamos de cerca las cifras.

Por cada 7.000 personas, una persona que no tomó el fármaco desarrolló un coágulo de sangre. Por cada 7.000 personas que tomaron el fármaco, dos desarrollaron un coágulo de sangre.

Diapositiva 6

Sin duda, se trata de un aumento, pero las cifras relativas parecen más aterradoras. La diferencia relativa es del 100%, la absoluta de una persona, por supuesto en relación a 7000 personas.

Diapositiva 7

Las cifras absolutas y las relativas pueden enviar mensajes diferentes, y eso es lo que vamos a ver.

Juguemos con los números. Supongamos - para ponérnoslo fácil - 1000 personas y un aumento del 100%.

Entonces

1 persona se convierte en 2 personas

10 personas se convierten en 20 personas

100 personas se convierten en 200 personas

Si son pequeños en términos absolutos, es obvio que una duplicación no es aterradora. Una persona entre mil no es mucho y dos tampoco. Si son grandes, la impresión es muy diferente.

Diapositiva 8

Juguemos de nuevo con los números. Supongamos de nuevo 1000 personas y esta vez un aumento de 1 persona.

Entonces

1 persona se convierte en 2 personas – son 100%

10 personas se convierten en 11 personas – son 10%

100 personas se convierten en 101 personas – es solamente 1%

Una vez más: una persona entre mil no es mucho y dos tampoco. Si son pequeños en términos absolutos, entonces este aumento parece muy grande y básicamente entonces desproporcionado.

Diapositiva 9

Los valores medios también pueden tratarse de diferentes maneras. En particular, diferentes valores medios, como la mediana y la media aritmética, pueden dar lugar a indicaciones muy diferentes.

Ilustrémoslo también con un ejemplo.

Diapositiva 10

Según un informe del sitio web www.capital.de, los trabajadores en Alemania ganaron una media de 43.200 euros en 2020.

El sitio web muestra que -también en 2020- los trabajadores en Alemania ganaban una media de 3.975 euros al mes (empleo a tiempo completo).

Si se calcula con 12 sueldos y medio anuales, esto supone unos ingresos anuales de 12,5 • 3.975 Euro ≈ 49.700 Euro.

Obviamente, las dos cifras no son idénticas, sino que difieren en unos 6500 euros.

Diapositiva 11

¿De dónde viene la discrepancia? Eso es muy difícil de juzgar. Por ejemplo, podría deberse a que en ambos casos no se tienen en cuenta sólo los empleados a tiempo completo.

Sin embargo, es plausible que el valor declarado de 49.700 euros sea la media aritmética de los salarios, y no su mediana como en el caso de los 43.200 euros.

¿Por qué?

Pues los empleados que ganan mucho hacen subir la media aritmética.

Y aquí, también, un ejemplo ayuda a comprender este hecho.

Diapositiva 12

Echamos un vistazo a Llenería, una pequeña ciudad con exactamente 1.000 habitantes activos. Hay una característica especial: todos los habitantes ganan la misma cantidad. Para ser exactos, ganan 1.000 euros al año. No es mucho, pero hace que sea mucho más fácil de calcular.

Ahora la señora Muyrica ha decidido trasladarse a Llenería. Tiene un sueldo anual de 1.000.000 de euros. Y lleva el movimiento a la media aritmética, es decir, a los ingresos medios así determinados.

Como todos ganaban la misma cantidad, la media aritmética era anteriormente de 1.000 euros.

La media aritmética posterior se calcula a partir de 1.000 • 1.000, es decir, los ingresos de los 1.000 habitantes anteriores, y que son 1.000.000.000. A esto hay que añadir el millón ganado por la señora Muyrica. 1.000.000.000 + 1.000.000.000 = 2.000.000.000, divididos por el número de habitantes 1001 se obtienen unos 1,998 euros.

La mediana, en cambio, no está impresionada, es el antes y el después: 1.000 €.

Diapositiva 13

La página web gehalt.de tiene en cuenta ambos valores para 2020, es decir, la media aritmética y la mediana. Además, aquí se mencionan dos valores, que se denominan Q1 y Q3 y que se llaman cuartiles.

Diapositiva 14

Claramente, la media aquí es la media aritmética.

La mediana es el valor que marca el 50%. El 50% de cada uno de los salarios está por debajo y por encima de este valor.

El Q1 denota el primer cuartil, el cuarto inferior, por así decirlo: el 25% de los salarios están por debajo de este valor.

Q3 denota el tercer cuartil y, por tanto, el cuarto superior: el 75% de los salarios están por debajo de este valor, es decir, el 25% por encima.

Sólo para completar la información: las estadísticas dividen los datos en tres cuartiles. El que falta aquí se llama Q2 o segundo cuartil. Comprende - no es de extrañar - el 50% medio.

Diapositiva 15

Por último, queremos tratar de nuevo las representaciones.

Ya hemos hablado de esto antes: Se pueden elegir las representaciones de tal manera que se lleve el mensaje de los datos (al menos para los observadores no muy atentos) en la dirección deseada.

¿Recuerda el consumo de arroz en las distintas regiones? Volvamos a ver ese ejemplo.

Diapositiva 16

Este es un gráfico de barras para el consumo de arroz per cápita y por año en kg. En África se consumen unos 25 kg, en América Latina unos 29 kg y en Asia y el Pacífico algo menos de 85 kg per cápita y año. Aquí se pueden leer muy bien las cifras y también ver las proporciones de un vistazo. América Latina se sitúa ligeramente por delante de África, mientras que Asia y el Pacífico se sitúan aproximadamente tres veces por detrás.

Diapositiva 17

Y esta diapositiva también la conozca más o menos ya. Si se traza el valor del consumo en el eje x y en el eje y, el resultado es un cuadrado. La diferencia lineal se convierte - al menos percibida - en una diferencia cuadrática, es decir, el factor 3 se convierte en el factor 9 percibido.

Como he dicho, ya lo tuvimos en un episodio anterior, el gráfico de barras también. Derivemos nuevas representaciones de ella.

Diapositiva 18

Este es un gráfico de barras una vez más. Las cifras no han cambiado, se pueden leer en el eje Y. Sin duda, la impresión ha cambiado. Parece que Asia y el Pacífico siguen consumiendo bastante más que África o América Latina. La razón es sencilla: el etiquetado en el eje Y comienza en 20 y no en 0. Las columnas expresan las proporciones como no correctas.

Europa, con un consumo de arroz de 4,6 kg per cápita y año, y América del Norte, con 12,5 kg, habrían desaparecido por completo, razón por la que no las incluí en el primer diagrama.

Diapositiva 19

Se vuelve realmente espeluznante cuando se mezclan las dos representaciones. Y ya ves, se crea una impresión que poco tiene que ver con los hechos. Sin embargo, todavía se pueden leer las cifras correctas en el eje Y. Así que no es una mentira, sino que está bastante manipulado. Y créanme, pueden encontrar representaciones como ésta en los medios de comunicación.

Diapositiva 20

Una conclusión breve: Las estadísticas se han convertido en la base de muchas decisiones en el mundo actual.

Pero las estadísticas también son a menudo malinterpretadas o deliberadamente engañosas. La única posibilidad: hay que cuestionar críticamente (pero no, en general, con suspicacia) los datos, su significado y sus limitaciones, así como su presentación.

Diapositiva 21

Muchas gracias por su atención. Este ha sido el vigésimo episodio de nuestras conversaciones sobre matemáticas y también el último del nivel avanzado. Espero volver a verlo en el próximo episodio. Entonces ya se tratará de conocimientos en estadística y probabilidad para profesionales. ¡Hasta la próxima!