Mis notas para esta página:

Fundamentos de estadística: ¿Cómo se pueden presentar los resultados de una manera significativa?

Diapositiva 0

Muy buenos días o muy buenas tardes para ustedes, bienvenidas y bienvenidos. Hoy volvemos a hablar de matemáticas y, en concreto, de cómo presentar los datos de forma que tengan el mayor sentido posible para los lectores. Y también hablaremos de cómo no hacerlo. Las representaciones no sólo pueden ser desfavorables, sino también deliberadamente manipuladoras.

Diapositiva 1

Este es el objetivo: queremos presentar los resultados de las observaciones estadísticas de forma que se capte el núcleo de la afirmación que hacen los datos. Por supuesto, queremos hacerlo lo mejor posible y, sobre todo, mantener bajo el riesgo de malas interpretaciones. Además, los datos deben prepararse de forma adecuada para el grupo objetivo y deben entenderse lo mejor posible.

Diapositiva 2

Está claro que primero se necesitan datos. Si sólo lo tiene en una tabla o algo así, entonces es una lista original.

Puede ver dos ejemplos aquí. Está la elección del presidente o representante de la clase, que tratamos en un episodio anterior. La hoja de recuento con los resultados es la lista original aquí. También puede ver aquí – conocido de un episodio anterior – los resultados de 100 lanzamientos de un dado normal. Esta tabla con los resultados no procesados es la lista original.

Diapositiva 3

Veamos otro ejemplo, el de los idiomas más hablados del mundo. En esta tabla se puede ver, para seis lenguas, el número estimado de hablantes nativos y de segundo idioma en millones.

De acuerdo, sólo las cinco primeras son realmente los idiomas más hablados del mundo. Pensé que las cifras del idioma alemán podrían ser interesantes, aunque sólo ocupa el duodécimo lugar en esta lista con ciento treinta y dos millones de hablantes.

Los dos primeros puestos los ocupan el inglés y el mandarín, cada uno con más de 1.000.000.000 de hablantes. El tercer puesto es para el hindi, con 637.000.000 de hablantes, y el cuarto para el español, con 538.000.000 de hablantes. El francés le sigue en quinto lugar, con 280.000.000 de hablantes activos.

Por cierto, una segunda lengua es diferente de una lengua extranjera. Hablamos aquí de hablantes de segunda lengua cuando un idioma es vital en el uso diario, por ejemplo, una lengua oficial en un país como lo es el inglés en la India.

Si sólo ordenamos por hablantes nativos, el mandarín ocupa el primer lugar, el español el segundo y el inglés sólo el tercero.

Diapositiva 4

El gráfico de barras suele ser el tipo de representación más sencillo. En este ejemplo, introducimos las lenguas individuales en el eje x y elegimos una etiqueta con números en el eje y. Aquí va de zero a 1.400.000.000, porque tenemos que tener suficiente espacio hacia arriba.

Cada barra permite inmediatamente una interpretación aproximada del número de hablantes y, sobre todo, de la clasificación relativa de los resultados.

Diapositiva 5

Por cierto, siempre es importante tener en cuenta qué representación es realmente adecuada. Un gráfico circular, por ejemplo, es menos útil en este caso.

Muestra bastante bien las proporciones entre las lenguas. Pero sugiere, por un lado, que los datos son completos. Eso no es cierto, porque hay muchas más lenguas en el mundo y muchas más personas que no hablan una de ellas.

Además, se tiene la impresión de que cada persona es considerada aquí exactamente una vez. Tampoco es el caso, ya que muchas personas en la India, por ejemplo, pueden comunicarse igualmente bien en hindi e inglés.

Diapositiva 6

Pero incluso con el simple gráfico de barras, se aconseja precaución. ¿Nota algo? De alguna manera, las proporciones parecen haberse desviado. ¿Ve por qué es así?

Diapositiva 7

Sencillamente, el eje del lado izquierdo no empieza en 0, como lo hace en el diagrama del lado derecho, que ya conoce por la diapositiva 4. En consecuencia, las cuotas del alemán, en particular, pero también del francés, parecen ser significativamente menores.

Preste atención a esto, esta representación se encuentra a menudo en las publicaciones y puede ser engañosa a la hora de interpretar los datos.

Diapositiva 8

Otro gráfico de barras: sólo los idiomas con menor número de hablantes se han puesto claramente al tanto de la situación. Esto se debe a la escala logarítmica del eje y.

La distancia entre 1 y 1000 es tres veces mayor que la distancia entre 1 y 10 y la distancia entre 1 y 100 es dos veces mayor que la distancia entre 1 y 10.

Lo sé, no es fácil. Pero es un poco más fácil entender el principio si se expresa con la ayuda de potencias: La distancia entre 1 = 100 y 1000 = 10³ es aquí tres veces mayor que la distancia entre 1 = 100 y 10 = 101 y la distancia entre 1 = 100 y 100 = 102 es dos veces mayor que la distancia entre 1 = 100 y 10 = 101 .

En la representación lineal que todos conocemos de los primeros días de escuela y también de la diapositiva 4, la distancia entre 0 y 100 es, por supuesto, 10 veces mayor que la distancia entre 0 y 10. Estamos muy acostumbrados a esta forma de ver las cosas.

Por lo tanto, no siempre reconocemos las representaciones logarítmicas a primera vista. Hay que tener cuidado para interpretar correctamente los datos presentados en una escala logarítmica.

Diapositiva 9

Se lanzan los dados. El gráfico muestra la evolución de la frecuencia relativa de lanzar un 6 en el transcurso de 1250 intentos. ¿Se acuerda? Aquí hemos utilizado el generador de números aleatorios de un ordenador. Luego está la lista original, que no se presta a una diapositiva con una secuencia de 1250 números entre el 1 y el 6. Comienza con 6, 4, 5 ,4 ,2 1, 4 y termina con 2, 4, 1, 3, 2 4, 4. Y nos ahorraremos el resto. Importante: Por supuesto, incluso en este caso, debe haber datos concretos.

Diapositiva 10

El último ejemplo de hoy se refiere al consumo de arroz en determinadas regiones, a saber, Europa, América del Norte, África, América Latina y Asia con la región del Pacífico. El consumo per cápita por año difiere significativamente. Mientras que el consumo en Europa y América del Norte es bastante bajo, con 4,6 kg y 12,5 kg respectivamente, es mucho mayor en África, con 25,1 kg, y en América Latina, con 29,3 kg. El líder es Asia/Pacífico con casi 85 kg per cápita.

Pongamos estos datos en un gráfico.

Diapositiva 11

Está claro que el gráfico de barras también es una buena opción en este caso. Ofrece una buena idea del estado de cosas.

Ahora bien, a veces se ven en la prensa bonitas imágenes que pretenden ilustrar los datos y sus relaciones utilizando las proporciones adecuadas. En la siguiente diapositiva vemos un ejemplo.

Diapositiva 12

¿Qué le parece la representación? ¿Qué sugiere?

Ahora bien, lo que se ha hecho aquí, no ocurre tan raramente. Si comparamos Europa y América del Norte, por ejemplo, estas regiones se diferencian por un factor de aproximadamente 3, es decir, en América del Norte se consume una cantidad de arroz aproximadamente tres veces más grande. Puede ver este triple aquí, tanto en el eje equis como en el eje y griega, por lo que las imágenes difieren en un factor de 3 • 3 = 9, lo que sugiere diferencias mucho mayores. El factor 2 entre América del Norte y África se convierte en un factor percibido de 2 • 2 = 4. Incluso la diferencia no tan grande entre el consumo en África y América Latina se hace claramente visible.

¿Y qué pasa con Asia? Ya no cabe en la diapositiva.

Diapositiva 13

En la comparación entre América Latina y Asia, 3 veces se convierte en 3 • 3 = 9 veces.

Así que preste mucha atención cuando le ofrezcan representaciones de datos. En caso de duda, pida la lista original.

Diapositiva 14

Eso fue todo por hoy. Gracias por acompañarme y hasta la próxima.