Diapositiva 0
Hola a todas y todos, bienvenidas y bienvenidos a este episodio. Hoy hablaremos de dos conceptos importantes en estadística a saber, la frecuencia absoluta y la frecuencia relativa. Además, vamos a aprender sobre las diferentes representaciones de datos y echar un vistazo a otro concepto básico.
Volveremos a probar algunos experimentos con los que hemos trabajado en episodios anteriores. Esta es una propuesta que también puede aplicarse en la escuela: Utilizar más de una vez las buenas ideas.
Diapositiva 1
Lancemos un dado una vez más. Lancémoslo diez veces, cien veces, mil veces.
Lo que se ve en la tabla, son los resultados. Son números que indican cuantas veces se lanzó un número determinado entre el 1 y el 6. En lugar de “cuantas veces” decimos “frecuencia” y hablamos de la frecuencia absoluta de los resultados 1, 2, 3, 4, 5 o 6.
Diapositiva 2
Si se quiere determinar las proporciones de los resultados individuales, obviamente es útil dividir las frecuencias absolutas por el número de lanzamientos. Lo que se obtiene es la frecuencia relativa.
A diez lanzamientos esto todavía parece bastante desordenado, pero a mil lanzamientos estos valores se acercan bastante a 0,16 (cero coma uno seis), a 0,17 16 (cero coma uno siete) y a 0,18 16 (cero coma uno ocho), redondeados a dos decimales aquí. Haz las cuentas: 1/6 = 0,166666 (un sexto es igual a cero coma uno seis seis seis seis) y eso es en realidad entre 0,16 y 0,17 (cero coma uno seis y cero coma uno siete).
Diapositiva 3
Quizá recuerde esta encuesta sobre el modo en que los alumnos llegan a la escuela. Es un buen ejemplo de los conceptos ya introducidos. En la tabla están los números absolutos o – expresado de otra manera – las frecuencias absolutas.
Diapositiva 4
Si se suman las cifras, se ve que 1073 (mil setenta y tres) estudiantes participaron en la encuesta. Si se dividen las frecuencias absolutas por este número, se obtienen las frecuencias relativas. Los he escrito aquí como porcentajes y los he redondeado a un decimal. Esta representación es familiar, permite evaluar de un vistazo si muchos o pocos niños se dirigen al colegio en un determinado medio de transporte.
Diapositiva 5
Por supuesto, se pueden representar las cifras en un gráfico de columnas. Ciertamente, no es sorprendente que la altura de la columna muestre el número del resultado observado. También se puede ver rápidamente en esta representación, qué medios de transporte se utilizan con mayor o menor frecuencia. Bueno, y esto se llama una distribución de frecuencias. Recuerde este término, también aparecerá en otros contextos. Es un concepto importante en estadística.
Diapositiva 6
Veamos otro ejemplo. Una vez más, estamos hablando de un propósito de la estadística, es decir, la recopilación adecuada de datos. Los números son un poco más grandes esta vez, pero las consideraciones principales siguen siendo las mismas.
Observamos el número de nuevas infecciones por Covid-19 en la semana en torno al 23/03/2021 (veintitrés de marzo del dos mil veintiuno) en algunos países seleccionados: Alemania, Chile, Colombia, España, México y Perú. Una propia encuesta es casi imposible para ello, por eso nos basamos en los datos de la Universidad Johns Hopkins.
Diapositiva 7
De nuevo, lo interesante no son sólo las cifras absolutas, sino sobre todo la proporción relativa de personas infectadas. Y de nuevo dividimos, esta vez el número de nuevos infectados en esta semana por el número de habitantes de un estado.
Puede ver el resultado en la columna central de la tabla. Chile, por ejemplo, aparece con 0,00224 (cero coma cero cero dos dos cuatro) nuevos infectados y México con 0,00023 (cero coma cero cero cero dos tres), lo que significa que hay 0,00224 y 0,00023 (cero coma cero cero dos dos cuatro y cero coma cero cero cero dos tres) nuevos infectados por habitante, respectivamente, o el 0,224% y el 0,023% (cero coma dos dos cuatro por ciento o cero coma cero dos tres por ciento) de la población se infectó en esa semana.
Incluso si estos números ya están redondeados, rara vez se hacen amigos fuera de las matemáticas con ellos, quizá ni siquiera dentro de ellas. Por eso no se presentan en esta forma, sino convertido por 100.000 (cien mil) habitantes. En pocas palabras, se multiplica por 100.000 (cien mil), lo que, como se recuerda, significa mover el punto decimal cinco lugares a la derecha. Así, 0,00224 (cero coma cero cero dos dos cuatro) se convierte en 224 (dos cientos veinte y cuatro) y 0,00023 (cero coma cero cero cero dos tres) en 23 (veinte y tres), y estas son las incidencias que todos conocemos ya.
Diapositiva 8
Veamos de nuevo los seis países. Esta vez nos interesan los nacimientos. Una vez más, su propia encuesta no es el camino a seguir, estos números se pueden encontrar en Internet. Algunos, por cierto, son de 2018 otros de 2019. Casi siempre es difícil conseguir datos que se basen en la misma fecha de corte. Esta incertidumbre debe tenerse en cuenta al evaluar los resultados.
En principio, se procede de la misma manera que en el ejemplo anterior. Necesitamos saber cuántos habitantes tiene un país en un año determinado y cuántos nacimientos hubo en ese año. A continuación, podemos calcular la frecuencia relativa a partir de la frecuencia absoluta mediante una división. Y como estas cifras relativas – por ejemplo, 0,0094 (cero coma cero cero nueve cuatro) para Alemania o 0,0179 (cero coma cero uno siete nueve) para Perú- no son del agrado de todos, volvemos a extrapolarlas, esta vez a 1000 habitantes.
Es 0,094 • 1000 = 9,4 (cero coma cero cero nueve cuatro por mil igual a nueve come cuatro) y 0,0179 - 1000 = 17,9 (cero coma cero uno siete nueve por mil igual a diecisiete come nueve). En Alemania hubo 9,4 nacimientos por cada 1000 habitantes en 2019, mientras que en Perú hubo 17,9, es decir, bastante más. Por cierto, las cifras aquí son para 2018.
Diapositiva 9
Hay muchos ejemplos adecuados para la escuela. Aquí también se pueden planificar encuestas propias por ejemplo sobre la asignatura favorita, el número de hermanos o las actividades de ocio. Y aquí también se puede continuar con datos recogidos por profesionales, como los que se encuentran en los anuarios estadísticos. Sólo deben ser razonablemente interesantes para la clase específica.
Diapositiva 10
Resumamos.
Realizamos un experimento aleatorio n veces y descubrimos que un determinado suceso ocurre k veces. Entonces k es la frecuencia absoluta de ese evento.
Supongamos que un suceso se produce k veces cuando el experimento aleatorio se realiza n veces. Entonces 𝑘/𝑛 (k n ésimos) es la frecuencia relativa de ese evento.
Si asignamos a cada suceso de un experimento aleatorio su frecuencia absoluta, entonces se llama distribución de frecuencias.
Diapositiva 11
¿Recuerda el lanzamiento de dos dados? Sumamos los puntos y pensamos en qué posibilidades había en principio. El resultado fue la tabla que se ve a la derecha.
Para las sumas 2 y 12 hay exactamente una combinación, porque entonces ambos dados muestran el 1 o el 6 respectivamente. Para la suma 7 hay el mayor número de combinaciones, desde el 1 y el 6, pasando por el 2 y el 5, hasta el 3 y el 4. Puede ver las frecuencias relativas teóricas como porcentajes en el extremo derecho del gráfico.
Diapositiva 12
Vamos a verlo de nuevo. Lancé dos dados 1000 veces en realidad y anoté los resultados intermedios después de cada 100 lanzamientos.
Diapositiva 13
Lo que se ve aquí son las distribuciones de frecuencia para N = 100, N = 400, N = 600 y N = 1000. Puede ver muy bien cómo estos números absolutos se acercan a nuestro ideal teórico paso a paso. Para N = 100 sigue pareciendo un poco accidentado, por ejemplo, con las sumas 5, 6 y 10. Para N = 400, el 7 todavía se escapa de la cuadrícula, pero luego todo da una buena impresión.
Diapositiva 14
Y esta buena impresión se confirma cuando se determinan las frecuencias relativas. Los he dado aquí en forma de porcentajes, así puede comparar fácilmente con las frecuencias teóricas que se ven en la línea inferior. Para leer hay que tomarse un tiempo y, por supuesto, pausar el video.
Permítanme destacar dos resultados. Las sumas 2 y 12 deberían ocurrir teóricamente en el 2,8% de los casos, aquí son el 3,5% y el 3,0% respectivamente, así que bastante cerca. Y la suma 7 cumple todas las expectativas: el 16,7% es tanto la proporción obtenida empíricamente como la teórica de esta suma de puntos.
Diapositiva 15
Si se trasladan los resultados a un gráfico de líneas, el aspecto es el siguiente. La curva para N = 100 muestra la tendencia, pero sigue siendo algo inestable, la curva para N = 1000 también confirma visualmente la buena aproximación a los valores teóricos.
Diapositiva 16
Echemos la vista atrás.
En este episodio, hemos analizado los conceptos de frecuencia absoluta y frecuencia relativa de un evento. Para ello, hemos elegido diferentes representaciones: un gráfico circular, un gráfico de columnas o barras, una tabla y un gráfico de líneas.
También hemos introducido – con un ejemplo muy obvio – la noción de distribución de frecuencias, que desempeña un papel importante en la estadística.
Al fin y al cabo, hemos comprobado una vez más que, sencillamente, no hay nada mejor que su propio experimento. Y esto es especialmente cierto en el aula. Experimente y permita que sus alumnos experimenten. Esto debería ayudarles a entender esta rama de las matemáticas.
Diapositiva 17
Esto fue todo por hoy. ¡Nos vemos en el próximo episodio de charlas matemáticas!