Mis notas para esta página:

Estadísticas aplicadas: Cifras de una pandemia.

Diapositiva 0

Hola a todas y todos. Bienvenidos a un nuevo episodio en el que charlaremos de matemáticas. Esta vez se trata de un episodio muy especial, porque hablaremos exclusivamente de cifras, que han cobrado gran importancia en el contexto de la pandemia de Covid-19.

Diapositiva 1

Volvemos a tratar con funciones exponenciales, de las que hablamos en detalle en el último episodio. Esta vez se trata de la conexión concreta con la pandemia. Ya ha oído hablar de la incidencia y del valor R. Veremos estos términos en concreto y con la ayuda de ejemplos.

Diapositiva 2

Consideremos que tienen en común las funciones exponenciales con la pandemia producida por el Covid-19.

Supongamos que hay 10 personas enfermas en una ciudad al principio de una pandemia. Ahora supongamos que su número se duplica cada semana. Puedes ver los números. Al cabo de siete semanas habría 1.280 enfermos y al cabo del doble de tiempo, es decir a las 14 semanas, ya habría 162.840 enfermos, es decir, más de 100 veces más.

Diapositiva 3

Más de un millón ya estaría allí después de la semana 17. Pero no, la realidad no suele ser tan mala como la teoría matemática.

Pero hay importantes vínculos entre la teoría y la práctica. Veamos esto con un ejemplo.

Diapositiva 4

Como ocurre a menudo, hay que entrar en detalles cuando se trata de la práctica. Hemos tenido que tomar nota del aumento del número de nuevos infectados en todo el mundo durante varias semanas. Pero la realidad, por supuesto, no funciona tan bien como el modelo que acabamos de ver.

Vayamos a España al verano del 2021, aquí hubo (redondeado y sin garantía de cifras totalmente correctas) en el

23 de junio     3.400 nuevos infectados            

30 de junio     4.400 nuevos infectados            

etc. etc. Puedes leer los numeros en la diapositiva.

Son cifras alarmantes que también contienen mucho sufrimiento al nivel personal.

Veamos las matemáticas que hay detrás. Efectivamente, no se trata de un crecimiento lineal, en el que cada día se añadiría un número más o menos fijo como al total. En concreto, hay 1.000 infecciones más de la semana 1 a la semana 2, unas 6.000 más de la semana 2 a la 3, unas 5.000 más de la 3 a la 4, y 12.000 más de la 4 a la 5.

En la parte derecha se puede ver que estos números siguen un patrón variable, porque no siempre aparece el mismo factor. Así que no siempre se multiplica por el mismo número. Por ejemplo, las nuevas infecciones aumentan de la primera a la segunda semana indicada aquí por un factor de 1.3, de la segunda a la tercera semana por un factor de 2.4, de la tercera a la cuarta semana por un factor de 1.5 y de la cuarta a la quinta semana por un factor de 1.8.

Diapositiva 5

¡Un pequeño alivio para España! Después, las cifras volvieron a bajar y de nuevo calculé los factores correspondientes. Todos están por debajo de 1, con un factor superior a 1, por supuesto, no es posible la disminución.

Estamos hablando de un descenso exponencial, que incluso se produjo de forma perfecta al principio, con un factor constante de 0.9.

Diapositiva 6

Las cifras absolutas son a veces difíciles de interpretar porque en este caso dependen del número de habitantes de un país. Por esta razón, a menudo se utilizan números relativos. Esto da lugar a la incidencia.

Ya lo vimos en un episodio anterior. Se divide el número de habitantes por el número de nuevas infecciones en los últimos siete días y se multiplica esa cifra por 100.000. No hay nada más que mover el punto decimal cinco lugares a la derecha: un decimal por cada cero en el número 100.000.

Alemania tiene unos 83 millones de habitantes. Dividiendo el número de nuevos infectados 92.877 entre el número de habitantes se obtiene 0.00112 y la correspondiente incidencia de 0.00112 • 100.000 = 112 para esta semana de marzo que se muestra aquí.

Una vez más, las cifras que se muestran aquí son algo más antiguas. Pero como el estado de cosas cambia constantemente de todos modos, el principio de cálculo puede verse bien con estas cifras.

Diapositiva 7

La incidencia indica, por tanto, cuántas personas por cada 100.000 habitantes dieron positivo al virus en el transcurso de 7 días.

¿Por qué se toma el valor en siete días? Muy sencillo. Porque siempre hay fluctuaciones en el recuento, por ejemplo, a causa del fin de semana o de un día festivo. Por lo tanto, este valor, que tiene en cuenta una semana completa, es más fiable.

Una cosa más sobre la incidencia: Con los mismos pasos de cálculo (y, por supuesto, otras cifras) también se podría determinar cuántas personas en relación con la población llegan al hospital con una infección. También en este caso son interesantes las cifras relativas que tienen en cuenta el tamaño de la población. Por otro lado, es importante tener en cuenta las fluctuaciones en determinados días, es decir, observar lo que ocurre en un determinado periodo de tiempo.

Diapositiva 8

Por último, veamos el valor R, también un número importante en relación con Covid-19.

Este es el número de reproducción, indica cuántas otras personas están infectadas por una persona infectada. Por ejemplo, R = 1.25 significa que 100 personas infectadas infectarán a otras 125. El valor R = 0.75 significa que 100 personas infectadas volverán a infectar a otras 75 personas.

Pero cuidado: la cifra de reproducción es una estimación. No se puede registrar con exactitud. Por lo tanto, en los ejemplos que acabamos de ver, la cifra dada sólo corresponderá aproximadamente a la realidad. Sobre todo, los valores R estimados de, por ejemplo, 1.05 y 0.95 no tienen que ser diferentes en la realidad.

Se determina el valor dentro de un error que también se puede estimar, el llamado intervalo de confianza. Hablaremos de ello en detalle en un episodio posterior, pero vamos a intentar una aproximación aquí.

Diapositiva 9

¿Qué es un intervalo de confianza?

En primer lugar, se trata de un concepto central pero no totalmente sencillo en estadística.

Refleja el hecho de que en este campo matemático no suele haber un simple acierto o error, sino que por lo general uno sólo puede acercarse a los hechos.

Imagina que pregunta a 1000 niños de preescolar seleccionados al azar sobre su color favorito de ositos de goma. En esta encuesta por ejemplo 450 niños, es decir, el 45%, eligen los ositos de goma naranja. Entonces, es plausible que otra muestra representativa arroje un valor similar: tal vez el 43%, tal vez el 44%, tal vez el 48% o el 49%.

En otras palabras, hay muchos indicios de que un segundo valor medido también se encuentra en un intervalo bastante pequeño en torno al 45%. Pero, por supuesto, esto no es seguro, sólo es probable.

En la práctica, se suele especificar un intervalo para que el valor correcto se encuentre dentro de él con una probabilidad del 95%. Pero eso también significa que está fuera una probabilidad del 5%. Una vez más: en este punto simplemente tenemos que aceptar la incertidumbre.

Por desgracia, el intervalo de confianza no es fácil de calcular. En particular, depende del tamaño de la muestra. En relación con Covid-19, se necesita información sobre el número de personas que una persona infectada ha infectado de nuevo. Obviamente, son cifras difíciles de recopilar.

Diapositiva 10

Se puede decir más o menos así: El intervalo de confianza es un rango alrededor de un valor medido en el que es muy probable que se encuentre el valor verdadero.

Diapositiva 11

Echemos la vista atrás muy brevemente. Hemos tratado tres términos.

Número 1: Crecimiento exponencial. Obviamente, es extremadamente peligroso en términos de número de personas infectadas. Es bueno reconocer esta función matemática.

Número 2: Incidencia. Una indicación importante del curso de la pandemia. Pero cuidado, nunca se pueden registrar esas cifras con exactitud. Hay errores en las pruebas en ambas direcciones (falsos positivos y falsos negativos). Y hay personas infectadas que nunca se han hecho la prueba.

Número 3: Número de reproducción. Es un valor aproximado que podría desviarse tanto hacia abajo como hacia arriba. Esta incertidumbre debe tenerse en cuenta en la interpretación.

Sí, como ya se ha mencionado brevemente, hay otros indicadores del curso de una pandemia, como el número de enfermos en unidades de cuidados intensivos o los afectados por problemas secundarios. Pero también tienen algo en común: los datos necesarios no son fáciles de recopilar y están marcados por un cierto grado de incertidumbre. No se puede hacer una evaluación sólida sin estadísticas. 

Diapositiva 12

Eso fue todo por hoy. Fue un placer que nos acompañaran. Muchas gracias por su interés.