Diapositiva 0
Un buen día y bienvenido. Hoy hablaremos de estadística y de la correcta clasificación de los resultados. Esto es un asunto serio, sin duda. No obstante, empezaremos con un ejemplo no tan serio.
Diapositiva 1
Involúcrese en una historia tan ficticia como poco seria.
Una vez más, se trata de una cuestión de principios y se puede entender incluso con historias que no son tan serias. Pero no se preocupe, habrá un ejemplo (al menos medio) decente al final del episodio.
Los caballitos de mar desempeñan un papel destacado en este sentido. En mi opinión, en la foto se puede ver un ejemplar especialmente bonito.
Diapositiva 2
Hace algún tiempo, el diario alemán Süddeutsche Zeitung informó sobre un nuevo escándalo relacionado con la carne en una columna que no siempre cuenta con historias serias. La pregunta era si los palitos de pescado que tanto gustan a los niños contienen realmente carne de caballitos de mar. Los caballitos de mar también son muy queridos, pero sobre todo, si simplemente se les deja nadar.
Hemos entrevistado a expertos sobre este tema - puede verlos aquí. Y efectivamente, suponen que alrededor del 1% de los palitos de pescado están contaminados, es decir, uno de cada 100 palitos de pescado contiene carne de caballito de mar.
Diapositiva 3
Las buenas noticias:
Existe una prueba casera que detecta si la carne de caballito de mar se ha mezclado con los palitos de pescado. Activa una alarma de caballito de mar si es necesario.
La prueba detecta la carne de caballito de mar la mayoría de las veces, pero no siempre. Da el resultado correcto en el 90% de los casos. ¿Es suficiente para estar seguro?
Diapositiva 4
Supongamos que hacemos la prueba con un palito de pescado y obtenemos un resultado positivo, es decir, la temida alarma del caballito de mar.
Pero, obviamente, el resultado de esta prueba también puede ser erróneo, es decir, un falso positivo.
Entonces, ¿cuál es la probabilidad de que un resultado positivo contenga realmente carne de caballito de mar en un palito de pescado?
Diapositiva 5
Dé una pista y anote el resultado.
Supongamos que hacemos la prueba con un palito de pescado y obtenemos un resultado positivo.
¿Cuál es la probabilidad de que haya realmente carne de caballito de mar en este palito de pescado?
¿Está entonces el palito de pescado contaminado en cualquier caso? ¿Esto se aplica en el 90% de los casos? O sólo en un 50% de los casos. O es incluso menos del 10% de los casos en los que un resultado positivo es realmente cierto y apunta correctamente a que contiene carne de caballito de mar.
Diapositiva 6
Enfoquemos el asunto de forma sistemática, como hemos hecho hasta ahora. Si el 1% de los palitos de pescado están contaminados, entonces es uno de cada 100 o 10 de cada 1000. Aquí calculamos para 1000 palitos de pescado como ejemplo. Entonces encontrará carne de caballito de mar en 10 palitos de pescado mientras que en 990, no.
Diapositiva 7
90% de las veces, es decir, 90 de cada 100 o 9 de cada 10. Así, de los diez palitos de pescado que contienen carne de caballito de mar, 9 son reconocidos correctamente. Pero uno se escapa. La prueba es falsamente negativa.
¿Y los 990 palitos de pescado restantes? Similar, seguro. El 90% da negativo y son 891 piezas, 10% -y son 99- dan falso positivo.
Sumando el 99 y el 9, hay 108 palitos de pescado que dan positivo, incluyendo los positivos correctos y los falsos positivos.
Diapositiva 8
Sin embargo, los positivos correctos son sólo unos pocos, sólo 9 palitos de pescado. Así que y vemos que su cuota es sólo del 8%. Increíble, ¿verdad?
Diapositiva 9
¿Cuál fue su respuesta? Si éste problema era desconocido para usted, probablemente fue significativamente más alta. Como ocurre a menudo con las cuestiones estadísticas, la percepción nos juega una mala pasada e intuimos que el número de falsos negativos es bastante elevado.
Diapositiva 10
¿Dónde está el problema? ¿Seguro que los especialistas manejan correctamente las estadísticas, no?
No, no parece ser tan fácil. En un estudio, por ejemplo, el 60% de los médicos encuestados respondió a una pregunta similar sobre el diagnóstico de enfermedades de forma incorrecta.
Volveremos a ver esto en detalle dentro de un momento, utilizando un ejemplo muy serio.
Diapositiva 11
Nada nuevo: desgraciadamente, tratar los datos no significa tratarlos de forma sensata y adecuada. Sin embargo, la importancia de un manejo correcto para la vida cotidiana debe ser indiscutible.
Diapositiva 12
COVID-19 una y otra vez, aunque sea molesto, el tema tiene mucho que ofrecer para la enseñanza de la estadística.
Se ha debatido mucho sobre la fiabilidad de las pruebas rápidas. Para evaluar las consecuencias, no está de más el uso específico de métodos estadísticos.
También en este caso se producen falsos positivos en las pruebas. Un resultado falso-positivo significa que una persona da positivo pero no está infectada por el virus que causa el COVID-19.
En la fiabilidad intervienen muchos factores, uno de los cuales es la carga viral de las personas afectadas. Pero repasemos la situación aquí también. Por supuesto, bajo supuestos muy simples.
Diapositiva 13
La pregunta es: ¿Cuál es la probabilidad de que una persona que da positivo esté realmente infectada por el agente patógeno que causa la enfermedad?
Para evaluar esto, hacemos algunas suposiciones básicas.
Suponemos una incidencia de 1200 y vemos cómo una prueba indica el resultado correcto con una probabilidad del 75%, del 99% o del 99,9%.
Diapositiva 14
Enfoquemos esto de forma sistemática.
Estamos en la ciudad A que tiene 100.000 habitantes. Actualmente hay una incidencia de 1200 en siete días, es decir, que de 100.000 personas, exactamente 1200 se han infectado con el virus en los últimos siete días. Suponemos que todas las 100.000 personas de la ciudad A se hacen la prueba.
Oh, sí, piensa en lo grande que podría ser este número. Tal vez funcione mejor esta vez.
Diapositiva 15
Una incidencia de 1200 en siete días significa que 1200 de cada 100.000 o 1,2 de cada 100, es decir, el 1,2% de la población, se ha infectado. Supongamos que la prueba detecta el resultado correcto el 75% de las veces. A continuación, determinamos los números correspondientes de la misma manera que para los palitos de pescado.
De 100.000 personas, 1200 están infectadas, 98.800 no. Independientemente de si hay infección o no: la prueba da el resultado correcto en el 75% de los casos, es decir, en las partes. En consecuencia, 900 de los 1200 infectados están correctamente identificados. Pero 300 son falsamente negativos. De las 98.800 personas no infectadas, partes también están correctamente identificadas. Por lo tanto, 74.100 de estas personas dan un resultado negativo correcto. Sin embargo, parte, es decir, 24.700 personas, obtienen un resultado erróneo, es decir, un resultado positivo. En total, 24.700 + 900 = 25.600 personas tienen un resultado positivo.
Diapositiva 16
Por lo tanto, con una prueba de este tipo, en realidad sólo el 3,5% de los casos en los que el resultado de la prueba es positivo y la infección por el virus coinciden.
Una vez más, nuestra intuición para tales situaciones no está realmente bien desarrollada. Tiene sentido describir la situación de forma concreta y calcular en consecuencia.
Diapositiva 17
Supongamos que la prueba funciona de forma más fiable y muestra un resultado correcto en el 99% de los casos. No quiero repetir todos los números de nuevo, así que usted puede hacer las cuentas por sí mismo. En cualquier caso, un total de 2176 personas dieron positivo, de las cuales 1188 están realmente infectadas.
Diapositiva 18
Y eso nos lleva a un 54,6%, aproximadamente la mitad, que sigue siendo una cifra elevada.
Diapositiva 19
Así que vamos a hacer otro intento en el mundo casi perfecto. Supongamos que la prueba funciona de forma aún más fiable y muestra un resultado correcto en el 99,9% de los casos.
Entonces, un total de 1298 personas dan positivo, de las cuales algo menos de 1200 son realmente portadoras del virus.
Diapositiva 20
El porcentaje de aciertos se eleva a más del 90%. Pero -y esto es importante- incluso en un mundo casi perfecto no puede ser del 100% si la fiabilidad de la prueba está por debajo de eso.
Diapositiva 21
Por favor, recuerde que hemos trabajado con un modelo muy simple y que la realidad es mucho más compleja. Obviamente, el cálculo depende de muchos factores. Por ejemplo, es importante el número de personas que se someten a la prueba y si muchas personas sin síntomas también se someten a ella.
Sólo queríamos aclarar el principio ... y demostrar que los modelos matemáticos no son, definitivamente, brujería. Las matemáticas no son místicas, sino que obedecen a consideraciones racionales que a menudo son bastante sencillas de entender. Pero, créame, si lo hace paso a paso, suele tener éxito.
Diapositiva 22
Eso fue todo por hoy. Muchas gracias por estar ahí. Estoy deseando que llegue la próxima vez.