30 Lo que cuenta es el objetivo: Pruebas de significación de una y dos caras.
Diapositiva 0
Bienvenidos y bienvenidas a este último episodio sobre estadística y probabilidad. Hoy hablamos de la significación, es decir, del significado de un resultado obtenido estadísticamente.
Diapositiva 1
En particular, volvemos a examinar las pruebas de hipótesis.
Se trata de una afirmación justificada y validada estadísticamente sobre si se rechaza o no una hipótesis en relación con la población.
Ya lo hemos visto en el último episodio: Al rechazar o no rechazar una hipótesis, puede haber errores. Por lo tanto, nos gustaría saber un poco más sobre un posible error. Las herramientas para ello son las pruebas de significación unilateral y bilateral.
Lo analizaremos más a fondo dentro de un momento.
Diapositiva 2
Como casi siempre, el enfoque sistemático debería ser útil.
Si uno decide rechazar o no rechazar una hipótesis inicial H0, entonces obviamente estas cuatro posibilidades entran en cuestión.
Si la hipótesis es realmente correcta y se mantiene después de la prueba, entonces todo salío bien. Lo mismo ocurre si la hipótesis no es correcta y se rechaza tras la prueba. En los otros dos casos, sin embargo, es evidente que se está cometiendo un error.
Diapositiva 3
Tomemos la hipótesis como ejemplo: una mascarilla de color verde claro protege de forma fiable contra la gripe. Si realmente es así y uno rechaza erróneamente la hipótesis, es de esperar que se proteja de la gripe con otros métodos. Sin embargo, si una mascarilla de color verde claro no es en realidad una protección contra la gripe y, a pesar de ello, se supone que es eficaz, entonces el error es definitivamente más grave. Así, uno se verá erróneamente en el lado seguro con dicha máscara.
En cualquier caso, podemos afirmar que suelen ser errores muy diferentes. Por lo tanto, también se les denomina de forma diferente y se habla de error de tipo I, cuando se rechaza erróneamente una hipótesis verdadera, y de error de tipo II, cuando no se rechaza una hipótesis que no es verdadera.
Diapositiva 4
Pasemos a las pruebas de significación, aquí el error del tipo I juega el papel importante.
Una prueba de significación consiste en saber si se rechaza falsamente una hipótesis nula, es decir, si se comete un error de tipo I. Se especifica un nivel de significación α.
Se distinguen dos posibilidades, que primero examinaremos formalmente. Se trata de la prueba de significación de cola inferior y de la prueba de significación de cola superior. Pero no se preocupe si parece un poco abstracto, los ejemplos concretos e ilustrativos vendrán enseguida:
En una prueba de cola inferior (o “lado izquierdo”, “menor”), hay una hipótesis nula de la forma H0: p = p0 (o también H0: p ≥ p0), que se opone a una hipótesis alternativa de la forma H1: p < p0.
En una prueba de cola superior (o “lado derecho”, “mayor”), hay una hipótesis nula de la forma H0: p = p0 (o también H0: p ≤ p0), que se opone a una hipótesis alternativa de la forma H1: p > p0.
Diapositiva 5
La base de la prueba de significación unilateral es el error de tipo I.
Fijamos un nivel de significación α.
Comprobamos, con la hipótesis nula H0, si la probabilidad real p de un evento es como máximo tan grande como una p0 fija.
La probabilidad de rechazar falsamente la hipótesis nula no debe ser mayor que el nivel de significación α de la hipótesis nula.
¿Suena eso demasiado abstracto una vez más? No hay problema, vamos a ver ejemplos.
Diapositiva 6
El primer ejemplo se refiere a la prueba de significación de cola inferior.
Un examen de matemáticas no suele ser aprobado por el 20% de los alumnos. Este año se ha cambiado el plan de estudios. Ahora hay que comprobar si un porcentaje menor de alumnos ha suspendido el examen (y sólo interesa este cambio a la baja).
Diapositiva 7
Y ahora otro ejemplo en el que una prueba de significación de cola superior sería útil.
Un comerciante de frutas compra albaricoques en el mercado. Observa que el 5% de los albaricoques tienen manchas de podredumbre y sospecha que esta proporción es mayor que en la última entrega (y sólo interese este cambio al alza).
Diapositiva 8
Y, por supuesto, todo depende de la descripción concreta del problema. La cola inferior y la cola superior se pueden cambiar.
Se puede suponer fácilmente que el 80% de los alumnos han aprobado el examen. La cuestión es si hay algunos más después del cambio. Del mismo modo, se puede concluir que el 95% de los albaricoques estaban bien y preguntarse si ahora hay menos.
Sólo es importante hacer esta determinación de forma clara e inequívoca y, por supuesto, antes de realizar la prueba de significación.
Diapositiva 9
Intentémoslo con números concretos. Esta es la tarea:
En la clase 8 del colegio Marie Curie, 6 de los 32 alumnos suspendieron un examen de matemáticas. "Dios, al menos una cuarta parte no tiene ni idea de matemáticas", se queja el profesor de la clase.
¿Es así? En realidad, sólo un poco más del 18% ha suspendido el examen. ¿Funciona un nivel de significación del 5%?
Primero intente una solución usted mismo y recuerde lo que hemos trabajado en el episodio 29.
Diapositiva 10
Esta es la hipótesis inicial: Al menos un cuarto significa p0 ≥ 0,25 . Elegimos α = 0,05.
Se puede calcular con estos valores. De hecho . Para .
Por lo tanto, la hipótesis emocional no debe ser rechazada. Sólo cuando hay tres o menos alumnos que han suspendido el examen se puede rechazar la hipótesis con una probabilidad razonable. Pero quizás ya sea mejor en el próximo examen ;-)
Diapositiva 11
Siguiendo con el tema, veamos otro examen de matemáticas. Por un lado, se entienden inmediatamente los problemas de este tipo y, por otro, es fácil calcular con él.
En el octavo grado del colegio Marie Curie, 18 de 100 alumnos suspendieron un examen de matemáticas. "Querida, al menos una cuarta parte no tiene ni idea de matemáticas", se queja la directora.
¿Es eso cierto? Al fin y al cabo, es exactamente el 18%, es decir, bastante menos del 25%. ¿Funciona esta vez con un nivel de significación del 5%?
De nuevo, intente resolver la tarea primero.
Diapositiva 12
También es esta vez la hipótesis de que p0 ≥ 0,25. Otra vez elegimos α = 0,05.
De hecho, en este caso se calcula
.
Así que la hipótesis emocional tampoco debería ser rechazada esta vez. Sin embargo, parece estar cerca, ¿no?
Y por eso estamos estudiando un tercer examen de matemáticas. No se preocupe, es el último por hoy.
Diapositiva 13
En varios cursos de 8º, 180 de cada 1000 alumnos suspendieron un examen de matemáticas. "Querido, al menos una cuarta parte no tiene ni idea de matemáticas", se queja la ministra de Educación.
¿Es esto cierto? ¿Funciona con un nivel de significación del 5%?
Diapositiva 14
De nuevo p0 ≥ 0,25 es la hipótesis. También elegimos de nuevo un nivel de significación de α = 0,05.
Lo probamos y calculamos para,
Por lo tanto, en este caso debe rechazarse la hipótesis es posible que haya un error de tipo I, pero es poco probable, ya que
.
y sólo muy por detrás del punto decimal se encuentran unos pocos decimales no nulos en este número.
La hipótesis era la misma cada vez, cada vez el valor real estaba en torno al 18%. Interesante, ¿no? Y bastante claro. El tamaño de la muestra desempeña aquí un papel importante.
Diapositiva 15
Veamos la prueba de significación bilateral.
Si una prueba de hipótesis se refiere a si la probabilidad de un suceso cambia en comparación con el valor supuesto y no importa en qué dirección vaya, se trata de una prueba de significación bilateral.
Específicamente: En una prueba de significación bilateral, hay una hipótesis nula H0: p = p0, que se opone a una hipótesis alternativa H1: p ≠ p0.
Diapositiva 16
Aquí hay un ejemplo. Comprobamos si una moneda es justa, es decir, una moneda de acuerda con la regla de Laplace.
Si se lanza 100 veces, se espera p = 0,5.
Sin embargo, si la “cabeza” cae menos de 45 veces o más de 55, entonces -pensamos - la moneda no puede ser realmente justa, por lo que p sería entonces ≠ 0,5 y que obviamente no está en orden.
Sin embargo, primero suponemos que la moneda es justa (esta es la hipótesis nula H0) y calculamos la probabilidad con la que se produciría el evento anterior. La variable aleatoria X = “número de cara” está, pues, distribuida binomialmente con los parámetros 100 y 0,5.
Diapositiva 17
Calculemos.
Obviamente, no se puede rechazar la hipótesis de que se trata de una moneda justa. Hay una probabilidad de poco más del 27% de que uno se equivoque. Esto es demasiado alto para rechazar la hipótesis nula.
Diapositiva 18
El lanzamiento de la moneda probablemente debería tener resultados significativamente más divergentes si se quiere rechazar la hipótesis de la equidad.
Tenemos nuevos valores, menos de 40 veces o más de 60 veces debe aparecer "cara". Se ve así:
P(X < 40 o. X > 60 | p = 0,5)
Esto ya parece mucho más claro. La probabilidad de que la hipótesis se rechace erróneamente es ahora de sólo un 3,5%.
En este caso - en otras palabras - el riesgo de juzgar la moneda como "no justa" es bajo, aunque realmente lo sea.
Diapositiva 19
Y aquí también depende mucho del tamaño de la muestra.
Veamos de nuevo un resultado en el que “cara” se lanza menos del 45% o más del 55% de las veces. Pero lancemos la moneda 1000 veces para esto.
P(X < 450 o. X > 550 | p = 0,5)
=
Obviamente, la hipótesis debe rechazarse ahora. La probabilidad de error al hacerlo es baja.
¿Recuerda la ley de los grandes números? Aquí aparece en los cálculos prácticos.
Diapositiva 20
También puede empezar al revés y no jugar con los números, sino especificar un valor para la máxima probabilidad de error permitida (es el nivel de significación).
Así que elegimos α = 0,01 y n = 100, por lo tanto, una probabilidad de error máximo de 1%.
Entonces y
, por eso
.
En el caso del rango de [37 a 63] se superaría el α elegido. Por lo tanto no rechazaríamos la hipótesis de una moneda justa.
Diapositiva 21
Veamos de nuevo los posibles errores. Resultan - como ya hemos visto - fácilmente de la sistemática.
Aquí puede ver de nuevo la tabla correspondiente.
Diapositiva 22
Apliquemos de nuevo la sistemática al ejemplo de la moneda justa.
La hipótesis nula es: La moneda es justa y sobre todo genuina.
Con el error de tipo I, esta hipótesis se rechaza erróneamente. Entonces tiramos el buen dinero a la basura. En el error de tipo II, es falsamente no rechazado. Entonces ponemos en circulación dinero falso. Juzgue usted mismo qué es más perdonable.
Diapositiva 23
Normalmente, una hipótesis (que contiene lo contrario de lo que se quiere demostrar) sólo se rechaza cuando la probabilidad de error es menor o igual al 5% ("significativa") o, a menudo, menor o igual al 1% ("altamente significativa").
Pero está claro: son nombramientos que también podrían hacerse de otra manera.
Generalmente se habla del nivel de significación.
Diapositiva 24
Este es el último episodio en el que hablamos de matemáticas. Los ositos de goma son imprescindibles.
A la izquierda se puede ver mi saldo de ositos de goma a esta hora de ayer. Estadísticamente, todo estaba bien, los colores individuales no se desviaban significativamente del sexto que cabría esperar.
Luego llegó un visitante que prefiere los ositos de goma en los colores verde y rojo oscuro. Puede ver el resultado después de eso a la derecha. ¿La visita provocó una desviación estadísticamente significativa?
Diapositiva 25
Haga las cuentas. Quedan 70 ositos de goma en total.
Suponemos una probabilidad de p = 1/6 para cada uno de los seis colores.
A un nivel de significación de α = 0,05 = 5%, sólo el número de ositos de goma blancos es significativamente demasiado alto (y a un nivel de α = 1%, ninguno de los colores está representado demasiado a menudo o demasiado poco).
Así son las cosas: Si la muestra es pequeña, se necesitan fuertes desviaciones para que resulten estadísticamente significativas.
Diapositiva 26
No era sólo por hoy, era la formación avanzada en estadística y probabilidad. Me divertí mucho trabajando con ustedes. Espero que haya podido llevarse muchas ideas para sus clases y que las ponga en práctica. Adiós, cuídese y no lo olvide: casi todo en la vida es incierto, simplemente hay que tratar de entender mejor esas incertidumbres. Qué bien que las matemáticas sean una ayuda fiable en este caso.