Mis notas para esta página:

¿Se puede controlar el azar? Del Concepto matemático de probabilidad.

Diapositiva 0

Muy buenas tardes, bienvenidas y bienvenidos a este episodio de las charlas matemáticas. Hoy queremos aclarar qué implica el concepto matemático de probabilidad. Partiremos del concepto anterior, más intuitivo, y veremos que gran parte de él puede encontrarse también en el enfoque de las matemáticas.

Diapositiva 1

Empecemos por aquí. Hasta ahora, como dije, utilizamos una noción bastante intuitiva. El punto de partida siempre fueron los experimentos con un espacio muestral, es decir el conjunto de los resultados discreto y finito.

Entonces contábamos con bastante frecuencia y, a la hora de interpretar las probabilidades, nos ceñíamos esencialmente a los sucesos y resultados del recuento real, simulado o incluso imaginado que en principio era posible.

Se ve los ejemplos típicos de los episodios anteriores. Hicimos experimentos según la regla de Laplace como el lanzamiento de un dado o una moneda. Y también estudiamos experimentos que no siguen la regla de Laplace, como el lanzamiento de una tachuela.

Diapositiva 2

De eso se trata ahora: intentamos captar el concepto de probabilidad de forma matemáticamente útil, y eso no significa otra cosa que esforzarnos por conseguir una definición exacta. Pero, por supuesto, no olvidaremos nada de lo que hemos elaborado hasta ahora.

Diapositiva 3

Un primer acceso al concepto matemático de probabilidad es posible a través de la regla de Laplace.

Cuando se lanza un dado regular, se supone que cada uno de los números 1, 2, 3, 4, 5 y 6 tiene la misma probabilidad de salir. Esta probabilidad es de - cualquier otra cosa parecería poco plausible.

Si se lanza una moneda, saldrá cara o sello con la misma probabilidad. Esta probabilidad es un medio y también es la única hipótesis plausible.

Elaboremos una definición matemática a partir de estas observaciones y suposiciones.

Diapositiva 4

Consideramos un experimento aleatorio con un conjunto finito de resultados y suponemos que todos los resultados ocurren con igual probabilidad y eso no significa otra cosa que se producen con igual frecuencia.

Entonces la probabilidad del evento E se define por P(E) es igual al número de casos favorables dividido por el número de casos posibles. En otras palabras: Dividimos la potencia del conjunto E – y esto es el número de elementos – por la potencia del conjunto Ω.

Veamos ejemplos, entonces la matemática abstracta se convierte rápidamente en algo completamente inofensivo y comprensible.

Diapositiva 5

Lanzamos un dado regular y determinamos la probabilidad según la regla de Laplace para el evento E = saldrá un “5”. Obviamente la probabilidad de E = .

Hay 6 resultados posibles – todas las cifras entre el 1 y el 6 – y sólo uno de ellos es un resultado favorable, es decir, deseado, y eso es el 5.

Diapositiva 6

Lanzamos un dado regular y determinamos la probabilidad para el evento E = saldrá un “5” o un “6”.

Entonces

P(𝐸) = 1/6 + 1/6 = 2/6 = 1/3.

Hay 6 resultados posibles – las cifras entre el 1 y el 6 – y dos de ellos son resultados favorables o deseados, y eso son el 5 y el 6.

Diapositiva 7

Lanzamos un dado regular. Determinamos la probabilidad para el evento E = saldrá un “5” o un “6” o un número primo.

Hay 4 resultados favorables, es decir el 2, el 3, el 5 y el 6. Por eso hay 4 elementos en el conjunto E y la probabilidad de E = 1/6 + 1/6 + 1/6 + 1/6 = 4/6 o simplificado 2/3.

Diapositiva 8

Repetimos el experimento y determinamos la probabilidad para el evento E = saldrá un “5” o un “6” o un número primo. Pero justifiquemos el resultado de otra manera.

Por supuesto hay 6 resultados posibles, todas las cifras entre el 1 y el 6.

Dos de ellos son "favorables" por la primera condición, a saber, el 5 y el 6, tres son "favorables" por la segunda condición y son los números primos 2, 3 y 5. Pero ahora un número se ha contado dos veces y es el 5.

Por lo tanto, se obtiene la probabilidad de E = 2/6 + 3/6 − 1/6 = 4/6 = 2/3.

Con estas sencillas consideraciones, ya hemos creado un marco para tratar la probabilidad matemática y aquí, en primer lugar, la probabilidad según la regla de Laplace. Veamos esto de manera más formal en la siguiente página.

No se preocupe, todo sigue siendo sencillo.

Diapositiva 9

En primer lugar, consideramos en términos generales un evento E y, por tanto, los resultados favorables del conjunto de todos los resultados posibles. Por supuesto, sólo puede haber como máximo tantos resultados favorables como posibles. Si se escribe como una fracción, entonces el numerador es como máximo tan grande como el denominador y, por tanto, el valor de la fracción es como máximo 1.

Formalmente se escribe: la probabilidad de E es entre 0 y 1 para todos los sucesos E.

¿Y si no hay ningún resultado favorable? Entonces el numerador es cero y el valor de la fracción es cero.

Una vez más: si no especificamos ningún posible evento E como deseado, es decir, favorable, entonces P(E) es obviamente igual a cero. Y si consideramos cada resultado como favorable, entonces E debe ser el conjunto Ω.

Se escribe formalmente así: la probabilidad del conjunto vacío { } es 0 y la probabilidad de Ω es igual a 1.

Por último, consideremos los sucesos independientes E1 y E2, cada uno de los cuales se considera favorable pero no tienen elementos comunes. Entonces, obviamente, tenemos que sumar las probabilidades individuales para obtener la probabilidad de E1 y E2 juntas.

Se escribe formalmente así: La probabilidad de la unión des los sucesos E1E2 es igual a P(E1) + P(E2) si la intersección de E1E2 es igual al conjunto vacío.

Como se ve, estas características de las probabilidades se pueden derivar fácilmente con el sentido común. Si los experimentos se basan principalmente en los experimentos según la regla de Laplace, entonces se pueden ver sin problemas.

En matemáticas, se busca siempre una forma de expresión formal. No, ciertamente no para diferenciarse del resto del mundo. Se trata más bien de una representación inequívoca que no deja dudas sobre lo que dice. Nuestro lenguaje normal muchas veces no puede satisfacer esta demanda.

Diapositiva 10

Ahora bien, no todo experimento aleatorio se basa en un experimento según la regla de Laplace. Se puede ver un ejemplo aquí.

Hacemos girar la rueda de la fortuna que se muestra aquí. Entonces Ω = {1, 2, 3} y también es razonable suponer que: P(1) = ¼ , P(2) = ¼, P(3) = ½

De nuevo, cualquier otra determinación no parece plausible.

Del mismo modo, la probabilidad de obtener un 1 o un 2 se calcularía mediante

P(1) + P(2) = ¼ + ¼ = ½.

Sólo se puede tener 1 o 2 o 3 como resultado, así que P(Ω) = 1. El apuntador se detendrá en algún lugar.

El 4 no aparece, la probabilidad de que aparezca es 0. Y eso es igual de cierto para el 5, el 6 o el 7 o cualquier otro número que no esté en la rueda. Estos son eventos imposibles.

De nuevo, lo formalizamos en la página siguiente.

Diapositiva 11

Una vez más, 0 ≤ P(E) ≤ 1 para todos los eventos E, es decir, la probabilidad de cada evento E está entre 0 y 1.

Asimismo, P({ }) = 0 y P(Ω) = 1. El suceso imposible tiene probabilidad 0, el suceso seguro probabilidad 1.

Finalmente P(E1∪E2) = P(E1) + P(E2) si E1∩E2 = { }. Se acuerda: Si la rueda de la fortuna se detiene en el 1 o el 2, entonces las probabilidades individuales para el 1 y para el 2 se suman para este evento compuesto.

Diapositiva 12

Sabemos que no hay suposiciones teóricas sobre el resultado de cada experimento aleatorio. Observamos el ejemplo de una tachuela. Lo lancé 1000 veces. Cayó de cabeza 633 veces y de lado 367 veces.

Por lo tanto, es razonable suponer que

P(de cabeza) = y P(de lado) = .

Por supuesto, aquí la suposición puede cambiar fácilmente en el siguiente intento o con un nuevo tipo de tachuela.

¿Podemos seguir controlándolo? Vamos a intentarlo.

Diapositiva 13

Los términos básicos aquí son la frecuencia absoluta y la relativa.

Si un experimento aleatorio se repite varias veces, cada suceso se produce con una determinada frecuencia. Este número se llama frecuencia absoluta.

Si una tachuela cae de cabeza 633 veces al ser lanzado 1000 veces, 633 es la frecuencia absoluta.

Si un evento A ocurre k veces en n intentos, se llama hn(A) = k/n la frecuencia relativa.

Si una tachuela cae de cabeza 633 veces al ser lanzado 1000 veces,

h1000(de cabeza) := = 0,633 = 63,3% es la frecuencia relativa del evento "de cabeza".

Diapositiva 14

La frecuencia relativa es ahora el punto de partida para una definición del concepto de probabilidad, la que se llama probabilidad estadística.

La idea básica se origina en Richard von Mises, que vivió de 1883 a 1953 y la publicó por primera vez en 1919. En un experimento aleatorio, determinamos la frecuencia relativa en un número muy grande de intentos, lo que se llama el método frecuentista. Al hacerlo, imaginamos que podríamos realizar el experimento "infinitamente a menudo".

La probabilidad estadística de un suceso A se define ahora como el valor límite de la frecuencia relativa si se realizara el experimento "infinitamente a menudo":

Suena bien, ¿verdad? También tiene un aspecto maravillosamente matemático, ¿verdad? Sin embargo, hay escollos, de los que hablaremos más adelante. Pero primero veamos las propiedades que se han vuelto familiares. Le prometo que esta vez también funcionará.

Diapositiva 15

Primeramente, la tachuela cae de lado o de cabeza al ser lanzado. Podemos volver a asignar una probabilidad a los posibles eventos, aunque se haya obtenido experimentalmente. En cada caso, un número entre 0 y 1, en el que 0 caracteriza el suceso imposible y 1 el suceso "de cabeza o de lado".

Ya hemos escrito las dos primeras propiedades de manera bastante formal:

Es 0 ≤ P(E) ≤ 1 para todos los eventos E, la probabilidad del conjunto vacío P({ }) = 0, la probabilidad de Ω P(Ω) = 1.

La tercera característica también se explica por sí misma. Otra vez P (E1∪E2) = P(E1) + P(E2) si E1∩E2 = { }.

Diapositiva 16

Ya había indicado que el concepto de probabilidad estadística no está sin problemas. Un problema muy grande es que no podemos realizar un experimento aleatorio con una frecuencia infinita. Y para el caso finito – como ya hemos visto – se el azar hace lo que quiere.

Un ejemplo: Se dice que el 18 de agosto de 1913, en el casino de Montecarlo, la bola cayó 26 veces seguidas en una casilla negra durante la ruleta. Mucha gente perdió mucho dinero ese día porque apostó por un color diferente demasiado pronto.

En consecuencia, el concepto de valor límite tal y como se utiliza en la probabilidad estadística no puede tener la precisión del concepto de valor límite tal y como se conoce en el cálculo.

A las matemáticas no les gusta esto y este fue un motivo importante para seguir investigando.

Diapositiva 17

El avance llegó con Andrei Nikolayevich Kolmogorov, que publicó un libro en 1933 en el que proponía un concepto axiomático de la probabilidad.

Estos son los axiomas, que en realidad todos conocen ya. Pero uno tras otro.

Supongamos que el conjunto Ω es un espacio de resultados finito. En este caso, no lo dude, piense en los seis números de un dado o en las dos posibilidades de que caiga una de las tachuelas.

Ahora supongamos que P es un mapeo que asigna un número real a cada evento.

Por lo tanto, P debe asignar un número real a todos los subconjuntos de Ω. El conjunto de todos los subconjuntos de un conjunto es su conjunto de potencias y, por tanto, P es un mapeo del conjunto de potencias P(Ω) al conjunto .

Este mapeo P tiene un nombre específico. La llamamos distribución de probabilidad exactamente cuando se cumplen los siguientes axiomas:

  1. P(A) ≥ 0 para todos sucesos A del conjunto de potencia de Ω. P(Ω).
  2. P(Ω) = 1 .
  3. Para los sucesos A, B del conjunto de potencia de Ω y si la intersección de A y B es igual al conjunto vacío la probabilidad de la unión de los sucesos A y B es igual a P(A) + P(B).

Bueno, y ya habíamos elaborado estos axiomas.

Con los dados igual que con la rueda de la fortuna o la tachuela, es decir, con los experimentos según la regla de Laplace y otros experimentos aleatorios.

Diapositiva 18

Estos axiomas pueden describirse adecuadamente. El primer axioma - P(A) ≥ 0 para todos sucesos A P(Ω) significa no negatividad, porque P tiene valores mayores o iguales a cero.

El segundo axioma proporciona una normalización. Ω contiene todos los sucesos. Por eso P(Ω) = 1 tiene sentido, ya que entonces todos los sucesos deberían asumir razonablemente un valor entre 0 y 1 bajo P.

Y para que esto funcione, el tercer axioma es la aditividad. Para los sucesos A, B del conjunta de la potencia de Ω que no contienen elementos comunes es siempre la probabilidad de la unión de A y B igual a la probabilidad de A más la probabilidad de B.

¿Son realmente adecuados estos axiomas ahora? Eso no es lo que nos concierne. En este punto nos apoyamos en los numerosos ejemplos que lo hacen plausible.

Diapositiva 19

No, el concepto axiomático de probabilidad no nos dice nada sobre cómo resultará la cosa con las tachuelas a largo plazo.

Pero lo hace matemáticamente a prueba de crisis y es la base de las inferencias y los cálculos.

Aquí hay un ejemplo. Podemos deducir de los tres axiomas que la probabilidad del conjunto vacío es igual a cero.

En primer lugar Ω ∩ { } = { }. Esto puede derivarse simplemente de las reglas de tratamiento de los conjuntos.

También sabemos que P(Ω) = 1. Constata el segundo axioma.

Además P(Ω ∪ { }) = P(Ω) + P({ }). Nos dice el axioma 3. En total:

1 = P(Ω) = P(Ω { }) = P(Ω) + P({ }) y por eso P({ }) = 0.

Diapositiva 20

¿Fue demasiado rápido para usted? No se preocupe. He vuelto a repasar la demostración aquí, paso a paso.

He adoptado la forma – afirmaciones a la izquierda y justificaciones a la derecha – del mundo anglosajón. Allí se habla de “demostración en dos columnas”. Tómese un respiro, mírelo en detalle. No se pueden entender las matemáticas simplemente escuchando.

Diapositiva 21a

Y si usted quiere practicar un poco más, entonces podría hacer esta demostración:

Consideremos un suceso A y su opuesto "no A". Demuestre que P(A) + P(no A) = 1.

Sin duda, recomiendo escribir esta demostración en dos columnas.

Diapositiva 21b

Aquí está la solución. Hechele un vistazo cuando quiera.

Diapositiva 22

En este episodio discutimos tres ideas del concepto de probabilidad. En primer lugar, se basó en la frecuencia relativa de un evento en un experimento según la regla de Laplace. Luego discutimos una idea basada en la ley de los grandes números. Por último, presentamos el enfoque de Kolmogorov basado en axiomas. Estoy seguro de que una idea le resulta más fácil de entender que la otra. Pero creo que las tres ideas pueden ser útiles para la enseñanza de las matemáticas.

¿Por qué no se piensa en qué situación es más adecuado el concepto y qué ventajas e inconvenientes muestran los enfoques discutidos?

Diapositiva 23

Eso fue todo por hoy. Muchas gracias por acompañarme. Estoy deseando verle en el próximo episodio.