Consideremos de nuevo el número de puntos que se obtiene al
tirar dos dados. La distribución de probabilidad de esta variable aleatoria
está dada por la siguiente tabla.
Si el par de dados se tira muchas veces, ¿cuál será el
promedio de puntos que obtengamos? Si pensamos en las probabilidades como la
proporción de veces que los dados producen los diferentes puntos,
entonces esperamos obtener 2 puntos un treintaiseisavo de las veces, tres
puntos dos treintaiseisavos de las
veces, etc. Así, el promedio de puntos o valor esperado de puntos es
$2\cdot{\frac{1}{36}}$ +$3\cdot{\frac{2}{36}}$+$4\cdot{\frac{3}{36}}$
+$5\cdot{\frac{4}{36}}$+$6\cdot{\frac{5}{36}}$+7$\cdot{\frac{6}{36}}$
+$8\cdot{\frac{5}{36}}$+$9\cdot{\frac{4}{36}}$+$10\cdot{\frac{2}{36}}$+$11\cdot{\frac{2}{36}}$+$12\cdot{\frac{1}{36}}$=7
Este valor esperado representa el promedio de puntos que a la larga se obtienen tirando los dados.
En general, si una variable aleatoria
toma los valores $ x_1,x_2,x_3,...x_k, $ con probabilidades f($ x_1$), f($ x_2$),f($x_3$),…,f($x_k$),
su valor esperado es
$ x_1f(x_1)+x_2f(x_2)+x_3f(x_3)+...+x_kf(x_k)$
Este valor también conocido como la media de la distribución
de probabilidad de la variable aleatoria, que también podemos escribir como
Media de la distribución de probabilidad $ \mu=\sum{x\cdot{f(x)}}$
Recordemos el ejemplo que vimos de las probabilidades que considerabauna empresa de seguros de recuperar algunos autos de un total deocho autos robados. La media de esta distribución de probabilidad
representa el número esperado de autos
que la compañía de seguros espera recuperar. De acuerdo con la fórmula, este
número es
$\mu=0\cdot{f(0)}+1\cdot{f(1)}+2\cdot{f(2)}+...+8\cdot{f(8)}=0\cdot{0.001}+1\cdot{0.008}+2\cdot{0.041}+...+8\cdot{0.017}$=4.8
Es conveniente tener
una fórmula que nos ahorre hacer estos cálculos que son un poco tediosos. En el
caso de la distribución binomial el valor esperado es sencillo de calcular ,
puesto que tenemos un total de n ensayos
y cada uno de ellos tiene una probabilidad p de éxtio, de modo que la
media de una distribución binomial está dada por
Media de la distribución binomial $\mu =n\cdot{p} $
Es importante señalar que esta fórmula tan sencilla sólo es
válida para la distribución binomial. El ejemplo que estudiamos sobre el númerode pacientes que se sometieron a un tratamiento para dejar de fumar y quevuelven a fumar corresponde a una variable binomial con n=7 y p=0.4.Su media es $\mu$= 7 x (0.4)=2.8. Por tanto,
para grupos de siete pacientes que toman el tratamiento, en promedio 2.8 de
cada grupo de vuelven a fumar.
En el post sobre medidad de dispersión vimos que para comprender mejor una colección de datos además de la media era necesariotener una medida de la variabilidad de los datos, la de su desviación estándar.
Si x es una variable aleatoria, su desviación estándar se define como
Desviación estándar de una distribución de probabilidad $\sigma=\sqrt[]{\sum(x- \mu)^2\cdot{f(x)}}$
Observemos que esta fórmula se parece a la expresión orginal
para calcular la desviación estándar de una población con las probabilidades f(x)
en lugar de 1/N. La varianza de una
distribución de probabilidad se define también como el cuadrado de la
desviación estándar. La desviación estándar es una medida de la variabilidad de
los valores esperados de la variable aleatoria. La siguiente figura muestra dos
distribuciones con misma media pero con diferente desviación estándar.
Calculemos la desviación estándar de la distribución de
probabilidad de los autos recuperados. Ya vimos que su media es $\mu$=4.8
Podemos agrupar los cálculos necesarios en la tabla de
arriba. La suma de la última columna es la varianza de esta distribución y su
desviación estándar es su raíz cuadrada $\sigma=\sqrt[]{(1.921)}=1.386$. Al igual
que para la media es posible calcular la
desviación estándar de una distribución binomial por medio de una fórmula:
Desviación estándar de una distribución binomial $\sigma=\sqrt[]{np(1-p)}$
En el ejemplo anterior n=8 y p=0.4, entonces podemos
calcular la desviación estándar directamente por medio de la expresión $\sigma=\sqrt[]{(8)(0.4)(0.6)}=\sqrt[]{1.92}=1.386$.
La diferencia de un milésimo en la varianza (antes de sacar la raíz cuadrada)
se debe a las aproximaciones a tres decimales de la primera tabla.
No hay comentarios:
Publicar un comentario