domingo, 24 de junio de 2012

Media y desviación estándar de una variable aleatoria discreta.


Consideremos de nuevo el número de puntos que se obtiene al tirar dos dados. La distribución de probabilidad de esta variable aleatoria está dada por la siguiente tabla.
Si el par de dados se tira  muchas veces, ¿cuál será el promedio de puntos que obtengamos? Si pensamos en las probabilidades como la proporción  de veces  que los dados producen los diferentes puntos, entonces esperamos obtener 2 puntos un treintaiseisavo de las veces, tres puntos  dos treintaiseisavos de las veces, etc. Así, el promedio de puntos o valor esperado de puntos es

$2\cdot{\frac{1}{36}}$ +$3\cdot{\frac{2}{36}}$+$4\cdot{\frac{3}{36}}$
+$5\cdot{\frac{4}{36}}$+$6\cdot{\frac{5}{36}}$+7$\cdot{\frac{6}{36}}$
+$8\cdot{\frac{5}{36}}$+$9\cdot{\frac{4}{36}}$+$10\cdot{\frac{2}{36}}$+$11\cdot{\frac{2}{36}}$+$12\cdot{\frac{1}{36}}$=7
Este valor esperado representa el promedio de puntos  que a la larga se obtienen tirando los dados. En general, si una variable  aleatoria toma los valores $ x_1,x_2,x_3,...x_k, $ con probabilidades f($ x_1$), f($ x_2$),f($x_3$),…,f($x_k$), su valor esperado es
$ x_1f(x_1)+x_2f(x_2)+x_3f(x_3)+...+x_kf(x_k)$
Este valor también conocido como la media de la distribución de probabilidad de la variable aleatoria, que también podemos escribir como
Media de la distribución de probabilidad  $ \mu=\sum{x\cdot{f(x)}}$

Recordemos el ejemplo que vimos  de las probabilidades que considerabauna  empresa de seguros  de recuperar algunos autos de un total deocho autos robados. La media de esta distribución de probabilidad representa  el número esperado de autos que la compañía de seguros espera recuperar. De acuerdo con la fórmula, este número es
$\mu=0\cdot{f(0)}+1\cdot{f(1)}+2\cdot{f(2)}+...+8\cdot{f(8)}=0\cdot{0.001}+1\cdot{0.008}+2\cdot{0.041}+...+8\cdot{0.017}$=4.8


Es  conveniente tener una fórmula que nos ahorre hacer estos cálculos que son un poco tediosos. En el caso de la distribución binomial el valor esperado es sencillo de calcular , puesto que tenemos un total de n ensayos  y cada uno de ellos tiene una probabilidad p de éxtio, de modo que la media de una distribución binomial está dada por
Media de la distribución binomial $\mu =n\cdot{p} $



Es importante señalar que esta fórmula tan sencilla sólo es válida para la distribución binomial. El ejemplo que estudiamos sobre el númerode pacientes que se sometieron a un tratamiento para dejar de fumar y quevuelven a fumar corresponde a una variable binomial con n=7 y p=0.4.Su media es $\mu$= 7 x (0.4)=2.8. Por tanto, para grupos de siete pacientes que toman el tratamiento, en promedio 2.8 de cada grupo de vuelven a fumar.
Desviación estándar de una distribución de probabilidad  $\sigma=\sqrt[]{\sum(x- \mu)^2\cdot{f(x)}}$
Observemos que esta fórmula se parece a la expresión orginal para calcular la desviación estándar de una población con las probabilidades f(x) en lugar de  1/N. La varianza de una distribución de probabilidad se define también como el cuadrado de la desviación estándar. La desviación estándar es una medida de la variabilidad de los valores esperados de la variable aleatoria. La siguiente figura muestra dos distribuciones con misma media pero con diferente desviación estándar.


Calculemos la desviación estándar de la distribución de probabilidad de los autos recuperados. Ya vimos que su media es $\mu$=4.8
Podemos agrupar los cálculos necesarios en la tabla de arriba. La suma de la última columna es la varianza de esta distribución y su desviación estándar es su raíz cuadrada   $\sigma=\sqrt[]{(1.921)}=1.386$. Al igual que  para la media es posible calcular la desviación estándar de una distribución binomial por medio de una fórmula:
Desviación estándar de una distribución binomial  $\sigma=\sqrt[]{np(1-p)}$
En el ejemplo anterior n=8 y p=0.4, entonces podemos calcular la desviación estándar directamente por medio de la expresión $\sigma=\sqrt[]{(8)(0.4)(0.6)}=\sqrt[]{1.92}=1.386$. La diferencia de un milésimo en la varianza (antes de sacar la raíz cuadrada) se debe a las aproximaciones a tres decimales de la primera tabla.


No hay comentarios: