sábado, 23 de junio de 2012

Distribuciones binomiales


Es muy frecuente estar interesados en determinar la probabilidad de  que un evento ocurra x veces de un total de n posibilidades. Por ejemplo, a un analista político le interesa la probabilidad de que al realizar una encuesta de intención de votos x entrevistados de un total de n entrevistados se manifiesten a favor de cierto candidato o partido; a un fabricante de cigarrillos le interesa la probabilidad de que en una muestra de n fumadores, x de ellos prefieran su marca; y a un fabricante le interesa la probabilidad de que al someter a un control una muestra de n productos, x de ellos satisfagan sus normas de calidad.
Basándonos en el lenguaje de los juegos, diremos en general, que estamos  interesados en la probabilidad de obtener x éxitos en n ensayos.
En esta sección estudiaremos problemas que satisfacen las siguientes condiciones:
1. El experimento consiste de n ensayos idénticos.
2. Cada ensayo tiene dos resultados posibles, éxito o fracaso.
3. La probabilidad de éxito en cada uno de estos ensayos es la misma en todos los ensayos, digamos p, por lo que la probabilidad de fracaso es 1-p en todos los ensayos.
4. Los ensayos son independientes.
El número de éxitos  que ocurren bajo estas condiciones es una variable aleatoria que se dice tiene una distribución de probabilidad binomial, o simplemente una distribución binomial.
Es muy importante verificar estas hipótesis cuando deseemos aplicar los métodos de esta sección a alguna situación. Veamos algunos ejemplos.
1. Una galería de arte ofrece un lote de dieciocho cuadros de Picasso. Ellos saben que de estos cuadros cuatro de ellos son copias falsificadas. Un millonario que no conoce de arte compra cinco pinturas del lote. El número de cuadros falsificados que adquiere el millonario no es una variable binomial, pues si bien hay un total de cinco ensayos (uno por cada cuadro adquirido por el millonario) y el resultado de cada ensayo es un éxito (el cuadro es falso) o un fracaso (el cuadro es original), cada ensayo no es independiente ya que la probabilidad de que un cuadro sea una copia depende de los resultados de los ensayos anteriores.
2. Se toman cinco cartas (sin reponerlas) de una baraja de póker bien revuelta y se analiza el número de ases que se obtienen. El experimento consta de n=5 ensayos, cada uno con dos resultados posibles, as (éxito) o carta diferente de as (fracaso). La probabilidad de éxito del primer ensayo es 4/52, pero la probabilidad de éxito del segundo ensayo será de 3/51 o de4/51, dependiendo  de si el resultado del primer ensayo fue un éxito o un fracaso. Por lo tanto, en este ejemplo tampoco se satisface que las probabilidad de éxito de los ensayos sean fijas ni que los ensayos sean independientes.
3. Se toman cinco cartas de una baraja de póker bien revuelta, pero se repone inmediatamente cada una de las cartas elegidas y se vuelve a revolver la baraja. Se analiza el número de ases que se obtienen. El experimento consta de n =5 ensayos, cada uno con dos resultados posibles as (éxito) o carta diferente de as (fracaso). La probabilidad de éxito de cada ensayo es 4/52 y cada ensayo es ahora independiente. En este caso sí se satisfacen las hipótesis arriba mencionadas.
Supongamos que p y 1-p son las probabilidades de éxito t fracaso de n ensayos independientes. ¿Cuál es la probabilidad de tener x éxitos en n ensayos? Puesto que los ensayos son independientes, la probabilidad de obtener dos éxitos en los primeros dos ensayos es $p^2$, la probabilidad de obtener dos éxitos en los primeros tres ensayos es  $p^3$, y de esta manera, la probabilidad de obtener x éxitos en los primeros p ensayos es $p^x$. Empleando de nuevo la independencia de los ensayos y la regla multiplicativa vemos que la probabilidad de obtener  x éxitos en los primeros x ensayos  y un fracaso en el siguiente ensayo es $p^x(1-p)$, la probabilidad de obtener x exítos en  los primeros ensayos y  dos fracasos en los siguientes dos ensayos es $p^x(1-p) ^2$,etc. Por lo tanto, la probabilidad de obtener x éxitos en los primeros x ensayos y n-x  fracasos en los  últimos n-x ensayos es $p^x(1-p)^{n-x}$. Por medio de un  análisis similar es fácil ver que  la probabilidad $p^x(1-p)^{n-x}$ permanece constante para cada otro orden predeterminado de x éxitos. Como hay en total $\displaystyle\binom{n}{x}$ ordenes posibles en que podemos predeterminar los x éxitos, se tiene el siguiente resultado.
Distribución binomial 
La probabilidad de obtener x éxitos en n ensayos independientes es
$f(x)=\displaystyle\binom{n}{x}p^x(1-p)^{n-x}$
Donde p es la probabilidad de éxito de cualquier ensayo.
El nombre de distribución binomial surgió del hecho de que los valores de las probabilidad de esta distribución son los términos de la expansión binomial $((1-p)+p)^n$. A continuación presentamos algunos ejemplos para ilustrar el uso de estas probabilidades.
1. De acuerdo con  datos de la asociación mexicana de automóviles la probabilidad de recuperar un auto robado en México es de 0.6. Si en una semana una compañía de seguros tiene reportados ocho autos reportados cierta semana, ¿cuáles son las probabilidad de que se recuperen 0,1, 2,…,7 y 8 de los autos robados?
Si suponemos que la recuperación de los diferentes automóviles son eventos independientes (no hay bandas que tengan dos o más de los ocho autos robados) podemos aplicar la fórmula de arriba de la distribución binomial. Aquí la probabilidad de éxito es p= 0.6 y el total de ensayos es n=8. La probabilidad de recuperar x de los ocho automóviles robados es
$f(x)=\displaystyle\binom{8}{x}0.6^x(1-0.6)^{8-x}=\displaystyle\binom{8}{x}0.6^x(0.4)^{8-x}$
Por ejemplo, la probabilidad de que se recuperen 3 de los 8 autos son
$f(3)=\displaystyle\binom{8}{3}0.6^3(0.4)^{5}=\frac{8\cdot{7}\cdot{6}}{3\cdot{2}}(0.6)^3(0.4)^5=(56)(0.216)(0.01)=0.124$
Procediendo de igual manera, podemos ver que f(0)=0.001, f(1)=0.008, f(2)=0.041, f(4)=0.232.f(5)=0.279,f(6)=0.209, f(7)=0.090 y finalmente f(8)=0.017. En la figura mostramos el histograma correspondiente a esta distribución de probabilidad.

Como estos cálculos son muy tediosos existen tablas de probabilidades binomiales como esta tabla de distribuciones binomiales donde aparecen los valores explícitos de x para algunos valores de n y p.

2. Después de seguir un tratamiento especial para dejar de fumar la probabilidad de volver a fumar despues  del primer mes es de 0.4. Determina las probabilidades de que
a) a lo más 3 de 7 pacientes vuelven a fumar antes de un mes;
b) al menos  5 de 7 pacientes vuelven a fumar antes de un mes.
En este caso llamamos “éxito” a volver a fumar en menos de un mes después del tratamiento. Ahora n=7  y p=0.4.  Usando la fórmula arriba mencionada o buscando en una tabla  podemos hallar que los valores correspondientes a x=0, x=1,x=2 y x=3 son respectivamente 0.028,0.131,0.261 y 0.29. La probabilidad de que a lo más tres de los siete pacientes vuelvan a fumar dentro de un mes es
0.028  + 0.131 + 0.261 +0.29=0.71.
Si buscamos ahora los valores para x=5, x06 y x=7 obtenemos  0.077, 0.017 y 0.002, por lo que su suma es la probabilidad de que vuelvan a fumar cinco  o más de los pacientes, que es 0.096. Vemos así que es poco probable  que cinco o más de los pacientes vuelvan a fumar y que es altamente probable que vuelvan a fumar hasta tres de los pacientes que se sometieron al tratamiento.
3. En una fábrica los lotes de artículos recibidos necesarios para la producción se inspeccionan para detectar lotes defectuosos por medio de muestras de 12 artículos. Se examinan estos doce artículos y el lote es rechazado si se encuentran dos o más artículos defectuosos. ¿Cuál es la probabilidad de rechazar un lote que contiene 5% de artículos defectuosos?

La probabilidad de rechazar un lote que contiene 5% de artículos defectuosos es la suma de f(2)+f(3)+…+f(12), donde f(x) es la probabilidad binomial de x éxitos con n=12 y p=0.05. Como la suma de todas  las probabilidades de la distribución es igual a 1, entonces
F(2) +f(3) + …+f(12)=1- f(0) -  f(1)
Que es más sencillo de calcular. Por lo tanto, la probabilidad de rechazar un lote con 5% de artículos defectuosos es igual a
$1-\displaystyle\binom{12}{0}(0.05)^0 (0.95)^{12}-\displaystyle\binom{12}{1}(0.05)^1 (0.95)^{11}=0.118.$
¿Cómo cambia esta probabilidad si aumenta el porcentaje de artículos defectuosos del lote? Si el lote contiene un 10%, 20%,30% ó un 40% de artículos defectuosos la probabilidad de rechazarlos se calcula de la misma manera, sólo que ahora con p=0.1, 0.2 o 0.3
$1-\displaystyle\binom{12}{0}(0.1)^0 (0.9)^{12}-\displaystyle\binom{12}{1}(0.1)^1 (0.9)^{11}=0.341.$,             
$1-\displaystyle\binom{12}{0}(0.2)^0 (0.8)^{12}-\displaystyle\binom{12}{1}(0.2)^1 (0.8)^{11}=0.725.$,
$1-\displaystyle\binom{12}{0}(0.3)^0 (0.7)^{12}-\displaystyle\binom{12}{1}(0.3)^1 (0.7)^{11}=0.915.$
Y
$1-\displaystyle\binom{12}{0}(0.4)^0 (0.6)^{12}-\displaystyle\binom{12}{1}(0.4)^1 (0.6)^{11}=0.981.$
Aun cuando en la realidad se desconoce el porcentaje de artículos defectuosos de un lote, este ejemplo ilustra cómo las probabilidades de rechazo aumentan considerablemente al aumentar el porcentaje de artículos defectuosos. Podríamos haber obtenido las posibilidades de rechazar los lotes recurriendo también a una tabla de probabilidades binomiales.



No hay comentarios: