En la estimación de proporciones usualmente se dispone de
una proporción muestral $\frac{\bar{x}}{n}$, donde $\bar{x}$ es el número de
veces que un evento ha sucedido en n ensayos. Por ejemplo su 34 de 180
entrevistados aleatoriamente gastaron más de $\$$ 200.00 , entonces $\frac{\bar{x}}{n}
= \frac{36}{180} = 0.189$ es una estimación de la proporción de visitantes del
centro comercial que gastan más de $\$$ 200.00. Como un porcentaje es una
proporción multiplicada por 100, y una probabilidad puede interpretarse como
una proporción en el largo plazo, también
podríamos decir que estimamos que el 18,9 $\%$ de los visitantes del
centro comercial gastan más de $\$$ 200.00 o que la probabilidad de que un
visitante del centro comercial gaste más de $\$$ 200.00 es de 0.189. Por lo
tanto, en cierto modo las estimaciones de proporciones, porcentajes y
probabilidades son esencialmente iguales, Si suponemos además que las
situaciones que estudiamos satisfacen las condiciones de una distribución
binomial, esto es, nuestra información
consiste en el número $\bar{x}$ de ensayos independientes y la
probabilidad de éxito de cada uno de los
ensayos tiene un valor constante p, la variable aleatoria $\bar{x}$ resulta binomial. Cuando el tamaño de la
muestra es grande ($n \geq 30$) sabemos que esta distribución binomial es aproximadamente
normal, con media $\mu = np$ y con desviación estándar $ \sigma = \sqrt[]{np (1-p)}$. Entonces , la
variable
$z=\frac{\bar{x}-np}{\sqrt[]{np (1-p)}}$
Tiene prácticamente una distribución normal estándar.
Sabemos, por ejemplo, que la probabilidad de que z se encuentre entre -1.96 y
1.96 es 0.95; esto es, la probabilidad de que
$-1.96=\frac{\bar{x}-np}{\sqrt[]{np (1-p)}} < 1.96 $
Es 0.95. Procediendo como en la sección 6.1, se puede ver
que esta desigualdad se cumple cuando
$\frac{\bar{x}}{n} -1.96 \sqrt[]{\frac{p(1-p)}{n}} < p
< \frac{\bar{x}}{n} + 1.96 \sqrt[]{\frac{p(1-p)}{n}}$
Desafortunadamente, no podemos emplear esta expresión para
obtener un intervalo de confianza para p, ya que la variable p aparece también
de lado izquierdo y derecho de la igualdad. Una alternativa razonable consiste
en sustituir
$\sqrt[]{\frac{p(1-p)}{n}}$
Por
$\sqrt[]{\frac{\frac{\bar{x}}{n}(1-\frac{\bar{x}}{n})}{n}}=\sqrt[]{\frac{\frac{\bar{x}}{n}(\frac{n-\bar{x}}{n})}{n}}=\sqrt[]{\frac{\bar{x}(n-\bar{x})}{n^3}}=\frac{1}{n}\sqrt[]{\frac{\bar{x}(n-\bar{x})}{n}}$
Para llegar a la siguiente expresión para los intervalos de
confianza de 95 $\%$
$\frac{\bar{x}}{n}-\frac{1.96}{n}\sqrt[]{\frac{\overline{x}(n-\overline{x})}{n}}
< p < \frac{\bar{x}}{n}+
\frac{1.96}{n}\sqrt[]{\frac{\overline{x}(n-\overline{x})}{n}}$
Para la estimación de intervalos de confianza de 99$\%$ para p
simplemente sustituimos el valor 1.96 por 2.575 para obtener
Intervalos de confianza de 99$\%$
$\frac{\bar{x}}{n}-\frac{2.575}{n}\sqrt[]{\frac{\overline{x}(n-\overline{x})}{n}}
< p < \frac{\bar{x}}{n}+ \frac{2.575}{n}\sqrt[]{\frac{\overline{x}(n-\overline{x})}{n}}$
Supongamos que al realizar una encuesta a 360 ciudadanos de
un municipio, 136 de ellos afirman que tienen la intención de votar por cierto
candidato a la presidencia municipal. Para obtener el intervalo de confianza
del 95% para la proporción verdadera de ciudadanos que pretendan votar por este
candidato, vemos que al sustituir los valores $\overline{x}$ = 136 y n=360 en
$\frac{\bar{x}}{n}-\frac{1.96}{n}\sqrt[]{\frac{\overline{x}(n-\overline{x})}{n}}
< p < \frac{\bar{x}}{n}+
\frac{1.96}{n}\sqrt[]{\frac{\overline{x}(n-\overline{x})}{n}}$
Se tiene
$\frac{{136}}{360}-\frac{1.96}{360}\sqrt[]{\frac{{360}(360-136)}{360}}
< p < \frac{{136}}{360} +
\frac{1.96}{360}\sqrt[]{\frac{{360}(360-136)}{360}}$
Que es
0.328 < p < 0.428
Esto significa que con un grado de confianza de 95 $\%$ , la
proporción de todos los ciudadanos que piensan votar por este candidato se
encuentra entre 0.328 y 0.428.
Equivalentemente podemos, afirmar que con probabilidad 0.95, entre el 32.8 % y
el 42.8 % de los ciudadanos piensa votar por este candidato.
Para construir el intervalo de confianza de 99% procedemos
análogamente, simplemente cambiando el
factor 1.96 por 2.575:
$\frac{{136}}{360}-\frac{2.575}{360}\sqrt[]{\frac{{360}(360-136)}{360}}
< p < \frac{{136}}{360} +
\frac{2.575}{360}\sqrt[]{\frac{{360}(360-136)}{360}}$
Que da
0.12 < p <
0.444.
De nuevo, entre mayor sea el grado de confianza más grande
resulta el intervalo.
Como los intervalos de confianza se construyen sumando y
restando los facotres
$\frac{1.96}{n}\sqrt[]{\frac{\overline{x}(n-\overline{x})}{n}}$
o
$\frac{2.575}{n}\sqrt[]{\frac{\overline{x}(n-\overline{x})}{n}}$
Al centro $\frac{\bar{x}}{n}$ , estos factores representan
el error máximo asociada a la estimación de la proporción. Por ejemplo, si en
una encuesta telefónica a 400 hogares que tenían la televisión encendida, 118
de ellos veían cierta telenovela, entonces podemos tomar a $\frac{\bar{x}}{n}=\frac{118}{400}=0.295$
como nuestra estimación de la proporción de televidentes que ven esta
telenovela. Entonces, con un grado de
confianza del 99%, el error en nuestra estimación es menor que
$\frac{2.575}{n}\sqrt[]{\frac{\overline{x}(n-\overline{x})}{n}}=\frac{2.575}{400}\sqrt[]{\frac{118(400-118)}{400}}=0.059$
Que representa un error menor al 5.9 $\%$.
No hay comentarios:
Publicar un comentario