domingo, 8 de julio de 2012

Muestreo aleatorio


En los próximos posts veremos cómo los conceptos que hemos estudiado de estadística descriptiva y probabilidad se conjuntan para desarrollar la estadística inferencial. El objetivo de la estadística inferencial es el de obtener información confiable de una población analizando sólo una muestra relativamente pequeña. Si deseamos, por ejemplo estudiar las preferencias de los aficionados al fútbol en México no tomaríamos una muestra de aficionados de la porra del América para preguntarles ¿a qué equipo le va usted? En los métodos que describiremos aquí supondremos que las muestras que analizaremos son aleatorias. Supongamos que la población total consta de N individuos y que deseamos realizar una investigación en una muestra de n personas. Como cada muestra se conforma con una elección que hagamos de n individuos de entre el total N se  tienen por lo tanto $\displaystyle\binom{N}{n}$  maneras diferentes en que podemos escoger la muestra. Una muestra es aleatoria si cada una de las $\displaystyle\binom{N}{n}$ muestras posibles tiene la misma probabilidad de ser escogida.
Por ejemplo, si tenemos una población con 20 individuos y deseamos hacer una muestra con 6 de estos individuos, hay en total $\displaystyle\binom{20}{6}$ =38760 muestras posibles. Si cada una de estas muestras la elegimos con probabilidad $\frac{1}{38760}$ entonces la muestra sería aleatoria. ¿Cómo obtener una muestra efectivamente aleatoria? Una alternativa consistiría en asignar un número entre 1 y 38760 a cada muestra e introducir 38760 boletos en una tómbola, girar la tómbola y escoger un boleto. Este esquema de muestreo es totalmente impráctico. Otra forma más sencilla, que resulta ser equivalente, consiste en introducir  20 boletos  en una tómbolo, girar y escoger 6 de estos 20 boletos. Aun este esquema sencillo resulta impráctico si deseáramos, por ejemplo, estudiar el ingreso mensual de las familias en México ya que el total de familias es del  orden de varios millones. Una alternativa práctica para elegir una muestra  aleatoria es el emplear tablas de números aleatorios como la siguiente:
Esta tabla contiene números entre  cero y uno distribuidos uniformemente. Para obtener una muestra aleatoria escogemos un número cualquiera de estos, digamos que elegimos el séptimo número de la quinta columna (.246194) y a partir de él tomamos tantos números como tenga la muestra. Para elegir una muestra  de 6 de 20 individuos nos fijamos en los siguientes cinco números, los multiplicamos por 20, el tamaño de la población y redondeamos a números enteros. En la siguiente tabla estos cálculos.
Esto significa que la muestra que obtuvimos consiste de los individuos 5,7,14,17,12 y 20. En caso de que después de redondear obtengamos un número repetido simplemente lo ignoramos y tomamos un número aleatorio más de la tabla. Existen tablas muy extensas de números aleatorios que pueden consultarse en caso necesario, o bien, es posible generar secuencias de números aleatorios en hojas de cálculo.



1 comentario:

Unknown dijo...

Es muy ilustrativo el ejemplo para usar la tabla de números aleatorios. Esto evita el subjetivismo en la selección de los elementos de la muestra.