En los próximos posts veremos cómo los conceptos que hemos
estudiado de estadística descriptiva y probabilidad se conjuntan para desarrollar
la estadística inferencial. El objetivo de la estadística inferencial es el de
obtener información confiable de una población analizando sólo una muestra relativamente
pequeña. Si deseamos, por ejemplo estudiar las preferencias de los aficionados
al fútbol en México no tomaríamos una muestra de aficionados de la porra del América
para preguntarles ¿a qué equipo le va usted? En los métodos que describiremos
aquí supondremos que las muestras que analizaremos son aleatorias. Supongamos
que la población total consta de N individuos y que deseamos realizar una
investigación en una muestra de n personas. Como cada muestra se conforma con
una elección que hagamos de n individuos de entre el total N se tienen por lo tanto $\displaystyle\binom{N}{n}$ maneras diferentes en que podemos escoger la
muestra. Una muestra es aleatoria si cada una de las $\displaystyle\binom{N}{n}$
muestras posibles tiene la misma probabilidad de ser escogida.
Por ejemplo, si tenemos una población con 20 individuos y
deseamos hacer una muestra con 6 de estos individuos, hay en total $\displaystyle\binom{20}{6}$
=38760 muestras posibles. Si cada una de estas muestras la elegimos con
probabilidad $\frac{1}{38760}$ entonces la muestra sería aleatoria. ¿Cómo
obtener una muestra efectivamente aleatoria? Una alternativa consistiría en
asignar un número entre 1 y 38760 a cada muestra e introducir 38760 boletos en
una tómbola, girar la tómbola y escoger un boleto. Este esquema de muestreo es
totalmente impráctico. Otra forma más sencilla, que resulta ser equivalente,
consiste en introducir 20 boletos en una tómbolo, girar y escoger 6 de estos 20
boletos. Aun este esquema sencillo resulta impráctico si deseáramos, por
ejemplo, estudiar el ingreso mensual de las familias en México ya que el total
de familias es del orden de varios
millones. Una alternativa práctica para elegir una muestra aleatoria es el emplear tablas de números
aleatorios como la siguiente:
Esta tabla contiene números entre cero y uno distribuidos uniformemente. Para
obtener una muestra aleatoria escogemos un número cualquiera de estos, digamos
que elegimos el séptimo número de la quinta columna (.246194) y a partir de él
tomamos tantos números como tenga la muestra. Para elegir una muestra de 6 de 20 individuos nos fijamos en los siguientes
cinco números, los multiplicamos por 20, el tamaño de la población y
redondeamos a números enteros. En la siguiente tabla estos cálculos.
Esto significa que la muestra que obtuvimos consiste de los
individuos 5,7,14,17,12 y 20. En caso de que después de redondear obtengamos un
número repetido simplemente lo ignoramos y tomamos un número aleatorio más de
la tabla. Existen tablas muy extensas de números aleatorios que pueden
consultarse en caso necesario, o bien, es posible generar secuencias de números
aleatorios en hojas de cálculo.
Es muy ilustrativo el ejemplo para usar la tabla de números aleatorios. Esto evita el subjetivismo en la selección de los elementos de la muestra.
ResponderEliminar