¿Qué tanto sabes osbre el Muestreo con o sin reemplazo?

El muestreo estadístico puede realizarse de varias maneras diferentes. Además del tipo de método de muestreo que utilizamos, hay otra pregunta relacionada con lo que le sucede específicamente a un individuo que hemos seleccionado al azar.  Esta pregunta que surge cuando el muestreo es, "Después de seleccionar un individuo y registrar la medición del atributo que estamos estudiando, ¿qué hacemos con el individuo?

 

Hay dos opciones:

 

  • Podemos reemplazar al individuo de nuevo en la piscina de la que estamos tomando muestras.
  • Podemos elegir no reemplazar al individuo.

 

Podemos ver muy fácilmente que estas conducen a dos situaciones diferentes.   En la primera opción, el reemplazo deja abierta la posibilidad de que el individuo sea elegido al azar una segunda vez.  Para la segunda opción, si estamos trabajando sin reemplazo, entonces es imposible elegir a la misma persona dos veces.  Veremos que esta diferencia afectará el cálculo de probabilidades relacionadas con estas muestras.

Efecto sobre las probabilidades

Para ver cómo manejamos el reemplazo afecta el cálculo de probabilidades, considere la siguiente pregunta de ejemplo. ¿Cuál es la probabilidad de sacar dos ases de un mazo de cartas estándar?

 

Esta pregunta es ambigua.  ¿Qué pasa una vez que robamos la primera carta?  ¿Lo volvemos a poner en la cubierta o lo dejamos fuera?

 

Comenzamos con el cálculo de la probabilidad de reemplazo.  Hay cuatro ases y 52 cartas en total, por lo que la probabilidad de robar un as es de 4/52. Si reemplazamos esta carta y robamos de nuevo, entonces la probabilidad es de nuevo 4/52. Estos eventos son independientes, por lo que multiplicamos las probabilidades (4/52) x (4/52) = 1/169, o aproximadamente 0.592%.

Ahora vamos a comparar esto con la misma situación, con la excepción de que no reemplazamos las tarjetas.  La probabilidad de sacar un as en el primer sorteo sigue siendo de 4/52. Para la segunda carta, suponemos que ya se ha cogido un as.  Ahora debemos calcular una probabilidad condicional.  En otras palabras, necesitamos saber cuál es la probabilidad de dibujar un segundo as, dado que la primera carta es también un as.

 

Ahora quedan tres ases de un total de 51 cartas. Así que la probabilidad condicional de un segundo as después de dibujar un as es 3/51.  La probabilidad de obtener dos ases sin reemplazo es (4/52) x (3/51) = 1/221, o aproximadamente 0.425%.

 

Vemos directamente del problema anterior que lo que elegimos hacer con el reemplazo tiene que ver con los valores de las probabilidades.  Puede cambiar significativamente estos valores.

Tamaños de población

Hay algunas situaciones en las que el muestreo con o sin reemplazo no cambia sustancialmente las probabilidades.  Supongamos que estamos eligiendo al azar a dos personas de una ciudad con una población de 50.000 habitantes, de los cuales 30.000 son mujeres.

 

Si tomamos una muestra con reemplazo, entonces la probabilidad de elegir una hembra en la primera selección es de 30000/50000 = 60%.  La probabilidad de una mujer en la segunda selección sigue siendo del 60%.  La probabilidad de que ambas personas sean mujeres es de 0,6 x 0,6 = 0,36.

 

Si tomamos una muestra sin reemplazo, la primera probabilidad no se ve afectada.  La segunda probabilidad es ahora 29999/4999999 = 0,5999919998...., que está muy cerca del 60%.  La probabilidad de que ambos sean hembras es de 0,6 x 0,5999919998 = 0,359995.

Las probabilidades son técnicamente diferentes, sin embargo, son lo suficientemente cercanas como para ser casi indistinguibles.  Por esta razón, muchas veces, aunque tomamos muestras sin reemplazo, tratamos la selección de cada individuo como si fuera independiente de los otros individuos de la muestra.

 

Otras aplicaciones

Hay otros casos en los que necesitamos considerar si tomar muestras con o sin reemplazo. Un ejemplo de esto es el bootstrapping. Esta técnica estadística se enmarca dentro de una técnica de remuestreo.

 

En el bootstrapping empezamos con una muestra estadística de una población. A continuación, utilizamos programas informáticos para calcular las muestras de bootstrap. En otras palabras, la computadora remuestra con el reemplazo de la muestra inicial.

(0 votes)