Guia Para El Estudio de Distribuciones Muestrales y Estimaciones

● ¿Qué es una distribución muestral? ¿En qué se diferencian las distribuciones muestrales de las trabajadas como la Bernoulli, Binomial, Hipergeométrica y Poisson?

Como su nombre lo indica la distribución muestral analiza el comportamiento de variables aleatorias que son muestras, antes nosotros analizábamos las observaciones de una muestra e identificamos la distribución de cada variable aleatoria. Ahora no, lo que buscamos es tomar muestras y, como de una población podemos formar muchas entonces cada muestra se vuelve una variable y es aleatoria porque cada muestra se toma al azar.

La idea es la siguiente, supongamos que tenemos una población de 15 observaciones y deseamos tomar muestras de tamaño 3, ¿cuántas muestras podríamos formar? Observemos que en el fondo lo que queremos saber es cuántos grupos de tres elementos podemos formar con quince elementos, ésto es una combinatoria en el sentido que no importa el orden en que se forme la muestra ya que no hay jerarquía entre las observaciones, lo importante es saber el total de grupos que se pueden forma de a 3: 15C3= 455, esto quiere decir que hay 455 posibles muestras de tamaño 3 en una población de 15 elementos.

Muestras de tamaño 3

Dado que cada muestra tiene la misma probabilidad de ser seleccionada, cada una de ellas se convierte en una variable aleatoria (variable porque cada muestra es distinta, varía, y aleatoria porque se eligen al azar) y tal como veníamos trabajando con las observaciones muestrales queremos averiguar el tipo de distribución que tienen. La distribución se determina o establece por el teorema del Límite Central según si se esta analizando la variable aleaotria media muestral o proporción muestral; para cada uno el teorema nos dice:

Sea X1 , X 2 ,..., X n un conjunto de n variables aleatorias independientes idénticamente distribuidas con media y varianza

2 . Sea X la media de las variables aleatorias, a medida que n aumenta el teorema del límite central nos dice que la

distribución de X es normal con media y varianza

2

n.

Guía de apoyo para el estudio de distribuciones muestrales yestimadores puntuales

Guía de apoyo para el estudio de distribuciones muestrales yestimadores puntuales

En el caso de la media muestral no es difícil comprender el teorema pero podría suceder que nos preguntemos por qué sucede los mismo para el caso de la proporción muestral. Para comprender mejor el uso del teorema interpretemos el significado de proporción muestral:

Supongamos que, de una población cuyas observaciones son variables aleatorias de tipo binomial, tomamos una muestra aleatoria de tamaño n ; como sabemos la variable binomial estudia el número de observaciones que cumple determinada característica dentro de la población, entonces si X representa dicho número y calculamos la proporción de la

muestra que cumple con la característica tendremos: P=Xn

que corresponde a un

promedio; recordemos que X es la suma de un conjunto de n observaciones tipo Bernoulli que son independientes y tienen la misma media y la misma varianza. Entonces nos encontramos de nuevo bajo los supuestos del teorema del límite central ( n variables aleatorias identicamente distribuidas con misma media y varianza) por lo cual P se

distribuye normal con media P la probabilidad de éxito y varianzaP 1−P

n.

Con base en lo anterior se presentará un ejercicio que hace referencia al cálculo de probabilidades de medias muestrales y proporciones muestrales.

Media muestral

“Cuando un proceso de producción funciona correctamente, el número de unidades producidas por hora sigue una distribución normal que tiene media de 92 y desviación típica de 3,6. Se ha tomado una muestra aleatoria de cuatro horas distintas.

a) Halle la media de la distribución de las medias muestrales en el muestreo.b) Halle la varianza de la media muestral.c) Halle el erro típico de la media muestral.d) ¿Cuál es la probabilidad de que la media muestral sea de más de 93

unidades?” (Newbold Paul, Carlson William L., Thorne Betty, 2008, p. 269)

Hay algunas características importantes a tener en cuenta en el ejercicio:

➔ En el ejercicio nos deben dar la media y la desviación o la varianza poblacional.➔ El tamaño de la muestra.➔ Los ejercicios propuestos deben indicar que se está hablando de medias muestrales.

En ocasiones suele confundirsen los ejercicios de variables aleatorias normales con los de variables aleatorias muestrales. La forma de diferenciarlos para no cometer errores es identificar que en un ejercicio de variable aleatoria normal no nos dan el tamaño de la muestra y no hablan de medias muestrales.

Debemos recordar que en las lecturas nos indican cómo calcular la media, la varianza, el error típico y la forma de estandarizar la variable aleatoria normal X . Aunque la forma de estandarizar es la misma que la normal sólo que ahora no se divide entre

2 sino entre

2

n:

Z=X−

n

Esta nueva variable se distribuye normal estándar y como consecuencia podemos utilizar las tablas de probabilidad normal estándar.

Si consideramos el ejercicio presentado, la forma de resolverlo sería:

a) Dado que la media de la variable aleatoria media muestral es la media de la población tenemos que: E X ==92 . Esto significa que el promedio de las medias muestrales de unidades producidas por hora es 92.

b) Como se observa en las lecturas la varianza de la media muestral es

Var X =

2

n=3,62

4=3,24 y nos permite determinar a través de la desviación

típica cuán alejados estan los datos u observaciones del promedio o media de los datos.

c) Recordemos que el error típico es justamente la desviación típica, es decir la raíz de la varianza: 3,24=1,8 con lo cual diremos que los datos estan alejados alrededor de dos unidades del promedio de los datos o que estamos equivocándonos en cerca de 2 unidades por hora respecto al promedio de 92 unidades producidas por hora.

d) Para determinar la probabilidad de que la media muestral sea de más 93 unidades debemos realizar el siguiente proceso.

P X93=P X−92

1,8

93−921,8

=P Z0,55=0.7088≈0,71

Estandarizamos la variable; recordemos que estandarizamos a lado y lado de la desigualdad o igualdad planteada en la probabilidad. Luego, buscamos en la tabla de la normal estándar o calculamos en excel el valor de la probabilidad.

Así concluimos que hay una probabilidad de 0,71 aproximadamente de que la media muestral sea de más de 93 unidades. Esto significaría por otra parte que el proceso de producción funciona correctamente.

Proporción muestral

Como se observa en las lecturas, la distribución de proporciones muestrales se maneja de forma análoga al de media muestral sólo que cambian los datos datos:

➔ Nos deben hablar de proporciones muestrales y por ende deben aparecer enunciados como 30 personas de 210, 25 elementos de 100, entre muchos otros y sino deben decirnos el 15% de la población (u otros porcentajes) cumple determinada característica.

➔ Nos deben dar el tamaño de la muestra.

Con estos datos lo único que nos resta por hacer es determinar datos como la media, la varianza, el error típico y la probabilidad de que la variable aleatoria proporción muestral sea inferior, superior, al menos, a lo más, por lo menos, como mínimo, como máximo o se encuentre entre algunos valores.

Veamos el siguiente ejemplo:

“Una fábrica tiene 438 obreros, de los cuales 239 están preocupados por las futuras prestaciones sanitarias. Se ha pedido a una muestra aleatoria de 80 de estos obreros que estime la proporción poblacional preocupada por las futuras prestaciones sanitarias.

a. ¿Cuál es el error típico de la proporción muestral preocupada?b. ¿Cuál es la probabilidad de que la proporción muestral sea inferior a 0.5?c. ¿Cuál es la probabilidad de que la proporción muestral este comprendida entre 0.5 y 0.6? (Newbold Paul, Carlson William L., Thorne Betty, 2008, p. 277)”

Como se observa hemos indicado con rojo las palabras importantes en el ejercicio que justamente hacen referencia a los datos que nos tienen que dar para resolver un ejercicio de proporciones muestrales.

Ahora nos enfocaremos en mencionar los pasos para resolver el ejercicio:

a. Identifiquemos P y n que son parte fundamental:

P=239438

≈0.5456 n=80

Dado que el error típico de una proporción muestral se calcula con la expresión p o desviación típica tenemos:

P= P 1−Pn=

239438

1− 239438

80≈0.0556

Por lo cual concluimos que el error típico es de 0.0556 aproximadamente, que significa que la proporción estimada de la población esta alejada de la proporción muestral cerca de 0.0556 unidades.

b. Para determinar la probabilidad de que la proporción muestral sea inferior a 0.5 debemos estandarizar la variable aleatoria proporción muestral cuya distribución es normal con media

P=239438

y varianza P ²≈0.0030989 .

P P0.5=P P−PP

0.5−PP

=P Z 0.5−0.54560.0556

=P Z−0.82 =0.21

Con esto concluimos que la probabilidad de que la proporción muestral sea inferior a 0.5 es de 0.21.

c. Para responder este literal seguimos un proceso análogo al del ejercicio anterior determinando la siguiente probabilidad:

P 0.5 P0.6=P 0.5−PP

P−PP

0.6−PP

=P 0.5−0.54560.0556

Z0.6−0.54560.0556

=P −0.82Z0.98=P Z0.98−P Z−0,82 =0.84−0.21=0.63

Con lo cual concluimos que la probabilidad de que la proporción muestral se encuentre entre 0.5 y 0.6 es 0.63.

Basados en lo anterior ya hemos identificado características del significado de distribución muestral que según sea el contexto se referirá a media muestral o a proporción muestral, pero entonces ¿dónde dejamos o dónde encontramos el concepto de estimador puntual? Es muy simple en realidad puesto que lo que tenemos es que como una población puede ser tan grande que dificulte el cálculo de medidas como la media poblacional o la proporción poblacional requerimos buscar métodos que nos permitar estimar dichos parámetros. Estos procesos son justamente el tomar muestral aleatorias y establecer mediante probabilidades si dichas muestras son representantes adecuados de los parámetros poblacionales.

Guia Para El Estudio de Distribuciones Muestrales y Estimaciones

Documents

Transcript of Guia Para El Estudio de Distribuciones Muestrales y Estimaciones