Distribución de muestreo

12
REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA DEFENSA UNIVERSIDAD NACIONAL EXPERIMENTAL DE LA FUERZA ARMADA NACIONAL U.N.E.F.A. GUANARE ESTADO PORTUGUSA. NÚCLEO GUANARE. Distribución en el muestreo BACHILLER: Guerra G. Alirio J. C.I:21.526.890

description

Distribución de muestreo

Transcript of Distribución de muestreo

REPBLICA BOLIVARIANA DE VENEZUELAMINISTERIO DEL PODER POPULAR PARA LA DEFENSAUNIVERSIDAD NACIONAL EXPERIMENTALDE LA FUERZA ARMADA NACIONALU.N.E.F.A.GUANARE ESTADO PORTUGUSA.NCLEO GUANARE.

Distribucin en el muestreo

BACHILLER:Guerra G. Alirio J.C.I:21.526.890

Distribucin de muestreo

La distribucin por muestreo de un estadstico muestral es la distribucin de probabilidad del mismo, calculado en cada una de las muestras posibles extradas aleatoriamente de la poblacin.La distribucin de todos los valores posibles que puede asumir un estadstico muestral, calculados a partir de muestras delmismo tamaoy extrado en forma aleatoriade la misma poblacin, se llamadistribucin muestral de ese estadstico. Las distribuciones de muestreo constituyen una pieza importante de estudio por varias razones. En la mayora de los casos, la viabilidad de un experimento dicta el tamao de la muestra. La distribucin de muestreo es la distribucin de probabilidad de una muestra de una poblacin en lugar de toda la poblacin.En palabras ms simples, supongamos que de una determinadapoblacintomas todas las muestras posibles de tamao n y calculas una estadstica (por ejemplo, media) de todas las muestras. Si luego preparas una distribucin de probabilidad de esta estadstica, obtendrs una distribucin de muestreo. Las propiedades de ladistribucin de muestreopueden variar dependiendo de cun pequea sea la muestra en comparacin con la poblacin. Se supone que la poblacin sedistribuye normalmentecomo generalmente sucede. Si eltamao de la muestraes lo suficientemente grande, la distribucin de muestreo tambin estar cerca de lo normal. Si ste es el caso, entonces la distribucin de muestreo puede ser totalmente determinada por dos valores: lamediay ladesviacin estndar. Estos dos parmetros son importantes para calcular la distribucin de muestreo si se nos da la distribucin normal de toda la poblacin.La teora del muestreo como base de la Estadstica inferencialUno de los propsitos de la estadstica inferencial es estimar las caractersticas poblacionales desconocidas, examinando la informacin obtenida de una muestra, de una poblacin. El punto de inters es la muestra, la cual debe ser representativa de la poblacin objeto de estudio.Se seguirn ciertos procedimientos de seleccin para asegurar de que las muestras reflejen observaciones a la poblacin de la que proceden, ya que solo se pueden hacer observaciones probabilsticas sobre una poblacin cuando se usan muestras representativas de la misma. Unapoblacinest formada por la totalidad de las observaciones en las cuales se tiene cierto observa.Unamuestraes un subconjunto de observaciones seleccionadas de una poblacin. Cuando nos interesa estudiar las caractersticas de poblaciones grandes, se utilizan muestras por muchas razones; una enumeracin completa de la poblacin, llamada censo, puede ser econmicamente imposible, o no se cuenta con el tiempo suficiente.A continuacin se ver algunos usos del muestreo en diversos campos: Poltica. Las muestras de las opiniones de los votantes se usan para que los candidatos midan la opinin pblica y el apoyo en las elecciones. Educacin. Las muestras de las calificaciones de los exmenes de estudiantes se usan para determinar la eficiencia de una tcnica o programa de enseanza. Industria. Muestras de los productos de una lnea de ensamble sirve para controlar la calidad. Medicina. Muestras de medidas de azcar en la sangre de pacientes diabticos prueban la eficacia de una tcnica o de un frmaco nuevo. Agricultura. Las muestras del maz cosechado en una parcela proyectan en la produccin los efectos de un fertilizante nuevo. Gobierno. Una muestra de opiniones de los votantes se usara para determinar los criterios del pblico sobre cuestiones relacionadas con el bienestar y la seguridad nacional.Muestreo al azarEl concepto bsico de todo muestreo es el de la muestra al azar. Una muestra de objetos de una poblacin se llama al azar cuando todos los miembros de la poblacin tienen igual oportunidad de aparecer en la muestra. Es muy importante insistir en que esto es igualmente vlido para todos los miembros de la poblacin, tanto para los raros como para los tpicos. Por ejemplo, el plegonero (Merlangus merlangus) desembarcado por un solo barco en Lowestoft suele tener (aqu supondremos que siempre) una composicin de longitudes suavemente unimodal, con la moda normalmente entre 28 y 30 cm, pero alguna vez, por ejemplo, una entre 30, llega a ser hasta de 35 cm. Por lo tanto, si tomamos una muestra al azar de plegonero de cada barco, una vez de cada 30, por trmino medio, tendr una moda de 35 cm o ms, aunque normalmente estar entre 28 y 30 cm. Si entonces un bilogo pesquero, apoyndose en una sola muestra, obtiene una moda de 35 cm, esta desviacin de la media de 29 cm no significar necesariamente una muestra que no sea al azar, puesto que se puede dar este caso una vez de cada 30; pero se puede comprobar tomando ms muestras, por ejemplo tres muestras, que slo tendrn juntas una moda superior a 35 cm una vez entre 27.000.Un procedimiento muy til y de amplia aplicacin para tomar muestras al azar consiste en utilizar nmeros al azar, tal como se describe en la mayor parte de los libros de estadstica. A cada individuo de la poblacin de la cual se quiere extraer una muestra se le atribuye un nmero, y los que se tomen como muestra estarn determinados por la tabla de nmeros al azar. Por ejemplo, si se quieren elegir 5 individuos entre 100, como una muestra, y los 5 primeros nmeros de la tabla son 3, 47, 43, 73 y 86, se tomarn los individuos correspondientes a estos nmeros. Cuando la cantidad de individuos no sea exactamente 100 (o 1.000, etc.) saldrn nmeros que no correspondan a ningn individuo, y no se tendrn en cuenta. Esta prdida de tiempo puede ser reducida atribuyendo a cada individuo dos o ms nmeros, con tal de que todos tengan igual cantidad de nmeros. Supongamos, por ejemplo, que se quieren tomar 5 unidades de una poblacin de 24; en este caso, a cada individuo se le adscriben cuatro nmeros; as la primera unidad tendr, por ejemplo, los nmeros 01 al 04, etc., la 24 tendr 93-96, con lo que quedarn slo cuatro nmeros, 97-100, sin utilizar. Los individuos sometidos al muestreo, que corresponden a la serie previa de 5 nmeros al azar, seran entonces los nmeros 1, 12, 11, 16 y 22 (si uno de los nmeros al azar es 97 o ms, se descarta y se toma otro). En lugar de escoger todas las unidades en la muestra individualmente de la tabla de nmeros al azar, las unidades se pueden tomar a intervalos regulares, por ejemplo, cada 5 100 individuos, y solamente el primero elegido utilizando los nmeros al azar. En el primer ejemplo, la muestra era de 1/20 de la poblacin, de modo que el intervalo de la muestra ser 20 y como el primer nmero elegido al azar era el 3, los siguientes seran 23, 43, 63 y 83. Este sistema es peligroso si en la poblacin hay una periodicidad natural equivalente al intervalo elegido; por ejemplo, en el caso de someter a muestreo los desembarcos totales en un puerto, no se debe anotar la captura cada 7 14 das, puesto que pudiera haber grandes variaciones sistemticas asociadas a los distintos das de la semana.Distribucin

Enestadstica, ladistribucin de Pearson, llamada tambinji cuadradaochi cuadrado() es unadistribucin de probabilidad continuacon un parmetroque representa losgrados de libertadde lavariable aleatoria

Dondeson variables aleatoriasnormalesindependientesdemediacero yvarianzauno. El que la variable aleatoriatenga esta distribucin se representa habitualmente as: .Sufuncin de densidades:

Dondees lafuncin gamma.

Distribucin t de Student

Enprobabilidadyestadstica, ladistribucin t(de Student) es unadistribucin de probabilidadque surge del problema de estimarlamediade unapoblacinnormalmente distribuidacuando eltamao de la muestraes pequeo.Aparece de manera natural al realizar laprueba t de Studentpara la determinacin de las diferencias entre dos medias muestrales y para la construccin delintervalo de confianzapara la diferencia entre las medias de dos poblaciones cuando se desconoce la desviacin tpicade una poblacin y sta debe ser estimada a partir de los datos de una muestra.

La distribucin t de Student es la distribucin de probabilidad del cociente

Donde Zes unavariable aleatoriadistribuida segn unanormaltpica (de media nula yvarianza1). Ves una variable aleatoria que sigue unadistribucin congrados de libertad. ZyVsonindependientesSies una constante no nula, el cocientees una variable aleatoria que sigue ladistribucin t de Student no centralcon parmetro de no-centralidad.Distribucin "f" fisherLa necesidad de disponer de mtodos estadsticos para comparar las varianzas de dos poblaciones es evidente a partir del anlisis de una sola poblacin. Frecuentemente se desea comparar la precisin de un instrumento de medicin con la de otro, la estabilidad de un proceso de manufactura con la de otro o hasta la forma en que vara el procedimiento para calificar de un profesor universitario con la de otro.Intuitivamente, podramos comparar las varianzas de dos poblaciones,y, utilizando la razn de las varianzas muestrales s21/s22. Si s21/s22es casi igual a 1, se tendr poca evidencia para indicar queyno son iguales. Por otra parte, un valor muy grande o muy pequeo para s21/s22, proporcionar evidencia de una diferencia en las varianzas de las poblaciones.La variable aleatoria F se define como el cociente de dos variables aleatorias ji-cuadrada independiente, cada una dividida entre sus respectivos grados de libertad. Esto es,

Donde U y V son variables aleatorias ji-cuadrada independientes con grados de libertad1y2respectivamente.Sean U y V dos variables aleatorias independientes que tienen distribucin ji cuadradas congrados de libertad, respectivamente. Entonces la distribucin de la variable aleatoriaest dada por:

Y se dice que sigue la distribucin F congrados de libertad en el numerador ygrados de libertad en el denominador.La media y la varianza de la distribucin F son:paraparaLa variable aleatoria F es no negativa, y la distribucin tiene un sesgo hacia la derecha. La distribucin F tiene una apariencia muy similar a la distribucin ji-cuadrada; sin embargo, se encuentra centrada respecto a 1, y los dos parmetrosproporcionan una flexibilidad adicional con respecto a la forma de la distribucin.Si s12y s22son las varianzas mustrales independientes de tamao n1y n2tomadas depoblaciones normalescon varianzas12y22, respectivamente, entonces:

Para manejar las tablas de Fisher del libro de Introduccin a la Inferencia Estadstica del autor Genther, se tendr que buscar primero los grados de libertad dos para luego localizar el rea correspondiente, relacionndola con los grados de libertad uno, para calcular el valor de F.El valor de 30.4 es el correspondiente a una Fisher que tiene 3 grados de libertad uno y 6 grados de libertad dos con un rea de cero a Fisher de 0.995. Si lo vemos grficamente:

Como nos podemos imaginar existen varias curvas Fisher, ya que ahora su forma depende de dos variables que son los grados de libertad.Distribucin muestral de la Media aritmtica

Enmatemticasyestadstica, lamedia aritmtica(tambin llamadapromedioo simplementemedia) de un conjunto finito de nmeros es el valor caracterstico de una serie de datos cuantitativos objeto de estudio que parte del principio de la esperanza matemtica o valor esperado, se obtiene a partir de la suma de todos sus valores dividida entre el nmero de sumandos. Cuando el conjunto es unamuestra aleatoriarecibe el nombre demedia muestralsiendo uno de los principalesestadsticos mustrales.Expresada de forma ms intuitiva, podemos decir que la media (aritmtica) es la cantidad total de la variable distribuida a partes iguales entre cada observacin.Por ejemplo, si en una habitacin hay tres personas, la media de dinero que tienen en sus bolsillos sera el resultado de tomar todo el dinero de los tres y dividirlo a partes iguales entre cada uno de ellos. Es decir, la media es una forma de resumir la informacin de una distribucin (dinero en el bolsillo) suponiendo que cada observacin (persona) tuviera la misma cantidad de la variable.Tambin la media aritmtica puede ser denominada comocentro de gravedad[citarequerida]de unadistribucin, el cual no est necesariamente en la mitad.Una de las limitaciones de la media aritmtica es que se trata de una medida muy sensible a los valores extremos; valores muy grandes tienden a aumentarla mientras que valores muy pequeos tienden a reducirla, lo que implica que puede dejar de ser representativa de la poblacin.La media aritmtica se calcula sumando todos los componentes y dividiendo el resultado entre el nmero de componentes. El resultado entero o decimal es la media aritmtica.Dados los nmeros, lamedia aritmticase define como:

Por ejemplo, la media aritmtica de 8, 5 y -1 es igual a:

Se utiliza la letraXcon una barra horizontal sobre el smbolo para representar la media de una muestra (), mientras que la letra (mu) se usa para la media aritmtica de una poblacin, es decir, elvalor esperadode una variable.En otras palabras, es la suma denvalores de lavariabley luego dividido porn: dondenes el nmero de sumandos, o en el caso de estadstica el nmero de datos se da el resultado La suma de las desviaciones con respecto a la media aritmtica es cero (0). La media aritmtica de los cuadrados de las desviaciones de los valores de la variable con respecto a una constante cualquiera se hace mnima cuando dicha constante coincide con la media aritmtica. Si a todos los valores de la variable se le suma una misma cantidad, la media aritmtica queda aumentada en dicha cantidad. Si todos los valores de la variable se multiplican por una misma constante la media aritmtica queda multiplicada por dicha constante. La media aritmtica de un conjunto de nmeros positivos siempre es igual o superior a lamedia geomtrica:

La media aritmtica est comprendida entre el valor mximo y el valor mnimo del conjunto de datos:

En otros trminos hay por lo menos un dato que es mayor o igual que la media aritmtica.Por ejemplo, es fcil deducir que en una reunin de 38 individuos hay necesariamente al menos 4 que nacieron el mismo mes. El promedio de individuos que nacieron por mes es 38/12 3,167. Luego en algn mes nacieron en una cantidad entera y mayor o igual que el promedio, o sea 4 3,167.1

Error estndarElerror estndares ladesviacin estndarde ladistribucin muestralde unestadstico.1El trmino se refiere tambin a una estimacin de la desviacin estndar, derivada de una muestra particular usada para computar la estimacin.Lamedia muestrales el estimador usual de una media poblacional. Sin embargo, diferentes muestras escogidas de la misma poblacin tienden en general a dar distintos valores de medias mustrales. Elerror estndar de la media(es decir, el error debido a la estimacin de la media poblacional a partir de las medias mustrales) es la desviacin estndar de todas las posibles muestras (de un tamao dado) escogidos de esa poblacin. Adems, el error estndar de la media puede referirse a una estimacin de la desviacin estndar, calculada desde una muestra de datos que est siendo analizada al mismo tiempo.En aplicaciones prcticas, el verdadero valor de la desviacin estndar (o del error) es generalmente desconocido. Como resultado, el trmino "error estndar" se usa a veces para referirse a una estimacin de esta cantidad desconocida. En tales casos es importante tener claro de donde proviene, ya que el error estndar es slo una estimacin. Desafortunadamente, esto no es siempre posible y puede ser mejor usar una aproximacin que evite usar el error estndar, por ejemplo usando la estimacin demxima verosimilitudo una aproximacin ms formal derivada de losintervalos de confianza. Un caso bien conocido donde se pueda usar de forma apropiada puede ser en la distribucin t de Student para proporcionar un intervalo de confianza para una media estimada o diferencia de medias. En otros casos, el error estndar puede ser usado para proveer una indicacin del tamao de la incertidumbre, pero su uso formal o semi-formal para proporcionar intervalos de confianza o test debe ser evitado a menos que el tamao de la muestra sea al menos moderadamente grande. Aqu el concepto "grande" depender de las cantidades particulares que vayan a ser analizadas.