51 INTRODUCCION
52 DISTRIBUCIONES MUESTRALES
53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS DE DOS MUESTRAS
51 INTRODUCCION
55 DISTRIBUCION DE LA PROPORCION DE LA MUESTRA
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES DE DOS MUESTRAS
57 RESUMEN
Antes de examinar el tema de estudio de este capftulo es conveniente repasar algunos de los conceptos importantes estudiados hasta ahora En el capitulo 1 se presenta un vocabulario estadfstico util y basico y tambien se estudian los conceptos fundamentales para la recolecci6n de datos En el capitulo 2 se hace resaltar los procesos de organizaci6n y resumen de datos Aquf es donde se introducen los conceptos de tendencia central y dispersi6n y en donde se estudia c6mo ca1cular sus medidas descriptivas En el capitulo 3 se presentan las ideas fundamentales de probabilidad y en el capitulo 4 se considera el concepto de distribuci6n de probabilidad Estos conceptos son importantes para comprender la inferencia estadfstica tema de estudio que abarca la mayor parte de este libro
Este capitulo sirve para vincular los conceptos ya mencionados de naturaleza esencialmente descriptiva con la mayorfa de los temas subsecuentes seleccionados del area de estudio de la inferencia estadfstica
124
52 DISTRIBUCIONES MUESTRALES 125
52 DISTIUBUCIONES MUESmALES
El tema principal de este capitulo trata ace rca de las distribuciones muestrales Es necesario destacar la importancia de un entendimiento claro de estas distribushydones ya que este concepto es la clave para comprender la inferencia estadfsshytica Las distribuciones de probabilidad sirven para dos prop6sitos 1) permiten responder preguntas de probabilidad acerca de estadisticas muestrales y 2) proporcionan la teoria necesaria para hacervalidos los procedimientos de inshyferencia estadistica En este capitulo se utiliza la distribuci6n muestral para contestar preguntas de probabilidad acerca dela estadfstica muestral Se debe recordar que en el capitulo 2 se dijo que la estadistica muestral es una medida descriptiva como la media la mediana la variancia 0 la desviaci6n estandar que se calcula a partir de los datos de la muestra En los siguientes capftulos se estudia c6mo la distribud6n muestral hace validas las inferendas estadisticas Por ahora se inicia con la siguiente definicion
DEFINICION
La distribucion de todos los valores posibles que puede asumir una estadfstica calculados a partir de muestras del mismo tamano seleccionadas aleatoriamente de la misma poblacion se llamadistribuci6n muestrul de esa estadistica
Distribuciones muestrules elaboraci6n Las distribuciones muestrales pueden construirse empfricamente a partir de poblaciones finitas y discretas Para ello se procede como sigue
1 De una poblaci6n finita de tamano N se extraen de manera aleatoria todas las muestras posibles de tamano n
2 Se calcula Iii estadistica de interes para cada muestra
3 S~ ordenan en una columna los distintos valores observados de la estadistica y en otra col-qmna las frecuencias de ocurrencia correspondientes de cada vashylor observado
Elaborar la distribuci6n muestral es una tarea formidable si la poblaci6n es de un tamano muy grande e imposible si la poblaci6n es infinita En ultimo caso es posible obtener aproximaciones de las distribuciones muestrales toshymando un gran numero de muestras de un tamano dado
Distribuciones HllIestrales curacteristicas irnporlantes Normalmente para una distribuci6n muestral se tiene interes en conocer tres cosas media variancia y forma funcional (apariencia gnlfica)
Es bien conocida la dificultad que existe para elaborar una distribuci6n muestral de acuerdo con el procedimiento anterior cuando la poblaci6n es muy grande Tambien constituye un problema cuando la poblaci6n es infinita En este caso 10 mejor que se puede hacer de manera experimental es aproximar la distribuci6n muestral de la estadfstica
126 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Ambos problemas pueden evitarse por medio de las matematicas Aunque los procedimientos que intervienen no son compatibles con el nivel matematico deeste libro las distribuciones muestrales pueden deducirse matematicamente Ellectodnteresado puede consultar cualquiera delos libros de texto de estadfsshytica matematica por ejemplo Larsen y Marx (1) 0 Rice (2)
En las siguientes secciones se estudian algunas de las distribuciones muesshytrales mas frecuentes
53 DISTRIBUCION DE IA MEDIA DE IA MllESTRA
Una distribuci6n muestral importante es la distribucionde la media de la muestra A continuaci6n se da un ejemplo de como elaborar esta distribuci6n siguiendo los pasos del procedimiento descrito en la seccion anterior
EJEMPLO 531
Considere una poblaci6nde tamano N = 5 la cual se compone de las edades de cinco ninos que son pacientes externos de una clfnica de salud mental Las edades son las siguientes Xl = 6 x2 = 8 X3 10 x4 = 12 Y X5 = 14 La media 11 para esa poblaciones igual a Ix)N = lOy la variancia es 8
TABLA 531 Todas las posibles llluestras de talllano n = 2 de una poblacion de talllano N = 5 Las llluestras ar~iba 0 abajo de la diagon31 principal resultan cuando el llluestreo es sin reelllplazos Las lllediai dt~ las llluestras esmn entre parentesis
Segunda seleccion
6 8 12 14
Primera seleccion
6
8
10
12
14
66 (6) 86 (7) 106 (8) 126 (9) 146 (10)
68 (7) 88 (8) 108 (9) 12 8 (10) 148 (11)
6 lO (8)
8 10 (9) 1010 (10)
12 10 (11)
14 10 (12)
6 12 (9)
8 12 (10) 10 12 (11) 12 12 (12) 14 12 (I3)
6 14 (I 0) 814 (11) 10 14 (12) 12 14 (13) 14 14 (14)
127
x
53 DISTRIBUCION DE LA MEDIA DE LA liUESTRA
TABLA 532 Distribucion muestral de x calculada a pmmiddotthmiddot de las muestras de la tabla 531
Frecuencia Frecuencia relativa
6 1 125 7 2 225 8 3 325 9 4 425 10 5 525 11 4 425 12 3 325 13 2 225 14 1 125
Total 25 2525
Se calcula otra medida de dispersion y se designa con la letra S como sigue
40 =lO
N-I 4
Esta cantidad se utilizara en el siguiente capitulo Por ahora se pretende elaborar la distribucion muestral de la media de la muestra X con base en las muestras de tamafio n == 2 seleccionadas de esta poblacion
Solucion Seleccione todas las muestras posibles de tamafio n = 2 de esta poblashyci6n Estas muestrasl junto con sus medias se encuentran en la tabla 53~ 1~
En este ejemplo se observa que cuando el muestreo se efectua con reemplazos hay 25 muestras posibles En general cuando e1 muestreo se neva a cabo con reemplazos el numero de muestras posibles es igual aNn
Puede construirse la distribuci6n muestral de xordenando los dishyferentes valores de xen una columna y sus frecuencias de ocurrencia en Ia otra tal como 10 muestra la tabla 532 bull
En la tabla 532 se aprecian los datos que satisfacen los requerimientos para la distribuci6n de probabilidad Las probabilidades individuales todas son mayores a 0 y la suma es igual a 1
Se mencion6 al principio que un interes principal radica en la forma funcional de la distribuci6n muestral la media y la variancia Ahora estas caracteristicas se consideran para la distribucion muestral de la media de la muestra x
128 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
fIx)
6
5
4
3
2
8 10 12 14 x6 Distribucion de la poblacion
fIX)
6
5
4
3
2
0
Distribucion muestral de X
FIGURA 531 Distribuci6n de la poblaci6n y distribuci6n muestral de x
DistribuciOn muestral d~xfQrmafunciQnal En la figura 531 se muestra el histograma de x junto con la distribucion de la poblacion Es notashyble la diferencia entre la apariencia del histograma de la poblacion y la del histograma de la distribuci6n muestral de x Mientras que el primero esta disshytribuido uniformemente el segundo crece gradualmente hasta un punto maxishymo y despues decrece fonnando una figura simetrica
Distribuci6n muestral de x la media EI siguiente paso es calcular la media representada por lx de la distribucion muestral Para hacerlo se sushymanlas 25 medias de la muestramiddoty el resultado se divide entre 25 As
LXi 6+7+7+8+middotmiddotmiddot+14 250 Il- = -- = ------- 10
x N 25 25
Es interesante notar que la media de ladistribucion muestral para x tieshyne el mismo valor que la media de la poblacion original
129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA
Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue
lt L(xj ilx)2cr=----shy
N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2
=-------------------------------- shy25
100 =-=4
25
Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es
cr 2 8 cr~= =-=4
x n 2
A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar
Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0
cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL
DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades
1 La distribucion de x sera normal
2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras
3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra
llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo
130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Teorema del limite central
Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande
Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande
La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande
Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra
Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que
N 51 5middot4middot31 = 10 muestras posibles
n(N n) 2131 213
131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
La media de las lO medias muestrales es
Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n
La variancia de la distribuci6n muestral se calcula como sigue
30 - 3 10
y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es
n N 1
Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado
Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia
n N-l
Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal
Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N
1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05
132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES
Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones
1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il
b) Ox =degIf c) La distribucion muestral de x es normal
2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida
a) Ilx = Il
b) Ox =degI~donde n IN 05
- N-n Ox (o-vn)I- shy
V N I
c) La distribucion muestral de xes aproximadamente normal
AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos
EJEMPLO 532
Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190
Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion
Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a
1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse
En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente
133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar
x Jlx z=--- (531)
(5
La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral
(a)
x
a x= = 40161 110
1357
kJi=1856 190
(b)
109
1357
o z
(e)
FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar
134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Esta area es igual al area de la derecha de
190-1856 z=----- 44 =110
40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357
La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull
EJEMPLO 533
Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml
Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es
P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212
= P(-236 ~ z ~ 236)
= 9909 - 0091
=9818 bull EJERCICIOS
531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar
532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea
a) Entre 170 y 195 b) Abajo de 175
c) Arriba de 190
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
52 DISTRIBUCIONES MUESTRALES 125
52 DISTIUBUCIONES MUESmALES
El tema principal de este capitulo trata ace rca de las distribuciones muestrales Es necesario destacar la importancia de un entendimiento claro de estas distribushydones ya que este concepto es la clave para comprender la inferencia estadfsshytica Las distribuciones de probabilidad sirven para dos prop6sitos 1) permiten responder preguntas de probabilidad acerca de estadisticas muestrales y 2) proporcionan la teoria necesaria para hacervalidos los procedimientos de inshyferencia estadistica En este capitulo se utiliza la distribuci6n muestral para contestar preguntas de probabilidad acerca dela estadfstica muestral Se debe recordar que en el capitulo 2 se dijo que la estadistica muestral es una medida descriptiva como la media la mediana la variancia 0 la desviaci6n estandar que se calcula a partir de los datos de la muestra En los siguientes capftulos se estudia c6mo la distribud6n muestral hace validas las inferendas estadisticas Por ahora se inicia con la siguiente definicion
DEFINICION
La distribucion de todos los valores posibles que puede asumir una estadfstica calculados a partir de muestras del mismo tamano seleccionadas aleatoriamente de la misma poblacion se llamadistribuci6n muestrul de esa estadistica
Distribuciones muestrules elaboraci6n Las distribuciones muestrales pueden construirse empfricamente a partir de poblaciones finitas y discretas Para ello se procede como sigue
1 De una poblaci6n finita de tamano N se extraen de manera aleatoria todas las muestras posibles de tamano n
2 Se calcula Iii estadistica de interes para cada muestra
3 S~ ordenan en una columna los distintos valores observados de la estadistica y en otra col-qmna las frecuencias de ocurrencia correspondientes de cada vashylor observado
Elaborar la distribuci6n muestral es una tarea formidable si la poblaci6n es de un tamano muy grande e imposible si la poblaci6n es infinita En ultimo caso es posible obtener aproximaciones de las distribuciones muestrales toshymando un gran numero de muestras de un tamano dado
Distribuciones HllIestrales curacteristicas irnporlantes Normalmente para una distribuci6n muestral se tiene interes en conocer tres cosas media variancia y forma funcional (apariencia gnlfica)
Es bien conocida la dificultad que existe para elaborar una distribuci6n muestral de acuerdo con el procedimiento anterior cuando la poblaci6n es muy grande Tambien constituye un problema cuando la poblaci6n es infinita En este caso 10 mejor que se puede hacer de manera experimental es aproximar la distribuci6n muestral de la estadfstica
126 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Ambos problemas pueden evitarse por medio de las matematicas Aunque los procedimientos que intervienen no son compatibles con el nivel matematico deeste libro las distribuciones muestrales pueden deducirse matematicamente Ellectodnteresado puede consultar cualquiera delos libros de texto de estadfsshytica matematica por ejemplo Larsen y Marx (1) 0 Rice (2)
En las siguientes secciones se estudian algunas de las distribuciones muesshytrales mas frecuentes
53 DISTRIBUCION DE IA MEDIA DE IA MllESTRA
Una distribuci6n muestral importante es la distribucionde la media de la muestra A continuaci6n se da un ejemplo de como elaborar esta distribuci6n siguiendo los pasos del procedimiento descrito en la seccion anterior
EJEMPLO 531
Considere una poblaci6nde tamano N = 5 la cual se compone de las edades de cinco ninos que son pacientes externos de una clfnica de salud mental Las edades son las siguientes Xl = 6 x2 = 8 X3 10 x4 = 12 Y X5 = 14 La media 11 para esa poblaciones igual a Ix)N = lOy la variancia es 8
TABLA 531 Todas las posibles llluestras de talllano n = 2 de una poblacion de talllano N = 5 Las llluestras ar~iba 0 abajo de la diagon31 principal resultan cuando el llluestreo es sin reelllplazos Las lllediai dt~ las llluestras esmn entre parentesis
Segunda seleccion
6 8 12 14
Primera seleccion
6
8
10
12
14
66 (6) 86 (7) 106 (8) 126 (9) 146 (10)
68 (7) 88 (8) 108 (9) 12 8 (10) 148 (11)
6 lO (8)
8 10 (9) 1010 (10)
12 10 (11)
14 10 (12)
6 12 (9)
8 12 (10) 10 12 (11) 12 12 (12) 14 12 (I3)
6 14 (I 0) 814 (11) 10 14 (12) 12 14 (13) 14 14 (14)
127
x
53 DISTRIBUCION DE LA MEDIA DE LA liUESTRA
TABLA 532 Distribucion muestral de x calculada a pmmiddotthmiddot de las muestras de la tabla 531
Frecuencia Frecuencia relativa
6 1 125 7 2 225 8 3 325 9 4 425 10 5 525 11 4 425 12 3 325 13 2 225 14 1 125
Total 25 2525
Se calcula otra medida de dispersion y se designa con la letra S como sigue
40 =lO
N-I 4
Esta cantidad se utilizara en el siguiente capitulo Por ahora se pretende elaborar la distribucion muestral de la media de la muestra X con base en las muestras de tamafio n == 2 seleccionadas de esta poblacion
Solucion Seleccione todas las muestras posibles de tamafio n = 2 de esta poblashyci6n Estas muestrasl junto con sus medias se encuentran en la tabla 53~ 1~
En este ejemplo se observa que cuando el muestreo se efectua con reemplazos hay 25 muestras posibles En general cuando e1 muestreo se neva a cabo con reemplazos el numero de muestras posibles es igual aNn
Puede construirse la distribuci6n muestral de xordenando los dishyferentes valores de xen una columna y sus frecuencias de ocurrencia en Ia otra tal como 10 muestra la tabla 532 bull
En la tabla 532 se aprecian los datos que satisfacen los requerimientos para la distribuci6n de probabilidad Las probabilidades individuales todas son mayores a 0 y la suma es igual a 1
Se mencion6 al principio que un interes principal radica en la forma funcional de la distribuci6n muestral la media y la variancia Ahora estas caracteristicas se consideran para la distribucion muestral de la media de la muestra x
128 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
fIx)
6
5
4
3
2
8 10 12 14 x6 Distribucion de la poblacion
fIX)
6
5
4
3
2
0
Distribucion muestral de X
FIGURA 531 Distribuci6n de la poblaci6n y distribuci6n muestral de x
DistribuciOn muestral d~xfQrmafunciQnal En la figura 531 se muestra el histograma de x junto con la distribucion de la poblacion Es notashyble la diferencia entre la apariencia del histograma de la poblacion y la del histograma de la distribuci6n muestral de x Mientras que el primero esta disshytribuido uniformemente el segundo crece gradualmente hasta un punto maxishymo y despues decrece fonnando una figura simetrica
Distribuci6n muestral de x la media EI siguiente paso es calcular la media representada por lx de la distribucion muestral Para hacerlo se sushymanlas 25 medias de la muestramiddoty el resultado se divide entre 25 As
LXi 6+7+7+8+middotmiddotmiddot+14 250 Il- = -- = ------- 10
x N 25 25
Es interesante notar que la media de ladistribucion muestral para x tieshyne el mismo valor que la media de la poblacion original
129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA
Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue
lt L(xj ilx)2cr=----shy
N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2
=-------------------------------- shy25
100 =-=4
25
Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es
cr 2 8 cr~= =-=4
x n 2
A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar
Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0
cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL
DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades
1 La distribucion de x sera normal
2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras
3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra
llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo
130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Teorema del limite central
Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande
Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande
La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande
Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra
Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que
N 51 5middot4middot31 = 10 muestras posibles
n(N n) 2131 213
131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
La media de las lO medias muestrales es
Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n
La variancia de la distribuci6n muestral se calcula como sigue
30 - 3 10
y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es
n N 1
Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado
Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia
n N-l
Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal
Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N
1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05
132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES
Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones
1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il
b) Ox =degIf c) La distribucion muestral de x es normal
2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida
a) Ilx = Il
b) Ox =degI~donde n IN 05
- N-n Ox (o-vn)I- shy
V N I
c) La distribucion muestral de xes aproximadamente normal
AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos
EJEMPLO 532
Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190
Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion
Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a
1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse
En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente
133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar
x Jlx z=--- (531)
(5
La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral
(a)
x
a x= = 40161 110
1357
kJi=1856 190
(b)
109
1357
o z
(e)
FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar
134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Esta area es igual al area de la derecha de
190-1856 z=----- 44 =110
40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357
La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull
EJEMPLO 533
Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml
Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es
P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212
= P(-236 ~ z ~ 236)
= 9909 - 0091
=9818 bull EJERCICIOS
531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar
532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea
a) Entre 170 y 195 b) Abajo de 175
c) Arriba de 190
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
126 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Ambos problemas pueden evitarse por medio de las matematicas Aunque los procedimientos que intervienen no son compatibles con el nivel matematico deeste libro las distribuciones muestrales pueden deducirse matematicamente Ellectodnteresado puede consultar cualquiera delos libros de texto de estadfsshytica matematica por ejemplo Larsen y Marx (1) 0 Rice (2)
En las siguientes secciones se estudian algunas de las distribuciones muesshytrales mas frecuentes
53 DISTRIBUCION DE IA MEDIA DE IA MllESTRA
Una distribuci6n muestral importante es la distribucionde la media de la muestra A continuaci6n se da un ejemplo de como elaborar esta distribuci6n siguiendo los pasos del procedimiento descrito en la seccion anterior
EJEMPLO 531
Considere una poblaci6nde tamano N = 5 la cual se compone de las edades de cinco ninos que son pacientes externos de una clfnica de salud mental Las edades son las siguientes Xl = 6 x2 = 8 X3 10 x4 = 12 Y X5 = 14 La media 11 para esa poblaciones igual a Ix)N = lOy la variancia es 8
TABLA 531 Todas las posibles llluestras de talllano n = 2 de una poblacion de talllano N = 5 Las llluestras ar~iba 0 abajo de la diagon31 principal resultan cuando el llluestreo es sin reelllplazos Las lllediai dt~ las llluestras esmn entre parentesis
Segunda seleccion
6 8 12 14
Primera seleccion
6
8
10
12
14
66 (6) 86 (7) 106 (8) 126 (9) 146 (10)
68 (7) 88 (8) 108 (9) 12 8 (10) 148 (11)
6 lO (8)
8 10 (9) 1010 (10)
12 10 (11)
14 10 (12)
6 12 (9)
8 12 (10) 10 12 (11) 12 12 (12) 14 12 (I3)
6 14 (I 0) 814 (11) 10 14 (12) 12 14 (13) 14 14 (14)
127
x
53 DISTRIBUCION DE LA MEDIA DE LA liUESTRA
TABLA 532 Distribucion muestral de x calculada a pmmiddotthmiddot de las muestras de la tabla 531
Frecuencia Frecuencia relativa
6 1 125 7 2 225 8 3 325 9 4 425 10 5 525 11 4 425 12 3 325 13 2 225 14 1 125
Total 25 2525
Se calcula otra medida de dispersion y se designa con la letra S como sigue
40 =lO
N-I 4
Esta cantidad se utilizara en el siguiente capitulo Por ahora se pretende elaborar la distribucion muestral de la media de la muestra X con base en las muestras de tamafio n == 2 seleccionadas de esta poblacion
Solucion Seleccione todas las muestras posibles de tamafio n = 2 de esta poblashyci6n Estas muestrasl junto con sus medias se encuentran en la tabla 53~ 1~
En este ejemplo se observa que cuando el muestreo se efectua con reemplazos hay 25 muestras posibles En general cuando e1 muestreo se neva a cabo con reemplazos el numero de muestras posibles es igual aNn
Puede construirse la distribuci6n muestral de xordenando los dishyferentes valores de xen una columna y sus frecuencias de ocurrencia en Ia otra tal como 10 muestra la tabla 532 bull
En la tabla 532 se aprecian los datos que satisfacen los requerimientos para la distribuci6n de probabilidad Las probabilidades individuales todas son mayores a 0 y la suma es igual a 1
Se mencion6 al principio que un interes principal radica en la forma funcional de la distribuci6n muestral la media y la variancia Ahora estas caracteristicas se consideran para la distribucion muestral de la media de la muestra x
128 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
fIx)
6
5
4
3
2
8 10 12 14 x6 Distribucion de la poblacion
fIX)
6
5
4
3
2
0
Distribucion muestral de X
FIGURA 531 Distribuci6n de la poblaci6n y distribuci6n muestral de x
DistribuciOn muestral d~xfQrmafunciQnal En la figura 531 se muestra el histograma de x junto con la distribucion de la poblacion Es notashyble la diferencia entre la apariencia del histograma de la poblacion y la del histograma de la distribuci6n muestral de x Mientras que el primero esta disshytribuido uniformemente el segundo crece gradualmente hasta un punto maxishymo y despues decrece fonnando una figura simetrica
Distribuci6n muestral de x la media EI siguiente paso es calcular la media representada por lx de la distribucion muestral Para hacerlo se sushymanlas 25 medias de la muestramiddoty el resultado se divide entre 25 As
LXi 6+7+7+8+middotmiddotmiddot+14 250 Il- = -- = ------- 10
x N 25 25
Es interesante notar que la media de ladistribucion muestral para x tieshyne el mismo valor que la media de la poblacion original
129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA
Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue
lt L(xj ilx)2cr=----shy
N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2
=-------------------------------- shy25
100 =-=4
25
Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es
cr 2 8 cr~= =-=4
x n 2
A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar
Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0
cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL
DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades
1 La distribucion de x sera normal
2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras
3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra
llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo
130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Teorema del limite central
Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande
Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande
La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande
Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra
Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que
N 51 5middot4middot31 = 10 muestras posibles
n(N n) 2131 213
131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
La media de las lO medias muestrales es
Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n
La variancia de la distribuci6n muestral se calcula como sigue
30 - 3 10
y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es
n N 1
Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado
Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia
n N-l
Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal
Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N
1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05
132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES
Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones
1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il
b) Ox =degIf c) La distribucion muestral de x es normal
2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida
a) Ilx = Il
b) Ox =degI~donde n IN 05
- N-n Ox (o-vn)I- shy
V N I
c) La distribucion muestral de xes aproximadamente normal
AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos
EJEMPLO 532
Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190
Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion
Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a
1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse
En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente
133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar
x Jlx z=--- (531)
(5
La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral
(a)
x
a x= = 40161 110
1357
kJi=1856 190
(b)
109
1357
o z
(e)
FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar
134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Esta area es igual al area de la derecha de
190-1856 z=----- 44 =110
40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357
La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull
EJEMPLO 533
Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml
Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es
P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212
= P(-236 ~ z ~ 236)
= 9909 - 0091
=9818 bull EJERCICIOS
531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar
532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea
a) Entre 170 y 195 b) Abajo de 175
c) Arriba de 190
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
127
x
53 DISTRIBUCION DE LA MEDIA DE LA liUESTRA
TABLA 532 Distribucion muestral de x calculada a pmmiddotthmiddot de las muestras de la tabla 531
Frecuencia Frecuencia relativa
6 1 125 7 2 225 8 3 325 9 4 425 10 5 525 11 4 425 12 3 325 13 2 225 14 1 125
Total 25 2525
Se calcula otra medida de dispersion y se designa con la letra S como sigue
40 =lO
N-I 4
Esta cantidad se utilizara en el siguiente capitulo Por ahora se pretende elaborar la distribucion muestral de la media de la muestra X con base en las muestras de tamafio n == 2 seleccionadas de esta poblacion
Solucion Seleccione todas las muestras posibles de tamafio n = 2 de esta poblashyci6n Estas muestrasl junto con sus medias se encuentran en la tabla 53~ 1~
En este ejemplo se observa que cuando el muestreo se efectua con reemplazos hay 25 muestras posibles En general cuando e1 muestreo se neva a cabo con reemplazos el numero de muestras posibles es igual aNn
Puede construirse la distribuci6n muestral de xordenando los dishyferentes valores de xen una columna y sus frecuencias de ocurrencia en Ia otra tal como 10 muestra la tabla 532 bull
En la tabla 532 se aprecian los datos que satisfacen los requerimientos para la distribuci6n de probabilidad Las probabilidades individuales todas son mayores a 0 y la suma es igual a 1
Se mencion6 al principio que un interes principal radica en la forma funcional de la distribuci6n muestral la media y la variancia Ahora estas caracteristicas se consideran para la distribucion muestral de la media de la muestra x
128 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
fIx)
6
5
4
3
2
8 10 12 14 x6 Distribucion de la poblacion
fIX)
6
5
4
3
2
0
Distribucion muestral de X
FIGURA 531 Distribuci6n de la poblaci6n y distribuci6n muestral de x
DistribuciOn muestral d~xfQrmafunciQnal En la figura 531 se muestra el histograma de x junto con la distribucion de la poblacion Es notashyble la diferencia entre la apariencia del histograma de la poblacion y la del histograma de la distribuci6n muestral de x Mientras que el primero esta disshytribuido uniformemente el segundo crece gradualmente hasta un punto maxishymo y despues decrece fonnando una figura simetrica
Distribuci6n muestral de x la media EI siguiente paso es calcular la media representada por lx de la distribucion muestral Para hacerlo se sushymanlas 25 medias de la muestramiddoty el resultado se divide entre 25 As
LXi 6+7+7+8+middotmiddotmiddot+14 250 Il- = -- = ------- 10
x N 25 25
Es interesante notar que la media de ladistribucion muestral para x tieshyne el mismo valor que la media de la poblacion original
129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA
Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue
lt L(xj ilx)2cr=----shy
N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2
=-------------------------------- shy25
100 =-=4
25
Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es
cr 2 8 cr~= =-=4
x n 2
A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar
Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0
cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL
DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades
1 La distribucion de x sera normal
2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras
3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra
llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo
130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Teorema del limite central
Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande
Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande
La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande
Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra
Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que
N 51 5middot4middot31 = 10 muestras posibles
n(N n) 2131 213
131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
La media de las lO medias muestrales es
Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n
La variancia de la distribuci6n muestral se calcula como sigue
30 - 3 10
y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es
n N 1
Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado
Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia
n N-l
Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal
Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N
1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05
132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES
Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones
1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il
b) Ox =degIf c) La distribucion muestral de x es normal
2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida
a) Ilx = Il
b) Ox =degI~donde n IN 05
- N-n Ox (o-vn)I- shy
V N I
c) La distribucion muestral de xes aproximadamente normal
AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos
EJEMPLO 532
Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190
Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion
Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a
1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse
En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente
133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar
x Jlx z=--- (531)
(5
La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral
(a)
x
a x= = 40161 110
1357
kJi=1856 190
(b)
109
1357
o z
(e)
FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar
134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Esta area es igual al area de la derecha de
190-1856 z=----- 44 =110
40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357
La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull
EJEMPLO 533
Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml
Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es
P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212
= P(-236 ~ z ~ 236)
= 9909 - 0091
=9818 bull EJERCICIOS
531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar
532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea
a) Entre 170 y 195 b) Abajo de 175
c) Arriba de 190
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
128 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
fIx)
6
5
4
3
2
8 10 12 14 x6 Distribucion de la poblacion
fIX)
6
5
4
3
2
0
Distribucion muestral de X
FIGURA 531 Distribuci6n de la poblaci6n y distribuci6n muestral de x
DistribuciOn muestral d~xfQrmafunciQnal En la figura 531 se muestra el histograma de x junto con la distribucion de la poblacion Es notashyble la diferencia entre la apariencia del histograma de la poblacion y la del histograma de la distribuci6n muestral de x Mientras que el primero esta disshytribuido uniformemente el segundo crece gradualmente hasta un punto maxishymo y despues decrece fonnando una figura simetrica
Distribuci6n muestral de x la media EI siguiente paso es calcular la media representada por lx de la distribucion muestral Para hacerlo se sushymanlas 25 medias de la muestramiddoty el resultado se divide entre 25 As
LXi 6+7+7+8+middotmiddotmiddot+14 250 Il- = -- = ------- 10
x N 25 25
Es interesante notar que la media de ladistribucion muestral para x tieshyne el mismo valor que la media de la poblacion original
129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA
Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue
lt L(xj ilx)2cr=----shy
N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2
=-------------------------------- shy25
100 =-=4
25
Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es
cr 2 8 cr~= =-=4
x n 2
A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar
Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0
cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL
DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades
1 La distribucion de x sera normal
2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras
3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra
llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo
130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Teorema del limite central
Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande
Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande
La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande
Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra
Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que
N 51 5middot4middot31 = 10 muestras posibles
n(N n) 2131 213
131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
La media de las lO medias muestrales es
Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n
La variancia de la distribuci6n muestral se calcula como sigue
30 - 3 10
y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es
n N 1
Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado
Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia
n N-l
Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal
Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N
1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05
132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES
Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones
1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il
b) Ox =degIf c) La distribucion muestral de x es normal
2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida
a) Ilx = Il
b) Ox =degI~donde n IN 05
- N-n Ox (o-vn)I- shy
V N I
c) La distribucion muestral de xes aproximadamente normal
AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos
EJEMPLO 532
Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190
Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion
Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a
1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse
En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente
133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar
x Jlx z=--- (531)
(5
La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral
(a)
x
a x= = 40161 110
1357
kJi=1856 190
(b)
109
1357
o z
(e)
FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar
134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Esta area es igual al area de la derecha de
190-1856 z=----- 44 =110
40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357
La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull
EJEMPLO 533
Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml
Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es
P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212
= P(-236 ~ z ~ 236)
= 9909 - 0091
=9818 bull EJERCICIOS
531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar
532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea
a) Entre 170 y 195 b) Abajo de 175
c) Arriba de 190
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
129 53 DISTRIBUCION DE LA MEDIA DE LA lIgt1UESTRA
Dislribuei6n mueslral de x varianeia Finalmente el calculo de la variancia de x representada por es como sigue
lt L(xj ilx)2cr=----shy
N (6 10)2+(7-10)2+(7-10)2+ +(14 10)2
=-------------------------------- shy25
100 =-=4
25
Tambien se puede advertir que la variancia de la distribucion muestral no es igual a la variancia de la poblacion Sin embargo es interesante observar que Ia variancia de la distribucion muestral es igual a la variancia de la poblacion dividida entre el tamano de la muestra utilizada para obtener la distribuci6n muestral Esto es
cr 2 8 cr~= =-=4
x n 2
A la raiz cuadrada de la variancia de la distribucion muestral ~ = cr rse Ie llama error esttindar de fa media 0 simplemente error estandar
Estos resultados no son coincidencias sino ejemplos de las caracteristicas de las distribuciones muestrales en general cuando el muestreo es con reemplazo 0
cuando se efectUa a partir de una poblaci6n infinita Para generalizar se debe disshytinguir entre dos situaciones muestreo a partir de una poblaci6n que sigue una distribuci6n normal y muestreo a partir de una poblacion que no sigue una distrishybucion normaL
DislribuciOn mueslral de x mueslreo a partir de poblaeiones que siguen una dislribuci6n normal Cuando el muestreo se realiza a partir de una poblacion que sigue una distribucion normal la distribucion de la media de la muestra tiene las siguientes propiedades
1 La distribucion de x sera normal
2 La media ilx de la distribuci6n de x sera igual a la media de la poblaci6n de la cual se seleccionaron las muestras
3 La variancia cri de la distribuci6n de x sera igual a la variancia de la poblashycion dividida entre el tamano de la muestra
llueslreo a parlir de poblaciones que no signen dlslribuei6n normal Cuando el muestreo seefectua a partir de una poblacion que no sigue una distribushycion normal se utiliza un teorema matematico conocido como teorema del limite central La importancia de este teorema en la inferencia estadistica se resume en el siguiente parrafo
130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Teorema del limite central
Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande
Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande
La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande
Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra
Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que
N 51 5middot4middot31 = 10 muestras posibles
n(N n) 2131 213
131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
La media de las lO medias muestrales es
Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n
La variancia de la distribuci6n muestral se calcula como sigue
30 - 3 10
y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es
n N 1
Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado
Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia
n N-l
Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal
Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N
1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05
132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES
Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones
1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il
b) Ox =degIf c) La distribucion muestral de x es normal
2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida
a) Ilx = Il
b) Ox =degI~donde n IN 05
- N-n Ox (o-vn)I- shy
V N I
c) La distribucion muestral de xes aproximadamente normal
AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos
EJEMPLO 532
Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190
Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion
Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a
1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse
En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente
133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar
x Jlx z=--- (531)
(5
La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral
(a)
x
a x= = 40161 110
1357
kJi=1856 190
(b)
109
1357
o z
(e)
FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar
134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Esta area es igual al area de la derecha de
190-1856 z=----- 44 =110
40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357
La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull
EJEMPLO 533
Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml
Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es
P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212
= P(-236 ~ z ~ 236)
= 9909 - 0091
=9818 bull EJERCICIOS
531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar
532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea
a) Entre 170 y 195 b) Abajo de 175
c) Arriba de 190
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
130 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Teorema del limite central
Dada una poblaci6n de cualquierforma funcional no normal can una media y variancia finita 0 2 La distribuci6n muestraL de x calculada a partir de muesiras de tamano n de dicha poblacion sera ccsi rormal con mediay variancia 021n wando la muestra es muy grande
Observe que el teorema del limite central permite tomar muestras a partir de poblaciones con distribucion no normal y garantizar que se obtengan aproximadashymente los mismos resultados que si la poblacion tuviera una distribucion normal siempre que se tome una muestra grande
La importancia de esto se demostrara mas adelante al estudiar que una distrishybucion muestral con distribucion normal es una herramienta importante en la infeshyrencia estadfstica En el caso de la media de la muestra se dene la seguridad de que la distribucion muestral esta distribuida en forma al menos aproximadamente norshymal con tres condiciones 1) cuando se hace el muestreo a partir de una poblacion con distribucion normal 2) cuando se hace el muestreo a partir de una poblacion que no exhibe una distribucion normal y la muestra es grande y 3) cuando se hace el muestreo a partir de una poblacion cuya forma funcional se desconoce siempre que el tamano de la muestra sea grande
Alllegar a este punto surge una pregunta logica (que tan grande debe ser la muestra para que el teorema dellfmite central sea aplicable No existe una sola respuesshyta pues el tamano de la muestra depende de la condicion de no-normalidad en la poblacion Una regIa empirica establece que en la mayoria de las situaciones pracshyticas una muestra de tamano 30 es suficiente En general la aproximacion a la normalidad de la distribucion muestral para x llega a ser mucho mejor a medida que crece el tamano de la muestra
Muestreo sin reemplazo Los resultados anteriores se han dado con la premisa de que el muestreo es con reemplazo 0 que la muestra fue extrafda de una poblacion infinita En general no se efectuan muestreos con reemplazo y en muchos casos practicos el muestreo debe hacerse a partir de una poblacion finita por 10 tanto es necesario conocer el comportamiento de la distribucion muestral de la media de la muestra con estas condiciones Antes de hacer cualquier afirmacion general convieshyne revisar nuevamente los datos de la tabla 531 Las medias de la muestra que resultan cuando el muestreo es sin reemplazos se presentan sobre la diagonal princishypal que son las mismas que estan por debajo de dicha diagonal siempre y cuando se ignore el orden en que se hicieron las observaciones Se observa que hay 10 muestras posibles En general cuando se extraen sin reemplazos muestras de tamano n a parshytir de una poblacion finita de tamano N y se ignora el orden en que son extraidas las muestras se obtiene el numero de muestras posibles mediante la combinacion de N cosas tomadas n a la vez En el siguiente ejemplo se tiene que
N 51 5middot4middot31 = 10 muestras posibles
n(N n) 2131 213
131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
La media de las lO medias muestrales es
Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n
La variancia de la distribuci6n muestral se calcula como sigue
30 - 3 10
y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es
n N 1
Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado
Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia
n N-l
Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal
Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N
1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05
132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES
Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones
1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il
b) Ox =degIf c) La distribucion muestral de x es normal
2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida
a) Ilx = Il
b) Ox =degI~donde n IN 05
- N-n Ox (o-vn)I- shy
V N I
c) La distribucion muestral de xes aproximadamente normal
AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos
EJEMPLO 532
Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190
Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion
Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a
1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse
En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente
133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar
x Jlx z=--- (531)
(5
La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral
(a)
x
a x= = 40161 110
1357
kJi=1856 190
(b)
109
1357
o z
(e)
FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar
134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Esta area es igual al area de la derecha de
190-1856 z=----- 44 =110
40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357
La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull
EJEMPLO 533
Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml
Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es
P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212
= P(-236 ~ z ~ 236)
= 9909 - 0091
=9818 bull EJERCICIOS
531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar
532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea
a) Entre 170 y 195 b) Abajo de 175
c) Arriba de 190
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
131 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
La media de las lO medias muestrales es
Nuevamente se aprecia que la media de la distribuci6n muestral es igual a la meshydia de la poblaci6n
La variancia de la distribuci6n muestral se calcula como sigue
30 - 3 10
y en esta-ocasi6n se observa que la variancia de la distribuci6n muestral no es igual a la variancia de la poblaci6n dividida entre el tamano de la muestra porque (J~ = 3 82 = 4 Sin embargoexiste una relaci6n interesante que se descubre al multiplicar (J2n por (N n )(N - 1) Esto es
n N 1
Este resultado indica que si se multiplica la variancia de la distribuci6n muestral que se obtendria si el muestreo fuese con reemplazos por el factor (N n)(NshyI) se obtiene el valor de la variancia de la distribuci6n muestral que resulta cuando el muestreo es sin reemplazos Es posible generalizar estos resultados con el siguiente enunciado
Cuando el muestreo es sin reemplazos a partir de una poblaci6n finita la distribuci6n muestral de x tendra una media JL y variancia
n N-l
Si el tamano de la muestra es muy grande el teorema del Hmite central es aplicable y la distribuci6n muestral de x sera aproximadamente normal
Carreccion par pabacion finita AI factor (N n)(N 1) se Ie llama correcci6n por poblaci6n jinita y se puede omitir cuando el tamano de la muestra es pequeno en comparaci6n con el tamano de la poblaci6n Cuando la poblashycion es mucho mayor que la muestra la diferencia entre (J2n y laquoJ2n)[(N - n )(N
1)] es insignificante Por ejemplo si una poblaci6n tiene un tamano de 10000 Yel tamano de una muestra de esta poblaci6n es de 25 la correcci6n por poshyblaci6n finita es igual a (10000 - 25)(9999) 9976 Multiplicar (J2n por 9976 es casi equivalente a multiplicar por 1 La mayorfa de los estadfsticos no utilizan la correccion por poblaci6n finita a menos que la muestra sea de mas de 5 por ciento de la poblaci6n Es decir la correcci6n de poblaci6n finita geneshyralmente se ignora cuando nN 05
132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES
Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones
1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il
b) Ox =degIf c) La distribucion muestral de x es normal
2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida
a) Ilx = Il
b) Ox =degI~donde n IN 05
- N-n Ox (o-vn)I- shy
V N I
c) La distribucion muestral de xes aproximadamente normal
AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos
EJEMPLO 532
Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190
Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion
Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a
1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse
En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente
133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar
x Jlx z=--- (531)
(5
La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral
(a)
x
a x= = 40161 110
1357
kJi=1856 190
(b)
109
1357
o z
(e)
FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar
134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Esta area es igual al area de la derecha de
190-1856 z=----- 44 =110
40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357
La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull
EJEMPLO 533
Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml
Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es
P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212
= P(-236 ~ z ~ 236)
= 9909 - 0091
=9818 bull EJERCICIOS
531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar
532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea
a) Entre 170 y 195 b) Abajo de 175
c) Arriba de 190
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
132 CAPITULO 5 ALGUNAS DlSTRIBUCIONES DE MUESTREO IMPORTANTES
Distribuci6n muestral de x el resumen Las caracteristicas de la distribushycion muestral de x se resumen en las dos siguientes condiciones
1 Cuando el muestreo se realiza a partir de una pobJacion distribuida normalshymente con una variancia de poblacion conocida a) Ilx Il
b) Ox =degIf c) La distribucion muestral de x es normal
2 EI muestreo se efectua a partir de una poblacion que sigue una distribucion no normal con una variancia de poblacion conocida
a) Ilx = Il
b) Ox =degI~donde n IN 05
- N-n Ox (o-vn)I- shy
V N I
c) La distribucion muestral de xes aproximadamente normal
AplicaciQnes Como se vera en capitulos posteriores el conocimiento y la comprension de las distribuciones muestrales son necesarios para entender los conceptos de la inferencia estadfstica La aplicacion mas sencilla para la distribucion muestral de la media de la muestra es el calculo de la probabilidad de obtener una muestra con una media de alguna magnitud especificada Esto se ilustra con algunos ejemplos
EJEMPLO 532
Suponga que en una poblacion grande de seres humanos la dimension del diameshytro craneal sigue una distribucion aproximadamente normal con una media de 1856 mm y una desviacion estandar de 127 mm ~CuaI es la probabilidad de que una muestra aleatoria de tamafio lOde esta poblacion tenga una media mayor que 190
Soluci6n Se sabe que la muestra individual que se estudia es solo una de todas las muestras posibles de tamano 10 que pueden ser extrafdas de la poblashycion de modo que la media a la que conduce es una de las x que forman parte de la distribucion muestral de xque teoricamente podria inferirse de esta poblacion
Cuando se dice que la poblacion tiene una distribucion aproximashydamente normal se supone que la distribucion muestral de x sigue para fines pnicticos una distribuci6n normal Tambien se sabe que la media y la desviaci6n estandar de la distribuci6n muestral son iguales a
1856 y J027)2 10 =127-110 = 40161 respectivamente Se supone que la poblacion es grande con respecto a la muestra de manera que la correccion por poblacion finita puede omitirse
En el capItulo 4 se aprendi6 que siempre que se tenga una variable aleatoria con distribucion normal esta puede transformarse facilmente
133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar
x Jlx z=--- (531)
(5
La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral
(a)
x
a x= = 40161 110
1357
kJi=1856 190
(b)
109
1357
o z
(e)
FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar
134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Esta area es igual al area de la derecha de
190-1856 z=----- 44 =110
40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357
La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull
EJEMPLO 533
Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml
Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es
P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212
= P(-236 ~ z ~ 236)
= 9909 - 0091
=9818 bull EJERCICIOS
531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar
532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea
a) Entre 170 y 195 b) Abajo de 175
c) Arriba de 190
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
133 53 DISTRIBUCION DE LA MEDIA DE LA MUESTRA
en una distribuci6n normal estltindar Ahora la variable aleatoria es xla media de su distribuci6n es lix y su desviaci6n estandar es (Jx (J -V n AI modificar adecuadamente la formula anterior se obtiene la siguiente f6rmula para transformar la distribuci6n normal de xen la distribuci6n normal estandar
x Jlx z=--- (531)
(5
La probabilidad que responde a la pregunta formulada se representa en el area ala derecha de x 190 bajo la curva de la distribuci6n muestral
(a)
x
a x= = 40161 110
1357
kJi=1856 190
(b)
109
1357
o z
(e)
FIGURA 532 Distribuci6n de la poblaci6n distribuci6n muestral y distribushyci6n normal estandar ejemplo 532 a) distribuci6n de la poblaci6n b) distrishybuci6n muestral de x para muestras de tamafio 10 c) distribuci6n normal estfudar
134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Esta area es igual al area de la derecha de
190-1856 z=----- 44 =110
40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357
La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull
EJEMPLO 533
Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml
Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es
P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212
= P(-236 ~ z ~ 236)
= 9909 - 0091
=9818 bull EJERCICIOS
531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar
532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea
a) Entre 170 y 195 b) Abajo de 175
c) Arriba de 190
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
134 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
Esta area es igual al area de la derecha de
190-1856 z=----- 44 =110
40161 40161 AI consultar la tabla normal estandar se encuentra que el area a la dereshycha de 110 es 1357 por 10 tanto se puede decir que la probabilidad de que la muestra de tamaiio 10 tenga una media mayor que 190 es 1357
La figura 532 muestra la relaci6n entre la poblaci6n original la distribuci6n muestral de x y la distribuci6n normal estandar bull
EJEMPLO 533
Si la media y desviaci6n estandar de la concentraci6n de hierro en el suero en hombres sanos es de 120 y 15 microgramos por cada 100 ml respectivamente ~cual es la probabilidad de que una muestra aleatoria de 50 hombres normales tenga una media entre 115 y 125 microgramos por cada 100 ml
Soluci6n No se especifica la forma funcional de la poblaci6n de valores de conshycentraciones de hierro en el suero pero dado que se tiene un tamaiio de muestra mayor que 30 se puede utilizar el teorema del lfmite central para transformar la distribuci6n muestral casi normal resultante de x (la cual tiene una media de 120 y una desviaci6n estandar de 15 -J5O = 21213) en una distribuci6n normal estandar La probabilidad buscada es
P(1l5 ~ x~ 125) = pl1l5 -120 ~ z ~ 125 -120] 212 212
= P(-236 ~ z ~ 236)
= 9909 - 0091
=9818 bull EJERCICIOS
531 La National Health and Nutrition Examination Survey de 1976-1980 (A-l) encontr6 que los niveles de colesterol en individuos varones estadounidenses con edades entre 20-74 afios fue de 211 La desviaci6n estandar fue aproximadamente de 90 Considere la distribuci6n muestral de la media de la muestra basada en muestras de tamafio 50 extraidas de esta poblaci6n de individuos varones ~Cual es la media de la distribuci6n muestral y el error estandar
532 El estudio mencionado en el ejercicio 531 report6 niveles de colesterol de 180 en varones con edades entre 20 y 24 afios con desviaci6n estandar de aproximadamente 43 Si se extrae una muestra aleatoria simple de tamafio 60 calcule la probabilidad de que el nivel de colesterol de la media de la muestra sea
a) Entre 170 y 195 b) Abajo de 175
c) Arriba de 190
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDIAS 135
533 Si las concentraciones de acido urico en hombres adultos normales siguen una distribuci6n aproximadamente normal con una media y desviaci6n estandar de 57 Y 1 mg por ciento respectivamente encuentre la probabilidad de que una muestra de tamafio 9 proporcione una media
a) Mayor que 6 b) Entre 5 y 6
c) Menor que 52
534 Para cierto sector amplio de poblaci6n en un afio determinado suponga que el numero medio de dias de incapacidad es 54 con una desviaci6n estandar de 2S dfas Encuentre la probabilidad de que una muestra aleatoria de tamafio 49 de esa poblaci6n tenga una media
a) Mayor a 6 dias b) Entre 4 y 6 dfas
c) Entre 45 y 55 dfas
535 Dada una poblacion distribuida normalmente can una media de 100 Yuna desviaci6n estandar de 20 encuentre las siguientes probabilidades para una muestra de tamafio 16
a) P( X ~ 100) b) P(96 S x s lOS)
c)P(x S 110)
536 Dada fl= 50 (J 16 Yn = 64 calcular
a) P(45 S XS 55) b)P(xgt 53)
c)P(xlt 47) d) P(49 s x s 56)
537 Suponga que una poblaci6n se compone de los siguientes valores 13579 Construya la distribuci6n muestral de x a partir de muestras de tamafio dos seleccionadas sin reemplashyzoo Calcule la media y la varian cia de la distribuci6n
538 Utilice los datos del ejemplo 531 para obtener la distribuci6n muestral de X a partir de muestras de tamafio tres seleccionadas sin reemplazo Calcule la media y la variancia
539 En una poblaci6n dej6venes de 17 afios de edad la media del espesor del pliegue subescapular (en miHmetros) es de 97 con una desviaci6n estandar de 60 A partir de una muestra aleatoria simple de tamafio 40 extrafda de esa poblaci6n calcule la probabilidad de que la media de la muestra
a) Sea mayor que 11 b) Sea menor 0 igual que 75 c) Este entre 7 y 105
54 DISmmUCION DE lA DIFERENCIA ENTRE lAS MEDIAS DE DOS MUESTRAS
Con frecuencia el interes en una investigacion se dirige hacia dos poblaciones Especfficamente puede ser que un investigador desee saber algo acerca de la difeshyrencia entre las medias de dos poblaciones En una investigacion por ejemplo el investigador tal vez deseara saber si es razonable concluir que dos medias poblacionales son diferentes En otra situaci6n es posible que el investigador quiera conocer la magnitud de la diferencia entre elIas Un equipo de investigaci6n medica por ejemshyplo quiza requiera saber si el nivel medio de cole sterol en el suero es mayor en un grupo de oficinistas que en un grupo de obreros Si los investigadores concluyen que las medias de la poblaci6n son diferentes es posible que deseen saber que
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
136 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
tanto difieren El conocimiento acerca de la distribuci6n muestral de la diferencia entre dos medias es muy utH en investigaciones de este tipo
JUuestreo a partir de poblaciones con distribucion normal Los ejemshyplos siguientes describen la elaboraci6n y las caracterfsticas de la distribuci6n muestral de la diferencia entre las medias de las muestras cuando el muestreo se hace a partir de dos poblaciones con distribuci6n normaL
EJEMPLO 541
Suponga que se tienen dos poblaciones de individuos Una de ellas (la poblaci6n 1) ha experimentado alguna enfermedad que se considera esci asociada con retraso mental y la otra (la poblaci6n 2) no ha experimentado tal enfermedad Se cree que la distribuci6n de calificaciones de inteligencia de cada una de las poblaciones presenta una distribuci6n aproximadamente normal con una desviaci6n estandar de 20
Suponga tambien que se toma una muestra de 15 individuos de cada poblashyci6n y se calcula en cada muestra la media de las calificaciones de inteligencia con los siguientes resultados Xl 92 Y x2 105 Si no hay diferencia entre las dos poblaciones con respecto a la media real de las calificaciones de inteligencia ~cual es la probabilidad de observar una diferencia de esta magnitud (Xl - 0 mayor entre las medias de las muestras
Soludon Para responder a esta pregunta es necesario conocer la naturaleza de la distribuci6n muestral para la estadfstica principal es decir la diferencia entre las dos medias de las muestras ~ - x2 bull Es importante notar que se busca la probabilidad asociada con la diferencia entre las medias de dos muestras en lugar de una bull
Distribucion muestral de x1 elaboracion Aunque en la practica no se intentarfa construir la distribuci6n muestral deseada es posible una idea conshyceptual ace rca de la forma en que podrfa efectuarse cuando el muestreo se realiza a partir de poblaciones finitas Se comenzarfa por seleccionar de la poblaci6n 1 todas las muestras posibles de tamano 15 y calcular la media de cada muestra Se sabe que hay NC de tales muestras donde N 1 es el tamano de la poblaci6n y n 1 15 De la misma forma se podrfa seleccionar todas las posibles muestras de tamano 15 de la poblaci6n 2 y calcular las medias Se tomarian todos los pares posibles de las medias muestrales una de la poblaci6n 1 y otra de la poblaci6n 2 asf como su diferencia En la tabla 511 aparecen los resultados de seguir este procedimiento Cabe aclarar que los 1 y los 2 en la ultima linea de la tabla no son exponentes sino indicadores de poblaci6n 1 y 2 respectivamente
Distribucion muestral de x1 - caracteristicas Lo que se pretende es caIcular ll distribuci6n de la diferencia entre las medias de las muestras Si se elabora una grMica de las diferencias de las muestras contra sus frecuencias de ocurrencia se podrfa obtener una distribuci6n normal con una media igual a fJ f2 la diferencia entre las medias reales de los dos grupos 0 poblaciones y una variancia igual a (Of n j ) + (O~ n2 ) Esto es el error estandar de la difeshy
rencia entre las medias serfa igual a ~(O~ n j ) + (Oi n2 )
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
137 54 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS MEDLiS
TABlA 541 Tabla de Qabajo pala elaboral la distlibuci6n de las difelencias entre las dos medias de las muestras
Muestras Muestras de Medias de las Medias de las Todas las de la de la muestras de muestras de posibles diferencias poblacion 1 poblacion 2 la poblacion 1 la poblacion 2 entre las medias
nnil 12 xJl Xl2 Xll X l2
n n21 Z2 X21 X22 xl - X22
n31 n32 X31 XS2 XII XS2
Para el ejemplo 541 habria una distribuci6n normal con una media igual a 0 (si no hay diferencia entre las medias reales de la poblaci6n) y una variancia de [(20)215] + [(20)215] = 533333 La gnifica de la distribuci6n muestral se ilustra en la figura 541
Conversion a z Se sabe que la distribuci6n normal descrita en el ejemplo 541 se puede transformar en una distribuci6n normal estandar mediante la modificaci6n de una f6rmula estudiada con anterioridad La nueva f6rmula es como sigue
(Xl X2 ) (Jll I-lz)z
(J2 (J2 _I +_2 (541) nJ nz
EI area bajo la curva de XI - Xz correspondiente a la probabilidad buscada es el area ala izquierda de Xl -X2 = 92 lOS -13 Suponiendo que no hay diferencia
bull
u~ u~ -+ - =5333 n 1 n2
P- x x2 = P-1 - P-2 = 0
FIG[jRAS41 Gnifica de la distribuci6n muestral de X - x2 cuando no existe diferencia
entre las medias de las poblaciones ejemplo 541
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
138 -APITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
entre las medias de las poblacionesel valor de z que corresponde a -13 es
-13 0 ~= -13 =-178z =-=-===== (20)2 (20)2 ~533 73 --+-shy
15 15
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar a la izquierda de -178 es igual a 0375 Para responder a la pregunta original se puede decir que si no hay diferencia entre las medias poblacionales la probabilidad de obteshyner una diferencia mayor 0 igual que 13 entre las medias de las muestras es de 0375
lJ1uesreo a parlir de poblaciones normales El procedimiento anterior es valido incluso cuando el tamano de las muestras n
l Yn
2 son diferentes y cuando
las variancias cr~ y cr~ tienen valores diferentes Los resultados te6ricos sobre los que se basa este procedimiento se resumen de la siguiente forma
Dadas dos poblaciones con una distribucion normal con medias III Y 112 Y variancias (j~
Y (j~ respectivamente la distribucilin muestral de la diferencia Xl - X2 entre las medias de muestras independientes de tamaiio n
l Y n
2 extraidas de esas poblaciones siguen una
distribucion normal con media III 112 Y variancia laquoj~ I n1) + laquoj~ I n 2 )
iJ1ueslreo a partir de poblacioHes no normales La mayorfa de las veces el investigador se enfrenta a uno de los siguientes problemas 1) la necesidad de extraer muestras de una poblaci6n con distribuci6n no normal 0 2) extraer muesshytras de poblaciones cuya forma funcional se desconoce Una soluci6n para estos problemas consiste en tomar muestras grandes dado que ruando el tamano de las muestras es grande e1 teorema de1limite central es aplicable y la distribuci6n de la diferencia entre las dos medias de las muestras sigue una distribuci6n aproximadashymente normal con una media iguaI a III - 112 Yuna variancia de (cr~ n1) + (cr~ n 2 )
Para calcular probabilidades asociadas con los valores espedficos de la estadfstica e1 procedimiento es e1 mismo que el dado ruando el muestreo se hace a partir de poblaciones con disttibuci6n normal
EJElUPLO 542
Suponga que se estableci6 que para cierto tipo de pacientes e1 tiempo promedio de visita domiciliaria hecha por una enfermera es de 45 minutos con una desviaci6n estandar de 15 minutos y para un segundo tipo de paciente el promedio de visit a domiciliaria es de 30 minutos con una desviaci6n estandar de 20 minutos Si la enfermera visita al azar a 35 pacientes del primer tipo y 40 del segundo tipo ~cual es la probabilidad de que el tiempo promedio de visita domiciliaria difiera entre los dos grupos por 20 minutos 0 mas
Soluci6n No se menciona nada respecto a la forma funcional de las poblaciones por 10 que se supone que est a caracteristica se desconoce 0 que las poshyblaciones no presentan una distribuci6n normal Puesto que las muesshy
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
139 54 DISTRIBUCION DE LA DIFERENCL~ ENTRE LAS MEDIAS
tras son grandes (mayores que 30) en ambos casos se hace uso de los resultados del teorema dellfmite centraL Se sabe que la diferencia entre las medias de las muestras sigue una distribuci6n al menos aproximadashymente normal con las siguientes media y variancia
I1x -x 111 - 112 = 45 30 15
cr _ == cr~ + cr~ (15)2 + (20)2 == 164286 x-x n n 35 40
l 2
El area bajo la curva de XI x2 que se busca se encuentra a 1a derecha de 20 EI valor correspondiente de z en la distribuci6n normal estandar es
20 15 5 123
~164286 40532
En la tabla D se encuentra que el area a la derecha de z = 123 es 1- 8907 1093 Por 10 tanto se puede decir que la probabilidad de que las visitas al azar de la enfermera difieran entre las dos medias por 20 0 mas minutos es de 1093 La curva de Xl - x2 y la curva normal estandar correspondiente se muestran en la figura 542
1093
1093
o 123 z
FIGURA 542 Distribuci6n muestral de Xl - X Y la distribuci6n normal estandar correspondiente ejemplo de visitas domiciliarias bull
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
140 CAPiTULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
FJERCICIOS
541 La referencia de los ejercicios 531 y 532 arroja los siguientes datos del nivel de colesterol en el suero de varones estadounidenses
Poblaci6n Edad Media Desviaci6n estandar
A 20-24 180 43
B 25-34 199 49
Suponga que se escoge una muestra aleatoria simple de tamano 50 independiente a partir de cad poblaci6n ~Cual es la probabilidad de que las diferencias entre las medias de las muestras (XB xA ) sea mayor que 25
542 En un analisis de gastos familiares anuales para el cuidado general de la salud se investigashyron dos poblaciones con los siguientes resultados
Poblaci6n 1 n l
= 40 Xl = $346 Poblaci6n 2 n2 = 35 x2 = $300
Si se sabe que la variancia de las poblaciones es de cr~ = 2800 Y cr~ = 3250 respectivamente ~cuaI es la probabilidad de obtener resultados de muestras (XI - x2 ) tan amplios como los que se muestran si no hay diferencia entre las medias de las dos poblaciones
543 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias crf 100 y cr~ = 80 ~cual es la probabilidad de que las muestras de tamano n 1 = 25 Y n2 = 16 proporshycionen un valor de Xl - x2 mayor 0 igual que 8
544 Dadas dos poblaciones con distribuci6n normal con medias iguales y variancias de crf = 240 Y cr~ 350 ~cuaI es la probabilidad de que dos muestras de tamano n l = 40 Y n2 = 35 respectivamente proporcionen un valor de XI - x2 mayor 0 igual que 12
545 Para ambas poblaciones de hombres y mujeres j6venes de 17 anos de edad las medias y desviaciones estandar respectivamente del grosor del pliegue subescalpular son como sishygue para los varones es de 97 y 60 para las mujeres es de 156 y 95 Si se obtiene una muestra aleatoria simple de 40 varones y otra de 35 mujeres a partir de dicha poblaci6n ~cual es I probabilidad de que la diferencia entre las medias de las muestras (xmujeres - xhombreJ
sea mayor que 10
5 DISTRIBUCION DE IA PROPORCION DE IA MUESTRA
En las secciones anteriores se estudiaron las distribuciones muestrales para estadfsshyticas calculadas a partir de variables medidas Sin embargo frecuentemente se tieshyne interes en la distribuci6n muestral de estadfsticas como la proporci6n de muestras que resulta de los datos de conteo 0 frecuencias
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
141 55 DISTRIBUCION DE LA PROPORCrON DE LA MUESTRA
EJEMPLO 551
Suponga que en una poblacion de seres humanos 08 son daltonicos Si la proporcion de la poblacion se designa como p se puede decir para este ejemshyplo que p = 08 Si se eligen aleatoriamente 150 individuos de esa poblacion ~cU(H es la probabilidad de que la proporcion en la muestra de individuos daltonicos sea igual a 15
Solucion Para responder a esta pregunta es necesario conocer algunas de las propiedades de la distribucion muestral de la proporcion de la muestra Se designara la proporcion de la muestra con el simbolo p
EI lector reconocera la similitud entre este ejemplo y los que se presentan en la seccion 43 que se refieren a la distribucion binomial Ademas la variable daltonismo es una variable dicotomica porque un inshydividuo se puede clasificar en una u otra de dos categorias mutuamente excluyentes daltonico 0 no daltonico En la seccion 43 se da la misma informacion y se pide calcular el numero con la caracteristica de interes mientras que en el presente ejemplo se busca la proporcion de la muesshytra que posea tal caracteristica Mediante el uso de una tabla 10 suficienshytemente grande de probabilidades binomiales como la tabla B es posible determinar la probabilidad asociada con el numero correspondiente a la proporcion de interes Como se vera mas adelante esto no sera neceshysario porque se dispone de otro procedimiento que en general es mas conveniente cuando el tamafio de la muestra es grande bull
Distribucion muedral de I elaboracion La distribucion muestral de la proporcion de la muestra se puede obtener experimentalmente de la misma forma que se sugiere para el caso de la media aritmetica y la diferencia entre dos medias A partir de la poblacion que se supone es frnita se toman todas las muestras posibles de un tamafio dado y para cada muestra se calcula la proporcion de la muestra p Despues se elabora una distribucion de frecuenshycia de p ordenando los valores distintos de pjunto con sus frecuencias de ocurrencia Esta distribucion de frecuencia (al igual que la distribucion de freshycuencias relativas correspondiente) constituye la distribucion muestral de p
Distribucion muestral de I caracteristicas Cuando la muestra es grande la distribucion de las proporciones de la muestra es aproximadamente normal de acuerdo con el teorema del limite central La media de la distribucion -ip que es el promedio de todas las proporciones posibles de la muestra es igual a la proporcion real de la poblacion p y la variancia de la distribucion a es igual a P(l - P) I no pq I n donde q = 1 p Entonces para responder a las preguntas acerca de la probabilidad respecto a p se utiliza la siguiente formula
A
P P z=-====
(551 )~P(lP)
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
142 CAPiTULO 5 ALGUNAS D1STRIBUCIONES DE MUESTREO IMPORTANTES
La pregunta que surge ahora es ~que tan grande debe ser la muestra para que sea valido el uso de la aproximaci6n normal Un criterio ampliamente utilizashydo es que np y n(l - p) deben ser mayores que 5 por 10 que se seguira dicha regIa en el presente texto
Ahora se esta en posibilidad de responder a la pregunta referente al daltonisshymo en la muestra de 150 individuos de una poblaci6n en la cual 08 son dalt6nicos Puesto quenpyn (I-P) son mayores que 5 (IS0x 08= 12 YISO x 92 138) se puede decir que en este caso p sigue una distribuci6n aproximadamente normal con una media IJji = P 08 Y ofi = P(I-p)n= (08)(92)150 =00049 La probabilishydad buscada es el area bajo la curva de pala derecha de IS Esta area es igual al area bajo la curva normal estandar a la derecha de
A
p-p 15-08 07 z=-====- r====--=315
0222
La transformaci6n para la distribuci6n normal estandar se lleva a cabo de la maneshyra usual z se calcula al dividir el error estandar entre la diferencia de un valor de la estadfstica y su media AI utilizar la tabla D se tiene que el area a la derecha de z = 315 es 1 - 9992 = 0008 Por 10 tanto se puede decir que la probabilidad de observar p~ 15 en una muestra aleatoria de tamaiio n 150 de una poblaci6n en la que p = 08 es 0008 De hecho si se extrajera una muestra de este tipo much a gente la consideraria un evento extraiio
Correcci6nporcontinuidad La aproximaci6n normal puede mejorar con la correcci6n por continuidad un mecanismo que hace un ajuste en el caso de que una distribuci6n continua se aproxime a una distribuci6n discreta Suponga que se tieshyne x=np el numero en la muestra que posee la caracteristica de interes cuando la porci6n es p Para aplicar la correcci6n por continuidad se calcula
x+S -p
Zc =-==-parax ltnp (552)
o bien
x S --p
z = Wn para xgt np pqn (553)
donde q 1 - p La correcci6n por continuidad no produce una gran diferencia cuando nes grande En el ejemplo de arriba np = 150(15) 225 Y
225 5 08
--=1c=50====-_ = 301 100049
Y P(P~15)= 1 - 9987 = 0013 Este resultado no es muy diferente del que se obtiene sin la correcci6n por continuidad
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
EJERCICIOS 143
EJEMPLO 552
Suponga que se conoce que en una poblaci6n de mujeres 90 por ciento de quienes comienzan su tercer trimestre de embarazo han tenido alglin cui dado prenatal Si se extrae de esta poblaci6n una muestra aleatoria de tamano 200 2cual es la probashybilidad de que la proporci6n de la muestra de las mujeres que han tenido alglin cuidado prenatal sea menor que 85
Soluci6n Se puede suponer que la distribuci6n muestral de ppresenta una distrishybuci6n aproximadamente normal con 11 = 90 Y (J = (1)(9) 200 00045 Se calcula
85 90 -05 z = = == -236
V00045 0212 EI area a la izquierda de -236 bajo la curva normal estandar es 0091 Por 10 tanto P(P S 85) P(z S -236) =0091 bull
EJERCICIOS
551 Una il1vestigaci6n del National Center for Health Statistics (Centro Nacional para la Estadfsshytica de la Salud) (A-2) encontre que a 332 por ciento de las mujeres de 40 anos de edad 0
mas se les practice un examen de pecho (BPE) durante el ano anterior Si se extrae una muestra aleatoria simple de 200 individuos a partir de esa poblaci6n ~cual es la probabilishydad de que la proporci6n de la muestra de mujeres a las que se les practice el examen BPE durante elanD anterior este entre 28 y 37
552 A mediados de la decada de 1970 segiln informes del National Center for Health Statistics (A-3) 194 por ciento de la poblaci6n de adultos varones en EVA eran obesos ~Cual es la probabilidad de que en una muestra aleatoria simple de 150 individuos menos de IS por ciento sean obesos
553 Vna investigaci6n realizada en 1990 por el National Center for Health Statistics (A-4) 19 por ciento de los encuestados mayores de 18 anos dijo no saber del virus VIH del SIDA ~Cual es la probabilidad de que en una muestra de 175 individuos de esa poblaci6n 25 por ciento 0 mas no sepa de la existencia del virus del SIDA
554 Se sabe que un medicamento estandar utilizado para tratar cierta enfermedad es eficaz en un lapso de tres dias en 75 por ciento de los casos Para evaluar la eficacia de un nuevo medicamento para tratar la misma enfermedad este se administr6 a 150 personas que la padedan AI termino de tres dlas sanaron 97 personas Si este nuevo medicamento es tan eficaz como el primero ~cual es la probabilidad de obtener una proporci6n de pacientes que se recuperan tan pequena como esta
555 Dada una poblaci6n en la que p = 6 y una muestra aleatoria de esta poblaci6n de tamano 100 calcule
b) Pcp S 58) c) P(56 ~ P~ 63)
556 Se sabe que 35 por ciento de los miembros de una poblaci6n sufren de una 0 mas enfermeshydades cr6nicas ~Cual es la probabilidad de que en una muestra aleatoria de 200 individuos 80 0 mas de ellos tengan al menos una enfermedad cr6nica
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
144 CAPITULO 5 ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
56 DISfRmUCION DE lA DIFERENCIA ENTRE lAS PROPORCIONES DE DOS MllESfRAS
Con frecuencia son de interes las proporciones de dos poblaciones y se de sea averishyguar la probabilidad asociada con la diferencia de las proporciones calculadas a partir de muestras extraidas de cada una de dichas poblaciones La distribuci6n muestral pertinente es la distribuci6n de la diferencia entre las proporciones de dos muestras
DistribuclOn uestral de 11 - 12 caracterlsticas Las caracteristicas de esta distribuci6n muestral se resumen como sigue
Si se extraen muestras aLeatorias independientes de tamafio n l Y n2 de dos poblaciones de variables dicotomicas donde las proporciones de las observaciones con La caracteristica de interes en ambas pobLaciones son PlY P2 espertivamente la distribuciOn de La diferenshycia entre las proporciones de las muestras PI P2gt es aproximadamente normal con una media de
con variancia
cuando n 1Y n2
son [Jrandes
Se considera a n 1 Yn2 suficientemente grandes cuandondl n2 P2 nJ(l-P1) Y n
2(l - P
2) son mayores que 5
Dirftribucion nzuestral de 11 Y 12 elaboracion Para elaborar fisicamenshyte la distribuci6n muestral de la diferencia entre las proporciones de dos muestras se procede en la forma descrita en la seccion 54 para obtener la distribucion muestral de la diferencia entre dos medias
Dadas dos poblaciones suficientemente pequenas es posible extraer de la poblacion 1 todas las muestras aleatorias posibles de tamano n
J y calcular a partir
de cada conjunto de datos de la muestra la proporcion de la muestra PI De la poblaci6n 2 puede extraerse independientemente todas las muestras aleatorias simples de tamano n2 Y calcular para cada conjunto de datos de la muestra la proporci6n de la muestra P2 Es posible calcular las diferencias entre todos los pares posibles de proporciones muestrales donde un miembro de cada par tiene un valor PIgt y el otro un valor P2 Asi la distribuci6n muestral de la diferencia entre las dos proporciones de las muestras consta de todas las diferencias existentes acomshypanadas de sus frecuencias de ocurrencia (0 frecuencias relativas) Para poblaciones grandes finitas 0 poblaciones infinitas es posible obtener un calculo aproximado de la distribuci6n muestral de la diferencia entre las proporciones de las muestras tomando un gran numero de muestras aleatorias simples independientes para proshyceder de la forma descrita
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
56 DISTRIBUCION DE LA DIFERENCIA ENTRE LAS PROPORCIONES 145
Para responder a preguntas respecto a la diferencia entre las proporcioshynes de dos muestras se utiliza la siguiente formula
(561) Z=-r==============
EJEMPLO 561
Suponga que la proporcion de consumidores moderados a grandes consumidores de estupefacientes ilegales es de 50 para la poblacion 1 en tanto que en la poblaci6n 2 la proporci6n es de 33 ~Cual es la probabilidad de que muestras de tamaiio 100 extrafdas de cada una de las poblaciones presente un valor de PI - P2 igual a 30
Solucion Se supone que la distribuci6n muestral de PI - P2 es aproximadamente normal con una media de
y variancia
(2
p-p =(33)(67)
100 004711
(5)(5)
100
EI area correspondiente ala probabilidad buscada es la que se encuenshytra bajo la curva de PI - P2 a la derecha de 30 AI transformar en la distribucion normal estandar se obtiene
(Pt -P2)-(PI-P2) 30 -17 =189Z=-r==============
PI(l-PI) P2(I-P2) ~004711 + ------shy
V nl n2
AI consultar la tabla D se encuentra que el area bajo la curva normal estandar que esta a la derecha de Z 189 es 1 - 9706 = 0294 Por 10 tanto la probabilidad de observar una diferencia igual a 30 es de 0294 bull
EJEMPLO 562
Se sabe que en una poblacion de adolescentes 10 por ciento de los varones son obesos Si la misma proporcion de mujeres en esa poblacion son obesas ~cual es la probabilidad de que una muestra al azar de 250 varones y 200 mujeres proporcione un valor de PI - P2 06
Solucion Se supone que la distribucion muestral de PI - P2 es aproximadamente normal Si la proporci6n de individuos obesos es la misma en ambas poblaciones la media de la distribucion es igual a 0 y la variancia es
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
146 CAPITULO 5 ALGUNAS DISTRIBUCIONESDE MTIESTREO IMPORTANTES
00081
El area de interes bajo la curva de PI - P2 es la que se encuentra a la derecha de 06 El valor correspondiente de z es
06-0 z = 211
~00081 AI consultar la tabla D se encuentra que el area a la derecha de z = 211 es 1 9826 =0174 bull
EjERCICIOS
561 En una poblaci6n de ninos con retraso mental se sabe que la proporci6n de los que son hiperactivos es de 40 Se extrajo una muestra aleatoria de tamano 120 de esa poblaci6n y otra de tamano 100 a partir de otra pohlaci6n de ninos con el mismo problema Si la proporshyci6n de ninos hiperactivos es la misma en ambas poblaciones ~cual es la probabilidad de que la muestra presente comoresultado una diferencia PI P2de 160 mas
562 Se tienen bases para suponer que 40 por ciento de las casas en cierta area de la ciudad estan en malas condiciones Una muestra aleatoria de 75 casas de esa area y otra compuesta de 90 casas de otra secci6n dieron una diferenciade PI - P2 = 09 Si no hay diferencia en la proporci6n de casas en malas condiciones entre estas dos areas ~cuaI es la probabilidad de observar una diferencia de esta magnitud 0 mucho mayor
563 EI resultado de una investigaci6n realizada por el National Center for Health Statistics (A-5) revela que 14 y 238 por ciento de los hombres y de las mujeres respectivamente con edades entre 20 y74 arros tienen una desviaci6n de 20 por ciento 0 mas con respecto a su peso ideal Suponga que se extrae una muestra aleatoria simple de 120 varones y una muestra aleatoria simple independiente de 130 mujeres ~Cual es la probabilidad de que la diferencia entre las proporciones de las muestras PF - PM este entre 04 y 20
57 RESUMEN
EI tema principal de este capitulo son las distribuciones muestrales por 10 que aqul se presenta el concepto aSI como los mas importantes tipos de distribuci6n muestral
1 Distribuci6n de la media de una muestra unica
2 Distribuci6n de la diferencia entre las medias de dos muestras
3 Distribuci6n de la proporci6n de la muestra
4 Distribuci6n de la diferenciaentre las proporciones dedos muestras
Se destaca la importancia de estos aspectos y se exhorta allector para que se asegure que los ha comprendido antes de pasar al siguiente capitulo
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
147 PREGUNTAS Y EJERCICIOS DE REIASO
PHEGUNTAS YF-JERCICIOS DE REPASO
1 ~Que es una distribucion muestral
2 Explique como se puede elaborar una distribucionmuestral a partir de una poblacion
3 Describa la distribtiCion muestral de la media de una muestra cuando el muestreo es con reemplazos a partir de una p~blacion que sigue una distribucion normal
4 Explique el teorema del Hmite central
5 mn que forma difiere la distribucion muestraide la media ltieuna muestra cuando el muestreo es sin reemplazo~ de lao distribucion muestral que seobti~ne de un muestreo con reemplazo
6 Describa la distribucion muestral de la diferencia entre las medias de dos muestras
7 Describa la disttibucion muestral de laproporcion deia muestra cuando se seleccionan muestras grandes
8 Describa la distribuci6ri muestral de la diferencia entre las medias de dos muestras cuando se seleccionan muestras gran des
9 Explique el procediilli~nto que se sigue paraobtener la distribucion muestral de la diferenshycia entre las proporciones de las muestras con base en muestras grandesextrafdas de poblashyciones finitasmiddot
10 Suponga que se sabe que el tiempo de respuesta a un estimulo en particular en individuos sanos es una variabie aleatoiii ltdn distribucion normalccm una media de 15 segundos y una variancia de 16 (Coal es la probabilidadde que una muestra al azar de 16 individuos propor~ione un tiempo de respuesta de 12 segundos 0 JIills
11 Cierta empresatierie 2000 empleados DuranteuIlano ~ci~nte el gastomedio por empleashydo debido a servicios medic()s personaJes fue de $3150 y la desvlaeion estandar de $600 ~Cual es la probabilidad de que una muestra aleatoriasimple de 36 empleados proporcione una media entre $30y $33
12 Suponga que en cierta poblacion de adictos la duraci6n media de abuso de drogas es de 5 aiios y la desviaci6n estandar es de 3 aiios ~Cual es la probabilidad de queuna muestra aleatoria simple de 36 individuosproporcioneuna media de abuso entre 4 y 6 aiios
13 Suponga que elconsumomedio de protefnas de una pobiacion es de 125 gramos por dfa mientras que para otra poblaci6n el consumo medio es de 100 g Si los valores de consumo diario de protefnas deambas poblaciones siguen una distribuci6n normal con una desviashycion estandar de 15 gramos ~cual es la probabilidad de que las muestras aleatorias e indeshypendientes de tamaiio 25 a partir de cada PQblacion presenten una diferencia entre las medias de las muestras de 120 menos
14 Considere que dos medicamentos que se supone sirven para redllcir el tiempode respuesta a cierto estlmulo son estudiados en un laboratorio EI investigaclor se inclina a creer que los tiempos de respuesta de simes de administrar ambos medicamentos siguen una distribushyci6n normal con variancias iguales de 60 Como parte de la evaluci6n de los dos medicashymentos el medicamento A se aplica a 15individuos y el medicamento B se administra a otros 12 EI investigador esta interesado en saber entre que valores estaria 95 por ciento central de todas las diferencias entre-las medias de las muestras si ambos medicamentos fueron igualmente eficaces y si el ~xperimento se repitiera un gran mlmero de veces utilizanshydo estos tamaiios de rnuestras
15 Suponga que la concentraci6n de albumin a en el suero de cierta poblacion de individuos sigue una distrib1)f=iOn normal con 1lna media de 42 g100 ml y una desviacion estandar de 5 Una muestra at azar de nueve de esos individuos sometidos a una closis diaria de cierto
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
148 CAPITULOS ALGUNAS DISTRIBUCIONES DE MUESTREO IMPORTANTES
esteroide oral produjo una concentraci6nmedia de albumina en el suero de 38 g100 m Con base en estos resultados ~es probable queelesteroide oral disminuya la concentracion de albumina en el suero
16 Una encuesta llevada a cabo en un area grande de la ciudad revelil que entre los estudiantes de preparatoria 35 por ciento han fumado marihuana en una u otra ocasi6n Si en una muestra aleatoria de 150 de esos estudiantes s610 40 de ellos admitieron haber fumado marihuana ~que es 10 que se puede concluir
17 Una investigaci6n en 1989 por el National Center for Health Statistics revel6 que 71 por ciento de los pacientes dados de alta despues de una corta estanCia en hospitales de EUA tenian edadeseritre 20 y 24 aoos de edad inclusive Si se extrae una muestra aleatoria simple de tamaoo 150 de esa poblaci6n ~cual esla probabilidad de que la proporci6n de pacientesentre las edades de 20 y 24 afios se encuentre entre 05 y lO
18 Una trabajadora social especiaIizada en problemas psiquiatricos piensa que tanto en la coshymunidad A como en la B la proporci6n de adol~scentes que padecen algiin problema emoshycional 0 mental es de 20 En una muestra de 150 adolescentes de la comunidad A 15 de ellos presentaron problemas emocionales 0 mentales En una muestra de 100 adolescentes de la comunidadB se presentan If)casos Si la trabajadora social estaen 10 correcto ~cual es la probabilidad de observar una diferencia tangrande como la que se observa entre estas dos muestras
19 Un informe del NationalCenter for Health Statistics(A-7) mostr6 que en Estados Unidos 57 por ciento de los varones y 73de las mujeres con edades entre 20 y 74 afios tienen diabetes Suponga que se toma una muestra aleatoria simple de 100 varones (V) yuna muesshytra independiente de 150 mujeres (M) a partir de Ia poblacion correspondiente ~Clal e~ la probabilidad de que ladiferencia entre las proporciones de las muestras con diabetes PF PM sea mayor que 05
20 tCuantas muestras aleatorias simples (sin reemplazos) de tamaoo 5 se pueden seleccionar a partir de una poblaci6n de lO
21 Se sabe que 27 por cientode determinada poblaci6n de adultos nunea han fumado Consishydere la distribucion muestral de la proporcion de una muestra basada en muestras aleatorias simples de tamafio 110 extraidas de esa poblacion(Cual es la forma funcional de la distrishybucion muestral
22 ConsulteeI ejercicio 21 y calcule la media y la variancia de la distribuci6n muestral
23 Consulte el ejercicio 21 (Cilll es la probabilidad de que una muestra aleatoria simple de tamaoo 110 extraida de esta pobIacionpresente urtaproporci6n muestral menor que 18
24 En una poblaci6n de individuos que murieron de cancer pulmonar provocadQ por exposishycion a asbesto se encontr6 queIa media de los aoos transcurridos entre la exposici6n y el fallecimiento fuede 25 yla desviaci6n estandar de 7 aocl Considere la distribuci6n muestral
de las medias de las muestras con base en muestrasde tamaoo 35 Seleccionadas de esa poblashy ci6n ~Cual sera la lorma de la distribuci6n muestral
25 Consulte el ejercicio 24 (Cual es la media y la variancia de la distribucion muestral
26 Consulte el ejercicio 24 (CUiil es la probabilidad de que una muestra aleatoria simple de tamafio 35 extraida de esa poblaci6n presenteuna media entre 22 y 29
27 Para cada una de las siguientes poblaciones de medici ones establezca si la distribuci6n muestral de Ia media de la muestra sigue una disttibucion normal aproximadamente norshymal oni siquiera aproximadamente normal cuando se calrulaa partir de muestras de tamashyfio A) 10 B) 50 YC) 200
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
BIBLIOGRAFiA 149
a) Ellogaritmo de los indices metab6licos La poblaci6n sigue una distribuci6n normal
b) Tono vagal en reposo en adultos sanos Lapoblaci6n sigue una distribuci6nnormal
c) La acci6n de la insulina en individuos obesos La poblaci6n nose distribuyenormalmente
28 Para cada una de las siguientes situaciones de muestreo indique si la distribuci6n muestral de la proporci6n de la muestra puede aproximarse a una distribuci6n normal y explique por que sf 0 por que no
a) p= 50 n=8 b) P=40 n = 30
c)p 10n = 30 d) P = 01 n 1000
e) p = 90 n = 100 f) P 05 n = 150
BmUOGRAFfA
Bibliografia de metodologia
1 RichardJ Larsen y Morris L MarxAn Introduction to Mathematical Statistics and Its Applicatims segunda ediei6n Prentice-Hall Englewood Cliffs NJ
2 John A Rice Mathematical Statistics and Data Analysis segunda edici6n Duxbury Belmont CA
Bibliografia de aplicaciones
A-I National Center for Health Statistics R Fulwood W Kalsbeck R Rifkind etal Total Serum Cholest~rol Levels of Adults 20-74 years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 236 DHHS Pub No (PHS) 86-1686 Public Health Service US Government Printing Office Washington DC
A2 D A Dawson y G B Thompson Breast Cancer Risk Factors and Screening United States 1987 National Center for Health Statistics Vital and Health StatisticS 10 (172)
A-3 National Center for Health Statistics S Abraham Obese and Overweight Adults in the United States Vztaland Health Statistics Serie 11 No 230DHHS Pub No 83-1680 Public Health Service US Government Printing Office Washington DC
A-4 A M Hardy AIDS Knowledge and Attitudes for October-December 1990 Provisional data from the National Health Interview Survey Advance data from vital and health statistics No 204 National Center for Health Statistics Hyattsville MD
A~5 National Center for HealPl Statistics Advance data from vital and health statistics No 51shy60 National Center for Health Statistics Vital and Health Statistics 16 (6)
A-6 E J Graves y L J Kozak National Hospital Discharge Survey Annual Summary 1989 National Center for Health Statistics Vital and Health Statistics 13(109)
A-7 National Center for Health Statistics W C Hadden y M I Harris Prevalence ofDiagnosed Diabetes U ndiagriosed Diabetes and Impaired Glucose Tolerance in Adults 20-74 Years of Age United States 1976-80 Vital and Health Statistics Serie 11 No 237 DHHS Pub No (PHS) 87-1687 Public Health Service US Government Printing Office Washington DC
Top Related