UNIDAD 9 Multivariables y distribuciones...
Transcript of UNIDAD 9 Multivariables y distribuciones...
Objetivos
Al finalizar la unidad, el alumno:
• distinguirá y resolverá ejercicios de multivaria- bles discretas• resolverá ejercicios relacionados con las funciones acumuladas multivariables discretas• resolverá problemas de funciones de probabilidad marginales• resolverá ejercicios utilizando las fórmulas de valor esperado de multivariables• resolverá ejercicios de independencia de variables aleatorias• calculará el coeficiente de correlación de las variables aleatorias• aplicará el teorema central del límite en el cálculo de probabilidades que involucren muestras grandes
Multivariablesy distribuciones muestrales
UNIDAD
9
Introducción
Anteriormente se trabajó con variables aleatorias tanto discretas como continuas con argumento de una sola variable. Este análisis, al igual que en las funciones, se puede prolongar a las variables aleatorias con más de un argumento. Para fines de esta unidad, se analizarán los conceptos más comunes de las multivariables aleatorias tanto discretas como continuas, para continuar con aplicación teóricas de la estadística: las distribuciones muestrales.
La unidad finaliza con el teorema que probablemente es el de mayor importancia teórica en la probabilidad y estadística, el del límite central.
9.1 Multivariables
En las unidades 5 a 8 se analizaron las variables aleatorias resultantes de experimentos aleatorios donde sólo intervenía un factor, es decir, modelos que manejan series univariadas de datos que sólo se preocupan por entender la variabilidad de una sola variable. Un ejemplo de este tipo de modelos lo tenemos en los casos estadísticos exploratorios básicos del análisis de tendencia central y dispersión. Existe una gran variedad de modelos más que se emplean en las teorías de Pronósticos y regresión, los cuales serán vistos en el curso de Estadística aplicada.
Por otro lado, debido a que no siempre es suficiente entender la variabilidad de una sola variable o de un conjunto de variables de manera independiente, la estadística ha diseñado el análisis multivariado de datos para analizar la variabilidad de un conjunto de variables de forma conjunta. Así, modelos univariados anteriormente presentados tienen su extensión al análisis multivariado.
Dada su extensión, en esta unidad nos enfocaremos en la clase de modelos estadísticos exploratorios multivariados de análisis de tendencia central, dispersión ycorrelación.
Cabe notar que un análisis multivariado tendría sentido si y sólo si las variables de interés tienen interrelación entre ellas, como se verá posteriormente, que exista correlación entre ellas.
Datos multivariados
Después de una severa tormenta en febrero de 1898, se rescataron algunos gorriones moribundos y fueron puestos en cautiverio en los laboratorios de Brown University. Posteriormente, las muestras sobreviviente y muerta se estudiaron para corroborar varias hipótesis sobre el tema de selección natural. A estos gorriones se les pesó y se les tomaron ocho diferentes medidas morfológicas. Los datos son los siguientes:
Ejemplo 1
262
Tomando los datos anteriores como una muestra de datos multivariados, en donde cada medición representa una variable diferente, varias preguntas pueden llegar a nuestras cabezas:
1. ¿Cómo se relacionan las medidas anteriores? Por ejemplo, sucede que cuando una de las medidas tiende a ser grande ¿las demás lo son?
2. ¿Existen diferencias significativas entre los gorriones sobrevivientes y los que no sobrevivieron?
3. Si es que difieren, ¿puede construirse una función que dependa de las medidas que nos ayude a dividir los datosen dos grupos? Así, si esta función tiende a ser grande para los sobrevivientes y pequeña en valor para los que murieron, podría utilizarse como un índice de ajuste darwiniano.
Las preguntas anteriores sobre los datos de los gorriones pueden contestarse conalgunas de las herramientas del análisis multivariado quese estudiarán en esta unidad. Nos limitaremos a explicar las distribuciones bidimensionales o distribuciones en dos variables. Para tres o más variables se deben seguir los mismos principios que se explicarán para dos variables, razón por la cual en lugar de utilizar sólo x y y se emplearán subíndices, como x1 y x2.
El estudio de las multivariables aleatorias se va a simplificar para las discretas, en el caso de las continuas se procede de forma similar, cambiando las sumatorias por integrales, pero debido a la complejidad de los cálculos y el objetivo del texto, no se contemplarán. Los estudiantes interesados en el tema pueden consultar la bibliografía que aparece al final del texto.
La forma de trabajo será mucho menos detallada que en las unidades anteriores, ya que se conservan las interpretaciones de los conceptos que hemos estudiado, como son: la distribución de probabilidad, función acumulada, valor esperado, etc. y, por consiguiente, veremos sólo algunos conceptos nuevos y las fórmulas para llevar a efecto sus cálculos.
Distribución de probabilidad conjunta discretaistribución de probabilidad conjunta discreta
Supóngase un experimento aleatorio en el que intervienen dos factores, por ejemplo, lanzar dos monedas donde se define una variable aleatoria para cada una de ellas: X1 y X2. Por ejemplo, si X1: “cantidad de caras águila de la moneda uno”, es decir X1 = {0, 1},
Nota
263
asimismo X2: “cantidad de caras águila de la moneda dos”, X2 = {0, 1}, los valores de cada experimento se representan por las parejas (x1, x2), donde x1 X1 y x2 X2; es decir
X1 X2 = {(0, 0), (0, 1), (1, 0), (1, 1)}
Definidas las variables aleatorias del experimento, surge la necesidad de definir también probabilidad para las parejas (x1, x2).
Se le llamalama probabilidad conjunta el resultado de un experimento con dos factores cuyas varia-bles aleatorias son X1 y X2, y parejas del experimento (x1, x2), representadas por
P(x1, x2) = P(X1 = x1, X2 = x2)
En el ejemplo anterior sobre lanzar dos monedas, es fácil verificar que las probabi-lidades correspondientes están dadas por
P(0, 0) = P(0, 1) = P(1, 0) = P(1, 1) = 1/4
Dicha probabilidad cumple con los axiomas de probabilidad de Kolmogorov, por tanto, desde el punto de vista axiomático, es una probabilidad.
Propiedades de la probabilidad conjunta discreta
• P(x1, x2) 0, para toda (x1, x2)
• x x
P x x1 2
1 2 1( , )
Función de distribución acumulada
De forma similar que en las variables aleatorias unidimensionales, la función de distribución acumulada está dada por
F a b P x x P x a x bx
b
x
a( , ) ( , ) ( , )1 2 1 2
21
Para el ejemplo de lanzar dos monedas, se tiene
F(0, 1) = P(0, 0) + P(0, 1) = 1/4 + 1/4 = 1/ 2
Propiedades de la función acumulada en dos variable s
Al igual que en el caso unidimensional, las propiedades de una función acumulada están dadas por
F(x1, x2), la cual siempre es no decreciente para todas x1 y x2
Por ejemplo, en una variable sucede que si a b, entonces
F(b) F(a) o F(b) – F(a) 0
Por tanto, si a2 a1; b2 b1 , entonces
F(a2, b2) – F(a2, b1) F(a1, b2) – F(a1, b1)
Definición 9.1
264
De igual forma
[F(a2, b2) – F(a2, b1)] – [F(a1, b2) – F(a1, b1)] 0
Lo que indica que la función acumulada es no decreciente
• lím
lím
xx
xx
F x x
F x x
12
12
1 2
1 2
0
1
( , )
( , )
,
,•
Se va a considerar a tres ejecutivos para un ascenso de un grupo de nueve; cuatro de ellos están casados, tres nunca han estado casados y dos están divorciados. Dadas X1: “número de ejecutivos casados” y X2: “ejecutivos que nunca se han casado”
a) se calculan las distribuciones de probabilidad conjunta de X1 y X2, suponiendo que se toma una muestra al azar de tres de los nueve ejecutivos
b) se calcula F(1, 2)
Los pasos a seguir para resolver el problema son similares en el caso de una variable, primero se definen las variables aleatorias del experimento
X1: “número de ejecutivos casados”X2: “número de ejecutivos que nunca se han casado”
a) La distribución de probabilidad en esté caso está dada con base en los ejecutivos considerados de entre los divorciados y, por tanto, pueden suceder tres casos: caso 1, ningún divorciado; caso 2, un divorciado y, caso 3, dos divorciados.
1. P(x1, x2), para 0 divorciados.
PC C C
CP
C C C
C
P
( , ) ; ( , )
( , )
3 04
842 1
18
84
1 2
4 3 3 0 2 0
9 3
4 2 3 1 2 0
9 3
44 1 3 2 2 0
9 3
4 0 3 3 2 0
9 3
12
840 3
1
84
C C C
CP
C C C
C; ( , )
2. P(x1, x2), para un divorciado.
PC C C
CP
C C C
CP( , ) ; ( , ) ; ( ,2 0
12
841 1
24
840 24 2 3 0 2 1
9 3
4 1 3 1 2 1
9 3
)) 4 0 3 2 2 1
9 3
6
84
C C C
C
3. P(x1, x2), para dos divorciados.
PC C C
CP
C C C
C( , ) ; ( , )1 0
484
0 1384
4 1 3 0 2 2
9 3
4 0 3 1 2 2
9 3
b) F(1, 2) = P(0, 1) + P(0, 2) + P(1, 0) + P(1, 1) + P(1, 2) == 3/ 84 + 6/ 84 + 4/ 84 + 24/ 84 + 12/ 84 = 49/ 84 = 7/ 12
Ejemplo 2
265
Función de probabilidad marginal
Cuando se trabaja con varias variables puede ser necesario conocer las probabilidades cuando se elige un valor de alguna de ellas y las otras pueden variar en todo su rango.
Dadas X1 y X2 dos variables aleatorias discretas con función de probabilidad conjunta P(x1, x2),
entonces la función de probabilidad marginal para X1 está dada por
P x P x xx
1 1 1 22
( ) ( , )
es decir, x1 se considera constante, mientras que la otra variable x2 recorre todos sus valores.
Asimismo para X2, resulta
P x P x xx
2 2 1 21
( ) ( , )
donde la variable que se considera constante es x2, mientras que la que recorre todos sus valores es x1.
Se retoma el ejemplo anterior: dadas dadas X1: “número de ejecutivos casados” y X2: “ejecuti-vos que nunca se han casado”, se calculan las probabilidades marginales para X1 y X2: “número de ejecutivos casados entre los tres considerados para el ascenso”.
Por definición de probabilidad marginal y utilizando la distribución de probabilidad calculada en el ejemplo 1 se tiene
P1(x1)= marginal para x1 o sea P1(x1), resulta
P P x P P Px
1 20 0 0 1 0 2 0 33
84
6
84
1
84
10
842
( , ) ( , ) ( , ) ( , ) 5
42
P P x P P Px
1 21 1 1 0 1 1 1 2484
2484
1
2
( , ) ( , ) ( , ) ( , )22
844084
1021
2 2 2 0 2 112
84
18
841 22
P P x P Px
( , ) ( , ) ( , )30
84
5
14
3 3 3 04
84
1
211 22
P P x Px
( , ) ( , )
Se comprueba que la suma de las probabilidades marginales resulta uno
P x P P P Px
1 1 1 1 1 11
0 1 2 310
84
40
84
30
84
4
841( ) ( ) ( ) ( ) ( )
Asimismo, para P2(x2)
P P P P2 2 2 2020
841
45
842
18
843
1
84( ) , ( ) , ( ) ( ) y
Se verifica que la suma de probabilidades marginales sea igual a uno
P x P P P Px
2 2 2 2 2 22
0 1 2 320
84
45
84
18
84
1
841( ) ( ) ( ) ( ) ( )
Ejemplo 3
Definición 9.2
266
Función de probabilidad condicional
Al igual que en una variable también se puede hablar de probabilidades condicionales, es decir probabilidades donde la ocurrencia de una variable esté restringida a que primero suceda otra, de acuerdo con lo analizado en la unidad 4 dichas probabilidades cumplen con los axiomas de Kolmogorov.
Dadas X1 y X2 dos variables aleatorias discretas se llama probabilidad condicional al hecho de
que suceda la variable aleatoria X1 = x1 puesto que sucedió X2 = x2
P X x X xPX x X x
P X xP X x( | )
,( )
, ( )1 1 2 21 1 2 2
2 2 22 2 2 0
[ ]
Variables aleatorias independientes
En la unidad 4 se analizó el concepto de eventos independientes y la importancia de tales eventos en el desarrollo de la teoría de las probabilidades. Ahora se verá el concepto de variables independientes de forma muy similar, pero dirigido en el estudio hacia la estadística.
Las variables aleatorias discretas X1 y X2 con función de probabilidad conjunta P(x1, x2) y funciones
marginales P1(x1) y P2(x2), se llaman variables independientes si y solo si
P(x1, x2) = P1(x1)P2(x2), para toda x1 X1 y x2 X2.
Se retoma el ejemplo anterior: dadasdadas X1: “número de ejecutivos casados” y X2: “ejecutivos que nunca se han casado”
a) se calcula P(X1= 1 X2 = 2)b) se determina si X1 y X2 son independientesc) si X3 denota el número de ejecutivos divorciados entre los nueve considerados
para el ascenso, entonces X3 = 3 – X1 – X2. Se busca P(X3= 1 X2 = 1)
a) Probabilidad condicional. De la distribución de probabilidad calculada en el ejemplo 1, resulta
P(X1= 1, X2 = 2) = P(1, 2) = 12/ 84
para la siguiente probabilidad marginal se usa el resultado del ejemplo 2
P2(X2= 2) = P2(2) = 18/ 84 = 3/ 14
Por tanto,
P X XP X X
P X( )
( , )
( )1 21 2
2 21 2
1 2
2
12841884
12
18
2
3
Definición 9.3
Definición 9.4
Ejemplo 4
267
b) Independencia. Se utiliza la definición anterior sobre variables independientes.
P x x P x P x( , ) ( ) ( )1 2 1 1 2 2 conjunta marginal marginal
Las variables son dependientes puesto que para X1= 3 y X2= 0, de acuerdo con los resultados de los ejemplos 1 y 2, se tiene
P(3, 0) = 4/ 84
Por otro lado,
P1(3)P2(0) = (4/ 84)(20/ 84)
Por tanto,
P(3, 0) P1(3)P2(0)
Con esto se verifica que las variables son dependientes, ya que existe al menosuna combinación de valores de las variables con la cual no se cumple la condición de la definición de variables independientes.
c) Condicional de X3.
X3: “número de ejecutivos divorciados entre la muestra de nueve”
entonces X3 = 3 – X1 – X2.
P X XP X X
P X( )
( , )( )3 2
3 2
2 21 1
1 11
Se calculan las probabilidades por separado. Para P(X3= 1, X2 = 1): esta probabi-lidad ocurre cuando X2 = 1 y, por tanto, de X3 = 3 – X1 – X2, se tiene X1 = 1; es decir, P(X3= 1, X2 = 1) es equivalente a P(1, 1) = 24/ 84 = 2/ 7 (ver ejemplo 1), para finalizar
P X XP X X
P X( )
( , )
( )3 23 2
2 21 1
1 1
1
24844584
24
45
8
15
Valor esperado
En la unidad 5 se analizó el valor esperado de una variable aleatoria discreta, su interpre-tación y la fórmula para calcularlo. Para el caso de dos o más variables la interpretación se conserva, lo que se modifica un poco es la fórmula para calcularlo.
Dadas las variables aleatorias discretas X1 y X2 con función de probabilidad conjunta P(x1, x2), se llama valor esperado al calculado por
E X X x x P x xxx
( ) ( , )1 2 1 2 1 221
Definición 9.5
268
Propiedades
• si X1, X2 son independientes entonces E(X1X2) = E(X1)E(X2) • E(c) = c• E[g1(x1, x2) + g2(x1, x2)] = E[g1(x1, x2)] + E[g2(x1, x2)]
Dadas X1: “número de ejecutivos casados” y X2: “ejecutivos que nunca se han casado”, se calcula el valor esperado E(X1X2)
E X X x x P x x x x P x xxx xx
( ) ( , ) ( , )
(
1 2 1 2 1 2 1 20
3
0
3
1 221 21
3 0
)) ( ) ( ) ( ) ( ) ( ) ( )4
842 1
18
841 2
12
840 3
1
842 0
12
841 1
24
840 2
6
8411 0
4
84
84
841( )
9.2 Covarianza
Anteriormenteseanalizaron variablesaleatoriasy laformacómo sedispersaban losvalo-nteriormente se analizaron variables aleatorias y la forma cómo se dispersaban los valo-res de la variable, que se obtenían mediante la varianza. En el caso de dos o más variables, y la forma cómo están distribuidos sus datos, se emplea la dispersión de datos para ver si existe dependencia. El tema de la dependencia o independencia entre las variables es funda-mental en estadística. En las gráficas siguientes se muestran algunos datos donde es posible observar la dispersión y la posible dependencia entre las dos variables
En la primer gráfica ocurre una dependencia, puesto que cuando los valores de la variable X1 aumentan los de la variable X2 también aumentan; en la segunda no existe dicha dependencia o no es posible observarla claramente.
Supóngase que se sabe que E(X1) = 1 y E(X2) = 2, posteriormente para cada valor de las variables se calculan las desviaciones x1 – 1 y x2 – 2, y el producto de éstas (x1 – 1)(x2 – 2). El producto representa una medida para la dependencia de las variables, la cual se define a continuación.
La covarianza de las variables aleatorias X1 y X2(X1 – 1)(X2 – 2), y se simboliza
Cov [ ]( , ) ( )( )X X E X X1 2 1 1 2 2
Ejemplo 5
Definición 9.6
269
El valor de la covarianza depende de losvalores de las variables; pero, con esta forma para medir la dependencia entre variables se tiene un problema, por ejemplo, si la covarianza vale cinco, no se puede saber exactamente si este valor se considera grande o pequeño, ya que depende de los valores de las variables, por lo que surge la necesidad de un concepto más, el coeficiente de correlación.
El de las variables aleatorias X1 y X2, es un valor numérico que se
encuentra en el intervalo [–1, 1] y se simboliza (X1, X2) con
( , )( , )
( ) ( ),X X
X X
V X V X1 21 2
1 21 1
Cov[ ]
Con la definición anterior queda establecida una regla para medir la dependencia entre variables: si el coeficiente de correlación en valor absoluto es cercano a uno, las variables tienen un alto grado de dependencia, y en caso de estar cercano a cero las variables tienen un alto grado de independencia. Si los valores extremos valen cero, las variables son independientes; si valen uno las variables son dependientes.
Dadas X1 y X2 las variables aleatorias, la covarianza se calcula mediante
Cov(X1, X2) = E(X1, X2) – E(X1)E(X2)
Cov( ) [ ]X X E X X E X X X X
E X
1 2 1 1 2 2 1 2 2 1 1 2 1 2
1
, ( )( ) ( )
( XX E X E X
E X X E X E X
E
2 2 1 1 2 1 2
1 2 1 2 1 2 1 2
) ( ) ( )
( ) ( ) ( )
(( ) ( ) ( )X X E X E X1 2 1 2
Dadas X1 y X2 las variables aleatorias independientes, la covarianza vale cero
Cov(X1, X2) = 0
Se calcula el coeficiente de correlación de la variable aleatoria discreta del ejemplo 2. P1(x1) marginal para x1, del ejemplo 3 se obtuvieron las siguientes probabilidades
P x P P P P1 1 1 1 1 1010
841
40
84
10
212
30
84
5
14( ) ( ) , ( ) , ( )
5
42 y (( )3
4
84
1
21
De forma similar marginal para P2(x2)
P P P P2 2 2 202084
14584
21884
3184
( ) , ( ) , ( ) ( ) y
Se calculan los valores esperados de las variables
E X x P xk kk
n( ) ( )1 1
1
0542
11021
25
143
121
01021
57
17
22821
43
Definición 9.7
Teorema 9.1
Corolario
Ejemplo 6
270
05
211
15
282
3
143
1
840
15
22 21
E X x P xk kk
n( ) ( )
88
3
7
1
28
15 12 1
281
Se calcula la covarianza
Cov ( , ) ( )X X1 2 143
1 143
13
Para calcular el coeficiente de correlación se necesitan las varianzas
V X x P X E Xk kk
n( ) ( ) ( ( ))1
21
2 2 2 20542
11021
25
143
121
43
01021
2014
921
169
10 30 92
22
11169
147 11263
3563
59
05212
22 2
2 2V X x P x E Xk kk
n( ) ( ) ( ( )) 1
1528
23
143
184
1
01528
67
2 2 2 2
3328
115 24 3 28
281428
12
Finalmente el coeficiente de correlación
( , ) . .x x1 2
13
59
12
2
50 4 0 63
Ejercicio 1
1. Dadas X1 y X2 las variables aleatorias con la distribución de probabilidad conjunta
f x xx x
x x( , )
( ), , , ,
,1 2
1 1 21 233
1 2 1 2 3
0
y
en otro caso
x
calcula la distribución de probabilidad conjunta. 2. Calcula el valor esperado del ejercicio anterior. 3. Calcula el coeficiente de correlación de las variables del numeral 1. 4. Una cooperativa agrícola asegura que 30% de los melones embarcados pertenece a
la huerta uno, 20% a la huerta dos y 50% a la huerta tres. Define las variables
Xi: “melones embarcados pertenecientes a la huerta i”, para i = {1, 2, 3}{1, 2, 3}1, 2, 3}}
Calcula la probabilidad de que entre 18 melones embarcados, cuatro pertenezcan a la huerta dos y de los restantes al menos diez sean de la huerta tres.
5. Determina si las variables del numeral 4 son independientes.
9.3 Distribuciones muestrales y poblacionales
En la presente sección se analiza el muestreo aleatorio. Se dará una definición formal de muestra aleatoria, estadísticos y parámetros, conceptos fundamentales en el estudio del
271
proceso de inferencia estadística, que radica en inferir resultados de una muestra hacia su población, midiendo el grado de confiabilidad en los resultados por medio de la teoría de la probabilidad.
9.3.1 Muestreo aleatorio
En la unidad 1 se analizó la estadística descriptiva, donde se definió una población, una muestra, un estadístico, un parámetro, etc. También se determinó que la materia prima de la estadística consiste en conjuntos de números obtenidos al contar o medirelementos de algún fenómeno en estudio, por lo que se debe tener especial cuidado para garantizar que la información sea completa y correcta. Por consiguiente, el primer pro-blema reside en determinar qué información y en qué cantidad se habrá de reunir, ya que con base en ésta se establece la confiabi lidad de los resultados.
Se retoman los conceptos de población y muestra.
El conjunto de todos los elementos de un tipo particular cuyo conocimiento es de nuestro interés se llama población .
Puesto que la información disponible frecuentemente consta de una porción o la información disponible frecuentemente consta de una porción o subconjunto de la población, se establece el concepto de muestra de una población.
Se llama muestra a cualquier subconjunto de la población.
En la unidad 1 se mencionó que el problema del muestreo no es tan simple, además de que existen diferentes técnicas para llevarlo a cabo. Para los casos en que se quiere llegar a conclusiones con respecto a cierta medida de la población, siendo imposible o poco práctico analizar todo el conjunto de observaciones que la constituyen, se usa el muestreo aleatorio.
Muestreo aleatorio simple
Se caracteriza porque cualquier elemento de la población en estudio, tiene la misma posibilidad de ser seleccionado para formar parte de una muestra. Es decir, con el muestreo aleatorio se elimina cualquier problema en el que se sobreestime o subestime de forma consciente o inconsciente alguna característica de la población y, por tanto, las observaciones deben realizarse de forma independiente y al azar.
La forma de realizar un muestreo aleatorio simple es muy sencilla, por ejemplo, supóngase que de una población se quiere tomar una muestra al azar de 30 elementos para obtener cierto tipo de información; en estos casos, para respetar la aleatoriedad se puede hacer de diferentes formas: la más común es asignar un número diferente a cada elemento de la población, posteriormente con ayuda de una tabla de números aleatorios se delimita tomar un bloque de 30 elementos y se procede a analizar de los elementos correspondientes con la numeración del muestreo.
Definición 9.8
Definición 9.9
272
Al llevar a cabo muestreos de tamaño n de una población con N elementos en donde N n, en la mayoría de los casos la n es mucho más pequeña que N. Como se puede observar, la aleatoriedad del muestreo conduce a que cada una de las nobservaciones de la muestra al realizar todos los muestreos del mismo tamaño n de forma independiente, estarán representando variables aleatorias independientes para cada una de las n observaciones correspondientes X1, X2, . . . Xn, donde cada una tendrá la misma distribución de probabilidad de la población; X1 será la variable aleatoria correspondiente a la primer observación de la muestra, X2 será la variable aleatoria correspondiente a la segunda observación de la muestra, y así sucesivamente hasta la n-ésima observación.
Si las variables aleatorias X1, X2, . . . Xn obtenidas de una población forman una muestra aleatoria simple de tamaño n, si son independientes y tienen la misma distribución de probabilidad que la población.
Al hablar de independencia (unidad 4), se debe recordar que las elecciones con reemplazo eran sinónimo de independencia en la muestra, posteriormente en la sección 9.1 se presentó el concepto de variables aleatorias independientes. Para las muestras sin reemplazo se podría tener una aproximación a la independencia de las variables si el tamaño de la población es muy grande comparada con el de la muestra. Para efectos prácticos, si la muestra no representa 5% más de la población, las variables aleatorias obtenidas se pueden considerar independientes.
9.3.2 Estadísticos importantes
Uno de los objetivos de la estadística es obtener información de los parámetros de una población, por ejemplo
• supóngase que una industria fabricante de aparatos electrodomésticos quiere saber la vida promedio y la variabilidad de cierto modelo de refrigeradores. En este caso se tendría que observar la duración de todos los refrigeradores, lo que resultaría muy costoso. Por tanto, se realiza una inferencia con respecto a la vida promedio de todos los refrigeradores del modelo correspondiente
• supóngase que una fábrica de focos quiere saber lavida promedio y la variabilidad de los focos de 100 watts que produce. Igual que en el caso anterior, se tendrían que probar todos los focos para medir su duración, lo que resultaría laborioso y costoso. Por tanto, se realiza una inferencia con respecto a la vida promedio de todos los focos de 100 watts de la fábrica
• en elecciones presidenciales se necesita establecer ciertas inferencias sobre la prefe-rencia para un candidato. Ya que no resulta costeable estudiar a toda la población votante, en la víspera de las elecciones se realiza un muestreo rápido para detectar esta preferencia y tener conocimiento sobre las tendencias de la población
Es fundamental diferenciar entre variables aleatorias introducidas para las muestras ylos elementos de una de tales muestras. Supóngase que X1, X2, . . . Xn representan las n variables aleatorias del muestreo correspondientes a cada una de las n observaciones y que el valor anotado en la primer observación del muestreo es x1; esto significa que x1 representa un valor correspondiente a la variable aleatoria X1, de manera que el valor
Definición 9.10
273
anotado para la segunda observación del muestreo es x2, esto significa que x2 representa el valor correspondiente a la variable aleatoria X2, y así sucesivamente.
Ahora se puede aclarar que en la unidad 1 el uso de x x, , s2, etc., se debió a que se trataba de la media, mediana y varianza de una sola muestra.
Media xx x x
n nxni
i
n1 2
1
1
Mediana x
x
x x
n
n n
12
2 21
2
, cuando la cantidad de datos es impar
,, cuando la cantidad de datos es par
Varianza sesgada sn
x xn
x xn ii
n
ii
n2 2
1
2 2
1
1 1( )
Varianza insesgada sn
x xn
xn
nx
n
nsn i
i
n
i
n
ni12 2
1
2
1
2 21
1
1
1 1 1( ) ( )
En el primer ejemplo, si se toma una muestra 1 de los cuatro refrigeradores mencionados, con vida promedio de 4.0, 4.1, 5.0 y 3.8 años, la vida promedio de éstos será
x14 4 1 5 3 8
44 225
. .. años
Si se toma una muestra 2 de cuatro refrigeradores con vida promedio de 5.2, 6.4, 7.0 y 5.9 años, la vida promedio de esta muestra será
x25 2 6 4 7 0 5 9
46 125
. . . .. años
Se observa que la media muestral está variando de muestra en muestra, pero aún así, se puede afirmar que en la distribución muestral de medias el promedio de las medias de muestras es igual a la media de la población, es decir
x x x x
nn1 2 3 ...
En conclusión, x no es más que un valor de una variable aleatoria X. Esta relación de la variable aleatoria con su valor conocido genera la siguiente definición.
Un estadístico o estadígrafo es una función de las variables aleatorias que se pueden observar en una muestra de las constantes conocidas. Los estadísticos se utilizan para hacer inferencias (estimaciones) con respecto a parámetros poblacionales desconocidos.
En el caso de la duración promedio de cuatro refrigeradores, las medias x x1 2yse llaman estadísticos, que no son más que valores particulares de la estadística que se obtienen de las variables aleatorias X1, X2, X3 y X4 correspondientes a las muestras de tamaño cuatro y se calcula mediante
XX X X X1 2 3 4
4
Definición 9.11
Nota
274
De forma similar, para los estadísticos más comunes de un muestreo aleatorio de tamaño n, se tiene
Media XX X X
n nXn
kk
n1 2
1
1
Mediana X
X
X X
n
n n
12
2 21
2
, cuando la cantidad de datos es impar
,, cuando la cantidad de datos es
Varianza sesgada Sn
X Xn
X Xkk
n
kk
n2 2
1
2 2
1
1 1( )
Varianza insesgada Sn
nSn n1
2 2
1
9.3.3 Distribuciones muestrales
Se ha expresado la importancia de los estadísticos para llevar a cabo alguna inferencia, ahora hace falta tener más conocimientos con respecto al comportamiento de dichos estadísticos.
Primero recuérdese que un estadístico es una función de la variable aleatoria que depende sólo de la muestra en estudio, por tanto, debe tener una distribución de probabilidad que describa su comportamiento, por lo que se presenta la siguiente definición.
Se le llama distribución muestral a la distribución de probabilidad del estadístico en estudio.
Por ejemplo
La distribución muestral de X se llamará distribución muestral de medias La distribución muestral de S2 se llamará distribución muestral de la varianza
Como los estadísticos son funciones de variables aleatorias que se obtienen de muestreos de una población, dependerán del tamaño de la población, el tamaño de la muestra y el método de selección de la muestra.
Distribución de la media muestral
El estadístico que más aplicación tiene para llevar a cabo inferencias con respecto al parámetro media es la media muestral, por lo que conviene analizar tres propiedades del estadístico X que se emplean con bastante frecuencia en las inferencias.
Definición 9.12
275
Se llama distribución de la media a las variables de una muestra aleatoria de una distribución X1, X2, . . . Xn con valor medio y desviación estándar .
Dadas X1, X2, . . . Xn variables de una distribución con valor medio y desviación estándar . Entonces
• E X X( )
• V XnX( ) 22
• ( )Xn
De la definición de muestra aleatoria se deducen las propiedades del valor esperado ye la definición de muestra aleatoria se deducen las propiedades del valor esperado y la varianza para variables independientes. Como se trata de una muestra aleatoria, lasvariables X1, X2, . . . Xn tienen la misma distribución que la población, por consiguiente cada una de ellas tiene valor esperado , varianza 2 y además de ser independientes.
E X En
Xn
E Xn n
n
V X
kk
n
kk
n
k
n( ) ( ) ( )
( )
1 1 1 1
1 1 1
Vn
Xn
V Xn n
nnk
k
n
kk
n
k
n1 1 1 1
12
12
2
12
22
( ) ( )
( ) ( )X V Xn n
2
En caso de que la población tenga una distribución normal con media y desviación estándar , las variables aleatorias que conforman una muestra aleatoria de tamaño n X1, X2, . . . Xn deben tener la misma distribución normal que la población, por consiguiente cada una tendrá valor esperado y varianza 2, además de ser indepen-dientes. Con respecto a la distribución que tendrá la media muestral X, se presenta el siguiente teorema.
Dadas X1, X2, . . . Xn las variables de una muestra aleatoria de una distribución normal con
valor medio y desviación estándar , entonces, para cualquier tamaño de muestra n, X estará
normalmente distribuida con media E X( ) y desviación estandar
( )Xn
La regla de transformación en Z para el modelo normal muestral será
ZX E X
X
X
n
( )
( )
Definición 9.13
Teorema 9.3
Teorema 9.2
276
Los tornillos producidos por una máquina tienen 10 mm de diámetro y una desviación estándar de un milímetro. Se calcula la probabilidad de que de una muestra aleatoria de diez tornilloséstos tengan no más de 10.05 mm de diámetro promedio. Supóngase que la distribución de los diámetros de los tornillos es normal.
Dadas X1, X2, . . . X10 las variables aleatorias que representan los diámetros en milíme-tros de los diez tornillos para = 10, = 1 y n = 400, la probabilidad es P X( . )10 05 ; puesto que los diámetros de los tornillos tienen distribución normal se emplea el teorema 9.3
P X PX E X
X
E X
XP
X
n( . )
( )
( )
. ( )
( )
.10 05
10 05 10 05 100
1 10
0 16 0 5636P Z( . ) .
9.3.4 Teorema central del límite
Al final de la unidad 8 se analizó el modelo normal y se mencionó que era uno de los modelos de mayor trascendencia en el estudio de la estadística y la probabilidad. En esta sección se verá el porqué de dicha importancia.
Al final de la sección anterior, en el teorema 9.3, se determinó que si las variables aleatorias X1, X2, . . . Xn tienen una distribución normal, X tendrá la misma distribución; pero, qué pasará si las variables aleatorias de la muestra tomada tienen otro tipo de distribución diferente a la normal; el siguiente teorema determina los casos con muestras grandes.
Dadas X1, X2, . . . Xn las variables de una muestra aleatoria de una distribución con valor medio 2, la forma límite de la distribución de la variable siguiente
ZX X
nX
X tiene una distribución normal estándar cuando n
En forma práctica, la aproximación para X se considera bastante buena cuando el tamaño de la muestra es mayor o igual a 30 sin importar la forma de la distribución de la población. Para los casos en que el tamaño de la muestra sea menor a 30, la aproximación es buena sólo si la distribución de la población es semejante a la normal; en caso de que la distribución de la población sea normal se puede aplicar el teorema 9.3.
1. Los tornillos producidos por una máquina tienen 10 mm de diámetro y desviaciónLos tornillos producidos por una máquina tienen 10 mm de diámetro y desviación10 mm de diámetro y desviación estándar de un milímetro. Se calcula la probabilidad de que de una muestra aleatoria de 400 tornillos tenga un diámetro promedio de no más de 10.05 mm.
Dadas X1, X2, . . . X400 las variables aleatorias que representan los diámetros en milímetros de los 400 torni l los para = 10, = 1 y n = 400, la probabilidad es P X( . )10 05 ; por lo que se aplica el teorema central del límite, puesto que no se conoce la distribución de los datos. Sin embargo, cuando la muestra es grande no
Ejemplo 7
Teorema 9.4
Ejemplo 8
277
se puede aplicar el teorema 9.3, puesto que no se sabe si la distribución de los datoses normal.
P X PX
nP Z( . )
.( ) .10 05
10 05 10
1 4001 0 8413
2. Se supone que el peso de unos paquetes de café tienen media de 1 kg, y desviación estándar de 0.05 kg. Si en una caja se colocan 64 de esos paquetes y se calcula la probabilidad de que el peso total de la caja oscile entre 63 y 64.4 kg.
Dadas X1, X2, . . . X64 las variables aleatorias que representan el peso de los 64 paquetes de café con = 1, = 0.05 y n = 64, la probabilidad que se pide es la suma de los pesos de los 64 paquetes, es decir
P X ii
63 64 41
64.
se aplica el teorema central del límite puesto que no se conoce la distribución del peso de los paquetes. Sin embargo, la muestra es grande y para aplicar el teorema central del límite se necesita la media muestral, para esto, se dividen todos los miembros de las desigualdades entre 64
P X P X
P
ii
63
64
1
64
64 4
640 984375 1 00625
0
1
64 .( . . )
..
.
.
.( . )
984375 1
0 05 64
1 00625 1
0 05 642 5 1
X
nP Z
0 8413 0 0062 0 8351. . .
9.3.5 Distribuciones muestrales de una combinación lineal
Las distribuciones muestrales de combinaciones lineales tienen aplicación teórica para justificar la mayoría de los resultados estadísticos, por lo que en esta subsección se definirá la combinación lineal junto con los teoremas de mayor relevancia.
Dadas las variables aleatorias X1, X2, . . . Xn y las constantes a1, a2, . . . an, se llama combinación
lineal de una distribución muestral de las Xi a la variable aleatoria
Y = a1 X1 + a2 X2 + . . . + an Xn
Se tiene la media de las variables X1, X2, . . . Xn con a1 = a2 = . . . = an = 1/n Puesto que
Xn
Xn
Xn
Xn1 1 1
2
Se llama valor esperado y varianza de una combinación lineal a las variables de una muestra
aleatoria de una distribución X1, X2, . . . Xn, con valores medios 1, 2, . . . n
1 22 2 2, , ,
n, respectivamente, y a1, a2, . . . an constantes. Entonces
Definición 9.14
Teorema 9.5
Ejemplo 9
278
1. E a X a X a X a E X a E X a E Xn n n n( ) ( ) ( ) ( )1 1 2 2 1 1 2 2
sin importar cómo sean las variables independientes o dependientes.
2. V a X a X a X a V X a V X a V Xn n nn( ) ( ) ( ) ( )1 1 2 2
21
22
21 2
sólo cuando las variables aleatorias sean independientes.
3. Para cualesquier variables
V a X a X a X
a V X a V X a V X a a X
n n
n i jn
( )
( ) ( ) ( ) (
1 1 2 2
21
22
21 2
Cov ii jj
n
i j
nX, )
1
Ejercicio 2
1. Supón que el peso de unos paquetes de café se distribuye normalmente con media de un kilogramo y desviación estándar de 0.05 kg. Si en una caja se colocan 64 paquetes y se consideran faltas de peso las cajas de menos de 62.80 kg, calcula el porcentaje de cajas faltantes de peso.
2. Un guardabosques estudia los efectos de la fertilización en algunos bosques, paraello necesita calcular el área de la base de los pinos. Al estudiar ésta en árboles similares, descubrió que las mediciones tienen distribución normal con desviación estándar de aproximadamente 4 pulg2. Si el guardabosques toma una muestra al azar de nueve árboles, calcula la probabilidad de que la media muestral sea mayor al parámetro media en más de dos pulgadas cuadradas.
3. Se toma una muestra de n = 81, donde X es una variable aleatoria con = 7, calcula la probabilidad de que la media muestral se desvié por lo mucho dos unidades de la verdadera media.
4. El peso de los paquetes de azúcar es una variable aleatoria normal con = 6.4 y = 3 g. Si se toman al azar 150 paquetes de azúcar para reunir 1 kg, calcula la
probabilidad de que su peso no sea un kilogramo. 5. Se sabe que el tiempo promedio de reacción a un estimulo auditivo es una variable
aleatoria con distribución normal con = 0.15 y = 0.03 seg para personas con audición normal. Calcula el tamaño de la muestra si se requiere 95% de seguridad de que el tiempo medio de reacción muestral sea menor a 0.153 seg.
Ejercicios propuestos
1. Un inspector de control de tráfico reporta que 60% de los vehículos que llegan alpuerto de Acapulco tiene matrículas del D. F., 30% de Cuernavaca y el resto de otros estados. Dadas las variables aleatorias
X1: “cantidad de automóviles con placas del D. F. que llegan al puerto de Acapulco” X2: “cantidad de automóviles con placas del Cuernavaca que llegan al puerto de Acapulco” X3: “cantidad de automóviles con placas de otros estados que llegan al puerto de Acapulco”
calcula la probabilidad de que de los siguientes 50 automóviles que lleguen al puerto de Acapulco, 20 tengan placas del D. F., 20 de Cuernavaca y los restantes de otros estados.
279
2. Una encuesta entre los residentes de una ciudad demuestra que 30% prefiere teléfonos blancos, 30% azules, 25% negros y el restante plateados. Calcula la probabilidad de que exactamente tres de los próximos diez teléfonos preferidos por los compradores sean de color blanco, cuatro negros y ninguno plateado.
3. Un guardabosques estudia los efectos de la fertilización en algunos bosques, para ello necesita calcular el área de la base de los pinos. Al estudiar ésta en árboles similares, descubrió que las mediciones tienen una distribución normal con desviación estándar de aproximadamente 4 pulg2. Si el guardabosques toma una muestra al azar de nueve árboles, calcula la probabilidad de que la media muestral se desvíe por lo mucho dos pulgadas cuadradas del parámetro media.
4. Supón que el peso de una población es una variable aleatoria normal con =66kgy 66 kgy y 2 = 16 kg2. Si seis personas se suben a un ascensor que tiene una capacidad máxima
de 400 kg, calcula la probabilidad de que el ascensor no funcione. 5. Calcula media y varianza de la distribución muestral de cien variables cuya distribu-
ción individual es uniforme en el intervalo de 10 a 20.
Autoevaluación
1. Un inspector de control de tráfico reporta que 75% de los vehículos que llegan al puerto de Acapulco tienen matrículas del D. F., 10% de Cuernavaca y el resto de otros estados. Dadas las variables aleatorias:
X1: “cantidad de automóviles con placas del D. F. que llegan al puerto de Acapulco” X2: “cantidad de automóviles con placas del Cuernavaca que llegan al puerto de Acapulco” X3: “cantidad de automóviles con placas de otros estados que llegan al puerto de Acapulco”
calcula la probabilidad de que de los siguientes 30 automóviles que lleguen al puertode Acapulco, 20 tengan placas del D. F., cinco de Cuernavaca y los restantes tengan placas de otros estados.
a) 0.182 b) 0.0182 c) 0.9818 d) 0.0982
2. Dadas X1 y X2 las variables aleatorias con la distribución de probabilidad conjunta
f x xx x x
x x( , )( )
, , ,1 21 1 2
1 22
281 2 1 2y
calcula el coeficiente de correlación
a) 0.977 b) 0.023 c) –0.977 d) –0.023
280
3. Un pistón sefabricacon 12cm dediámetro internoydesviación estándar de0.25 cm,Un pistón se fabrica con 12 cm de diámetro interno y desviación estándar de 0.25 cm, calcula la probabilidad de que una muestra al azar de 64 pistones tenga diámetro interno promedio entre 11.95 y 12.05 centímetros.
a) 0.1096 b) 0.8904 c) 0.089 d) 0.911
4. Una persona llena un formato de solicitud de empleo en ocho minutos con desviación estándar de 2.5 minutos. Si llegan a las oficinas 40 personas para llenar la solicitud de empleo, calcula la probabilidad de que tarden por lo mucho siete horas en llenar las solicitudes
a) aproximadamente 0 b) 5 c) 0.25 d) aproximadamente 1
Respuestas de los ejercicios
Ejercicio 1
1. f f f f f( , ) , ( , ) , ( , ) , ( , ) , ( , )1 1233
1 2111
1 3433
2 1211
2 283
33
2 31033
y f( , )
2. 124/ 33
3. –0.031
4. 0.07486
5. sí son independientes
Ejercicio 2
1. 0.13
2. 0.0668 3. 0.9898
4. 0.8643
5. 271
281
Respuestas de los ejercicios propuestos
1. 0.00018
2. 0.01196
3. 0.8664
4. 0.3409
5. 0.1 y 0.08333
Respuestas de la autoevaluación
1. b)
2. d)
3. b)
4. d)