UNIDAD 9 Multivariables y distribuciones...

Objetivos

Al finalizar la unidad, el alumno:

• distinguirá y resolverá ejercicios de multivariables discretas• resolverá ejercicios relacionados con las funciones acumuladas multivariables discretas• resolverá problemas de funciones de probabilidad marginales• resolverá ejercicios utilizando las fórmulas de valor esperado de multivariables• resolverá ejercicios de independencia de variables aleatorias• calculará el coeficiente de correlación de las variables aleatorias• aplicará el teorema central del límite en el cálculo de probabilidades que involucren muestras grandes

Multivariablesy distribuciones muestrales

UNIDAD

9

Introducción

Anteriormente se trabajó con variables aleatorias tanto discretas como continuas con argumento de una sola variable. Este análisis, al igual que en las funciones, se puede prolongar a las variables aleatorias con más de un argumento. Para fines de esta unidad, se analizarán los conceptos más comunes de las multivariables aleatorias tanto discretas como continuas, para continuar con aplicación teóricas de la estadística: las distribuciones muestrales.

La unidad finaliza con el teorema que probablemente es el de mayor importancia teórica en la probabilidad y estadística, el del límite central.

9.1 Multivariables

En las unidades 5 a 8 se analizaron las variables aleatorias resultantes de experimentos aleatorios donde sólo intervenía un factor, es decir, modelos que manejan series univariadas de datos que sólo se preocupan por entender la variabilidad de una sola variable. Un ejemplo de este tipo de modelos lo tenemos en los casos estadísticos exploratorios básicos del análisis de tendencia central y dispersión. Existe una gran variedad de modelos más que se emplean en las teorías de Pronósticos y regresión, los cuales serán vistos en el curso de Estadística aplicada.

Por otro lado, debido a que no siempre es suficiente entender la variabilidad de una sola variable o de un conjunto de variables de manera independiente, la estadística ha diseñado el análisis multivariado de datos para analizar la variabilidad de un conjunto de variables de forma conjunta. Así, modelos univariados anteriormente presentados tienen su extensión al análisis multivariado.

Dada su extensión, en esta unidad nos enfocaremos en la clase de modelos estadísticos exploratorios multivariados de análisis de tendencia central, dispersión ycorrelación.

Cabe notar que un análisis multivariado tendría sentido si y sólo si las variables de interés tienen interrelación entre ellas, como se verá posteriormente, que exista correlación entre ellas.

Datos multivariados

Después de una severa tormenta en febrero de 1898, se rescataron algunos gorriones moribundos y fueron puestos en cautiverio en los laboratorios de Brown University. Posteriormente, las muestras sobreviviente y muerta se estudiaron para corroborar varias hipótesis sobre el tema de selección natural. A estos gorriones se les pesó y se les tomaron ocho diferentes medidas morfológicas. Los datos son los siguientes:

Ejemplo 1

262

Tomando los datos anteriores como una muestra de datos multivariados, en donde cada medición representa una variable diferente, varias preguntas pueden llegar a nuestras cabezas:

1. ¿Cómo se relacionan las medidas anteriores? Por ejemplo, sucede que cuando una de las medidas tiende a ser grande ¿las demás lo son?

2. ¿Existen diferencias significativas entre los gorriones sobrevivientes y los que no sobrevivieron?

3. Si es que difieren, ¿puede construirse una función que dependa de las medidas que nos ayude a dividir los datosen dos grupos? Así, si esta función tiende a ser grande para los sobrevivientes y pequeña en valor para los que murieron, podría utilizarse como un índice de ajuste darwiniano.

Las preguntas anteriores sobre los datos de los gorriones pueden contestarse conalgunas de las herramientas del análisis multivariado quese estudiarán en esta unidad. Nos limitaremos a explicar las distribuciones bidimensionales o distribuciones en dos variables. Para tres o más variables se deben seguir los mismos principios que se explicarán para dos variables, razón por la cual en lugar de utilizar sólo x y y se emplearán subíndices, como x1 y x2.

El estudio de las multivariables aleatorias se va a simplificar para las discretas, en el caso de las continuas se procede de forma similar, cambiando las sumatorias por integrales, pero debido a la complejidad de los cálculos y el objetivo del texto, no se contemplarán. Los estudiantes interesados en el tema pueden consultar la bibliografía que aparece al final del texto.

La forma de trabajo será mucho menos detallada que en las unidades anteriores, ya que se conservan las interpretaciones de los conceptos que hemos estudiado, como son: la distribución de probabilidad, función acumulada, valor esperado, etc. y, por consiguiente, veremos sólo algunos conceptos nuevos y las fórmulas para llevar a efecto sus cálculos.

Distribución de probabilidad conjunta discretaistribución de probabilidad conjunta discreta

Supóngase un experimento aleatorio en el que intervienen dos factores, por ejemplo, lanzar dos monedas donde se define una variable aleatoria para cada una de ellas: X1 y X2. Por ejemplo, si X1: “cantidad de caras águila de la moneda uno”, es decir X1 = {0, 1},

Nota

263

asimismo X2: “cantidad de caras águila de la moneda dos”, X2 = {0, 1}, los valores de cada experimento se representan por las parejas (x1, x2), donde x1 X1 y x2 X2; es decir

X1 X2 = {(0, 0), (0, 1), (1, 0), (1, 1)}

Definidas las variables aleatorias del experimento, surge la necesidad de definir también probabilidad para las parejas (x1, x2).

Se le llamalama probabilidad conjunta el resultado de un experimento con dos factores cuyas varia-bles aleatorias son X1 y X2, y parejas del experimento (x1, x2), representadas por

P(x1, x2) = P(X1 = x1, X2 = x2)

En el ejemplo anterior sobre lanzar dos monedas, es fácil verificar que las probabi-lidades correspondientes están dadas por

P(0, 0) = P(0, 1) = P(1, 0) = P(1, 1) = 1/4

Dicha probabilidad cumple con los axiomas de probabilidad de Kolmogorov, por tanto, desde el punto de vista axiomático, es una probabilidad.

Propiedades de la probabilidad conjunta discreta

• P(x1, x2) 0, para toda (x1, x2)

• x x

P x x1 2

1 2 1( , )

Función de distribución acumulada

De forma similar que en las variables aleatorias unidimensionales, la función de distribución acumulada está dada por

F a b P x x P x a x bx

b

x

a( , ) ( , ) ( , )1 2 1 2

21

Para el ejemplo de lanzar dos monedas, se tiene

F(0, 1) = P(0, 0) + P(0, 1) = 1/4 + 1/4 = 1/ 2

Propiedades de la función acumulada en dos variable s

Al igual que en el caso unidimensional, las propiedades de una función acumulada están dadas por

F(x1, x2), la cual siempre es no decreciente para todas x1 y x2

Por ejemplo, en una variable sucede que si a b, entonces

F(b) F(a) o F(b) – F(a) 0

Por tanto, si a2 a1; b2 b1 , entonces

F(a2, b2) – F(a2, b1) F(a1, b2) – F(a1, b1)

Definición 9.1

264

De igual forma

[F(a2, b2) – F(a2, b1)] – [F(a1, b2) – F(a1, b1)] 0

Lo que indica que la función acumulada es no decreciente

• lím

lím

xx

xx

F x x

F x x

12

12

1 2

1 2

0

1

( , )

( , )

,

,•

Se va a considerar a tres ejecutivos para un ascenso de un grupo de nueve; cuatro de ellos están casados, tres nunca han estado casados y dos están divorciados. Dadas X1: “número de ejecutivos casados” y X2: “ejecutivos que nunca se han casado”

a) se calculan las distribuciones de probabilidad conjunta de X1 y X2, suponiendo que se toma una muestra al azar de tres de los nueve ejecutivos

b) se calcula F(1, 2)

Los pasos a seguir para resolver el problema son similares en el caso de una variable, primero se definen las variables aleatorias del experimento

X1: “número de ejecutivos casados”X2: “número de ejecutivos que nunca se han casado”

a) La distribución de probabilidad en esté caso está dada con base en los ejecutivos considerados de entre los divorciados y, por tanto, pueden suceder tres casos: caso 1, ningún divorciado; caso 2, un divorciado y, caso 3, dos divorciados.

1. P(x1, x2), para 0 divorciados.

PC C C

CP

C C C

C

P

( , ) ; ( , )

( , )

3 04

842 1

18

84

1 2

4 3 3 0 2 0

9 3

4 2 3 1 2 0

9 3

44 1 3 2 2 0

9 3

4 0 3 3 2 0

9 3

12

840 3

1

84

C C C

CP

C C C

C; ( , )

2. P(x1, x2), para un divorciado.

PC C C

CP

C C C

CP( , ) ; ( , ) ; ( ,2 0

12

841 1

24

840 24 2 3 0 2 1

9 3

4 1 3 1 2 1

9 3

)) 4 0 3 2 2 1

9 3

6

84

C C C

C

3. P(x1, x2), para dos divorciados.

PC C C

CP

C C C

C( , ) ; ( , )1 0

484

0 1384

4 1 3 0 2 2

9 3

4 0 3 1 2 2

9 3

b) F(1, 2) = P(0, 1) + P(0, 2) + P(1, 0) + P(1, 1) + P(1, 2) == 3/ 84 + 6/ 84 + 4/ 84 + 24/ 84 + 12/ 84 = 49/ 84 = 7/ 12

Ejemplo 2

265

Función de probabilidad marginal

Cuando se trabaja con varias variables puede ser necesario conocer las probabilidades cuando se elige un valor de alguna de ellas y las otras pueden variar en todo su rango.

Dadas X1 y X2 dos variables aleatorias discretas con función de probabilidad conjunta P(x1, x2),

entonces la función de probabilidad marginal para X1 está dada por

P x P x xx

1 1 1 22

( ) ( , )

es decir, x1 se considera constante, mientras que la otra variable x2 recorre todos sus valores.

Asimismo para X2, resulta

P x P x xx

2 2 1 21

( ) ( , )

donde la variable que se considera constante es x2, mientras que la que recorre todos sus valores es x1.

Se retoma el ejemplo anterior: dadas dadas X1: “número de ejecutivos casados” y X2: “ejecuti-vos que nunca se han casado”, se calculan las probabilidades marginales para X1 y X2: “número de ejecutivos casados entre los tres considerados para el ascenso”.

Por definición de probabilidad marginal y utilizando la distribución de probabilidad calculada en el ejemplo 1 se tiene

P1(x1)= marginal para x1 o sea P1(x1), resulta

P P x P P Px

1 20 0 0 1 0 2 0 33

84

6

84

1

84

10

842

( , ) ( , ) ( , ) ( , ) 5

42

P P x P P Px

1 21 1 1 0 1 1 1 2484

2484

1

2

( , ) ( , ) ( , ) ( , )22

844084

1021

2 2 2 0 2 112

84

18

841 22

P P x P Px

( , ) ( , ) ( , )30

84

5

14

3 3 3 04

84

1

211 22

P P x Px

( , ) ( , )

Se comprueba que la suma de las probabilidades marginales resulta uno

P x P P P Px

1 1 1 1 1 11

0 1 2 310

84

40

84

30

84

4

841( ) ( ) ( ) ( ) ( )

Asimismo, para P2(x2)

P P P P2 2 2 2020

841

45

842

18

843

1

84( ) , ( ) , ( ) ( ) y

Se verifica que la suma de probabilidades marginales sea igual a uno

P x P P P Px

2 2 2 2 2 22

0 1 2 320

84

45

84

18

84

1

841( ) ( ) ( ) ( ) ( )

Ejemplo 3

Definición 9.2

266

Función de probabilidad condicional

Al igual que en una variable también se puede hablar de probabilidades condicionales, es decir probabilidades donde la ocurrencia de una variable esté restringida a que primero suceda otra, de acuerdo con lo analizado en la unidad 4 dichas probabilidades cumplen con los axiomas de Kolmogorov.

Dadas X1 y X2 dos variables aleatorias discretas se llama probabilidad condicional al hecho de

que suceda la variable aleatoria X1 = x1 puesto que sucedió X2 = x2

P X x X xPX x X x

P X xP X x( | )

,( )

, ( )1 1 2 21 1 2 2

2 2 22 2 2 0

[ ]

Variables aleatorias independientes

En la unidad 4 se analizó el concepto de eventos independientes y la importancia de tales eventos en el desarrollo de la teoría de las probabilidades. Ahora se verá el concepto de variables independientes de forma muy similar, pero dirigido en el estudio hacia la estadística.

Las variables aleatorias discretas X1 y X2 con función de probabilidad conjunta P(x1, x2) y funciones

marginales P1(x1) y P2(x2), se llaman variables independientes si y solo si

P(x1, x2) = P1(x1)P2(x2), para toda x1 X1 y x2 X2.

Se retoma el ejemplo anterior: dadasdadas X1: “número de ejecutivos casados” y X2: “ejecutivos que nunca se han casado”

a) se calcula P(X1= 1 X2 = 2)b) se determina si X1 y X2 son independientesc) si X3 denota el número de ejecutivos divorciados entre los nueve considerados

para el ascenso, entonces X3 = 3 – X1 – X2. Se busca P(X3= 1 X2 = 1)

a) Probabilidad condicional. De la distribución de probabilidad calculada en el ejemplo 1, resulta

P(X1= 1, X2 = 2) = P(1, 2) = 12/ 84

para la siguiente probabilidad marginal se usa el resultado del ejemplo 2

P2(X2= 2) = P2(2) = 18/ 84 = 3/ 14

Por tanto,

P X XP X X

P X( )

( , )

( )1 21 2

2 21 2

1 2

2

12841884

12

18

2

3

Definición 9.3

Definición 9.4

Ejemplo 4

267

b) Independencia. Se utiliza la definición anterior sobre variables independientes.

P x x P x P x( , ) ( ) ( )1 2 1 1 2 2 conjunta marginal marginal

Las variables son dependientes puesto que para X1= 3 y X2= 0, de acuerdo con los resultados de los ejemplos 1 y 2, se tiene

P(3, 0) = 4/ 84

Por otro lado,

P1(3)P2(0) = (4/ 84)(20/ 84)

Por tanto,

P(3, 0) P1(3)P2(0)

Con esto se verifica que las variables son dependientes, ya que existe al menosuna combinación de valores de las variables con la cual no se cumple la condición de la definición de variables independientes.

c) Condicional de X3.

X3: “número de ejecutivos divorciados entre la muestra de nueve”

entonces X3 = 3 – X1 – X2.

P X XP X X

P X( )

( , )( )3 2

3 2

2 21 1

1 11

Se calculan las probabilidades por separado. Para P(X3= 1, X2 = 1): esta probabi-lidad ocurre cuando X2 = 1 y, por tanto, de X3 = 3 – X1 – X2, se tiene X1 = 1; es decir, P(X3= 1, X2 = 1) es equivalente a P(1, 1) = 24/ 84 = 2/ 7 (ver ejemplo 1), para finalizar

P X XP X X

P X( )

( , )

( )3 23 2

2 21 1

1 1

1

24844584

24

45

8

15

Valor esperado

En la unidad 5 se analizó el valor esperado de una variable aleatoria discreta, su interpre-tación y la fórmula para calcularlo. Para el caso de dos o más variables la interpretación se conserva, lo que se modifica un poco es la fórmula para calcularlo.

Dadas las variables aleatorias discretas X1 y X2 con función de probabilidad conjunta P(x1, x2), se llama valor esperado al calculado por

E X X x x P x xxx

( ) ( , )1 2 1 2 1 221

Definición 9.5

268

Propiedades

• si X1, X2 son independientes entonces E(X1X2) = E(X1)E(X2) • E(c) = c• E[g1(x1, x2) + g2(x1, x2)] = E[g1(x1, x2)] + E[g2(x1, x2)]

Dadas X1: “número de ejecutivos casados” y X2: “ejecutivos que nunca se han casado”, se calcula el valor esperado E(X1X2)

E X X x x P x x x x P x xxx xx

( ) ( , ) ( , )

(

1 2 1 2 1 2 1 20

3

0

3

1 221 21

3 0

)) ( ) ( ) ( ) ( ) ( ) ( )4

842 1

18

841 2

12

840 3

1

842 0

12

841 1

24

840 2

6

8411 0

4

84

84

841( )

9.2 Covarianza

Anteriormenteseanalizaron variablesaleatoriasy laformacómo sedispersaban losvalo-nteriormente se analizaron variables aleatorias y la forma cómo se dispersaban los valo-res de la variable, que se obtenían mediante la varianza. En el caso de dos o más variables, y la forma cómo están distribuidos sus datos, se emplea la dispersión de datos para ver si existe dependencia. El tema de la dependencia o independencia entre las variables es funda-mental en estadística. En las gráficas siguientes se muestran algunos datos donde es posible observar la dispersión y la posible dependencia entre las dos variables

En la primer gráfica ocurre una dependencia, puesto que cuando los valores de la variable X1 aumentan los de la variable X2 también aumentan; en la segunda no existe dicha dependencia o no es posible observarla claramente.

Supóngase que se sabe que E(X1) = 1 y E(X2) = 2, posteriormente para cada valor de las variables se calculan las desviaciones x1 – 1 y x2 – 2, y el producto de éstas (x1 – 1)(x2 – 2). El producto representa una medida para la dependencia de las variables, la cual se define a continuación.

La covarianza de las variables aleatorias X1 y X2(X1 – 1)(X2 – 2), y se simboliza

Cov [ ]( , ) ( )( )X X E X X1 2 1 1 2 2

Ejemplo 5

Definición 9.6

269

El valor de la covarianza depende de losvalores de las variables; pero, con esta forma para medir la dependencia entre variables se tiene un problema, por ejemplo, si la covarianza vale cinco, no se puede saber exactamente si este valor se considera grande o pequeño, ya que depende de los valores de las variables, por lo que surge la necesidad de un concepto más, el coeficiente de correlación.

El de las variables aleatorias X1 y X2, es un valor numérico que se

encuentra en el intervalo [–1, 1] y se simboliza (X1, X2) con

( , )( , )

( ) ( ),X X

X X

V X V X1 21 2

1 21 1

Cov[ ]

Con la definición anterior queda establecida una regla para medir la dependencia entre variables: si el coeficiente de correlación en valor absoluto es cercano a uno, las variables tienen un alto grado de dependencia, y en caso de estar cercano a cero las variables tienen un alto grado de independencia. Si los valores extremos valen cero, las variables son independientes; si valen uno las variables son dependientes.

Dadas X1 y X2 las variables aleatorias, la covarianza se calcula mediante

Cov(X1, X2) = E(X1, X2) – E(X1)E(X2)

Cov( ) [ ]X X E X X E X X X X

E X

1 2 1 1 2 2 1 2 2 1 1 2 1 2

1

, ( )( ) ( )

( XX E X E X

E X X E X E X

E

2 2 1 1 2 1 2

1 2 1 2 1 2 1 2

) ( ) ( )

( ) ( ) ( )

(( ) ( ) ( )X X E X E X1 2 1 2

Dadas X1 y X2 las variables aleatorias independientes, la covarianza vale cero

Cov(X1, X2) = 0

Se calcula el coeficiente de correlación de la variable aleatoria discreta del ejemplo 2. P1(x1) marginal para x1, del ejemplo 3 se obtuvieron las siguientes probabilidades

P x P P P P1 1 1 1 1 1010

841

40

84

10

212

30

84

5

14( ) ( ) , ( ) , ( )

5

42 y (( )3

4

84

1

21

De forma similar marginal para P2(x2)

P P P P2 2 2 202084

14584

21884

3184

( ) , ( ) , ( ) ( ) y

Se calculan los valores esperados de las variables

E X x P xk kk

n( ) ( )1 1

1

0542

11021

25

143

121

01021

57

17

22821

43

Definición 9.7

Teorema 9.1

Corolario

Ejemplo 6

270

05

211

15

282

3

143

1

840

15

22 21

E X x P xk kk

n( ) ( )

88

3

7

1

28

15 12 1

281

Se calcula la covarianza

Cov ( , ) ( )X X1 2 143

1 143

13

Para calcular el coeficiente de correlación se necesitan las varianzas

V X x P X E Xk kk

n( ) ( ) ( ( ))1

21

2 2 2 20542

11021

25

143

121

43

01021

2014

921

169

10 30 92

22

11169

147 11263

3563

59

05212

22 2

2 2V X x P x E Xk kk

n( ) ( ) ( ( )) 1

1528

23

143

184

1

01528

67

2 2 2 2

3328

115 24 3 28

281428

12

Finalmente el coeficiente de correlación

( , ) . .x x1 2

13

59

12

2

50 4 0 63

Ejercicio 1

1. Dadas X1 y X2 las variables aleatorias con la distribución de probabilidad conjunta

f x xx x

x x( , )

( ), , , ,

,1 2

1 1 21 233

1 2 1 2 3

0

y

en otro caso

x

calcula la distribución de probabilidad conjunta. 2. Calcula el valor esperado del ejercicio anterior. 3. Calcula el coeficiente de correlación de las variables del numeral 1. 4. Una cooperativa agrícola asegura que 30% de los melones embarcados pertenece a

la huerta uno, 20% a la huerta dos y 50% a la huerta tres. Define las variables

Xi: “melones embarcados pertenecientes a la huerta i”, para i = {1, 2, 3}{1, 2, 3}1, 2, 3}}

Calcula la probabilidad de que entre 18 melones embarcados, cuatro pertenezcan a la huerta dos y de los restantes al menos diez sean de la huerta tres.

5. Determina si las variables del numeral 4 son independientes.

9.3 Distribuciones muestrales y poblacionales

En la presente sección se analiza el muestreo aleatorio. Se dará una definición formal de muestra aleatoria, estadísticos y parámetros, conceptos fundamentales en el estudio del

271

proceso de inferencia estadística, que radica en inferir resultados de una muestra hacia su población, midiendo el grado de confiabilidad en los resultados por medio de la teoría de la probabilidad.

9.3.1 Muestreo aleatorio

En la unidad 1 se analizó la estadística descriptiva, donde se definió una población, una muestra, un estadístico, un parámetro, etc. También se determinó que la materia prima de la estadística consiste en conjuntos de números obtenidos al contar o medirelementos de algún fenómeno en estudio, por lo que se debe tener especial cuidado para garantizar que la información sea completa y correcta. Por consiguiente, el primer pro-blema reside en determinar qué información y en qué cantidad se habrá de reunir, ya que con base en ésta se establece la confiabi lidad de los resultados.

Se retoman los conceptos de población y muestra.

El conjunto de todos los elementos de un tipo particular cuyo conocimiento es de nuestro interés se llama población .

Puesto que la información disponible frecuentemente consta de una porción o la información disponible frecuentemente consta de una porción o subconjunto de la población, se establece el concepto de muestra de una población.

Se llama muestra a cualquier subconjunto de la población.

En la unidad 1 se mencionó que el problema del muestreo no es tan simple, además de que existen diferentes técnicas para llevarlo a cabo. Para los casos en que se quiere llegar a conclusiones con respecto a cierta medida de la población, siendo imposible o poco práctico analizar todo el conjunto de observaciones que la constituyen, se usa el muestreo aleatorio.

Muestreo aleatorio simple

Se caracteriza porque cualquier elemento de la población en estudio, tiene la misma posibilidad de ser seleccionado para formar parte de una muestra. Es decir, con el muestreo aleatorio se elimina cualquier problema en el que se sobreestime o subestime de forma consciente o inconsciente alguna característica de la población y, por tanto, las observaciones deben realizarse de forma independiente y al azar.

La forma de realizar un muestreo aleatorio simple es muy sencilla, por ejemplo, supóngase que de una población se quiere tomar una muestra al azar de 30 elementos para obtener cierto tipo de información; en estos casos, para respetar la aleatoriedad se puede hacer de diferentes formas: la más común es asignar un número diferente a cada elemento de la población, posteriormente con ayuda de una tabla de números aleatorios se delimita tomar un bloque de 30 elementos y se procede a analizar de los elementos correspondientes con la numeración del muestreo.

Definición 9.8

Definición 9.9

272

Al llevar a cabo muestreos de tamaño n de una población con N elementos en donde N n, en la mayoría de los casos la n es mucho más pequeña que N. Como se puede observar, la aleatoriedad del muestreo conduce a que cada una de las nobservaciones de la muestra al realizar todos los muestreos del mismo tamaño n de forma independiente, estarán representando variables aleatorias independientes para cada una de las n observaciones correspondientes X1, X2, . . . Xn, donde cada una tendrá la misma distribución de probabilidad de la población; X1 será la variable aleatoria correspondiente a la primer observación de la muestra, X2 será la variable aleatoria correspondiente a la segunda observación de la muestra, y así sucesivamente hasta la n-ésima observación.

Si las variables aleatorias X1, X2, . . . Xn obtenidas de una población forman una muestra aleatoria simple de tamaño n, si son independientes y tienen la misma distribución de probabilidad que la población.

Al hablar de independencia (unidad 4), se debe recordar que las elecciones con reemplazo eran sinónimo de independencia en la muestra, posteriormente en la sección 9.1 se presentó el concepto de variables aleatorias independientes. Para las muestras sin reemplazo se podría tener una aproximación a la independencia de las variables si el tamaño de la población es muy grande comparada con el de la muestra. Para efectos prácticos, si la muestra no representa 5% más de la población, las variables aleatorias obtenidas se pueden considerar independientes.

9.3.2 Estadísticos importantes

Uno de los objetivos de la estadística es obtener información de los parámetros de una población, por ejemplo

• supóngase que una industria fabricante de aparatos electrodomésticos quiere saber la vida promedio y la variabilidad de cierto modelo de refrigeradores. En este caso se tendría que observar la duración de todos los refrigeradores, lo que resultaría muy costoso. Por tanto, se realiza una inferencia con respecto a la vida promedio de todos los refrigeradores del modelo correspondiente

• supóngase que una fábrica de focos quiere saber lavida promedio y la variabilidad de los focos de 100 watts que produce. Igual que en el caso anterior, se tendrían que probar todos los focos para medir su duración, lo que resultaría laborioso y costoso. Por tanto, se realiza una inferencia con respecto a la vida promedio de todos los focos de 100 watts de la fábrica

• en elecciones presidenciales se necesita establecer ciertas inferencias sobre la prefe-rencia para un candidato. Ya que no resulta costeable estudiar a toda la población votante, en la víspera de las elecciones se realiza un muestreo rápido para detectar esta preferencia y tener conocimiento sobre las tendencias de la población

Es fundamental diferenciar entre variables aleatorias introducidas para las muestras ylos elementos de una de tales muestras. Supóngase que X1, X2, . . . Xn representan las n variables aleatorias del muestreo correspondientes a cada una de las n observaciones y que el valor anotado en la primer observación del muestreo es x1; esto significa que x1 representa un valor correspondiente a la variable aleatoria X1, de manera que el valor

Definición 9.10

273

anotado para la segunda observación del muestreo es x2, esto significa que x2 representa el valor correspondiente a la variable aleatoria X2, y así sucesivamente.

Ahora se puede aclarar que en la unidad 1 el uso de x x, , s2, etc., se debió a que se trataba de la media, mediana y varianza de una sola muestra.

Media xx x x

n nxni

i

n1 2

1

1

Mediana x

x

x x

n

n n

12

2 21

2

, cuando la cantidad de datos es impar

,, cuando la cantidad de datos es par

Varianza sesgada sn

x xn

x xn ii

n

ii

n2 2

1

2 2

1

1 1( )

Varianza insesgada sn

x xn

xn

nx

n

nsn i

i

n

i

n

ni12 2

1

2

1

2 21

1

1

1 1 1( ) ( )

En el primer ejemplo, si se toma una muestra 1 de los cuatro refrigeradores mencionados, con vida promedio de 4.0, 4.1, 5.0 y 3.8 años, la vida promedio de éstos será

x14 4 1 5 3 8

44 225

. .. años

Si se toma una muestra 2 de cuatro refrigeradores con vida promedio de 5.2, 6.4, 7.0 y 5.9 años, la vida promedio de esta muestra será

x25 2 6 4 7 0 5 9

46 125

. . . .. años

Se observa que la media muestral está variando de muestra en muestra, pero aún así, se puede afirmar que en la distribución muestral de medias el promedio de las medias de muestras es igual a la media de la población, es decir

x x x x

nn1 2 3 ...

En conclusión, x no es más que un valor de una variable aleatoria X. Esta relación de la variable aleatoria con su valor conocido genera la siguiente definición.

Un estadístico o estadígrafo es una función de las variables aleatorias que se pueden observar en una muestra de las constantes conocidas. Los estadísticos se utilizan para hacer inferencias (estimaciones) con respecto a parámetros poblacionales desconocidos.

En el caso de la duración promedio de cuatro refrigeradores, las medias x x1 2yse llaman estadísticos, que no son más que valores particulares de la estadística que se obtienen de las variables aleatorias X1, X2, X3 y X4 correspondientes a las muestras de tamaño cuatro y se calcula mediante

XX X X X1 2 3 4

4

Definición 9.11

Nota

274

De forma similar, para los estadísticos más comunes de un muestreo aleatorio de tamaño n, se tiene

Media XX X X

n nXn

kk

n1 2

1

1

Mediana X

X

X X

n

n n

12

2 21

2

, cuando la cantidad de datos es impar

,, cuando la cantidad de datos es

Varianza sesgada Sn

X Xn

X Xkk

n

kk

n2 2

1

2 2

1

1 1( )

Varianza insesgada Sn

nSn n1

2 2

1

9.3.3 Distribuciones muestrales

Se ha expresado la importancia de los estadísticos para llevar a cabo alguna inferencia, ahora hace falta tener más conocimientos con respecto al comportamiento de dichos estadísticos.

Primero recuérdese que un estadístico es una función de la variable aleatoria que depende sólo de la muestra en estudio, por tanto, debe tener una distribución de probabilidad que describa su comportamiento, por lo que se presenta la siguiente definición.

Se le llama distribución muestral a la distribución de probabilidad del estadístico en estudio.

Por ejemplo

La distribución muestral de X se llamará distribución muestral de medias La distribución muestral de S2 se llamará distribución muestral de la varianza

Como los estadísticos son funciones de variables aleatorias que se obtienen de muestreos de una población, dependerán del tamaño de la población, el tamaño de la muestra y el método de selección de la muestra.

Distribución de la media muestral

El estadístico que más aplicación tiene para llevar a cabo inferencias con respecto al parámetro media es la media muestral, por lo que conviene analizar tres propiedades del estadístico X que se emplean con bastante frecuencia en las inferencias.

Definición 9.12

275

Se llama distribución de la media a las variables de una muestra aleatoria de una distribución X1, X2, . . . Xn con valor medio y desviación estándar .

Dadas X1, X2, . . . Xn variables de una distribución con valor medio y desviación estándar . Entonces

• E X X( )

• V XnX( ) 22

• ( )Xn

De la definición de muestra aleatoria se deducen las propiedades del valor esperado ye la definición de muestra aleatoria se deducen las propiedades del valor esperado y la varianza para variables independientes. Como se trata de una muestra aleatoria, lasvariables X1, X2, . . . Xn tienen la misma distribución que la población, por consiguiente cada una de ellas tiene valor esperado , varianza 2 y además de ser independientes.

E X En

Xn

E Xn n

n

V X

kk

n

kk

n

k

n( ) ( ) ( )

( )

1 1 1 1

1 1 1

Vn

Xn

V Xn n

nnk

k

n

kk

n

k

n1 1 1 1

12

12

2

12

22

( ) ( )

( ) ( )X V Xn n

2

En caso de que la población tenga una distribución normal con media y desviación estándar , las variables aleatorias que conforman una muestra aleatoria de tamaño n X1, X2, . . . Xn deben tener la misma distribución normal que la población, por consiguiente cada una tendrá valor esperado y varianza 2, además de ser indepen-dientes. Con respecto a la distribución que tendrá la media muestral X, se presenta el siguiente teorema.

Dadas X1, X2, . . . Xn las variables de una muestra aleatoria de una distribución normal con

valor medio y desviación estándar , entonces, para cualquier tamaño de muestra n, X estará

normalmente distribuida con media E X( ) y desviación estandar

( )Xn

La regla de transformación en Z para el modelo normal muestral será

ZX E X

X

X

n

( )

( )

Definición 9.13

Teorema 9.3

Teorema 9.2

276

Los tornillos producidos por una máquina tienen 10 mm de diámetro y una desviación estándar de un milímetro. Se calcula la probabilidad de que de una muestra aleatoria de diez tornilloséstos tengan no más de 10.05 mm de diámetro promedio. Supóngase que la distribución de los diámetros de los tornillos es normal.

Dadas X1, X2, . . . X10 las variables aleatorias que representan los diámetros en milíme-tros de los diez tornillos para = 10, = 1 y n = 400, la probabilidad es P X( . )10 05 ; puesto que los diámetros de los tornillos tienen distribución normal se emplea el teorema 9.3

P X PX E X

X

E X

XP

X

n( . )

( )

( )

. ( )

( )

.10 05

10 05 10 05 100

1 10

0 16 0 5636P Z( . ) .

9.3.4 Teorema central del límite

Al final de la unidad 8 se analizó el modelo normal y se mencionó que era uno de los modelos de mayor trascendencia en el estudio de la estadística y la probabilidad. En esta sección se verá el porqué de dicha importancia.

Al final de la sección anterior, en el teorema 9.3, se determinó que si las variables aleatorias X1, X2, . . . Xn tienen una distribución normal, X tendrá la misma distribución; pero, qué pasará si las variables aleatorias de la muestra tomada tienen otro tipo de distribución diferente a la normal; el siguiente teorema determina los casos con muestras grandes.

Dadas X1, X2, . . . Xn las variables de una muestra aleatoria de una distribución con valor medio 2, la forma límite de la distribución de la variable siguiente

ZX X

nX

X tiene una distribución normal estándar cuando n

En forma práctica, la aproximación para X se considera bastante buena cuando el tamaño de la muestra es mayor o igual a 30 sin importar la forma de la distribución de la población. Para los casos en que el tamaño de la muestra sea menor a 30, la aproximación es buena sólo si la distribución de la población es semejante a la normal; en caso de que la distribución de la población sea normal se puede aplicar el teorema 9.3.

1. Los tornillos producidos por una máquina tienen 10 mm de diámetro y desviaciónLos tornillos producidos por una máquina tienen 10 mm de diámetro y desviación10 mm de diámetro y desviación estándar de un milímetro. Se calcula la probabilidad de que de una muestra aleatoria de 400 tornillos tenga un diámetro promedio de no más de 10.05 mm.

Dadas X1, X2, . . . X400 las variables aleatorias que representan los diámetros en milímetros de los 400 torni l los para = 10, = 1 y n = 400, la probabilidad es P X( . )10 05 ; por lo que se aplica el teorema central del límite, puesto que no se conoce la distribución de los datos. Sin embargo, cuando la muestra es grande no

Ejemplo 7

Teorema 9.4

Ejemplo 8

277

se puede aplicar el teorema 9.3, puesto que no se sabe si la distribución de los datoses normal.

P X PX

nP Z( . )

.( ) .10 05

10 05 10

1 4001 0 8413

2. Se supone que el peso de unos paquetes de café tienen media de 1 kg, y desviación estándar de 0.05 kg. Si en una caja se colocan 64 de esos paquetes y se calcula la probabilidad de que el peso total de la caja oscile entre 63 y 64.4 kg.

Dadas X1, X2, . . . X64 las variables aleatorias que representan el peso de los 64 paquetes de café con = 1, = 0.05 y n = 64, la probabilidad que se pide es la suma de los pesos de los 64 paquetes, es decir

P X ii

63 64 41

64.

se aplica el teorema central del límite puesto que no se conoce la distribución del peso de los paquetes. Sin embargo, la muestra es grande y para aplicar el teorema central del límite se necesita la media muestral, para esto, se dividen todos los miembros de las desigualdades entre 64

P X P X

P

ii

63

64

1

64

64 4

640 984375 1 00625

0

1

64 .( . . )

..

.

.

.( . )

984375 1

0 05 64

1 00625 1

0 05 642 5 1

X

nP Z

0 8413 0 0062 0 8351. . .

9.3.5 Distribuciones muestrales de una combinación lineal

Las distribuciones muestrales de combinaciones lineales tienen aplicación teórica para justificar la mayoría de los resultados estadísticos, por lo que en esta subsección se definirá la combinación lineal junto con los teoremas de mayor relevancia.

Dadas las variables aleatorias X1, X2, . . . Xn y las constantes a1, a2, . . . an, se llama combinación

lineal de una distribución muestral de las Xi a la variable aleatoria

Y = a1 X1 + a2 X2 + . . . + an Xn

Se tiene la media de las variables X1, X2, . . . Xn con a1 = a2 = . . . = an = 1/n Puesto que

Xn

Xn

Xn

Xn1 1 1

2

Se llama valor esperado y varianza de una combinación lineal a las variables de una muestra

aleatoria de una distribución X1, X2, . . . Xn, con valores medios 1, 2, . . . n

1 22 2 2, , ,

n, respectivamente, y a1, a2, . . . an constantes. Entonces

Definición 9.14

Teorema 9.5

Ejemplo 9

278

1. E a X a X a X a E X a E X a E Xn n n n( ) ( ) ( ) ( )1 1 2 2 1 1 2 2

sin importar cómo sean las variables independientes o dependientes.

2. V a X a X a X a V X a V X a V Xn n nn( ) ( ) ( ) ( )1 1 2 2

21

22

21 2

sólo cuando las variables aleatorias sean independientes.

3. Para cualesquier variables

V a X a X a X

a V X a V X a V X a a X

n n

n i jn

( )

( ) ( ) ( ) (

1 1 2 2

21

22

21 2

Cov ii jj

n

i j

nX, )

1

Ejercicio 2

1. Supón que el peso de unos paquetes de café se distribuye normalmente con media de un kilogramo y desviación estándar de 0.05 kg. Si en una caja se colocan 64 paquetes y se consideran faltas de peso las cajas de menos de 62.80 kg, calcula el porcentaje de cajas faltantes de peso.

2. Un guardabosques estudia los efectos de la fertilización en algunos bosques, paraello necesita calcular el área de la base de los pinos. Al estudiar ésta en árboles similares, descubrió que las mediciones tienen distribución normal con desviación estándar de aproximadamente 4 pulg2. Si el guardabosques toma una muestra al azar de nueve árboles, calcula la probabilidad de que la media muestral sea mayor al parámetro media en más de dos pulgadas cuadradas.

3. Se toma una muestra de n = 81, donde X es una variable aleatoria con = 7, calcula la probabilidad de que la media muestral se desvié por lo mucho dos unidades de la verdadera media.

4. El peso de los paquetes de azúcar es una variable aleatoria normal con = 6.4 y = 3 g. Si se toman al azar 150 paquetes de azúcar para reunir 1 kg, calcula la

probabilidad de que su peso no sea un kilogramo. 5. Se sabe que el tiempo promedio de reacción a un estimulo auditivo es una variable

aleatoria con distribución normal con = 0.15 y = 0.03 seg para personas con audición normal. Calcula el tamaño de la muestra si se requiere 95% de seguridad de que el tiempo medio de reacción muestral sea menor a 0.153 seg.

Ejercicios propuestos

1. Un inspector de control de tráfico reporta que 60% de los vehículos que llegan alpuerto de Acapulco tiene matrículas del D. F., 30% de Cuernavaca y el resto de otros estados. Dadas las variables aleatorias

X1: “cantidad de automóviles con placas del D. F. que llegan al puerto de Acapulco” X2: “cantidad de automóviles con placas del Cuernavaca que llegan al puerto de Acapulco” X3: “cantidad de automóviles con placas de otros estados que llegan al puerto de Acapulco”

calcula la probabilidad de que de los siguientes 50 automóviles que lleguen al puerto de Acapulco, 20 tengan placas del D. F., 20 de Cuernavaca y los restantes de otros estados.

279

2. Una encuesta entre los residentes de una ciudad demuestra que 30% prefiere teléfonos blancos, 30% azules, 25% negros y el restante plateados. Calcula la probabilidad de que exactamente tres de los próximos diez teléfonos preferidos por los compradores sean de color blanco, cuatro negros y ninguno plateado.

3. Un guardabosques estudia los efectos de la fertilización en algunos bosques, para ello necesita calcular el área de la base de los pinos. Al estudiar ésta en árboles similares, descubrió que las mediciones tienen una distribución normal con desviación estándar de aproximadamente 4 pulg2. Si el guardabosques toma una muestra al azar de nueve árboles, calcula la probabilidad de que la media muestral se desvíe por lo mucho dos pulgadas cuadradas del parámetro media.

4. Supón que el peso de una población es una variable aleatoria normal con =66kgy 66 kgy y 2 = 16 kg2. Si seis personas se suben a un ascensor que tiene una capacidad máxima

de 400 kg, calcula la probabilidad de que el ascensor no funcione. 5. Calcula media y varianza de la distribución muestral de cien variables cuya distribu-

ción individual es uniforme en el intervalo de 10 a 20.

Autoevaluación

1. Un inspector de control de tráfico reporta que 75% de los vehículos que llegan al puerto de Acapulco tienen matrículas del D. F., 10% de Cuernavaca y el resto de otros estados. Dadas las variables aleatorias:

X1: “cantidad de automóviles con placas del D. F. que llegan al puerto de Acapulco” X2: “cantidad de automóviles con placas del Cuernavaca que llegan al puerto de Acapulco” X3: “cantidad de automóviles con placas de otros estados que llegan al puerto de Acapulco”

calcula la probabilidad de que de los siguientes 30 automóviles que lleguen al puertode Acapulco, 20 tengan placas del D. F., cinco de Cuernavaca y los restantes tengan placas de otros estados.

a) 0.182 b) 0.0182 c) 0.9818 d) 0.0982

2. Dadas X1 y X2 las variables aleatorias con la distribución de probabilidad conjunta

f x xx x x

x x( , )( )

, , ,1 21 1 2

1 22

281 2 1 2y

calcula el coeficiente de correlación

a) 0.977 b) 0.023 c) –0.977 d) –0.023

280

3. Un pistón sefabricacon 12cm dediámetro internoydesviación estándar de0.25 cm,Un pistón se fabrica con 12 cm de diámetro interno y desviación estándar de 0.25 cm, calcula la probabilidad de que una muestra al azar de 64 pistones tenga diámetro interno promedio entre 11.95 y 12.05 centímetros.

a) 0.1096 b) 0.8904 c) 0.089 d) 0.911

4. Una persona llena un formato de solicitud de empleo en ocho minutos con desviación estándar de 2.5 minutos. Si llegan a las oficinas 40 personas para llenar la solicitud de empleo, calcula la probabilidad de que tarden por lo mucho siete horas en llenar las solicitudes

a) aproximadamente 0 b) 5 c) 0.25 d) aproximadamente 1

Respuestas de los ejercicios

Ejercicio 1

1. f f f f f( , ) , ( , ) , ( , ) , ( , ) , ( , )1 1233

1 2111

1 3433

2 1211

2 283

33

2 31033

y f( , )

2. 124/ 33

3. –0.031

4. 0.07486

5. sí son independientes

Ejercicio 2

1. 0.13

2. 0.0668 3. 0.9898

4. 0.8643

5. 271

281

Respuestas de los ejercicios propuestos

1. 0.00018

2. 0.01196

3. 0.8664

4. 0.3409

5. 0.1 y 0.08333

Respuestas de la autoevaluación

1. b)

2. d)

3. b)

4. d)

UNIDAD 9 Multivariables y distribuciones...

Documents

Transcript of UNIDAD 9 Multivariables y distribuciones...