TEMA 3.- VECTORES ALEATORIOS.- CURSO...

download TEMA 3.- VECTORES ALEATORIOS.- CURSO 2017-2018acorral.etsisi.upm.es/Tel_Estadistica/TEMA_3_VECTORES_ALEATORIO… · 3.6. variables aleatorias n-dimensionales o multidimensionales.

If you can't read please download the document

Transcript of TEMA 3.- VECTORES ALEATORIOS.- CURSO...

  • TEMA 3.- VECTORES ALEATORIOS.- CURSO 2017-2018 3.1. VARIABLES ALEATORIAS BIDIMENSIONALES. FUNCIN DE DISTRIBUCIN CONJUNTA.

    3.2. VARIABLES BIDIMENSIONALES DISCRETAS.

    3.3. VARIABLES BIDIMENSIONALES CONTINUAS.

    3.4. INDEPENDENCIA DE VARIABLES ALEATORIAS BIDIMENSIONALES.

    3.5. MEDIDAS ASOCIADAS A VARIABLES ALEATORIAS BIDIMENSIONALES.

    3.5.1. COVARIANZA Y COEFICIENTE DE CORRELACIN LINEAL

    3.5.2 PROPIEDADES DE MEDIAS Y VARIANZAS DE COMBINACIONES LINEALES DE VARIABLES ALEATORIAS

    3.5.3. VECTOR DE MEDIAS Y MATRIZ DE VARIANZAS COVARIANZAS.

    3.6. VARIABLES ALEATORIAS n-DIMENSIONALES O MULTIDIMENSIONALES.

    3.7. DISTRIBUCIN NORMAL n-DIMENSIONAL.

    3.8. TEOREMA CENTRAL DEL LMITE.

  • 3.1 VARIABLES ALEATORIAS BIDIMENSIONALES

    Definicin Sea el espacio muestral asociado a un experimento aleatorio. Llamaremos variable aleatoria bidimensional a una funcin

    ( ) 2, :X Y . Cada variable componente de una variable aleatoria bidimensional es una variable aleatoria unidimensional que recibe el nombre de variable marginal.

    La variable (X, Y) es DISCRETA si sus dos variables componentes son discretas. (X, Y) es CONTINUA si sus componentes son continuas.

    Ejemplo 1: (problema 1) Se lanza una moneda equilibrada 3 veces. Se define la variable aleatoria (X, Y) donde X: nmero total de caras obtenidas, Y: valor absoluto de la diferencia entre el nmero de caras y el nmero de cruces obtenidas. La variable (X, Y) es discreta. Ejemplo 2:(prob 4) En un sistema de comunicaciones se utilizan dos canales para transmitir la informacin. Sea X el tiempo que tarda un mensaje por el primer canal e Y el tiempo que tarda por el segundo. (X, Y) es continua.

  • FUNCIN DE DISTRIBUCIN CONJUNTA Al igual que en el caso de una sola variable aleatoria, podemos definir para variables bidimensionales, tanto discretas como continuas, la funcin de distribucin. Definicin Sea ( ),X Y una variable aleatoria bidimensional. Llamaremos funcin de distribucin conjunta asociada a ( ),X Y a la funcin 2:F definida como

    ( ) { } { }( ) ( ) ( ) 2, , ,F x y P X x Y y P X x Y y x y= =

    Observacin: En el caso bidimensional NO vamos a calcular de manera general F(x,y) pero s realizaremos el clculo de valores concretos de esta funcin F(x0,y0).

  • 3.2. VARIABLES ALEATORIAS BIDIMENSIONALES DISCRETAS Definicin Diremos que una variable aleatoria ( ),X Y es de tipo discreto o, simplemente, discreta si el conjunto de posibles pares de valores de la variable es finito o infinito numerable.

    Notacin:

    , 1, 2,.., ;( 1, 2,. .,, ) .i j i n j mx y = = (pares de valores que toma la variable)

    ( ) { } { }( ), , 1, 2,.., ; 1, 2,...,i j i ji j ij P X x Y y P X x Y y p i n j mp = = = = = = = = = (pij es la probabilidad del par ( , )i jx y ).

    Propiedades: Se verifica que , 1 10 y 1ij ij

    i jp p

    = =

    = . (Si la variable tomase un nmero infinito de valores, las sumas seran series)

  • Definicin: A la coleccin de nmeros { }, ,ijp i j} que satisfacen ( ), 0i j ijP X x Y y p= = = y

    1 11

    n m

    iji j

    p= =

    = se llama funcin de probabilidad conjunta de la variable aleatoria (X,Y).

    Obs: La funcin de probabilidad conjunta se representa en una tabla de doble entrada.

    Propiedades:

    1. Para calcular la probabilidad de un recinto D de 2 :

    ( )( , )

    (( , ) ) ,i j

    i jx y D

    P X Y D P X x Y y

    = = =

    ( ) ( ) ( )2. , , ,i j

    i jx x y y

    F x y P X x Y y P X x Y y

    = = = =

    Ejemplo 3: Para la variable (X,Y) del problema 1 obtener la funcin de probabilidad conjunta, P(X = Y), P(Y > X/2) y F(2.5, 1).

  • DISTRIBUCIONES MARGINALES DE UNA VARIABLE ALEATORIA BIDIMENSIONAL DISCRETA

    Teorema: Sea ( ),X Y variable aleatoria bidimensional discreta con funcin de

    probabilidad conjunta { }( , ), , 1, 2,.., ; 1, 2,...,i j ijx y p i n j m= = entonces, las variables X e Y son variables aleatorias discretas. Se llaman variables marginales. Adems,

    1. X toma los valores { } , 1, 2,...,ix i n= y su funcin de probabilidad es

    ( ) ( )1 1

    ,m m

    i i ij i jj j

    p P X x p P X x Y y= =

    = = = = = = (Verificar que 1

    0, 1n

    i ii

    p p=

    = )

    2. Y toma los valores { } 1,2,..,jy j m= y su funcin de probabilidad es ( ) ( )

    1 1,

    n n

    j j ij i ji i

    q P Y y p P X x Y y= =

    = = = = = = (Verificar que 1

    0, 1m

    j jj

    q q=

    = )

    Ejemplo 4: Para (X,Y) del problema 1 obtener las distribuciones marginales y P(Y = j/ X = 2) si j = 1,3.

  • 3.3. VARIABLES BIDIMENSIONALES CONTINUAS Las variables aleatorias bidimensionales de tipo continuo son una extensin de las variables aleatorias unidimensionales continuas. Estas variables toman valores en recintos del plano 2 .

    Definicin: Diremos que una variable aleatoria bidimensional ( ),X Y es continua si existe una funcin 2:f no negativa tal que la funcin de distribucin de ( ),X Y , F, verifica que

    ( ) ( ) ( ) ( ) 2, ( , ) ( , ) , ,x y y xF x y f u v dv du f u v du dv x y = = A esta funcin ( ),f x y la llamaremos funcin de densidad conjunta.

  • Propiedades:

    1.- Una funcin ( ),f x y es funcin de densidad de una variable aleatoria bidimensional continua si y solamente si verifica

    ( ) ( ), 0, , y , 1f x y x y f u v dudv+ +

    =

    2.- ( ), 0, ,P X x Y y x y= = = 3.- La probabilidad de un rectngulo de 2 se calcula como:

    ( ) ( ) ( ), ( , ) ( , ) , , , ,b d d ba c c aP a X b c Y d f u v dv du f u v du dv a b c d< < < < = = 4.- La probabilidad de un recinto general D de 2 se calcula como:

    ( ) 2( , ) ( , ) ,D

    P X Y D f u v dudv D = Obs: Cuando D NO es un rectngulo es fundamental dibujarlo para poner correctamente los lmites de integracin para calcular ( )( , )P X Y D .

  • Ejemplo 5: Para la variable (X,Y) del problema 4 ( )2 8, 1 7

    ,0 en el restokx x y

    f x y

    =

    a) Obtener k para que f(x,y) sea funcin de densidad. Calcula F(3,5).

    c) Calcula la proporcin de mensajes que tardan ms por el primer canal que por el segundo.

    DISTRIBUCIONES MARGINALES DE UNA VARIABLE ALEATORIA BIDIMENSIONAL CONTINUA

    Si ( ),X Y es una variable aleatoria bidimensional continua con funcin de densidad ( ),f x y , las variables X e Y son continuas y sus distribuciones marginales son:

    X tiene como funcin de densidad ( ) ( ),Xf x f x y dy+

    = .

    Y tiene como funcin de densidad ( ) ( ),Yf y f x y dx+

    =

    Ejemplo 6: Obtener las distribuciones marginales de la variable (X,Y) del problema 4.

    b) Calcula la probabilidad de que un mensaje transmitido por el primer canal tarde ms de 7 unidades de tiempo (u) sabiendo que lleva ms de 6 u transmitindose por ese canal.

  • 3.4. INDEPENDENCIA DE VARIABLES ALEATORIAS BIDIMENSIONALES

    Idea: X e Y son independientes si el conocimiento de una de ellas no influye sobre las probabilidades de la otra variable.

    Definicin: Sea ( ),X Y una v.a. bidimensional, diremos que X e Y son independientes si

    ( ) { } { }( ) ( ) ( ), , para todo ,P X A Y B P X A Y B P X A P Y B A B = = Teorema Sea ( ),X Y una variable aleatoria bidimensional,

    Si ( ),X Y es discreta con funcin de probabilidad,{ }( , ),i j ijx y p , X e Y son independientes si y solo si se cumple

    ( ) ( ) ( ) ( ) 2, ,,ij i j ji j ip P X x Y y P X x xY yP y= = = = = = Si ( ),X Y es continua con funcin de densidad ( ),f x y , X e Y son

    independientes si y solo si se verifica que ( ) ( ) ( ) ( ) 2,, ,X Yf x y x f y yf x=

    Ejemplo 7: Estudiar la independencia de las variables de los problemas 1 y 4.

  • 3.5. MEDIDAS ASOCIADAS A VARIABLES ALEATORIAS BIDIMENSIONALES

    Para el caso bidimensional la esperanza de una variable aleatoria, an pudiendo definirse, no tiene una interpretacin clara. En la prctica es de mayor inters el clculo de la esperanza de una funcin de la variable aleatoria bidimensional, ( ),g X Y , siempre y cuando sta sea una variable aleatoria.

    Teorema: Sea ( ),X Y una variable aleatoria bidimensional. Sea 2:g una funcin tal que ( ),g X Y es una variable aleatoria. Entonces,

    Si ( ),X Y es discreta con funcin de probabilidad,{ }( , ), , 1,.., ; 1,...,i j ijx y p i n j m= = ( ) ( )

    1 1, ,i j ij

    i jE g X Y g x y p

    = =

    = Si ( ),X Y es continua con funcin de densidad ( ),f x y ,

    ( ) ( ) ( ), , ,E g X Y g x y f x y dxdy

    =

    Ejemplo 8: En el problema 1, calcular E[XY]. En el problema 7, calcular E[XY2].

  • 3.5.1. COVARIANZA Y COEFICIENTE DE CORRELACIN LINEAL Definicin: Si ( ),X Y es una variable aleatoria bidimensional, llamaremos covarianza de ( ),X Y al valor

    [ ]( ) [ ]( ) [ ] [ ] [ ]( , )Cov X Y E X E X Y E Y E X Y E X E Y = = 1. La covarianza es una medida de la dependencia LINEAL entre las variables

    (dependencia lineal entre X e Y significa que Y = aX+b). 2. Si ( ), 0Cov X Y = se dice que X e Y son INCORRELADAS o

    INCORRELACIONADAS. Esto significa que NO hay dependencia lineal entre X e Y (no hay dependencia del tipo Y = aX+b).

    3. La covarianza depende de las unidades de medida y de la magnitud de los datos. Vamos a definir el coeficiente de correlacin lineal que no tiene estas pegas

    Definicin: Si ( ),X Y es una variable aleatoria bidimensional, llamaremos coeficiente de correlacin lineal entre X e Y al valor:

    ( ) ( )( ) ( )

    ,,

    Cov X YX Y

    V X V Y = =

  • Propiedades de : 1. mide lo mismo que la covarianza (dependencia lineal entre las variables) pero es adimensional (no depende de las unidades ni de la magnitud de los datos). 2. toma valores en [-1,1]. 3. Cuanto ms cercano a 1 es ||, mayor es la dependencia lineal entre X e Y. 4. ( )0 , 0 e son incorreladasCov X Y X Y = = .

    Teorema: Sea ( ),X Y es una variable aleatoria bidimensional con X e Y INDEPENDIENTES, entonces

    [ ]( ) ( ) [ ( )] [ ( )]E g X h Y E g X E h Y =

  • Consecuencias del teorema: 1. Si X e Y son independientes X e Y son incorreladas. 2. Si X e Y NO son incorreladas X e Y NO son independientes 3. Si X e Y son incorreladas, X e Y NO tienen porqu ser independientes. Habr casos en que s lo sean y otros casos en que no. Ejemplo 9: (problema 7 de la hoja) Sea (X,Y) v.a. con densidad

    ( )0 1, 0 1

    ,0 en el resto

    x y x yf x y

    + = .

    a) Calcular Cov(X,Y) Son X e Y independientes? b) Comprobar tambin que X e Y no son independientes calculando las

    distribuciones marginales.

  • 3.5.2.PROPIEDADES DE MEDIAS Y VARIANZAS DE COMBINACIONES LINEALES DE VARIABLES ALEATORIAS

    Sea ( ),X Y es una variable aleatoria bidimensional. Sean , ,a b c . Consideremos la funcin ( ),g X Y aX bY c= + + . Entonces, se verifican las siguientes propiedades:

    1. [ ] [ ] [ ]E aX bY c aE X bE Y c+ + = + +

    2. ( ) ( ) ( )2 2 2 ( , )V aX bY c a V X b V Y abCov X Y+ + = + + . En el caso de que X e Y sean independientes, sabemos que Cov(X,Y) = 0 por lo que

    ( ) ( ) ( )2 2V aX bY c a V X b V Y+ + = +

  • e) Calcular el coeficiente de correlacin lineal e interpreta el grado de dependencia lineal entre X e Y.

    Ejemplo 10: (problema 8 de la hoja) 8

  • 3.5.3. VECTOR DE MEDIAS Y MATRIZ DE VARIANZAS COVARIANZAS Definicin: Sea ( ),X Y es una variable aleatoria bidimensional, llamaremos

    Vector de medias:[ ][ ]

    E Xm

    E Y

    =

    Matriz de varianzas-covarianzas:( ) ( )( ) ( )

    ,,

    V X Cov X YM

    Cov X Y V Y

    =

    Ejemplo 11: Escribir el vector de medias y la matriz de varianzas covarianzas para las variables X e Y del problema 8 de la hoja.

  • 3.6. VARIABLES ALEATORIAS n - DIMENSIONALES.

    Generalizacin: La mayora de los conceptos vistos para el caso bidimensional se extienden de forma natural al caso de n variables aleatorias X1, X2, , Xn.

    Definicin Sea el espacio muestral asociado a un experimento aleatorio. Llamaremos variable aleatoria multidimensional o variable aleatoria n-

    dimensional o vector aleatorio a una funcin ( )1, , , : nnX X X X= . Cada variable componente de una variable aleatoria n-dimensional, Xi, es una variable aleatoria unidimensional que recibe el nombre de variable marginal.

    Solamente generalizaremos:

    Variables aleatorias independientes. Vector de medias y matriz de varianzas covarianzas. Transformaciones lineales de variables aleatorias. Ejemplo de variable continua: distribucin normal n-dimensional.

  • INDEPENDENCIA EN VARIABLES MULTIDIMENSIONALES

    Definicin: Sea ( )1, , nX X X= una variable aleatoria n-dimensional. Diremos que 1, , nX X son independientes si y solo s ( ) ( ) ( ) ( ) { }1 1 2 2 1 1 2 2 1, , , ... ,

    nn n n n i i

    P X A X A X A P X A P X A P X A A=

    =

    Teorema Sea ( )1, , nX X X= una variable aleatoria n-dimensional Si ( )1, , nX X X= es discreta, 1, , nX X son independientes si y solo si se

    cumple ( ) ( ) ( ) ( )( )

    1 1 2 2 1 1 2 2

    1 2, ,...

    , ,..., ... ,

    ,n n n n

    nn

    P X x X x X x P X x P X x P X x

    x x x

    = = = = = =

    =

    Si ( )1, , nX X X= es continua con funcin de densidad conjunta ( )1 2, ,..., nf x x x , 1, , nX X son independientes si y solo si se verifica que

    ( ) ( ) ( ) ( ) ( )

    1 21 2 12 21, ,..., ... , , ,...,

    nn X X X nn

    nf x x x f x f x f x x x x = Ejemplo 11: Hacer el problema 13

  • VECTOR DE MEDIAS Y MATRIZ DE VARIANZAS COVARIANZAS

    Definicin: Sea ( )1, ,T

    nX X X= una variable aleatoria n-dimensional llamaremos

    Vector de medias, mX:

    [ ][ ]

    [ ]

    1

    2X

    n

    E XE X

    m

    E X

    =

    Matriz de varianzas-covarianzas, MX:

    ( ) ( ) ( )( ) ( ) ( )

    ( ) ( ) ( )

    1 1 2 1

    2 1 2 2

    1 2

    , ,, ,

    , ,

    n

    nX

    n n n

    V X Cov X X Cov X XCov X X V X Cov X X

    M

    Cov X X Cov X X V X

    =

    Observacin: Para hacer operaciones en la que intervenga la variable aleatoria n-dimensional X, tomaremos este vector como un vector COLUMNA.

    Observar que Cov(Xi,Xj)= = Cov(Xj,Xi) por lo que este matriz MX es simtrica.

  • VECTOR DE MEDIAS Y MATRIZ DE VARIANZAS COVARIANZAS DE TRANSFORMACIONES LINEALES DE VARIABLES MULTIDIMENSIONALES

    Teorema : Sea ( )1, ,T

    nX X X= una variable aleatoria n-dimensional con vector de medias mX y matriz de varianzas MX. Sean las transformaciones lineales:

    1) Y = AX + B, A una matriz mxn, B un vector mx1. Entonces, Y es una variable aleatoria m-dimensional y el vector de medias y la matriz de varianzas-covarianzas de Y son, respectivamente,

    mY = AmX + B y MY = AMXAT

    2) 1 1 2 2 ...T

    n nY a X a X a X b a X b= + + + + = + , ( )1 2, ,...,T

    na a a a= un vector de n y b . Entonces, Y es una variable aleatoria unidimensional y la media y la varianza de Y son, respectivamente,

    [ ] ( )yT TX XE Y a m b V Y a M a= + = Ejemplo 13: Hacer el problema 14 a) y b)

    c) Sea 1 2 33 2Z X X X= + + . Obtener E [Z] y V(Z).

  • 3.7. DISTRIBUCIN NORMAL n-DIMENSIONAL Es la distribucin n-dimensional CONTINUA que generaliza a la normal unidimensional, N( ,), cuya densidad era

    ( )( )22

    121 , , 0

    2x

    f x e x

    = >

    Definicin: La variable aleatoria n-dimensional X = (X1 , X2 , , Xn) tiene distribucin normal n-dimensional si su funcin de densidad es

    ( )( )

    ( ) ( ) ( )11

    21 21/2 /2

    1 , ,..., ,2

    : matriz de varianzas-covarianzas, : vector de medias

    TX X Xx m M x m n

    nnX

    X X

    f x e x x x xM

    M m

    = =

    Observacin: La normal n-dimensional queda TOTALMENTE CARACTERIZADA dando su vector de medias, mX, y su matriz de varianzas-covarianzas, MX, puesto que as conocemos su funcin de densidad.

    Notacin: ( ),n X XX N m M

  • PROPIEDADES para la normal n-dimensional ( ),n X XX N m M : 1. Cada variable marginal es una variable aleatoria unidimensional con

    distribucin normal, ( ) ( )( ),i i i i iX N E X V X = = .

    2. Cualquier subconjunto de k variables de X tiene distribucin normal k-dimensional, con vector de medias y matriz de varianzas correspondiente.

    3. ( )Si e son normales , 0 e son independientesi j i j i jX X Cov X X X X+ = , (Esto no es cierto si la distribucin NO es normal. Lo hemos visto en el problema 8)

    4. Si las variables X1 , X2 , , Xn son normales + independientes, entonces, la variable n-dimensional X = (X1 , X2 , , Xn) es normal n-dimensional. (Aunque las marginales sean normales, si no fuesen independientes, la conjunta NO sera normal n-dimensional)

  • En este caso, la matriz de varianzas covarianzas de X es:

    ( ) ( ) ( )( ) ( ) ( )

    ( ) ( ) ( )

    ( )( )

    ( )

    1 1 2 1 1

    2 1 2 2 2

    1 2

    , , 0 0, , 0 0

    , , 0 0

    n

    nX

    n n n n

    V X Cov X X Cov X X V XCov X X V X Cov X X V X

    M

    Cov X X Cov X X V X V X

    = =

    Ejemplo 14: Sea X = (X1, X2, X3) una variable aleatoria normal en dimensin 3 con vector de medias y matriz de varianzas covarianzas, respectivamente,

    1 1 0 31 y 0 2 1

    2 3 1 3X Xm M

    = =

    a) Obtener las distribuciones marginales de X1, X2 y X3. b) Obtener la distribucin conjunta de (X1, X3).

    Ejemplo 15: Sean ( ) ( )1,2 , 0,3X N Y N , X e Y independientes. Obtener la distribucin conjunta de la variable bidimensional (X,Y)

  • 5. Para las transformaciones lineales:

    a) Si Y = AX + B, donde A es una matriz m x n de rango m, m n, B matriz n x 1, entonces Y tiene distribucin normal m-dimensional

    ( ), con , Tm Y Y Y X Y XY N m M m Am B M AM A= + =

    ( )1 1 2 2 1 2) Si .... , con , ,..., ,T Tn n nb Y a X a X a X b a X b a a a a b= + + + + = + = Y es normal unidimensional con

    [ ] ( )yT TX XE Y a m b V Y a M a= + =

  • Ejemplo 16: problema 15 de la hoja

    15

  • 1.

    2.

    3.

    ( significa distribucin aproximada)

    ( n 30)

  • Ejemplo 17: (problema 19 de la hoja)

    Se lanza 30 veces un dado equilibrado. Utilizando el teorema central del lmite, obtn un valor aproximado de la probabilidad de que la suma de las puntuaciones sea menor que 110.

    Ejemplo 18 (problema 18 de la hoja)

    Para simplificar la contabilidad de su negocio una persona decide redondear 100 cantidades al entero ms prximo (por ejemplo, 19.53 euros y 20.46 euros se contabilizaran como 20 euros)

    Suponiendo que los errores de redondeo, Xi, siguen una distribucin uniforme en (-0.5, 0.5) y son independientes, calcula un valor aproximado de la probabilidad de que el vaor absoluto de la suma de los errores exceda los 10 euros.