Estadística i tema 3

12
Estadística I Melanie Nogué fructuoso 1 TEMA 3 VARIABLES ALEATORIAS DISCRETAS 1. Definición Hasta ahora hemos ido analizando las características de las variables de una muestra. No obstante, ahora las analizaremos de un experimento aleatorio. Por ejemplo, escoger al azar una familia de una población y preguntarnos la probabilidad de que la familia tenga 5 miembros. Tenemos las mismas partes: la muestra (), -álgebra (un suceso) y la función de probabilidad. Las variables aleatorias son numéricas, como por ejemplo lanzar una moneda sería 2 (cara o cruz). En el experimento de las familias: ={fam1, fam2, fam3…} P(fam1)= 1/10, P(fam2)= 1/10 X=nº de miembros. Y= sueldo mensual. Z= nº de ordenadores. Tenemos tres características que nos interesan, solo que ahora las llamamos VARIABLES ALEATORIAS del experimento. Con ello nos interesa calcular las probabilidades de esas variables aleatorias como la probabilidad de que tengan 5 miembros, 3 ordenadores… EJEMPLO I Lanzamos una moneda: ¿Qué valores puede tomar X si X=nº de caras? o X(CC)=2, X(+C)=1, X(C+)=1, X(++)=0 o A los posibles valores que toma la variable se le llama soporte. En nuestro caso: Sop(X)= {0,1,2} Cuando nuestro espacio muestral es elevado (como una población con muchas familias), el soporte lo definiríamos de 0 a ∞. 2. Cálculo de probabilidades de una variable aleatoria Si volvemos con el experimento de las monedas, con X=nº de caras, y Sop(X)={0,1,2}, queremos calcular la probabilidad de que el nº de caras sea 0, 1 o 2.

Transcript of Estadística i tema 3

Page 1: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

1

TEMA 3 VARIABLES ALEATORIAS DISCRETAS

1. Definición

Hasta ahora hemos ido analizando las características de las variables de una

muestra. No obstante, ahora las analizaremos de un experimento aleatorio. Por

ejemplo, escoger al azar una familia de una población y preguntarnos la probabilidad

de que la familia tenga 5 miembros.

Tenemos las mismas partes: la muestra (), -álgebra (un suceso) y la función de

probabilidad.

Las variables aleatorias son numéricas, como por ejemplo lanzar una moneda sería

2 (cara o cruz). En el experimento de las familias:

={fam1, fam2, fam3…}

P(fam1)= 1/10, P(fam2)= 1/10

X=nº de miembros.

Y= sueldo mensual.

Z= nº de ordenadores.

Tenemos tres características que nos interesan, solo que ahora las llamamos

VARIABLES ALEATORIAS del experimento.

Con ello nos interesa calcular las probabilidades de esas variables aleatorias como

la probabilidad de que tengan 5 miembros, 3 ordenadores…

EJEMPLO I

Lanzamos una moneda:

¿Qué valores puede tomar X si X=nº de caras?

o X(CC)=2, X(+C)=1, X(C+)=1, X(++)=0

o A los posibles valores que toma la variable se le llama soporte. En

nuestro caso:

Sop(X)= {0,1,2}

Cuando nuestro espacio muestral es elevado (como una población con muchas

familias), el soporte lo definiríamos de 0 a ∞.

2. Cálculo de probabilidades de una variable aleatoria

Si volvemos con el experimento de las monedas, con X=nº de caras, y

Sop(X)={0,1,2}, queremos calcular la probabilidad de que el nº de caras sea 0, 1 o

2.

Page 2: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

2

a. Probabilidad de que el número de caras sea 0: P(X=0)=P(++)

Tenemos que volver a nuestro experimento y ver cuándo no tenemos ninguna

cara. Por lo tanto será P(++)= ¼

b. Probabilidad de que el número de caras sea 1: P(X=1)=P(+C ó C+)= ¼ + ¼=

½

c. Probabilidad de que el número de caras sea 2: P(X=2)=P(CC)= ¼

Estas probabilidades las podemos agrupar en una tabla, llamada FUNCIÓN DE

PROBABILIDAD donde P(X=x) se escribirá ( ):

X ( )

0 ¼

1 ½ 2 ¼

La f nos recuerda a las frecuencias relativas. En este caso las frecuencias

relativas es la función de probabilidad.

EJEMPLO II

Lanzamos dos dados:

X= suma de los dos dados.

={(1,1) , (1,2), (1,3), … , (6,6)}

Sop(X)={2,3,4…12}

Calculamos probabilidades:

P(X=2)= ( )=1/36

P(X=3)= ( )= P((2,1) i (1,2))=2/36

P(X=4)= ( )= 3/36

Las colocamos en la tabla de función de probabilidad:

La ecuación viene dada por:

( ) { ( ) ( )

X ( )

2 1/36 3 2/36 4 3/36

5 4/36 6 5/36 7 6/36

8 5/36 9 4/36

10 3/36

11 2/36 12 1/36

Page 3: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

3

2.1. Propiedades

i. ( ) 0 Por que las probabilidades siempre son positivas.

ii. Si sumamos todas las ( )= 1

3. Función de distribución (=función probabilidad acumulada)

Es la probabilidad acumulada (sumando) como las frecuencias. La denotaremos

como ( ) que significa que es la probabilidad acumulada hasta el punto x. la

representaremos así:

( ) ( )

Si la representáramos gráficamente, nos daría un gráfico de barras con pendiente

positiva.

3.1. Propiedades

i. ( )

ii. ( ) es creciente porque seguimos sumando.

iii. ( )

iv. P(a < X b) ¿Cómo calculamos la probabilidad de un intervalo a través de

la frecuencia acumulada? Por ejemplo, tenemos P(3 < X 10), no obstante,

nosotros solo tenemos ( ) y ( ).

v. P(X > x) por ejemplo si quisiéramos saber P(X > 5) = 1- ( )

Según el tipo de soporte, podemos clasificar en:

- Discreta: soporte finito o infinito contable.

- Continua: si el soporte es infinito no contable.

3 10

Nos piden esta diferencia:

( )- ( )

Page 4: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

4

EJEMPLO III Variable aleatoria discreta

Lanzamos una moneda hasta obtener “cara”

X=nº de lanzamientos hasta obtener cara.

Sop(X)={1,2,3…} Infinito contable Variable discreta.

EJEMPLO IV

Lanzar una bola en una pista de 10m.

X=distancia desde el punto de lanzamiento hasta al punto donde cae.

Sop(X)=[0,10] Infinito contable Variable discreta.

4. Características numéricas: esperanza y varianza

Se parecen a las del tema 1, pues contienen los mismos conceptos pero en

términos para las variables aleatorias.

4.1. Esperanza

Es el valor esperado de una variable aleatoria. Es equivalente a la media del tema

1.

( ) ∑ ( )

( )

Si la calculamos en nuestro ejemplo de los dos dados, necesitamos la tabla con

la función de probabilidad:

( )

Este 7 significa que si repitiéramos 100 veces (o un número muy elevado) este

experimento, la media daría 7 o un número muy próximo a 7.

( )

4.1.1. Propiedades

i. E(a)= a donde a es un número constante y no un número aleatorio.

ii. E(a·X)= a · E(X)

iii. E(a+X) = a+ E(X)

iv. E(X+Y) = E(X) + E(Y)

v. E(X·Y)= E(X) · E(Y) SÓLO SI SON INDEPENDIENTES! Es decir, que

conocer Y no afecta las probabilidades de X.

Page 5: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

5

vi. E( ) = ∑ ( ) ( )

vii. E(2X- )= ∑ ( ) ( ) ( )

a. Por ejemplo:

( ) ( ) ( )

4.2. Varianza

Corresponde a una medida de dispersión. La fórmula es igual que la vista en el

tema 1, solo que cambia que lo que medimos es cuán dispersa está la variable de la

esperanza.

( ) ∑ ( ) ( ( ))

( )

EJEMPLO I

X= suma de los dos dados.

E(X)=7

( )

( )

( )

( )

También tenemos OTRA fórmula para calcular la varianza:

( ) ∑ ( ) ( )

( )

( ) ( ) ( )

4.2.1. Propiedades de la varianza

i. Para denotarla usamos y se llama varianza poblacional.

ii. V(a)=0.

iii. V(a · X)= a² · V(X)

iv. V(a + X) = V(X) Al sumar una constante no hace variar la varianza

pues la distancia entre los valores sigue siendo la misma.

v. V(X + Y) = V(X) + V(Y) SOLO SI SON INDEPENDIENTES!

vi. V(X) 0

X ( )

1 0,4 2 0,6

Page 6: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

6

5. Desviación típica (SD) de una variable aleatoria

√ ( )

Sirve para lo mismo que en el tema 1, nos da las unidades pues no queremos

las unidades al cuadrado.

La SD(X) también se puede denotar con sigma .

6. Coeficiente de variación

( ) ( )

( )

También mide el grado de dispersión. Además NO tiene unidades.

7. Variables aleatorias mutlidimensionales

Nos interesará ver el grado de relación de más de una variable. Lo haremos

mediante la covarianza y el grado de correlación.

Dos variables son independientes (X e Y) cuando conozco las probabilidades de Y y

no afecta a las de X.

- Necesitaremos la tabla de probabilidades conjunta (≈ tabla de frecuencias

conjuntas)

Para denotar de forma conjunta el soporte de dos variables emplearemos:

( ) ( ) ( )

Por ejemplo:

Sop(X)= {0,1,2}

Sop(Y)={3,4}

Sop(X,Y)= {(0,3) , (0,4) , (1,3) , (1,4) , (2,3) , (2,4)}

Es decir, estará compuesto por pares de números.

En algunos casos como por ejemplo en el lanzamiento de 2 dados, dará soportes

conjuntos con probabilidad 0 como (12,5) que quiere decir que la suma es 12 y la

diferencia es 5. Para saber qué pares tendremos que tachar (puesto que dan

probabilidad 0) haremos:

7.1. Cálculo de probabilidades en variables aleatorias

bidimensionales.

EJEMPLO I se lanzan 2 dados:

X=suma de los 2 dados.

Y= diferencia en valor absoluto de los dos dados.

Page 7: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

7

DADO 2

D

A D O

1

1 2 3 4 5 6

1 (2,0) (3,1) (4,2) (5,3) (6,4) (7,5) 2 (3,1) (3,0) (5,1) (6,2) (7,3) (8,4) 3 (4,2) (5,1) (6,0) (7,1) (8,2) (9,3)

4 (5,3) (6,2) (7,1) (8,0) (9,1) (10,2) 5 (6,4) (7,3) (8,2) (9,1) (10,0) (11,1) 6 (7,5) (8,4) (9,3) (10,2) (11,1) (12,0)

Entonces, todos aquellos pares de números que NO estén en la tabla, tendrán

probabilidad 0.

Para calcular la tabla de probabilidades conjunta, tenemos que ir mirando la

tabla. Un breve ejemplo de esta tabla de probabilidades sería:

Par (2,0) Probabilidad de sacar dos 1, entonces: P(dados (1,1))= 1/6 · 1/6

= 1/36

Par (2,1) No ocurre en ningún caso.

Par (3,1) Ocurre dos veces, para el (2,1) y el (1,2).

La anotación es importante, pues en el último par sería: P(X=2 Y=0) =

( ) que dice “función de probabilidad de X e Y donde X=2 e Y=0.

Con ellos también podemos sacar las distribuciones marginales. En nuestro

ejemplo, la función de probabilidad marginal sería a la pregunta: ¿probabilidad de que

X=3?

( ) ( ) ( )

( )

( ) ( ) ( ) ( ) ( ) ( )

0 1

2 1/36 0 3 0 2/36

4 1/36 0 5 0 2/36 6 1/36 0

7 0 2/36 8 1/36 0 9 0 2/36

10 1/36 0 11 0 2/36 12 1/36 0

Page 8: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

8

En resumen:

- ( ) ( )

- ( ) ( )

Imaginemos que nos piden el valor esperado de Y (E(Y)). Debemos multiplicar el

valor de Y por su probabilidad.

( )

Si E(X·Y)=2·0·1/36+… (X·Y· )

Si E(X²)=2²·1/36+3²·2/36… (X²· )

8. Función de probabilidad y esperanza condicionada. Concepto de

independencia

Probabilidad condicionada: tenemos dos variables, las cuales sabemos el valor de

una y nos preguntan por la probabilidad de la otra. Por ejemplo (los dados),

¿probabilidad de que la suma de 2 dados sea 5 si sabemos que la diferencia es 1?

La anotación sería P(X=5|Y=1)

( | ) ( )

( )

*Esto lo vemos en la tabla de las probabilidades marginales.

Recordemos que el tema 2, la primera fórmula para calcular la probabilidad

condicionada era:

( | ) ( )

( )

No obstante, en este caso la anotación sería:

| ( ) ( | )

Finalmente podemos construir una tabla con las probabilidades condicionadas,

por ejemplo de X condicionada a que Y=1. No serviría para responder la pregunta

“¿Valor esperado de la suma de 2 dados pero condicionada a que la diferencia sea 1?”

esto se llama ESPERANZA CONDICIONADA. Para calcularla, usaremos la

expresión de la esperanza condicionada que es:

( | ) ( ) | ( )

Page 9: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

9

9. Independencia de dos variables

Si recordamos el tema 2, dos sucesos era independientes si P(A|B)=P(A) o bien

P(AB)=P(A)+P(B). Entonces, si tenemos dos variables aleatorias:

( | ) ( ) | ( )

( ) ( ) ( ) ( ) ( ) ( )

10. Coeficiente de correlación

Se denomina “rho” y se calcula:

( )

( ) ( )

Mide la relación entre dos variables y siempre estará entre -1 y 1. Si X e Y son

independientes, el coeficiente dará 0.

11. Distribuciones discretas clásicas

Hay 4 distribuciones y de cada una sabemos la función de probabilidad, el soporte

y la varianza.

11.1. BERNOULLI

Sólo dos resultados son posibles, llamados “éxito” y “fracaso”. Por ejemplo,

preguntar a 10 personas si trabajan. Cada “sí” será un “éxito” y cada “no” un

“fracaso”.

X= 1 éxito

X=0 no éxito

Soporte (X)={1,0}

Lo que nos interesa comprobar será el éxito. Por ejemplo, lanzamos una moneda,

será “éxito” cuando sea cara y “no éxito” cuando sea cruz.

Entonces la P(X=1)=P(cara)=1/2=p Se llama p la probabilidad de éxito.

Y será P(X=0)=P(cruz)=1/2 = 1-p

X b(p)

Page 10: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

10

La definición general es: “X se distribuye como una Bernoulli de parámetro p”.

( ) { ( )

Para calcular la esperanza:

( )

Y la varianza:

( ) ( )

11.2. BINOMIAL

Es cuando nuestra variable cuenta el número de éxitos que ocurren. Por

ejemplo, el número de caras que salen al lanzar la moneda 10 veces.

Donde n es el número de veces que se repite el experimento y p la probabilidad de

que ocurra un éxito.

Soporte (X)= {0,1,2,…n}

( ) { ( ) (

)

( )

( ) ( )

11.3. GEOMÉTRICA

Se trata de repetir el experimento hasta que se logre el primer “éxito”,

quedando:

X= nº de repeticiones de un experimento hasta lograr el primer éxito.

X B(n,p)

X G(p)

Page 11: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

11

El soporte sería un infinito numerable, pues se repite hasta lograr un éxito siendo:

Sop(X)={1,2,3…}

No obstante, tenemos la fórmula para calcular la probabilidad:

( ) { ( )

( )

( )

11.4. POISSON

Se cuenta el número de veces que ocurre un suceso en un intervalo de tiempo

dado.

X= nº de éxitos en un intervalo

Donde es el número medio de éxitos en el intervalo de tiempo. El soporte

también es infinito numerable, y para calcular la probabilidad se hace:

( ) {

( ) ( )

TABLA RESUMEN:

Forma Probabilidad E V

X P()

Page 12: Estadística i tema 3

Estadística I Melanie Nogué fructuoso

12

Bernoulli X b(p)

( ) {

( )

( )

Binomial X B(n,p)

( )

{ ( ) (

)

( )

Geomé-trica

X G(p)

( ) { ( )

Poisson X P()

( ) {