Tema3_4_guion estadistica 1

29
Estad ´ ıstica Tema 3: C´alculo de Probabilidades Unidad 4: Algunas Distribuciones Notables de Variables Aleatorias ´ Area de Estad´ ıstica e Investigaci´on Operativa Licesio J. Rodr´ ıguez-Arag´on Noviembre 2010 Contenidos............................................................... 2 Variables Aleatorias Discretas 3 Distribuci´ on Uniforme .................................................... 4 Distribuci´ on de Bernoulli .................................................. 5 Distribuci´ on Binomial .................................................... 6 Distribuci´ on Binomial con R ................................................ 8 Distribuci´ on de Poisson ................................................... 9 Distribuci´ on de Poisson con R.............................................. 11 Variables Aleatorias Continuas 12 Distribuci´ on Uniforme ................................................... 13 Distribuci´ on de Uniforme con R ............................................ 14 Distribuci´ on Exponencial ................................................. 15 Distribuci´ on de Exponencial con R .......................................... 16 Distribuci´ on Normal ..................................................... 17 Distribuci´ on Normal con R ................................................ 18 Distribuci´ on Normal Est´ andar.............................................. 19 Teorema Central del L´ ımite ............................................... 23 Aproximaciones por la Normal ............................................. 24 Distribuci´ on χ 2 n de Pearson ................................................ 26 Distribuci´ on t n de Student ................................................ 30 Distribuci´ on F m,n de Snedecor ............................................. 34 1

description

estadistica

Transcript of Tema3_4_guion estadistica 1

Estadıstica

Tema 3: Calculo de Probabilidades

Unidad 4: Algunas Distribuciones Notables

de Variables Aleatorias

Area de Estadıstica e Investigacion OperativaLicesio J. Rodrıguez-Aragon

Noviembre 2010

Contenidos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

Variables Aleatorias Discretas 3

Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4Distribucion de Bernoulli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5Distribucion Binomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6Distribucion Binomial con R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8Distribucion de Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9Distribucion de Poisson con R. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

Variables Aleatorias Continuas 12

Distribucion Uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13Distribucion de Uniforme con R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14Distribucion Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15Distribucion de Exponencial con R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16Distribucion Normal. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17Distribucion Normal con R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18Distribucion Normal Estandar. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19Teorema Central del Lımite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23Aproximaciones por la Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24Distribucion χ2

n de Pearson. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26Distribucion tn de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30Distribucion Fm,n de Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

1

Contenidos

� Variables Aleatorias Discretas.

– Uniforme, Bernoulli, Binomial, Poisson.

� Variables Aleatorias Continuas.

– Uniforme, Exponencial, Normal, aproximaciones por la Normal, χ2 de Pearson, t deStudent y F de Snedecor.

Presentamos en este tema algunas Distribuciones de Variables Aleatorias, primero

discretas y luego contınuas, a continuacion presentaremos su Esperanza y Varianza.

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 2 / 37

Variables Aleatorias Discretas 3 / 37

Distribucion Uniforme

Sea X una variable aleatoria que toma valores x1, x2, . . . , xk con igual probabilidad, entonces laFuncion de Probabilidad de esta Variable Aleatoria Uniforme viene dada por,

f(x; k) = 1/k para x = x1, x2, . . . , xk,

siendo k un parametro de la distribucion de probabilidad.

Su Esperanza y Varianza vienen dadas por las expresiones:

E(X) = µ =k∑

i=1

xif(xi) =k∑

i=1

xi

k.

Var(X) = σ2 =

k∑

i=1

(xi − µ)2

k=

k∑

i=1

x2i

k−(

k∑

i=1

xi

k

)2

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 4 / 37

2

Distribucion de Bernoulli

Daniel Bernoulli (1700-1782). Se conoce como prueba de Bernoulli, todo experimento aleatorio enel que solo son posibles dos resultados, eg. “exito” o “fracaso”. Definamos X como la variablealeatoria que toma el valor 1 con probabilidad p, “exito”, y 0 con probabilidad 1 − p, “fracaso”.

La Funcion de Probabilidad de la Variable Aleatoria X vendra dada por,

f(x; p) = px · (1 − p)1−x , para x = 0, 1.

Su Esperanza y Varianza vienen dadas por las expresiones:

E(X) = 0 · f(0) + 1 · f(1) = 0 · (1 − p) + 1 · p = p.

Var(X) = E(X2) − E(X)2 = (0 · f(0) + 1 · f(1)) − p2 = p − p2 = p(1 − p).

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 5 / 37

3

Distribucion Binomial

Supongamos que realizamos n experimentos de Bernoulli, con probabilidad de “exito” p para cadauno de ellos. Definamos la Variable Aleatoria X como el numero de exitos en esas n ejecucionesdel experimento.La Funcion de Probabilidad es la siguiente:

f(x;n, p) =

(

n

x

)

px(1 − p)n−x , para x = 0, 1, 2, . . . , n,

siendo n y p parametros de la distribucion de probabilidad.

Su Esperanza y Varianza vienen dadas por las expresiones,

E(X) = µ = E(X1 + · · · + Xn) = E(X1) + · · · + E(Xn) = np.

Var(X) = σ2 = Var(X1) + · · · + Var(Xn) = np(1 − p).

Con Xi variables aleatorias independientes de Bernoulli.

Las graficas de la Funcion de Probabilidad y la Funcion de Distribucion de una variable aleatoriaBinomial, de parametros n = 10, p = 0.3.

0 2 4 6 8 10

0.00

0.05

0.10

0.15

0.20

0.25

Distribución Binomial: n = 10, p = 0.3

Número de Exitos

Pro

babi

lidad

0 2 4 6 8 10

0.0

0.2

0.4

0.6

0.8

1.0

Distribución Binomial: n = 10, p = 0.3

Número de Exitos

Pro

babi

lidad

Acu

mul

ada

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 6 / 37

4

Distribucion Binomial

Variable Aleatoria Binomial de parametros n = 10, p = 0.6.

0 2 4 6 8 10

0.00

0.05

0.10

0.15

0.20

0.25

Distribución Binomial: n = 10, p = 0.3

Número de Exitos

Pro

babi

lidad

0 2 4 6 8 100.

00.

20.

40.

60.

81.

0

Distribución Binomial: n = 10, p = 0.6

Número de Exitos

Pro

babi

lidad

Acu

mul

ada

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 7 / 37

Distribucion Binomial con R

Funcion de Probabilidad:

> x <- 0:10

> plot(x, dbinom(x, size=10, prob=0.6), xlab="Numero de Exitos",

+ ylab="Probabilidad",

+ main="Distribucion Binomial: n = 10, p = 0.3", type="h")

> points(x, dbinom(x, size=10, prob=0.6), pch=16)

> abline(h=0, col="gray")

Funcion de Distribucion:

> x <- 0:10

> x <- rep(x, rep(2, length(x)))

> plot(x[-1], pbinom(x, size=10, prob=0.6)[-length(x)],

+ xlab="Numero de Exitos", ylab="Probabilidad Acumulada",

+ main="Distribucion Binomial: n = 10, p = 0.6", type="l")

> abline(h=0, col="gray")

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 8 / 37

5

Distribucion de Poisson

Simeon Denis Poisson (1781-1840). Una Variable Aleatoria discreta X se dice que es una variablede Poisson si su funcion de probabilidad es de la forma:

f(x;λ) =λxe−λ

x!, para x = 0, 1, 2, . . . ,

siendo λ un parametro positivo.

Su Esperanza y Varianza vienen dadas por las expresiones,

E(X) = µ =∞∑

x=0

xf(x) =∞∑

x=0

xλxe−λ

x!= λe−λ

∞∑

x=0

λx−1

(x − 1)!= λ.

Var(X) = σ2 = E(X2) − E(X)2 = E(X(X − 1)) + µ − µ2 = µ = λ.

La distribucion de Poisson se presenta en experimentos en los que se estudia la ocurrencia desucesos en un intervalo de tiempo dado. Usualmente para sucesos “raros”, pi <<.

� El numero de vehıculos que pasan a traves de un cierto punto en una ruta durante unperiodo definido de tiempo.

� El numero de errores de ortografıa que uno comete al escribir una unica pagina.

� El numero de llamadas telefonicas en una central telefonica por minuto.

� El numero de servidores web accedidos por minuto.

� El numero de mutaciones de determinada cadena de ADN despues de cierta cantidad deradiacion.

Funcion de Probabilidad y de Distribucion,

0 2 4 6 8 10

0.00

0.05

0.10

0.15

0.20

Distribución Poisson: Media = 3

x

Pro

babi

lidad

0 2 4 6 8 10

0.2

0.4

0.6

0.8

1.0

Distribución Poisson: Media = 3

x

Pro

babi

lidad

Acu

mul

ada

λ = 3

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 9 / 37

6

Distribucion de Poisson

Funcion de Probabilidad y de Distribucion,

0 5 10 15

0.00

0.05

0.10

0.15

Distribución Poisson: Media = 6

x

Pro

babi

lidad

0 5 10 150.

00.

20.

40.

60.

81.

0

Distribución Poisson: Media = 6

x

Pro

babi

lidad

Acu

mul

ada

λ = 6

La distribucion de Poisson aproxima de forma muy acertada a la distribucion Binomial cuandon > 25 y p < .1 y np = λ < 5

0 2 4 6 8 10

0.00

0.05

0.10

0.15

0.20

Distribución Binomial: n = 30, p = 0.1

Número de Exitos

Pro

babi

lidad

0 2 4 6 8 10

0.00

0.05

0.10

0.15

0.20

Distribución Poisson: Media = 3

x

Pro

babi

lidad

f(x;n, p) =

(

n

x

)

px(1 − p)n−x → f(x;λ) =λxe−λ

x!

Para un proceso de Poisson, la probabilidad de obtener exactamente x exitos en n intentos vienedada por el lımite de la distribucion binomial.

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 10 / 37

7

Distribucion de Poisson con R

Funcion de Probabilidad:

> x <- 0:15

> plot(x, dpois(x, lambda=6), xlab="x", ylab="Probabilidad",

+ main="Distribucion Poisson: Media = 6", type="h")

> points(x, dpois(x, lambda=6), pch=16)

> abline(h=0, col="gray")

Funcion de Distribucion:

> x <- 0:15

> x <- rep(x, rep(2, length(.x)))

> plot(x[-1], ppois(x, lambda=6)[-length(.x)], xlab="x",

+ ylab="Probabilidad Acumulada",

+ main="Distribucion Poisson: Media = 6", type="l")

> abline(h=0, col="gray")

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 11 / 37

8

Variables Aleatorias Continuas 12 / 37

Distribucion Uniforme

Cuando el valor de la variable aleatoria se mide y no se cuenta, entramos dentro del concepto devariable aleatoria continua.

Una Variable Aleatoria sera Uniforme en el intervalo (a, b) si su Funcion de Densidad esconstante, es decir:

f(x) =

1b−a para a < x < b

0 en el resto.

Su Funcion de Distribucion, viene dada por:

F (x) =

∫ x

−∞

f(t)dt =

0 si x ≤ a,x−ab−a para a < x < b

1 si x ≥ b.

Siendo a y b los parametros de la distribucion.Su Esperanza y Varianza vienen dadas por las expresiones:

E(X) =

∫ ∞

−∞

xf(x)dx =

∫ b

axf(x)dx =

a + b

2.

Var(X) =

∫ ∞

−∞

(x − µ)2f(x)dx = E(X2) − E(X)2 =(b − a)2

12.

Las graficas de la Funcion de Densidad y de la Funcion de Distribucion para una VariableAleatoria Uniforme en (0, 1),

−0.5 0.0 0.5 1.0 1.5

0.0

0.2

0.4

0.6

0.8

1.0

Distribución Uniforme: mín=0, máx=1

x

Den

sida

d

−0.5 0.0 0.5 1.0 1.5

0.0

0.2

0.4

0.6

0.8

1.0

Uniform Distribution: min=0, max=1

x

Pro

babi

lidad

Acu

mul

ada

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 13 / 37

9

Distribucion de Uniforme con R

Funcion de Densidad:

> x <- seq(-.5, 1.5, length=100)

> plot(x, dunif(x, min=0, max=1), xlab="x", ylab="Densidad",

+ main="Distribucion Uniforme: mın=0, max=1", type="l")

> abline(h=0, col="gray")

Funcion de Distribucion:

> x <- seq(-0.5, 1.5, length=100)

> plot(x, punif(x, min=0, max=1), xlab="x",

+ ylab="Probabilidad Acumulada",

+ main="Uniform Distribution: min=0, max=1", type="l")

> abline(h=0, col="gray")

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 14 / 37

10

Distribucion Exponencial

Una Variable Aleatoria X sigue una distribucion Exponencial si su Funcion de Densidad vienedada por,

f(x;λ) =

λe−λx para x ≥ 0 y λ > 0

0 en el resto.

Su funcion de Distribucion sera,

F (x) =

∫ x

0f(t)dt =

{

0 si x ≤ 0,1 − e−λx para x ≥ 0

Su Esperanza y Varianza vienen dadas por las expresiones,

E(X) = µ =

∫ ∞

0xf(x)dx =

1

λ.

Var(X) = σ2 = E(X2) − E(X)2 = 1/λ2.

La representacon grafica de las Funciones de Densidad y de Distribucion para una Variablealeatoria que siga una distribucion Exponencial de parametro λ = 5,

0.0 0.5 1.0 1.5

01

23

45

Distribución Exponencial: λ = 5

x

Den

sida

d

0.0 0.5 1.0 1.5

0.0

0.2

0.4

0.6

0.8

1.0

Distribución Exponencial: λ = 5

x

Pro

babi

lidad

Acu

mul

ada

La distribucion Exponencial modeliza el tiempo transcurrido entre dos sucesos “raros”consecutivos modelizados por la distribucion de Poisson.

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 15 / 37

11

Distribucion de Exponencial con R

Funcion de Densidad:

> x <- seq(0, 1.52, length=100)

> plot(x, dexp(x, rate=5), xlab="x", ylab="Densidad",

+ main=expression(paste("Distribucion Exponencial: ",lambda," = 5")),

+ type="l")

> abline(h=0, col="gray")

Funcion de Distribucion:

> x <- seq(0, 1.52, length=100)

> plot(x, pexp(x, rate=5), xlab="x",

+ ylab="Probabilidad Acumulada",

+ main=expression(paste("Distribucion Exponencial: ",lambda," = 5")),

+ type="l")

> abline(h=0, col="gray")

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 16 / 37

12

Distribucion Normal

Johann Carl Friedrich Gauss (1777-1855). La Distribucion Normal es clave en multitud defenomenos naturales. Sobre todo destacar la distribucion de errores de medida, que siguen unadistribucion Normal.

Una variable aleatoria X, se dice que sigue una distribucion Normal si su Funcion de Densidad esde la forma,

f(x;µ, σ) =1

σ√

2πexp

{

−(x − µ)2

2σ2

}

,

con −∞ < x < ∞ siendo µ y σ parametros de la distribucion.

En estadıstica esta distribucion se conoce como la “distribucion normal”. Mientras en otroscampos se conoce con el nombre de distribucion Gaussiana o Campana Gaussiana.

Representacion grafica de las funciones de densidad de diferentes N (µ, σ),

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Distribución Normal: µ =−1, 0, 1, σ =1

x

Den

sida

d

µ = −1

µ = 0

µ = 1

−3 −2 −1 0 1 2 3

0.0

0.2

0.4

0.6

0.8

Distribución Normal: µ = 0 , σ = 0.5, 1, 1.5

x

Den

sida

d

σ = 0.5

σ = 1

σ = 1.5

La Esperanza y la Varianza de una variable aleatoria X de distribucion N (µ, σ), sonrespectivamente,

E(X) =

∫ ∞

−∞

xf(x)dx =1

σ√

∫ ∞

−∞

xe

{

−(x−µ)2

2σ2

}

dx =

z = (x − µ)/σ, dx = σdz

=1√2π

∫ ∞

−∞

(µ + σz)e−z2/2dz = µ

Var(X) = E((X − µ)2) =σ2

√2π

∫ ∞

−∞

z2e−z2/2dz =

u = z, dv = ze−z2/2dz

=σ2

√2π

(

[

−ze−z2/2]∞

−∞+

∫ ∞

−∞

e−z2/2dz

)

= σ2(0 + 1) = σ2

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 17 / 37

13

Distribucion Normal con R

Funcion de Densidad:

> x <- seq(-3.291, 3.291, length=100)

> plot(x, dnorm(x, mean=0, sd=1),col="blue",xlab="x", ylab="Densidad",

+ main=expression(paste("Distribucion Normal: ", mu, " = 0 , ", sigma, " = 1")),

+ type="l")

> abline(h=0, col="gray")

Funcion de Distribucion:

> x <- seq(-3.291, 3.291, length=100)

> plot(x, pnorm(x, mean=0, sd=1),col="blue",xlab="x", ylab="Probabilidad Acumulada",

+ main=expression(paste("Distribucion Normal: ", mu, " = 0 , ", sigma, " = 1")),

+ type="l")

> abline(h=0, col="gray")

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 18 / 37

14

Distribucion Normal Estandar

La funcion de Distribucion de una N (µ, σ),

F (x) =1

σ√

∫ x

−∞

exp

{

−(t − µ)2

2σ2

}

dt.

La transformacion Z = (X − µ)/σ nos proporciona valores de una distribucion normal de mediacero y varianza uno, N (0, 1).

−3 −2 −1 0 1 2 3

0.0

0.2

0.4

0.6

0.8

1.0

Distribución Normal: µ = 0, σ = 1

x

Pro

babi

lidad

Acu

mul

ada

Definimos entonces la Funcion de Distribucion de la Normal Estandarizada o Tipificada,

Φ(z) =1√2π

∫ z

−∞

exp

{

− t2

2

}

dt

Esta integral no puede calcularse por metodos ordinarios, debemos acudir a integracion numerica,esta funcion Φ se encuentra recogida en las Tablas de la Normal Tipificada.

De esta forma si X sigue una distribucion N (0, 1), para el calculo de P(a < X < b) podemoshacer uso de las tablas,

P(a < X < b) = Φ(b) − Φ(a).

La “distribucion normal estandar” se obtiene al tomar una distribucion normal con parametrosµ = 0 y σ2 = 1.

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 19 / 37

15

Distribucion Normal Estandar

X ≡ N (0, 1), P(1 < X < 2) = Φ(2) − Φ(1)

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Φ(2)

x

Den

sida

d

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Φ(1)

x

Den

sity

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Φ(2)−Φ(1)

x

Den

sity

P(1 < X < 2) = Φ(2) − Φ(1)

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 20 / 37

16

Distribucion Normal Estandar

Si X sigue una distribucion Normal cualquiera, N (µ, σ), la P(a < X < b) puede calcularserealizando la transformacion, Z = (X − µ)/σ, es decir:

P(a < X < b) = P((a − µ)/σ < Z < (b − µ)/σ) =

= Φ((b − µ)/σ) − Φ((a − µ)/σ).

Una conclusion de la definicion de Φ es que,

Φ(−x) = 1 − Φ(x),

esta relacion es muy util ya que en la mayorıa de las tablas, Φ solo aparece tabulada para valorespositivos de x.

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 21 / 37

17

Distribucion Normal Estandar

Vamos ahora a calcular,P(µ − kσ < X < µ + kσ),

para X ≡ N (µ, σ),

P(µ − kσ < X < µ + kσ) = P(−k < (X − µ)/σ < k) =

= Φ(k) − Φ(−k) = 2Φ(k) − 1,

que no depende ni de µ ni de σ.

P(µ − σ < X < µ + σ) = 2Φ(1) − 1 = 0.6826895P(µ − 2σ < X < µ + 2σ) = 2Φ(2) − 1 = 0.9544997P(µ − 3σ < X < µ + 3σ) = 2Φ(3) − 1 = 0.9973002

> 2*pnorm(1,mean=0,sd=1)-1

[1] 0.6826895

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 22 / 37

Teorema Central del Lımite

• Si X1,X2, . . . ,Xn son n variables aleatorias independientes yX = k1 · X1 + k2 · X2 + · · · + kn · Xn, entonces X es otra v.a. de media y varianza:

E(X) =∑

i

kiE(Xi) Var(X) =∑

i

k2i Var(Xi)

Si las Xi son normales, tambien lo sera X.

• Si las v.a. X1, . . . ,Xn, constituyen una muestra de una poblacion de media µ y varianza σ2 yX = 1

n

Xi, es la media muestral:

E(X) =1

n

i

E(Xi) = µ Var(X) =1

n2

i

Var(Xi) =nσ2

n2=

σ2

n

Ademas se tendra que X ≡ N (µ, σ2/n), n > 30.

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 23 / 37

18

Aproximaciones por la Normal

Si X es una variable Binomial, de parametros n y p, entonces si n es grande y ni p ni 1 − p sonproximos a cero:podemos considerar que X sigue aproximadamente una distribucionN (µ = n · p, σ2 = n · p · (1 − p)).

Z =X − n · p

n · p · (1 − p)≡ N (0, 1).

25 30 35 40 45 50 55

0.00

0.02

0.04

0.06

0.08

Distribución Binomial: n = 100, p = 0.4

Número de Exitos

Pro

babi

lidad

25 30 35 40 45 50 55

0.00

0.02

0.04

0.06

0.08

Distribución Normal: µ = 40, σ = 4.8989

x

Den

sida

d

Si X es una distribucion de Poisson de parametro λ grande, λ > 25, en la practica se puedeconsiderar que X sigue una distribucion N (µ = λ, σ2 = λ).

Z =X − λ√

λ≡ N (0, 1).

20 30 40 50

0.00

0.01

0.02

0.03

0.04

0.05

0.06

Distribución de Poisson: λ = 36

x

Pro

babi

lidad

20 30 40 50

0.00

0.01

0.02

0.03

0.04

0.05

0.06

Distribución Normal: µ = 36, σ = 6

x

Den

sida

d

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 24 / 37

19

Aproximaciones por la Normal con R

Aproximacion de la Binomial por la Normal:

> x <- seq(24, 56, length=100)

> plot(x, dnorm(x, mean=40, sd=sqrt(24)), xlab="x", ylab="Densidad",

+ main=expression(paste("Distribucion Normal: ", mu, " = 40, ", sigma, " = 4.89")),

+ type="l")

> x <- 24:56

> points(x, dbinom(x, size=100, prob=0.4), col="red", pch=16)

Aproximacion de la distribucion de Poisson por la Normal:

> x <- seq(18, 57, length=100)

> plot(x, dnorm(x, mean=40, sd=sqrt(40)), xlab="x", ylab="Densidad",

+ main=expression(paste("Distribucion Normal: ", mu, " = 40, ", sigma, " = 6.32")),

+ type="l")

> x <- 18:57

> points(x, dpois(x, lambda=40), col="blue", pch=16)

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 25 / 37

20

Distribucion χ2n de Pearson

Karl Pearson (1857-1936). Sean X1,X2, . . . ,Xn, n variables aleatorias independientes entre sı, deltipo N (0, 1). La variable:

X = X21 + X2

2 + · · · + X2n,

se dice que es una χ2n, ji-cuadrado de Pearson con n grados de libertad.

La funcion de densidad de una variable aleatoria χ2n es:

f(x;n) =

xn/2−1e−x/2

2n/2·Γ(n/2)si x > 0

0 en el resto.

Siendo Γ la funcion gamma definida: Γ(α) =∫∞

0 xα−1e−xdx para α > 0. La Esperanza yVarianza de la distribucion χ2

n, son respectivamente,

E(X) = µ = n

Var(X) = σ2 = 2n

0 2 4 6 8 10 12

0.0

0.2

0.4

0.6

0.8

1.0

Distribución χ2 : n = 1,2,3,4,5

χ2

Den

sida

d

n = 1

n = 2n = 3

n = 4n = 5

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 26 / 37

21

Distribucion χ2n de Pearson

Propiedad: La suma de χ2n1

, χ2n2

, . . . , independientes, es otra χ2n siendo n = n1 + n2 + . . . .

La Funcion de Distribucion F (x) nos permite saber, dada una variable aleatoria X ≡ χ2n,

P(X < a) = p =

∫ a

0f(x;n)dx.

El calculo de esta integral se encuentra en la Tabla de distribucion χ2n de Pearson.

> qchisq(0.95,df=3)

[1] 7.814728

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 27 / 37

22

Distribucion χ2n de Pearson

Mas en concreto la Funcion de Distribucion Inversa: para distintos valores de n y de p se puedebuscar en la tabla su cuantil a.

0 2 4 6 8 10

0.00

0.05

0.10

0.15

0.20

0.25

χ2 n=3, P(X<a)=p=F(a)

x

Den

sida

d

p

a

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 28 / 37

χ2n de Pearson con R

Distribucion χ2n de Pearson:

> x <- seq(0, 12.116, length=100)

> plot(x, dchisq(x, df=1), xlab=expression(chi^2), ylab="Densidad",

+ main=expression(paste("Distribucion ", chi^2," : n = 1,2,3,4,5")), type="l")

> abline(h=0, col="gray")

> abline(v=0, col="gray")

> text(1,1,"n = 1",col="black")

> lines(x, dchisq(x, df=2),col="blue")

> text(2,.34,"n = 2",col="blue")

> lines(x, dchisq(x, df=3),col="green")

> text(3,.31,"n = 3",col="green")

> lines(x, dchisq(x, df=4),col="red")

> text(4,.28,"n = 4",col="red")

> lines(x, dchisq(x, df=5),col="pink")

> text(5,.25,"n = 5",col="pink")

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 29 / 37

23

Distribucion tn de Student

William Sealy Gosset (1876-1937). Sea Z una variable aleatoria N (0, 1) e Y una χ2n ambas

independientes, entonces la variable aleatoria,

X =Z

Y/n,

se denomina tn de Student con n grados de libertad.La funcion de densidad de una variable aleatoria tn es:

f(x;n) =

1√

nβ( 12, n2)

(

1 + x2

n

)−(n+1)/2para −∞ < x < ∞y n > 0

0 en el resto.

Siendo β la funcion beta definida: β(α1, α2) = Γ(α1)·Γ(α2)Γ(α1+α2) para α1, α2 > 0.

La Esperanza y Varianza de la distribucion tn, son:

E(X) = µ = 0, para n > 1, indefinida para otros valores.

Var(X) = σ2 =n

n − 2, para n > 2, indefinida para otros valores.

−3 −2 −1 0 1 2 3

0.0

0.1

0.2

0.3

0.4

Distribución t Student : n = 1,2,3,4

x

Den

sida

d

N(0,1)

n = 1

n = 2

n = 3

n = 4

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 30 / 37

24

Distribucion tn de Student

Propiedad: A medida que aumenta n, tn −→ N (0, 1).

La Funcion de Distribucion F (x) nos permite saber, dada una variable aleatoria X ≡ tn,

P(X < a) = p =

∫ a

−∞

f(x;n)dx.

El calculo de esta integral se encuentra en la Tabla de distribucion tn de Student.

> qt(0.975,df=5)

[1] 2.570582

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 31 / 37

25

Distribucion tn de Student

Mas en concreto la Funcion de Distribucion Inversa: para distintos valores de n y de p se puedebuscar en la tabla su cuantil a.

−4 −2 0 2 4

0.0

0.1

0.2

0.3

t n=3, P(X<a)=p=F(a)

x

Den

sida

d

p

a

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 32 / 37

tn de Student con R

Distribucion tn de Student:

> x <- seq(-3.291, 3.291, length=100)

> plot(x, dnorm(x, mean=0, sd=1), xlab="x", ylab="Densidad",

+ main="Distribucion t Student : n = 1,2,3,4",, type="l")

> abline(h=0, col="gray")

> text(2,.38,"N(0,1)",col="black")

> lines(.x, dt(x, df=1),col="blue")

> text(2,.36,"n = 1",col="blue")

> lines(.x, dt(x, df=2),col="green")

> text(2,.34,"n = 2",col="green")

> lines(.x, dt(x, df=3),col="red")

> text(2,.32,"n = 3",col="red")

> lines(.x, dt(x, df=4),col="pink")

> text(2,.30,"n = 4",col="pink")

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 33 / 37

26

Distribucion Fm,n de Snedecor

George Waddel Snedecor (1881-1974). Sean U y V dos variables independientes distribuidassegun leyes ji-cuadrado de m y n grados de libertad respectivamente, la variable X,

X =U/m

V/n,

se dice que es una variable Fm,n de Snedecor con m y n grados de libertad, en el numerador ydenominador respectivamente.La funcion de densidad viene dada por la expresion,

f(x;m,n) =

(m/n)m/2

β(m2

, n2) · xm/2−1

(1+ mn

x)(m+n)/2 para x > 0 y m,n > 0

0 en el resto.

La Esperanza y la Varianza de una distribucion Fm,n son:

E(X) = µ =n

n − 2, para n > 2, indefinida para otros valores.

Var(X) = σ2 =2n2(m + n − 2)

m(n − 2)2(n − 4), para n > 4, indefinida para otros valores.

0 2 4 6 8

0.0

0.5

1.0

1.5

2.0

Distribución F: m,n

f

Den

sida

d

m=1, n=1

m=2, n=1

m=5, n=2

m=100, n=1

m=100, n=100

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 34 / 37

27

Distribucion Fm,n de Snedecor

Propiedad: Si X ≡ Fm,n entonces 1X ≡ Fn,m.

La Funcion de Distribucon F (x) nos permite saber, dada una variable aleatoria X ≡ Fm,n,

P(X < a) = p =

∫ a

0f(x;m,n)dx.

El calculo de esta integral se encuentra en la Tabla de distribucion Fm,n de Snedecor.

> qf(0.95,df1=3,df2=4)

[1] 6.591382

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 35 / 37

28

Distribucion Fm,n de Snedecor

Mas en concreto la Funcion de Distribucion Inversa: para distintos valores de m,n y de p sepuede buscar en la tabla su cuantil a.

0 1 2 3 4 5 6

0.0

0.1

0.2

0.3

0.4

0.5

F m=5,n=2, P(X<a)=p=F(a)

x

Den

sida

d

p

a

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 36 / 37

Fm,n de Snedecor con R

Distribucion Fm,n de Snedecor:

> x <- seq(0, 8, length=400)

> plot(x, df(x, df1=1, df2=1), xlab="f", ylab="Densidad",

+ main="Distribucion F: m,n", type="l")

> abline(h=0, col="gray")

> abline(v=0, col="gray")

> text(6,2,"m=1, n=1",col="black")

> lines(.x, df(x, df1=2, df2=1),col="blue")

> text(6,1.8,"m=2, n=1",col="blue")

> lines(.x, df(x, df1=5, df2=2),col="green")

> text(6,1.6,"m=5, n=2",col="green")

> lines(.x, df(x, df1=100, df2=1),col="red")

> text(6,1.4,"m=100, n=1",col="red")

> lines(.x, df(x, df1=100, df2=100),col="pink")

> text(6,1.2,"m=100, n=100",col="pink")

Licesio J. Rodrıguez-Aragon Tema 3, Unidad 4 – 37 / 37

29