Distribucions importants en Inferència estadística...Dep. d’Estadística.Divisió de Ciències...

Post on 11-Jul-2020

6 views 0 download

Transcript of Distribucions importants en Inferència estadística...Dep. d’Estadística.Divisió de Ciències...

Departament d’Estadística

Divisió de Ciències Experimentals i Matemàtiques

Distribucions importants en Inferència estadística

Diplomatura d’EstadísticaEstadística Matemàtica IJordi Ocaña Rebull

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Punts que tractarem:

Distribució khi-quadrat– Definició, principals propietats, gènesi, taules

Distribució t de Student– Definició, principals propietats, gènesi, taules

Distribució F de Fisher-Snedecor– Definició, principals propietats, gènesi, taules

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució khi-quadrat. Definició

Direm que la v.a. Y, absolutament contínua, té distribució “khi-quadrat” amb n graus de llibertat, ( )

( ) ( )2

2 2

2

2 ,sii la seva funció de densitat és:

si 02; 20 en cas contrari

yn

n

Y n

y e ynf y n

n

−− −

+

⎧⎪⎪ >⎪⎪ Γ= ⎨⎪⎪⎪⎪⎩∈

∼ χ

Z

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució khi-quadrat. Densitat per diversos g.d.ll.

y

khi2

(2)

0 2 4 6 8 10 12 14

0.0

0.1

0.2

0.3

0.4

0.5

y

khi2

(5)

0 2 4 6 8 10 12 14

0.0

0.05

0.10

0.15

5n =2n =

y

khi2

(10)

0 5 10 15 20 25

0.0

0.02

0.04

0.06

0.08

0.10

y

khi2

(20)

0 10 20 30 40

0.0

0.02

0.04

0.06

10n = 20n =

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució khi-quadrat. Propietats

Cas particular de la gamma, amb λ = 1/2 i p = n/2:

Tots els moments finits, amb valor:

En particular

( )( )

1; , , 0p

p yf y p y e yλλλλ

− −= >Γ

( ) ( ) ( )2 2 2E Y n n nν ν= + + −

( )

( )var 2

E Y n

Y n

=

=

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució khi-quadrat. Propietats

Reproductibilitat: si Y1 i Y2 són estocàsticament independents,

Funció característica:

( ) ( )( )

2 21 1 2 2

21 2 1 2

,Y n Y n

Y Y n n

χ

⇒ + +

∼ ∼

χ

χ

( ) ( ) 21 2 nC t it −= −

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució khi-quadrat.Per què és important?

Distribució “artificial”, normalment no trobarem al “món real” cap variable aleatòria que “sigui” χ2 !. Però ...en Inferència estadística, sovint hi ha la necessitat de determinar la distribució de sumes de quadrats de v.a. normals independents: aquestes distribucions estan molt relacionades amb la χ2. En concret:

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució khi-quadrat.Sumes de quadrats de N(0,1)

Si

És conseqüència (casi) immediata de les propietats de la funció característica:– f. característica de

– y la de la suma és

( )

( )

1 2

2 2 2 21 2

, , , són v.a. independents,0,1 per 1, , , aleshores:

n

i

n

Z Z ZZ N i n

Y Z Z Z n

=

= + + +

…∼ …

… ∼ χ

( ) ( )122 és 1 2i iZ C t it −= −

( )( )niC t

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució khi-quadrat.Taules de la khi-quadrat

Per uns graus de llibertat n i un valor de probabilitat α, donen el valor tal que

( )2 nαχ

( ){ }( )

2

2

Pr ,

amb

Y n

Y nαχ α≥ =

∼ χy

khi2

(5)

0.0

0.05

0.10

0.15

0 2 4 6 8 10 12 14

( )2 nαχ

α

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució khi-quadrat.Fórmules aproximades

Si n és gran (n ≥ 100), no serà a les taules. Podem utilitzar l’aproximació

( ) ( ){ }

( )( )

( )

2 212

2

2 1

per t.q. Pramb 0,1 ,justificada pel fet que, si

2 2 1 0,1

n

dn n

n z n

z Z zZ N

Y n

Y n Z N

αα

α α

χ

α

→∞

≈ + −

≥ =

− − ⎯⎯⎯⎯→

∼∼

χ

( )2 nαχ

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució khi-quadrat.Fórmules aproximades

Aproximació més precisa al valor crític:

Càlcul de la funció de distribució:

{ }( )

( ) ( )( )

( )

2

2 202

1 1 /2Pr!

amb

n kk

n nk

yY yk k

Y n

∞ +

=

−≤ =Γ +∑

∼ χ

( )2

32 21 , 309 9

n n z nn nααχ

⎛ ⎞⎟⎜≈ − + >⎟⎜ ⎟⎜⎝ ⎠

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució t de Student. Definició

Direm que la v.a. Y, absolutament contínua, té distribució “t de Student” amb n graus de llibertat, amb n ∈ Z+,

( )

( )( ) ( )

( ) R1

2 21

2 2

, sii la seva densitat és

; ,

1

n n

n

Y n

f y n yynn

π

+

+

Γ Γ= ∈

⎛ ⎞⎟⎜ + ⎟⎜ ⎟⎜⎝ ⎠

∼ t

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució t de Student.Gràfic de la funció de densitat

y

t(1)

-4 -2 0 2 4

0.05

0.10

0.15

0.20

0.25

0.30

y

t(2)

-4 -2 0 2 4

0.0

0.1

0.2

0.3

( )1t ( )2t

y

t(20)

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

y

N(0

,1)

-4 -2 0 2 4

0.0

0.1

0.2

0.3

0.4

( )20t ( )0,1N

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució t de Student. Propietats

Si n=1 tenim la distribució de CauchyUnimodal i simètrica respecte de 0Tot moment d’ordre inferior a n és finit– Si n>1 existeix E(Y) (i és 0)– Si n>2 existeix var(Y) = E(Y2) = n/(n−2)– En general, per 1 < 2ν < n: E(Y 2ν−1) = 0 i

( ) ( )( )( ) ( )

2 1 3 2 12 4 2

nE Yn n n

νν ν

ν⋅ ⋅ ⋅ −=

− − ⋅ ⋅ −…

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució t de Student. Propietats

Funció característica:

Aproximació a la normal:

Propietat fonamental: donades dues v.a. independents Z ∼ N(0,1) i X ∼ χ2(n), la v.a.

( ) ( )si , 0,1dn n nY n Y Z N→∞⎯⎯⎯⎯→∼ ∼t

( )ZY n= ∼ t

( )( )

( ) ( ) ( )2

2

2

2 "funció de Bessel"

n

n

ttnnnC t N Nνπ

/X n

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució t de Student.Taula per “dues cues”

La taula més habitualment utilitzada, per un determinat nombre de g.d.ll. n i per una probabilitat α, indica el valor tα(n) tal que, si Y ∼ t(n),

y

t(5)

-4 -2 0 2 4

0.0

0.1

0.2

0.3

1 α−

( )t nα− ( )t nα

( ) ( ){ }Pr 1t n Y t nα α α− ≤ ≤ = −

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució F de Fisher-Snedecor. Definició

Una v.a. Y, absolutament contínua, té distribució “F de Fisher-Snedecor” amb m g.d.ll al numerador i n g.d.ll. al denominador, Y ∼ F(m,n), si la seva funció de densitat és

( )( )

( ) ( ) ( )

( )

2 2 2

2

12

2 2; ,

si 0

; , 0 en cas contrari

m n m

m n

m n

m nm n yf y m n

my ny

f y m n

+

+ −Γ= ⋅

Γ Γ +>

=

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució F de Fisher-Snedecor. Algunes densitats

y

F(2,

2)

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

y

F(2,

5)

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

( )2,2F ( )2,5F

y

F(5,

2)

0 1 2 3 4

0.1

0.2

0.3

0.4

0.5

y

F(5,

5)

0 1 2 3 4

0.0

0.1

0.2

0.3

0.4

0.5

0.6

( )5,2F ( )5,5F

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució F de Fisher-Snedecor. Propietats

Esperança finita si n > 2:

Variància finita si n > 4:

Unimodal si m > 2, amb moda:

( )2

nE Yn

=−

( )( )

( ) ( )

2

22 2var

2 4n m nY

m n n+ −=

− −

2m n−2m n +

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució F de Fisher-Snedecor. Propietat fonamental

Raó per la qual la distribució F és fonamentalen Anàlisi de la variància i altres parts de la Inferència estadística:

Per tant, si Y ∼F(m,n), 1/Y∼F(n,m)

( ) ( )

( )

2 2, , , indep.,

,

V m W n V W

V m m nW n⇒

∼ ∼

χ χ

F

Dep. d’Estadística. Divisió de Ciències Experimentals i Matemàtiques

Distribució F de Fisher-Snedecor. Taules

y

F(5,

5)

0 1 2 3 4

0.0

0.1

0.2

0.3

0.4

0.5

0.6 Per una probabilitat

α, i graus de llibertatm i n, si Y∼F(m,n), donen Fα(m,n) t.q. Pr{Y > Fα(m,n)}=αEl “valor crític” perla cua esquerra es pot trobar a partir de:

( )( )11,,

F m nF n mαα

− =y

F(5,

5)

0 1 2 3 4

0.0

0.1

0.2

0.3

0.4

0.5

0.6

α

α

( ),F m nα

( )1 ,F m nα−