Conceptos Estadística Unidad 1 3er Semestre

33
Instituto Tecnológico de Campeche Asignatura: Estadística I. Alumno: Carlos Rodríguez de la Gala Ureña. Resumen de la Unidad I Distribuciones de Probabilidad Continuas Grupo: VI-3 1

Transcript of Conceptos Estadística Unidad 1 3er Semestre

Page 1: Conceptos Estadística Unidad 1 3er Semestre

Instituto Tecnológico de Campeche

Asignatura: Estadística I.

Alumno: Carlos Rodríguez de la Gala Ureña.

Resumen de la Unidad IDistribuciones de Probabilidad Continuas

Grupo: VI-3

Profesor: Ing. Ramón Agustín Bocos Patrón.

Fecha: 30 de agosto de 2010

1

Page 2: Conceptos Estadística Unidad 1 3er Semestre

Índice

Introducción................................................................................................................................3

Variables Aleatorias Continuas....................................................................................................4Distribución de Probabilidad de una variable aleatoria continua.......................................................7Media y Varianza de una variable aleatoria continua…………………………………………………………………….8

Distribución de Probabilidad T-Student.....................................................................................10Distribución de Probabilidad Gamma........................................................................................15Distribución de Probabilidad Beta……………………………………………………………………………………………19Distribución de Probabilidad χ2 (Ji cuadrada)…………………………………..……………………………………….21Distribución de Probabilidad F de Fisher…………….……………………………………………………………………24Distribución de Probabilidad Weibull……………………………………………………………………………………...26

Bibliografía…………………………………..…………………………………..…………………………………..…………………….29

2

Page 3: Conceptos Estadística Unidad 1 3er Semestre

Introducción

Las variables aleatorias pueden ser continuas o discontinuas. En este último caso se denomina también discretas.

Si X es una Variable aleatoria continua, puede tomar cualquier valor de un intervalo continuo o dentro de un campo de variación dado. Las probabilidades de que ocurra un valor dado x están dadas por una función de densidad de probabilidad de que X quede entre a y b. El área total bajo la curva es 1.

Ejemplo.- Sea el experimento aleatorio consistente en medir la altura que es capaz de saltar cada miembro de un conjunto de personas. En este experimento, cada miembro del conjunto observado da lugar a un número, por lo que se toma como variable aleatoria el conjunto de las medidas de las alturas que son capaces de saltar las distintas personas.

En el supuesto que una persona hubiera saltado 105 cm y otra 106 cm, no existiría ninguna razón para que otra no hubiera saltado un valor intermedio cualquiera entre las dos anteriores, como 105.5 cm. Se trata de una variable aleatoria continua.

3

Page 4: Conceptos Estadística Unidad 1 3er Semestre

Variables Aleatorias Continuas

Si una variable discreta toma los valores x1, ..., xk, la proposición afirma que las probabilidad de que al hacer un experimento, X tome uno de esos valores es 1, de modo que cada posible valor xi contribuye con una cantidad f(xi) al total:

Aun cuando la variable tomase un número infinito de valores, x1, x2, ..., no hay ningún problema en comprobar que cada xi contribuye con una cantidad f(xi) al total de modo que

Cuando la variable es continua, no tiene sentido hacer una suma de las probabilidades de cada uno de los términos en el sentido anterior, ya que el conjunto de valores que puede tomar la variable es no numerable. En este caso, lo que generaliza de modo

natural el concepto de suma ( ) es el de integral ( ). Por otro lado, para variables

continuas no tiene interés hablar de la probabilidad de que , ya que esta debe de valer siempre 0, para que la suma infinita no numerable de las probabilidades de todos los valores de la variable no sea infinita.

De este modo es necesario introducir un nuevo concepto que sustituya en v.a. continuas, al de función de probabilidad de una v.a. discreta. Este concepto es el de función de densidad de una v.a. continua, que se define como una función integrable, que verifica las dos propiedades siguientes:

 

y que además verifica que dado a<b, se tiene que

4

Page 5: Conceptos Estadística Unidad 1 3er Semestre

   Figura: Función de densidad f. La probabilidad de un intervalo, es el área que existe entre la función y el eje de abscisas.

Observación

Por ser f una función integrable, la probabilidad de un punto es nula:

y por ello al calcular la probabilidad de un intervalo no afectara nada el que este sea abierto o cerrado por cualquiera de sus extremos, pues estos son puntos y por tanto de probabilidad nula:

La función de distribución de la v.a. continua, F, se define de modo que dado , F(x) es la probabilidad de que X sea menor o igual que x, es decir

5

Page 6: Conceptos Estadística Unidad 1 3er Semestre

   Figura: Función de distribución F, calculada a partir de la función de densidad f.

Observación

Dado un intervalo de la forma (a,b], tenemos que

Es decir, la cantidad F(b) - F(a) representa la masa de probabilidad extendida a lo largo de dicho intervalo. Si dividimos esta cantidad por la longitud del intervalo,

tenemos la masa media de probabilidad por unidad de longitud en (a,b], es decir, su densidad media de probabilidad. Si hacemos tender a hacia b, , la cantidad

es la densidad de probabilidad del punto b (que como hemos mencionado no se ha de confundir con la probabilidad de b).

Proposición

Distribuciones Continuas.

6

Page 7: Conceptos Estadística Unidad 1 3er Semestre

La función de distribución F, es no decreciente

Además, es una función absolutamente continua que verifica:

Demostración

Los sucesos

y

son mutuamente exclusivos, siendo su unión el suceso . Por tanto

El resto es evidente pues por la relación:

y por otro lado

7

Page 8: Conceptos Estadística Unidad 1 3er Semestre

8

Page 9: Conceptos Estadística Unidad 1 3er Semestre

9

Page 10: Conceptos Estadística Unidad 1 3er Semestre

Distribución de Probabilidad T de Student

En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño.

Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra.

En muchas ocasiones no se conoce s y el número de observaciones en la muestra es menor de 30. En estos casos, se puede utilizar la desviación estándar de la muestra s como una estimación de s, pero no es posible usar la distribución Z como estadístico de prueba. El estadístico de prueba adecuado es la distribución t.Sus aplicaciones en la inferencia estadística son para estimar y probar una media y una diferencia de medias (independiente y pareada). Características de la distribución t de Student  1. Al igual que la distribución Z, es una distribución continua 

 2. La distribución t tiene una media de cero, es simétrica respecto de la media y se

extiende de - ¥ a + ¥ la varianza de t 2

para > 2. Cuando los grados de libertad son suficientemente grandes la varianza de la distribución t tiende a 1. 3. Tiene forma acampanada y simétrica 4. No hay una distribución t, sino una "familia" de distribuciones t. todas con la misma media cero, pero con su respectiva desviación estándar diferente de acuerdo con el tamaño de la muestra n. Existe una distribución t para una muestra de 20, otra para una muestra de 22, y así sucesivamente. 5. La distribución t es más ancha y más plana en el centro que la distribución normal estándar como resultado de ello se tiene una mayor variabilidad en las medias de muestra calculadas a partir de muestras más pequeñas. Sin embargo, a medida que aumenta el tamaño de la muestra, la distribución t se aproxima a la distribución normal estándar.

10

Page 11: Conceptos Estadística Unidad 1 3er Semestre

Caracterización

La distribución t de Student es la distribución de probabilidad del cociente

donde

Z tiene una distribución normal de media nula y varianza 1 V tiene una distribución chi-cuadrado con ν grados de libertad Z y V son independientes

Si μ es una constante no nula, el cociente es una variable aleatoria que sigue la distribución t de Student no central con parámetro de no-centralidad .μ

Aparición y especificaciones de la distribución t de Student

Supongamos que X1,..., Xn son variables aleatorias independientes distribuidas normalmente, con media y μ varianza σ2. Sea

la media muestral. Entonces

sigue una distribución normal de media 0 y varianza 1.

Sin embargo, dado que la desviación estándar no siempre es conocida de antemano, Gosset estudió un cociente relacionado,

donde

es la varianza muestral y demostró que la función de densidad de T es

donde es igual a ν n − 1.

La distribución de T se llama ahora la distribución-t de Student.

11

Page 12: Conceptos Estadística Unidad 1 3er Semestre

El parámetro ν representa el número de grados de libertad. La distribución depende de , pero no de o , lo cual es muy importante en la práctica.ν μ σ

Intervalos de confianza derivados de la distribución t de Student

El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en estimar la desviación típica de los datos S y calcular el error estándar de la media= S/(raíz cuadrada de n), siendo entonces el intervalo de confianza para la media = x media +- t (alfa/2) multiplicado por (S/(raíz cuadradada de n)).

Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye también normalmente, la distribución t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero.

para efectos prácticos el valor esperado y la varianza son :

E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para n > 3

Distribución t de Student

Función de densidad de probabilidad

Función de distribución de probabilidad

12

Page 13: Conceptos Estadística Unidad 1 3er Semestre

Parámetros grados de libertad (real)

Dominio

Función de densidad

(pdf)

Función de distribución

(cdf)donde es la función hipergeométrica

Media 0 para > 1, indefinida para otros valoresν

Mediana 0

Moda 0

Varianzapara > 2, indefinida para otros valoresν

Coeficiente de simetría

0 para > 3ν

Curtosispara > 4,ν

Entropía

13

Page 14: Conceptos Estadística Unidad 1 3er Semestre

: función digamma, ψ B: función beta

Función generadora

de momentos (mgf)

(No definida)

Función característica

Distribución de Probabilidad Gamma

Es un modelo básico en la teoría estadística.

14

Page 15: Conceptos Estadística Unidad 1 3er Semestre

Definición

Una variable aleatoria continua X tiene distribución Gamma si su densidad de probabilidad está dada por

f ( x )={ 1

βα Γ (α )xα−1 e−x /β , x>0

0 , para otro x

>0, >0 son los parámetros para este modelo .

Gráfico de la distribución Gamma para algunos valores de ,

() es la función Gamma: Γ ( α )=∫

0

xα−1e− xdx

Si es un entero positivo, entonces

() = ( - 1)! .

Demostración

15

Page 16: Conceptos Estadística Unidad 1 3er Semestre

Γ ( α )=∫0

xα−1e− xdx

u = x-1 du = (-1)x-2 dx Para integrar por partes

dv = e-x dx v = -e-x

Se obtiene

Γ ( α )=( α−1 )∫0

xα−2e−xdx= ( - 1)( - 1)

Sucesivamente

() = ( -1)(-2)(-3)...(1), pero (1) = 1 por integración directa.

Media y varianza de la distribución gamma

= E[X] = , s2 = V[X] = 2 .

Demostración para

= ∫−∞

xf ( x )dx= ∫0

x1

βα Γ (α )xα−1e− x /β dx

=

1

βα Γ (α )∫0

xα e− x /β dx

Mediante la sustitución y = x/

=

1

βα Γ (α )∫0

( βy )α e− y β dy

=

βΓ (α )∫0

y α e− ydy

Con la definición de la función Gamma:

=

βΓ (α )

Γ (α+1 )=

βΓ (α )

αΓ( α )=αβ

Ejemplo

16

Page 17: Conceptos Estadística Unidad 1 3er Semestre

El tiempo en horas que semanalmente requiere una máquina para mantenimiento es una variable aleatoria con distribución gamma con parámetros =3, =2

a) Encuentre la probabilidad que en alguna semana el tiempo de mantenimiento sea mayor a 8 horas

b) Si el costo de mantenimiento en dólares es C = 30X + 2X2, siendo X el tiempo de mantenimiento, encuentre el costo promedio de mantenimiento.

Solución

Sea X duración del mantenimiento en horas (variable aleatoria)

Su densidad de probabilidad es:

f(x) =

1

βα Γ (α )xα−1e−x / β= 1

23Γ (3 )x3−1e−x /2= 1

16x2e− x /2

a) P(X>8) es el área resaltada en el gráfico

P(X>8) = 1 – P(X8) = 1 -

116

∫0

8

x2e− x /2 dx

Para integrar se pueden aplicar dos veces la técnica de integración por partes:

17

Page 18: Conceptos Estadística Unidad 1 3er Semestre

∫ x2e− x /2dx,

u = x2 du = 2x dx

dv = e-x/2 dx v = -2 e-x/2

= -2x2 e-x/2 + 4∫ xe− x /2dx

∫ xe− x /2dx

u = x du = dx

dv = e-x/2dx v = -2 e-x/2

= -2x e-x/2 + 2∫ e−x /2dx

Sustituyendo los resultados intermedios,

P(X>8) = 1 -

116

[-2x2 e-x/2+4( -2x e-x/2+2(-2 e-x/2))]80 = 0.2381

b) E[C] = E[30X + 2X2] = 30 E[X] + 2 E[X2]E[X] = = 3(2) = 6

E[X2] =∫−∞

x2 f (x )dx=∫0

x2 116x2e− x /2dx

=

116 ∫

0

x4 e−x /2dx

sustituya y = x/2 para usar la función Gamma

=

116 ∫

0

(2 y )4 e− y(2dy )=

2∫0

y4 e− ydy = 2(5) = 2(4!) = 48

Finalmente se obtiene

E[C] = 30(6) + 2(48) = 276 dólares

Distribución de Probabilidad Beta

18

Page 19: Conceptos Estadística Unidad 1 3er Semestre

Este modelo tiene actualmente aplicaciones importantes por la variedad de formas diferentes que puede tomar su función de densidad para diferentes valores de sus parámetros. El dominio es el intervalo [0, 1], pero mediante alguna sustitución, otros intervalos finitos pueden llevarse a [0, 1]

Definición

Una variable aleatoria continua X tiene distribución beta si su densidad de probabilidad está dada por

f ( x )={ Γ (α+ β )Γ (α )Γ ( β )

xα -1(1-x )β -1 , 0<x<1

0 , para otro x

>0, >0 son los parámetros para este modelo

Fig. 28.2 Gráficos de la distribución beta

Media y varianza de la distribución beta

Si X es una variable aleatoria continua con distribución beta, entonces

= E[X] =

αα+β

s2 = V[X] =

αβ

(α+β )2( α+β+1) .

La demostración de se fundamenta en la definición de la función beta cuyo análisis se encuentra en los libros de cálculo. Con la definición de valor esperado y la sustitución respectiva, se encuentra

19

Page 20: Conceptos Estadística Unidad 1 3er Semestre

Ejemplo

Un distribuidor de gasolina llena los tanques del depósito cada lunes. Se ha observado que la cantidad que vende cada semana se puede modelar con la distribución beta con =4, =2

a) Encuentre el valor esperado de la venta semanalb) Encuentre la probabilidad que en alguna semana venda al menos 90%

Solución

Sea X: proporción de combustible que vende semanalmente (variable aleatoria

continua con valor entre 0 y 1)

Su densidad de probabilidad es

f(x) =

Γ ( 4+2 )Γ (4 )Γ (2 )

x4−1(1−x )2−1

= 20x3(1-x), 0<x<1

a) =E[X]=

αα+β =

44+2 = 2/3 (vende en promedio 2/3 del tanque

cada semana)

b) P(x>0.9) = 20∫

0 .9

1

x3(1−x )dx = 0.082 = 8.2%

Es el área marcada en el siguiente gráfico

Distribución de Probabilidad ²χ

20

Page 21: Conceptos Estadística Unidad 1 3er Semestre

En estadística, la distribución ²χ (de Pearson) es una distribución de probabilidad continua con un parámetro k que representa los grados de libertad de la variable aleatoria:

donde Zi son variables de distribución normal, de media cero y varianza uno. El que la variable aleatoria X tenga esta distribución se representa habitualmente así: .

Es conveniente tener en cuenta que la letra griega se transcribe al χ latín como chi[1] y se pronuncia en castellano como ji.[2] [3]

La distribución ² tiene muchas aplicaciones en χ inferencia estadística, por ejemplo en la denominada prueba ²χ utilizada como prueba de independencia y como prueba de bondad de ajuste y en la estimación de varianzas. También está involucrada en el problema de estimar la media de una población normalmente distribuida y en el problema de estimar la pendiente de una recta de regresión lineal, a través de su papel en la distribución t de Student, y participa en todos los problemas de análisis de varianza, por su papel en la distribución F de Snedecor, que es la distribución del cociente de dos variables aleatorias independientes con distribución ².χ

Propiedades

Función de densidad

Su función de densidad es:

donde Γ es la función gamma.

Función de distribución acumulada

Su función de distribución es

donde es la función gamma incompleta.

El valor esperado y la varianza de una variable aleatoria X con distribución ² son,χ respectivamente, k y 2k.

21

Page 22: Conceptos Estadística Unidad 1 3er Semestre

Relación con otras distribuciones

La distribución ² es un caso especial de la χ distribución gamma. De hecho,

Como consecuencia, cuando k = 2, la distribución ² es unaχ distribución exponencial de media k = 2.

Cuando k es suficientemente grande, como consecuencia del teorema central del límite, puede aproximarse por una distribución normal:

Distribución ² (ji-χcuadrado)

Función de densidad de probabilidad

Función de distribución de probabilidad

Parám grados de

22

Page 23: Conceptos Estadística Unidad 1 3er Semestre

etros libertad

Dominio

Función de densidad (pdf)

Función de distribución (cdf)

Media

Mediana

aproximadamente

Moda if

Varianza

Coeficiente de simetría

Curtosis

Entropía

Función generadora de momentos (mgf)

for

Función caract

23

Page 24: Conceptos Estadística Unidad 1 3er Semestre

erística

Distribución de Probabilidad F de Fisher

Usada en teoría de probabilidad y estadística, la distribución F es una distribución de probabilidad continua. También se la conoce como distribución F de Snedecor (por George Snedecor) o como distribución F de Fisher-Snedecor.

Una variable aleatoria de distribución F se construye como el siguiente cociente:

donde

U1 y U2 siguen una distribución ji-cuadrada con d1 y d2 grados de libertad respectivamente, y

U1 y U2 son estadísticamente independientes.

La distribución F aparece frecuentemente como la distribución nula de una prueba estadística, especialmente en el análisis de varianza. Véase el test F.

La función de densidad de una F(d1, d2) viene dada por

24

Page 25: Conceptos Estadística Unidad 1 3er Semestre

para todo número real x ≥ 0, donde d1 y d2 son enteros positivos, y B es la función beta.

La función de distribución es

donde I es la función beta incompleta regularizada.

Fisher-Snedecor

Función de densidad de probabilidad

Función de distribución de probabilidad

25

Page 26: Conceptos Estadística Unidad 1 3er Semestre

Parámetros

grados de libertad

Dominio

Función de densidad

(pdf)

Función de distribució

n (cdf)

Mediapara d2 > 2

Mediana

Modapara

d1 > 2

Varianza

para d2 > 4

Coeficiente de simetría

para d2 > 6

Curtosis

Entropía

Función generadora

26

Page 27: Conceptos Estadística Unidad 1 3er Semestre

de momentos

(mgf)

Función característi

ca

Distribución de Weibull

Este modelo se utiliza en estudios de confiabilidad de ciertos tipos de sistemas.

Definición

Una variable aleatoria continua X tiene distribución de Weibull si su densidad de probabilidad está dada por

f ( x )={αβ xβ−1e−αxβ

, x>00 , para otro x

>0, >0 son los parámetros para este modelo

Si = 1, este modelo se reduce al modelo de distribución exponencial.

Si > 1, el modelo tiene forma acampanada con sesgo positivo

Gráficos de la distribución de Weibull

27

Page 28: Conceptos Estadística Unidad 1 3er Semestre

Media y varianza de la distribución de Weibull

Si X es una variable aleatoria continua con distribución de Weibull, entonces

= E[X] = -1/(1+1/)

s2 = V[X] = -2/[(1+2/) – ((1+1/))2] .

Demostración de la media

Con la definición

= E[X] = ∫−∞

xf (x )dx=∫0

xαβ x β−1 e−αxβ

dx

Mediante la sustitución

y = x dy = x-1dx = yx-1dx = y(y/)-1/dx

se obtiene

= -1/∫0

y1 /β e− ydy

comparando con la función gamma

= -1/(1+1/)

Ejemplo

Suponga que la vida útil en horas de un componente electrónico tiene distribución de Weibull con =0.1, =0.5

a) Calcule la vida útil promediob) Calcule la probabilidad que dure más de 300 horas

Solución

Sea X: vida útil en horas (variable aleatoria continua)

su densidad de probabilidad:

f(x)= αβ xβ−1 e−αx

β

= 0 .05 x−0. 5e−0 .1 x 0 .5

28

Page 29: Conceptos Estadística Unidad 1 3er Semestre

a) = -1/(1+1/) = (0.1)-1/0.5(1+1/0.5) = 0.1-2(3) = 200 horas

b) P(X>300) = ∫300

0 .05 x−0. 5e−0 .1 x 0 .5

dx mediante la sustitución y=x0.5 dy = 0.5x-0.5dx = 0.5(1/y)dy

se obtiene

P(X>300) =

0 .05 ∫√300

∞ 1ye−0 . 1 y y

0 . 5dy=0 . 1 ∫

√300

e−0 . 1dy

= 1 – P(X300) = 1 – 0 .1 ∫

0

√300

e−0 .1 dy = 0.177

Bibliografía

www.wikipedia.com

Probabilidad y Estadística-Montgomery Runger

Probabilidad y Estadística para Ciencias Quím. Biológ.- José Márquez de Cantú

29