Estadistica

9
Nombre: Eduardo Serrano E. Materia: Métodos y técnicas de análisis Trabajo Práctico I 1) Considere el siguiente juego: se tiran 3 dados y se cuenta el número de puntos conseguidos. Describa la distribución de probabilidades de la variable aleatoria X = Cantidad de puntos obtenidos: a) ¿Qué valores puede tomar al variable? ¿Cuál es la probabilidad que le asigna a cada valor de la variable X? Haga un cuadro (puede ser con Excel) para facilitar el trabajo. Luego “péguelo” en el TP. P(3)=1/1, P(4)=1/3, P(5)=1/6, P(6)=1/10, P(7)=1/15, P(8)=1/21, P(9)=1/25, P(10)= 1/27, P(11)= 1/27, P(12)= 1/25, P(13)= 1/21, P(14)= 1/15, P(15)= 1/10, P(16)= 1/6, P(17)= 1/3, P(18)= 1/1. b) Calcule E(X), la esperanza o valor esperado de X. ¿Qué mide E(X)? ¿Es E(X) un valor que pueda lograrse al tirar los 3 dados? Explique. E(x)= E(X)=3(1/3)+4(1/1)+5(1/6)+6(1/10)+7(1/15)+8(1/21)+9(1/25)+1 0(1/27)+11(1/27)+12(1/25)+13(1/21)+14(1/15)+15(1/10)+16(1/6 )+17(1/3) +18(1/1)=10.5 La esperanza es el promedio del total de lanzamientos siendo una dist. Normal es el valor central de la distri. Una medida de tendencia central no sig. De debe ser un valor existente al lanzar el dado. c) Calcule Var(X), la varianza de X. ¿Qué mide Var(X)?. A la varianza de X También se la designa como σx2. Var(x)=

description

VarianzamediamedianamodaDesviacion estandarCorrelacion

Transcript of Estadistica

Page 1: Estadistica

Nombre: Eduardo Serrano E.Materia: Métodos y técnicas de análisis

Trabajo Práctico I

1) Considere el siguiente juego: se tiran 3 dados y se cuenta el número de puntos conseguidos. Describa la distribución de probabilidades de la variable aleatoria X = Cantidad de puntos obtenidos:

a) ¿Qué valores puede tomar al variable? ¿Cuál es la probabilidad que le asigna a cada valor de la variable X? Haga un cuadro (puede ser con Excel) para facilitar el trabajo. Luego “péguelo” en el TP.

P(3)=1/1, P(4)=1/3, P(5)=1/6, P(6)=1/10, P(7)=1/15, P(8)=1/21, P(9)=1/25, P(10)= 1/27, P(11)= 1/27, P(12)= 1/25, P(13)= 1/21, P(14)= 1/15, P(15)= 1/10, P(16)= 1/6, P(17)= 1/3, P(18)= 1/1.

b) Calcule E(X), la esperanza o valor esperado de X. ¿Qué mide E(X)? ¿Es E(X) un valor que pueda lograrse al tirar los 3 dados? Explique.

E(x)=

E(X)=3(1/3)+4(1/1)+5(1/6)+6(1/10)+7(1/15)+8(1/21)+9(1/25)+10(1/27)+11(1/27)+12(1/25)+13(1/21)+14(1/15)+15(1/10)+16(1/6)+17(1/3) +18(1/1)=10.5

La esperanza es el promedio del total de lanzamientos siendo una dist. Normal es el valor central de la distri. Una medida de tendencia central no sig. De debe ser un valor existente al lanzar el dado.

c) Calcule Var(X), la varianza de X. ¿Qué mide Var(X)?. A la varianza de X También se la designa como σx2.

Var(x)=

Var(x)= [(3-10.5)^2*(1/3)]+[(4-10.5)^2*(1/1)]+[(5-10.5) ^2*(1/6)]+[(6-10.5)^2*(1/10)]+[(7-10.5)^2*(1/15)]+[(8-10.5)^2*(1/21)]+[(9-10.5)^2*(1/25)]+[(10-10.5)^2*(1/27)]+[(11-10.5)^2*(1/27)]+[(12-10.5)^2*(1/25)]+[(13-10.5)^2*(1/21)]+[(1410.5)^2*(1/15)]+[(15-10.5) ^2*(1/10)]+[(16-10.5) ^2*(1/6)]+[(17-10.5) ^2*(1/3)]+[(18-10.5) ^2*(1/1)]=8.75

Page 2: Estadistica

Es una medida de dispersión de los datos con respecto a su media.

d) ¿En qué unidades se reporta la varianza? Considere que X se mide en puntos.

Si X se mide en puntos, entonces Var(X) se reporta en Puntos^2.

e) Calcule σx, el desvío estándar de X. ¿Qué mide σx? ¿En qué unidades se reporta el desvío estándar?

σx= 2.95 mide los valores más cercanos a la media en este caso ± 2.95 con respecto a la media. Se reporta en puntos (tomado como referencia el ítem d)

f) Calcule CV, el coeficiente de variación de X. ¿En qué unidades se reporta el CV? ¿Qué mide el CV?

CV= σx/E(X)

CV=0.281718

El CV. Es adimensional y mide la variabilidad con respecto a su media. En este caso 28%

2) Considere los datos de la tabla más abajo que indican de los salarios percibidos por los empleados en tres empresas del mismo ramo.

Nómina salarial en miles de pesosEmp A Emp B Emp C

6 6 66 6 86 6 108 8 12

10 8 1410 8 1610 10 1812 12 1812 16 1820 20 20

Page 3: Estadistica

a) ¿Cuál le parece que es la empresa que paga salarios más altos? Intente verificar su intuición calculando una medida de tendencia central: la media por ejemplo.

Nómina salarial en miles de pesosEmp A Emp B Emp C

Media 10 10 14Mediana 10 8 15

Al analizar su media y mediana podemos observar que la Emp C tiene los salarios más elevados.

b) ¿En qué empresa los salarios están más dispersos? Intente verificar su intuición calculando las siguientes medidas de dispersión: Varianza, desvío estándar y coeficiente de variación. Luego compare las empresas dos a dos utilizando cada medida y especifique la de salarios más dispersos (le ayudará hacer un cuadro).

Nómina salarial en miles de pesosEmp A Emp B Emp C

Media 10 10 14Mediana 10 8 15

Varianza17,777777

822,222222

223,111111

1

Desv. Est.4,2163702

14,7140452

1 4,8074017Coeficiente

de Variación42% 47% 34%

Emp. A Vs Emp. B: La Emp. B es menos equitativa al tener una Desv. Est. Y CV mayor que la Emp. A

Emp. A Vs Emp. C: En mi parecer la Desviación Estándar es la mejor opción para comparar porque la Emp. A y Emp. B tiene la misma unidad que son Salarios. Por lo tanto la Emp C tiene salarios más dispersos.

Emp. B Vs Emp. CEn mi parecer la Desviación Estándar es la mejor opción para comparar porque la Emp. B y Emp. C tiene la misma unidad que son Salarios. Por lo tanto la Emp C tiene salarios más dispersos.

Page 4: Estadistica

c) ¿Coinciden las respuestas al utilizar las varianzas y los desvíos estándar? ¿Por qué?

Si puesto que las respuestas están en Var(x)= Salarios^2 y Des. Est(x)=Salarios

d) ¿Coinciden las respuestas al utilizar los desvíos estándar y los coeficientes de variación? ¿Por qué?

No porque la Desv. Est. Me da una respuesta en salarios y el CV. Me la una respuesta en porcentaje.

e) ¿En qué casos es el desvío estándar una medida adecuada y en cuáles lo es el coeficiente de variación?

Cuando comparamos datos que están en las mismas unidades Des. Est.Cuando comparamos datos en distintas unidades solo nos queda CV.

3) Observe la distribución de salarios y años de educación que se consigna en la tabla para una empresa:

Salario Años Est Antigüedad25 14 2022 18 518 16 816 19 1014 16 813 15 1510 16 168 12 58 12 16 12 10

X= SalariosY= Años EstudioZ= Antigüedad

a) ¿Considera que hay una asociación positiva entre salarios y nivel de educación? ¿Y entre salarios y antigüedad? Conteste “a sentimiento”. Investigaremos el sentido de las asociaciones (directas o inversas) y su cuantificación.

Page 5: Estadistica

Si considero que exige esa asociación entre salarios y nivel de educación.

b) Intente verificar sus intuiciones calculando la Covarianza entre el salario y cada una de las otras variables. ¿Qué información se puede obtener del resultado (signo de la asociación, fuerza de la asociación)?

Cov(x,y)=[[(25-14)*(14-15)] + [(22-14)*(18-15)] + [(18-14)*(16-15)] + [(16-14)*(19-15)] + [(14-14)*(16-15)] + [(13-14)*(15-15)]+ [(10-14)*(16-15)] + [(8-14)*(12-15)]+ [(8-14)*(12-15)]+ [(6-14)*(12-15)]]/10=8.1

Cov(x,z)=[[(25-14)*(20-9.8)] + [(22-14)*(5-9.8)] + [(18-14)*(8-9.8)] + [(16-14)*(10-9.8)] + [(14-14)*(8-9.8)] + [(13-14)*(15-9.8)]+ [(10-14)*(16-9.8)] + [(8-14)*(5-9.8)]+ [(8-14)*(1-9.8)]+ [(6-14)*(10-9.8)]]/10=11.7

El resultado nos una agrupación lineal directa en los 2 casos y una asociación mayor en Salarios y Antigüedad.

c) Calcule ahora el coeficiente de correlación de Pearson entre el salario y cada una de las otras variables. ¿Qué información se puede obtener del resultado (signo de la asociación, fuerza de la asociación)?

Salario Años Est Antigüedad

µ 14 15 9,8

Des Est 6,30696264

2,49443826

5,76965241

Correlación Sal Vs. Años

8,1

Correlación Sal Vs. Ant.

11,7

Page 6: Estadistica

R(x,y)= (8.1)/(6.3*2.49)=0.51R(x,z)= (11.7)/(6.3*5.76)=0.32

El resultado nos da una correlación más fuerte entre Salarios y Años de estudio.

d) Redacte brevemente las conclusiones de su estudio

El estudio tiene como resultado una relación directa entre Salario vs Años y Salario vs Antigüedad. Una correlación más fuerte entre Salarios vs Años siendo 0.51 una correlación menos fuerte entre Salarios vs Antigüedad siendo 0.32

4) Suponga que los salarios en la industria textil se distribuyen en forma aproximadamente normal con media $ 5.000 y desvío estándar $ 1.000 y responda a las siguientes preguntas (no necesita tablas).

µ=5000

σ=1000

a) ¿Cuál es la probabilidad de que un trabajador textil elegido en forma aleatoria gane menos de $ 4.000 ?

P(S<4000)= P(Z<((4000-5000)/1000))= P(Z<-1)= P(Z>1)= 1-P(Z<1)= 1-0.8413= 0.1587

b) ¿Cuál es la probabilidad de que un trabajador textil elegido en forma aleatoria gane más de $ 7.000 ?

P(S>7000)= P(Z>((7-5)/1))= P(Z>2)= 1-P(Z<2)= 1-(0.5+0.4772)= 0.0228

c) ¿Cuál es la probabilidad de que un trabajador textil elegido en forma aleatoria gane entre $ 3.000 y $ 5.000 ?

P(3000<S<5000)= P(-2< Z <0)= P(Z<0) – P(Z<-2) P(Z<0)=0 P(Z<2)= 1-(0.5+0.4772)= 0.0228

P(3000<S<5000)= P(Z<0) – P(Z<-2)= 0-0.0228=0.0228d) ¿Cuál es la probabilidad de que un trabajador textil elegido en

forma aleatoria gane entre $ 3.000 y $ 7.000?

P(3000<S<7000)= P(0 < Z < 2)= P(Z<0) – P(Z<2) P(Z<0)=0

P(Z<2)= (0.5+0.4772)= 0.9772P(3000<S<5000)= P(Z<0) – P(Z<2)= 0-0.9772=-=0.9772

Page 7: Estadistica

e) ¿Cuál es la probabilidad de que de una muestra de 16 trabajadores elegidos al azar se obtenga un sueldo promedio menor que $ 5500?

P(S<5500)= P(Z < 5500-5000/(1000/√16))= P(Z < 2)= (0.5+0.4772)= 0.9772

5) Suponga que las edades de los alumnos universitarios en la UBA se distribuyen en forma aproximadamente normal con media 27 años y desvío estándar 2 años y responda a las siguientes preguntas (necesitará la tabla que se adjunta al final del TP).

µ=27

σ=2

a) ¿Cuál es la probabilidad de que un estudiante elegido en forma aleatoria tenga menos de 26 años?

P(S<26)= P(Z<((26-27)/2))= P(Z<-.5)= P(Z>.5)= 1-P(Z<.5)= 1-(0.5+0.1915)= 0.3085

b) ¿Cuál es la probabilidad de que un estudiante elegido en forma aleatoria tenga más de 32 años?

P(S>32)= P(Z>((32-27)/2))= P(Z>2.5)= 1-P(Z<2.5)= 1-(0.5+0.4938)= 0.0062

c) ¿Cuál es la probabilidad de que un estudiante elegido en forma aleatoria tenga entre 24 y 32 años?

P(24<S<32)= P(-1.5 < Z < 2.5)= P(Z< 2.5) – P(Z< -1.5) P(Z<2.5)= 0.5 + 0.4938= 0.99

P(Z<-1.5)= 1- (0.5+0.4332)= 0.0668P(24<S<32)= P(Z<2.5) – P(Z<-1.5)= 099-0.0668=-=0.927

d) ¿Cuál es la probabilidad de que un estudiante elegido en forma aleatoria tenga entre 22 y 26 años?

P(22<S<26)= P(-2.5 < Z < -0.5)= P(Z< -0.5) – P(Z< -2.5) P(Z<-0.5)= 0.3085

P(Z<-2.5)= 0.0062P(22<S<26)= P(Z<0.5) – P(Z<-2.5)= 0.3085-0.01=-=0.3023

Page 8: Estadistica

e) ¿Cuál es la probabilidad de que una muestra de 9 estudiantes elegidos al azar presenten un promedio de edad mayor que 28 años?

P(S<28)= P(Z < 28-27/(2/√9))= P(Z < 1.5)= (0.5+0.4332)= 0.9332