Solución Taller Estadística Aplicada

download Solución Taller Estadística Aplicada

of 14

description

taller resuelto en el sistema o paquete estadistico R

Transcript of Solución Taller Estadística Aplicada

SOLUCIN TALLER ESTADSTICA APLICADAUsar las salidas del software R para dar solucin a las siguientes situaciones1. Se cree que la pureza del oxgeno producido con un proceso de fraccionamiento est relacionada con el porcentaje de hidrocarburos en el condensador principal de la unidad de procesamiento. A continuacin los datos de veinte muestras :

Pureza (%)Hidrocarburos (%)

86.911.02

89.851.11

90.281.43

86.341.11

92.581.01

87.330.95

86.291.11

91.860.87

95.611.43

89.861.02

96.731.46

99.421.55

98.661.55

96.071.55

93.651.40

87.311.15

95.001.01

96.850.99

85.200.95

90.560.98

a. Ajustar un modelo de regresin lineal simple a los datos.

b. Probar la significancia del modelo, usando la prueba T y F.

Prueba de F

Para esto miramos el valor del F-stadistic y lo comparamos con el valor crtico al nivel de confianza de 0.05, observamos que el valor calculado 11.47 que es mayor que el valor tabulado (4.1). As rechazamos Ho. Decimos que el modelo es significativo en sus variables.

Prueba de TParmetro estimado del porcentaje de hidrocarburos. Se desea probar

El estadstico de inters en este caso es:

Si se escoge nivel de significancia 0.05, el valor critico de t es = 2.1. As se rechazara la hiptesis nula, y se llega a la conclusin que hay una relacin lineal entre el porcentaje de hidrocarburos y el porcentaje de pureza del oxgeno.

c. Determinar un intervalo de confianza de 95% para la pendiente.

As un I.C al 95% para la pendiente es (4.4%; 19.1%)

d. Calcular el coeficiente de correlacin y el coeficiente de determinacin, e intrprete.

Coeficiente de Determinacin:

Por tanto el 38% de la variabilidad de pureza del oxgeno es explicada por el porcentaje de hidrocarburos. Es decir una proporcin de variabilidad relativamente alta.

Coeficiente de Correlacin

Podemos notar que el grado de asociacin positiva entre el porcentaje de pureza del oxgeno y el porcentaje de hidrocarburo es muy cercano a 1.

e. Verifique si el valor del coeficiente de correlacin de la muestra tiene una magnitud suficiente para indicar que en la poblacin las dos variables de inters estn correlacionadas.

Como el coeficiente de correlacin es positivo, es decir, de 0.62 cercano a 1, no es perfecta la asociacin entre el porcentaje de pureza del oxgeno y el porcentaje de hidrocarburos.

2. Myers y Montgomery (Response Surface Methodology, 1995,pp. 267-268) describe un experimento para determinar la influencia de:X1 - Temperatura del bao cidoX2 - Concentracin del cido de cascadaX3 - Temperatura del aguaX4 - Concentracin de sulfuroX5 - Cantidad de blanqueador de cloro

Sobre una medida adecuada de la blancura del rayn (y). Los ingenieros que hicieron este experimento desean minimizar la medida. Los resultados experimentales se muestran a continuacinTemperatura del cidoConcentracin del cidoTemperatura del aguaConcentracin de sulfuroCantidad de blanqueador

350.3820.20.376.5

350.3820.30.576.0

350.3880.20.579.9

350.3880.30.383.5

350.7820.20.589.5

350.7820.30.384.2

350.7880.20.385.7

350.7880.30.599.5

550.3820.20.589.4

550.3820.30.397.5

550.3880.20.3103.2

550.3880.30.5108.7

550.7820.20.3115.2

550.7820.30.5111.5

550.7880.20.5102.3

550.7880.30.3108.1

250.5850.250.480.2

650.5850.250.489.1

450.1850.250.477.2

450.9850.250.485.1

450.5790.250.471.5

450.5910.250.484.5

450.5850.150.477.5

450.5850.350.479.2

450.5850.250.271.0

450.5850.250.690.2

Hacer un anlisis detallado de los resultados.Miremos anlisis por regresin estimando el siguiente modelo:

As:

De lo anterior podemos notar el porcentaje de variabilidad explicado por el modelo, es decir de un 48.2%. Haciendo prueba de significancia del modelo o prueba F podemos ver que el F calculado de 3.72 es mayor al valor critico tabulado de 2.54, por tal se rechaza la hiptesis nula de que todos los parmetros estimados son iguales a cero. Obteniendo el siguiente modelo especfico:

Y obtenemos intervalos de confianza al 95% para los parmetros:

3. Davidson (Update on Ozone Trends in Californias South Coast Air Basin, Air Waste, 43, 226, 1993) estudi las concentraciones de ozono en la Cuenca area de la costa sur de California, durante los aos 1976 a 1992. Cree que la cantidad de das en las que las concentraciones de ozono fueron mayores que 0.20 ppm (la respuesta) depende del ndice metereolgico estacional, que es el promedio estacional de la temperatura con 850 milibars (el regresor). La siguiente tabla muestra los datos

AoDasndice

19769116.7

197710517.1

197810618.2

197910818.1

19808817.2

19819118.2

19825816.0

19838217.2

19848118.0

19856517.2

19866116.9

19874817.1

19886118.2

19894317.3

19903317.5

19913616.6

a. Trazar un diagrama de dispersin con los datos.

b. Estimar la ecuacin de prediccin.

c. Probar la significancia de la regresin.Prueba de F

As miramos el valor del F-stadistic y lo comparamos con el valor crtico al nivel de confianza de 0.05, observamos que el valor calculado 2.36 que es menor que el valor tabulado (4.5). As no rechazamos Ho. Decimos que el modelo no es significativo en sus variables. El ndice meteorolgico estacional no es significativo para explicar el nmero de das en que la concentracin de ozono fue mayor a 0.20 ppm

d. Construya el intervalo de confianza para , e interprete.

As con un nivel de confianza del 95% podemos decir que el parmetro B1 se encuentra entre (-4.9; 35.5)

e. Verifique si el valor del coeficiente de correlacin de la muestra tiene una magnitud suficiente para indicar que en la poblacin las dos variables de inters estn correlacionadas.

Veamos el grfico de dispersion entre los dias y el indice meteorologico

Nos lo ratifica el anterior grfico, no hay grado de asociacin entre las variables en cuestin, el ndice meteorolgico no es significativo para explicar el nmero de das en que la concentracin de ozono fue mayor a 0.20ppm

4. Un embotellador de bebidas gaseosas analiza las rutas de servicio de las mquinas expendedoras de su sistema de distribucin. Le interesa predecir el tiempo necesario para que el representante de ruta atienda las mquinas expendedoras en una tienda. Esta actividad de servicio consiste en abastecer la mquina con productos embotellados, y algo de mantenimiento o limpieza. El ingeniero industrial responsable del estudio ha sugerido que las dos variables ms importantes que afectan el tiempo de entrega Y son la cantidad de cajas de producto abastecido, X1, y la distancia caminada por el representante, X2. El ingeniero ha reunido 25 observaciones de tiempo de entrega que se ven en la siguiente tabla. Se ajustar el modelo de regresin lineal mltiple.

Observacin numeroTipo de entrega (minutos)

Cantidad de cajas

Distancia (pies)

116.687560

211.503220

312.033340

414.88480

513.756150

618.117330

78.002110

817.837210

979.24301460

1021.505605

1140.3316688

1221.0010215

1313.504255

1419.756462

1524.009448

1629.0010776

1715.356200

1819.007132

199.50336

2035.1017770

2117.9010140

2252.3226810

2318.759450

2419.838635

2510.754150

a. Obtenga la ecuacin de Regresin Mltiple estimada.

As:

b. Interprete los coeficientes de regresin.

Del parmetro pendiente para el nmero de cajas, podemos interpretarlo, por cada unidad adicional de cajas transportada el tiempo de atencin de las mquinas expendedoras aumenta 1.61 minutos, hay una relacin positiva entre estas dos variables.Del parmetro pendiente para la distancia recorrida, podemos interpretarlo, por cada pie adicional recorrido el tiempo de atencin de las mquinas expendedoras aumenta 0.014 minutos, hay una relacin positiva entre estas dos variables.

c. Realice una prueba de hiptesis para verificar la relacin lineal entre las tres variables, use .

Realicemos prueba F, con el nivel de significancia del 99%

As miramos el valor del F-stadistic y lo comparamos con el valor crtico al nivel de confianza de 0.01, observamos que el valor calculado 261.2 que es mayor que el valor tabulado (5.71). As rechazamos Ho. Decimos que el modelo es significativo en sus variables. La distancia en pies recorrida y el nmero de cajas son variables significativo para explicar el tiempo de atencin de las mquinas expendedoras.

d. Evale la fuerza de la relacin lineal entre Y y las variables independientes de manera individual, use .

Parmetro estimado del nmero de cajas. Se desea probar

El estadstico de inters en este caso es:

Si se escoge nivel de significancia 0.01, el valor critico de t es = 2.83. As se rechazara la hiptesis nula, y se llega a la conclusin que hay una relacin lineal entre el nmero de cajas abastecidas y el tiempo de atencin a las mquinas expendedoras.

Parmetro estimado de la distancia caminada. Se desea probar

El estadstico de inters en este caso es:

Si se escoge nivel de significancia 0.01, el valor critico de t es = 2.83. As se rechazara la hiptesis nula, y se llega a la conclusin que hay una relacin lineal entre la distancia caminada y el tiempo de atencin a las mquinas expendedoras.

e. Construya los intervalos de confianza de 95% para los , e interprete.

As con un nivel de confianza del 95% podemos decir que los parmetros para el nmero de cajas abastecidas y la distancia caminada (pies) se encuentran en los siguientes intervalos de confianza.

Cajas (1.2; 1.96)Distancia (0.006; 0.02)

5. La siguiente tabla representa los resultados de un experimento para comparar cuatro tcnicas de mezclado diferentes (1, 2, 3, 4) sobre la resistencia de tensin de cuatro clases de cemento (A, B, C, D) Existe algn indicio de qu tcnica de mezclado afecta la resistencia?

MEZCLADOABCD

13129300028652890

23200300029753150

32800290029853050

42600270026002765

Miremos anlisis de varianza

Realizando la interaccin podemos evidenciar el indicio de que la tcnica de mezclado nmero dos afecta positivamente la resistencia de tensin del cemento A. Podemos verlo en el siguiente grfico.

6. Se pueden emplear dos tipos diferentes de puntas en un probador de dureza Rockwell. Se seleccionan ocho lingotes de una aleacin de nquel y cada uno se prueba dos veces con cada punta. En la siguiente tabla se encuentran las lecturas de dureza en la escala C de Rockwell utilice para determinar si las dos puntas producen o no las mismas lecturas de pureza.

LINGOTEPUNTA IPUNTA II

16360

25251

35856

46059

55558

65754

75352

85961

Bajo esto podemos determinar que las das puntas producen en promedio distintas lecturas de pureza.7. Una empresa reparadora de lavadoras desea estudiar desea estudiar el efecto el efecto de la marca y el centro de servicio de reparacin en minutos. Se eligieron tres marcas de lavadoras y tres centros de servicio. Cada centro fue asignado para efectuar una reparacin de dos lavadoras de cada marca. Los resultados se muestran en la siguiente tabla.

Marca AMarca BMarca C

Centro 152 3648 5659 50

Centro 251 4061 5058 55

Centro 337 4044 4065 60

a. Existe algn efecto debido a las marcas?b. Si los centros son homogneos entre s, responda de nuevo el literal a).c. Existe algn efecto debido a los centros de servicios?d. Existe algn efecto debido a la interaccin?Nota: para el tem a) y b), considere una sola observacin, resultado de hallar el promedio entre los dos registros, por ejemplo: (52+36)/2 = 44

8. En un estudio de 2989 fallecimientos por cncer, se registr el lugar de cada uno (casa, cuidado intensivo en hospitales, hospital de atencin permanente) y la edad al fallecimiento, resultando en la tabla dada de frecuencia en dos sentidos. Mediante el uso de un nivel de significancia de .01, pruebe la hiptesis nula que de la edad y el lugar del fallecimiento son independientes.Lugar

Edad

CasaCuidado IntensivoAtencin permanente

15 - 549441823

55 - 6411652434

65 - 74156581109

Ms de 74138558238

9. Se clasificaron 445 estudiantes segn su frecuencia de consumo de mariguana, y consumo de alcohol y de drogas sicotrpicas por parte de los padres. Sugiere la informacin que los consumos de padres t estudiante son independientes en la poblacin de la que se sac la muestra? Utilice el mtodo del valor para llegar a una conclusin. Nivel de consumo de mariguana del estudiante

Consumo de alcohol y drogas de padres

NuncaOcasionalRegular

Ninguno1415440

Uno684451

Ambos171119