estadistica (1).docx

download estadistica (1).docx

of 18

  • date post

    18-Feb-2016
  • Category

    Documents

  • view

    26
  • download

    0

Embed Size (px)

Transcript of estadistica (1).docx

Homogeneidad,Independencia y Bondad de Ajuste8.1.Ejercicios ResueltosEJERCICIO 1Un gineclogo analiza la posible relacin entre la edad de la menarqua y la aparicin de cncer de mama. Con el fin de estudiarlo clasifica a las mujeres que acuden a su consulta en dos grupos, aquellas que tuvieron la menarquia antes de los 12 aos (a las que distingue con el valor cero), y aquellas que la tuvieron despus de esta edad ( a las que distingue con el valor 1). Se presentan a continuacin los resultados obtenidos:

Cncer deMama

Edad de la MenarquaSNo

06453

147139

Determine si existe relacin o no entre estas variables.SOLUCIONPara medir si existe relacin entre la edad de la menarquia y el cncer de mama, realizamos un test de independencia. : No existe independenciaPara tal hiptesis, ocupamos el estadstico 2.

En donde los observados son los valores que aparecen en la tabla y los esperados los calculamos mediante H0, por ejemplo, el esperado para la casilla

Luego para cada casilla, los esperados seran los que se muestran a continuacin:CncerSiNoTotal

06453117

Edad42,8674,14

14713968,14 117,86186

Total111192303

Luego el estadstico nos queda de la siguiente manera:

= 10,425 + 6,027 + 6,558 + 3,791= 26,801Ahora, rechazamosdonde filas en este caso tenemos 2 y columnas 2 y el lo escogemos como 0.05. Por lo tanto tenemos 84 buscado en una tabla de la distribucin Chi-Cuadrado.Luego, como 84 se rechaza la hiptesis de que ambas variables sean independientes con un 95% de confianza.EJERCICIO 2De un proceso de fabricacin, se seleccionan 100 ampolletas de 75 watts y se lleva a cabo una prueba para determinar la vida til de estas ampolletas. El resultado de esta prueba, en miles de horas, se resume en la siguiente tabla:

Tiempo de Duracin0 - 0.20.2 - 0.40.4 - 0.60.6 - 0.80.8 - 11 - 1.1

No de Ampolletas29201591215

Se puede concluir al nivel de significancia del 5%, que la vida util de todas las ampolletas se distribuye exponencial?SOLUCIONEn este caso debemos hacer un test de Bondad de Ajuste, para una distribucin exponencial de los datos.

Para esto debemos sacar las frecuencias esperadas para cada uno de los rangos, bajo la hiptesis de una distribucin exponencial, luego primero debemos estimar el parmetro de la exponencial.Sabemos que la E(X) = 1 cuando X Exp(), luego ocupemos el estimador de la media:

La media la calculamos as por tener los datos en una tabla de frecuencias. Luego, obtenemos que:

Posteriormente, calculamos las probabilidades de estar en cada uno de las clases de la tabla de frecuencias, para despus calcular la frecuencia esperada.

Como tenemos un total de 100 observaciones, las frecuencias esperadas las obtenemos multiplicando la probabilidad de estar en la clase por 100, es decir:fesperada[0 0,2] = P (0 < X < 0,2) 100 = 33,7 Luego haciendo el clculo para cada celda, queda:Tiempo de Duracin0 - 0.20.2 - 0.40.4 - 0.60.6 - 0.80.8 - 11 - 1.1

No de Ampolletas29201591215

No de Amp. Esperado33.722.3414.819.826.512.37

Finalmente para testear nuestra hiptesisH0 : Los datos distribuyen Exponencial v/s H1 : No distribuyen exponencialOcupamos el estadstico

= 72,9Luego rechazamos48 con k el nmero de clases y p el nmero de parmetros de la distribucin.Por lo tanto, como 72,9 > 9,48 se rechaza la postura de una distribucin exponencial en los datos del tiempo de vida de las ampolletas.EJERCICIO 3Un mecnico analiza la posible relacin entre la edad de la mquina y la aparicin de una falla grave. Con el fin de estudiarlo clasifica a las maquinas en dos grupos, aquellas que tuvieron una falla grave antes de los 12 aos (a las que distingue con el valor 0), y aquellas que la tuvieron despus de esta edad (a las que distingue con el valor 1). Se presentan a continuacin los resultados obtenidos:Falla Grave

SiNo

Edad Maquina06453

147139

(a) Calcule el Test 2 de Pearson.(b) Determine si existe relacin o no entre la variablesSOLUCIONCompletamos la tabla dada con los valores esperados

Falla Grave

SiNoTotal

06453117

Edad Maquina42,86174,139

147139186

68,139117,861

Total111192303

(a) Dada la tabla completa con los valores esperados calculamos el estadstico como sigue:

= 10,425 + 6,027 + 6,558 + 3,791= 26,801(b) Se rechaza H0 : independencia entre la edad de la mquina y si la falla es grave si2 > (1;(f1)(c1))Como 2 = 26,801 > 3,841459 = 0,95;1Se rechaza la hiptesis de independencia entre las fallas graves y la edad de las maquinas.EJERCICIO 4Suponga que cierto artculo puede presentar hasta 4 defectos diferentes. Una muestra aleatoria de 625 de estos artculos es clasificado de acuerdo al nmero de defectos, obtenindose lo siguiente:

# de defectos01234

# de casos8218518211066

Un ingeniero afirma que el nmero de defectos X es una variable aleatoria con distribucin de probabilidad!0e.o.c

Que podra concluir, en base a los datos de la muestra, con = 0,05, respecto de lo firmado por el ingeniero?SOLUCIONNecesitamos calcular la frecuencia esperada, mediante las probabilidades.

luego el nmero de casos esperados serEi = P(X = i) 625 = no de defectos igual a iuna vez calculados estos valores tenemos lo siguiente

# de defectos (i)01234

# de casos observado (Oi)8218518211066

# de casos esperados (Ei)89.25178.56178.5611959.5

Para la hiptesis H0: los datos distribuyen con la funcin de probabilidad dada. Se rechaza H0 si

donde k: no de clases y p: no de parmetros. Luego

Por lo tanto no existe evidencia suficiente bajo un 95% de confianza para rechazar H0, es decir, los datos pueden ser modelados por la distribucin dada.

EJERCICIO 5Una empresa empaca determinado producto de latas de tres tamaos distintos, cada uno en distinta lnea de produccin. La mayor parte de las latas se apegan a las especificaciones, pero un ingeniero de control de calidad ha identificado los siguientes defectos:Mancha en la lata.Grieta en la lata.Ubicacin incorrecta del anillo de apertura.Falta del anillo de apertura.Otras.Se selecciona una muestra de unidades defectuosas de cada una de las tres lneas, y cada unidad se clasifica segn el defecto, la siguiente tabla de contingencia incluye esos datos:Defecto

ManchaGrietaUbicacinFaltaOtrasTamao de la muestra

Lnea13465172113150

de2235225196125

Produccin33228161410100

Total89145585429375

Los datos sugieren desigualdad en las proporciones que caen en las distintas categoras de las tres lneas?SOLUCIONLos parmetros de inters son las diversas proporciones y las hiptesis relevantes son:H0: Las lneas de produccin son homogneas con respecto a las 5 categoras que no cumplen las especificaciones.H1: Las lneas de produccin no son homogneas con respecto a las 5 categoras que no cumplen las especificaciones.Ahora se presenta una tabla resumen con los valores esperados y el valor de (Obs. Esp.)2/Esp.C1C2C3C4C5 Total1346517211315035,60 58,00 23,20 21,60 11,600,072 0,845 1,657 0,017 0,169223522519629,67 48,33 19,33 18,009,671,498 0,278 1,661 0,056 1,391125

3322816141023,73 38,67 15,47 14,407,732,879 2,943 0,018 0,011 0,664100

Total89145585429375

luego, bajo un 95% de confianza

lo que indica que no existe suficiente evidencia para rechazar H0, es decir las lneas de produccin seran homogneas con respecto a las 5 categoras que no cumplen las especificaciones. Si disminuimos la confianza a un 90% tenemos que

luego, ahora s existira evidencia bajo este nivel de significancia para rechazar H0.EJERCICIO 6Un estudio de la relacin entre las condiciones de las instalaciones en gasolineras y la agresividad en el precio de la gasolina reporta los siguientes datos basados en una muestra de n = 144 gasolineras.

AgresividadNeutralNo agresivani.

Anticuada24151756

Estndar527380205

Moderna588636180

n.j134174133441

En el nivel 0.01, la informacin sugiere que las condiciones de instalaciones y las polticas de precios son independientes entre si?SOLUCIONLa hiptesis a docimar es:H0: Las condiciones de las instalaciones con la poltica de precios son independientes. vsH1: No existe independencia.La siguiente tabla resume entrega la informacin necesaria para calcular el estadstico 2.

C1C2C3 Total124151717,02 22,10 16,892,867 2,278 0,00156

252738062,29 80,88 61,831,700 0,769 5,343205

358863654,69 71,02 54,290,200 3,159 6,159180

Total134174133441

luego, bajo un 99% de confianza

lo que indica que existe suficiente evidencia con este nivel de confianza para rechazar H0, es decir el conocimiento de la poltica de precios de una gasolinera proporciona informacin acerca de la condicin de las instalaciones de la gasolinera.EJERCICIO 7Se obtuvo una muestra aleatoria de individuos que viajan solos en automvil al trabajo, en una gran zona metropolitana, y cada individuo fue clasificado de acuerdo con el tamao de su automvil y la distancia de recorrido citadino. La siguiente informacin sugiere que dicha distancia y el tamao del automvil estn relacionados en la poblacin a la cual se hizo el muestreo? Exprese las hiptesis pertinentes y utilice una prueba Chi-cuadrado con un nivel 0.05.Distancia de Recorrido[0,10)[10,20)[20,...)

Subcompacto62719

Compacto83617

Mediano214533

Grande14186

Tamao deAutomvilSOLUCIONLa hiptesis a docimar es:H0: Existe independencia entre la distancia de recorrido y el tamao del automvil.vsH1: No existe independencia.La siguiente tabla resume entrega la informacin necesaria para calcular el estadstico 2.C1C2C3 Total16271910,19 26,21 15,601,724 0,024 0,74152

28361711,96 30,74 18,301,309 0,899 0,09261

321453319,40 49,90 29,700,131 0,480 0,367