Analisis de Una Muestra-Intervalos de Confianza-practica5

8

Click here to load reader

description

Analisis de una muestra-intervalos de confianza-practica5

Transcript of Analisis de Una Muestra-Intervalos de Confianza-practica5

Page 1: Analisis de Una Muestra-Intervalos de Confianza-practica5

Práctica 5. Intervalos de confianza 1

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València

Práctica 5

ANÁLISIS DE UNA MUESTRAINTERVALOS DE CONFIANZA

CONTRASTE DE HIPÓTESIS

Objetivos:

Ilustrar el grado de fiabilidad de un intervalo de confianza cuando se utiliza para estimarla media de una población. Análisis de las relaciones entre contrastes de hipótesis eintervalos de confianza.Uso del SPSS para el análisis de una muestra: cálculo de intervalos de confianza,contrastes de hipótesis sobre la media poblacional y pruebas de normalidad.

Índice:

1. Interpretación de los intervalos de confianza y contrastes de hipótesis.2. Análisis de una muestra con el SPSS3. Pruebas de normalidad

Page 2: Analisis de Una Muestra-Intervalos de Confianza-practica5

Práctica 5. Intervalos de confianza 2

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València

1. Interpretación de los intervalos de confianza y contrastes dehipótesis.

Por conveniencia, supondremos que los datos que aparecen en este apartado procedende una población normal.

1.1 Un ejemplo con una muestra.

Supongamos que la colección de 100 círculos que se presenta en la hoja adjuntarepresenta una población natural del mítico organismo C. ellipticus. Los círculos tienennúmeros de identificación 00, 01, 02,...., 98, 99 por conveniencia en el muestreo.Algunos individuos de C. ellipticus son mutantes y son más oscuros.

Vamos a utilizar esta "población" para simular la recogida de datos en un experimento,para estudiar la relación entre muestra y población y para interpretar las propiedades delos intervalos de confianza y del Contraste de Hipótesis.

Ejercicio 1:

a) Selección de una muestra aleatoria.

Seleccionar una muestra aleatoria de tamaño 5 de la población de C. ellipticus(utilizar el método descrito en la Práctica 3) y medir sus diámetros en mm.

b) Calcular la media y la varianza muestral de la muestras obtenida.

c) Comparar los estadísticos obtenidos en el apartado 2 con los que han obtenidovuestros compañeros.

1. 2. Intervalos de confianza

Evidentemente, en otros estudios no conoceremos el valor de la media poblacional. Sinembargo, en este ejercicio sabemos que µ = 11, esto nos permitirá saber con seguridadsi los intervalos de confianza que calculemos contienen o no al verdadero valor de µ.

Ejercicio 2:

a) Construir un intervalo de confianza del 95% para µ a partir de la muestraobtenida en el ejercicio 1. Análogamente para el 80%.

Page 3: Analisis de Una Muestra-Intervalos de Confianza-practica5

Práctica 5. Intervalos de confianza 3

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València

b). Considerando todos los intervalos de confianza del 95% construidos porvuestros compañeros, calcular la proporción de ellos que contienen al 11 mm(valor verdadero de µ). Hacer lo mismo con los intervalos del 80%. ¿Son losresultados obtenidos los que cabría esperar dado el nivel de confianza utilizadoen cada caso? Comentar la interpretación probabilística de un intervalo deconfianza y relacionar con los resultados obtenidos.

Recordar que en un estudio real no sabemos cuál es el verdadero valor de µ por lo quenunca estaremos completamente seguros de si el intervalo de confianza que hemosobtenido contiene o no a este valor. Solamente podemos esperar que lo contenga conmayor o menor confianza.

1.3. Contraste de Hipótesis: test t.

Ejercicios:

3. Haz el siguiente contraste de hipótesis sobre el valor de la media poblacionalutilizando la muestra anterior: H0 : µ = 11, HA : µ ≠ 11:

a) Utilizar α = 0.05.b) Utilizar α = 0.20.¿Qué relación hay entre los resultados obtenidos en los contrastes anteriores y elhecho de que los intervalos de confianza del ejercicio 4 contengan o no al 11?

4. Si en lugar de observar si el 11 pertenece o no a los intervalos de confianzanos fijamos en si contienen o no al 8 ¿qué contraste de hipótesis plantearías?

5. Suponed que un experto en C. ellipticus asegura que el diámetro medio deeste organismo es 13 mm. Utilizar un test t de dos colas para contrastar estaafirmación:H0 : µ = 13 , HA : µ ≠ 13

a) Utilizar α = 0.05.b) Utilizar α = 0.20.c) Teniendo en cuenta que sabemos que µ = 11, ¿es equivocada la conclusión aque llegamos con el test?

6. Teniendo en cuenta los resultados obtenidos por vuestros compañeros en elejercicio anterior, para cada valor de α utilizado:a) Calcular la proporción de veces en que se produce un resultado erróneo.b) ¿Cuál es la proporción de veces que se ha producido un error de tipo I?¿Tiene esta proporción alguna relación con el valor de α?c) ¿Cuál es la proporción de veces que se ha producido un error de tipo II?¿Cómo valorarías la potencia del test?

Page 4: Analisis de Una Muestra-Intervalos de Confianza-practica5

Práctica 5. Intervalos de confianza 4

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València

2. Análisis de una muestra con el SPSS

En este apartado describimos el uso del SPSS para el análisis de una muestra mediantela obtención de intervalos de confianza y la resolución de contrastes de hipótesis, todosellos referidos a la media de la población de la que proviene la muestra.

Una vez abierto un banco de datos, por ejemplo AMBIENTE, podemos invocar elprocedimiento Prueba T para una muestra, eligiendo el menú Analizar/Compararmedias/Prueba T para una muestra, con lo que aparece la siguiente pantalla:

Esta pantalla nos permitirá obtener intervalos de confianza y resolver contrastes para lasmedias de aquellas variables que seleccionemos y, con el puntero, situemos en laventana de Contrastar Variables. Por su parte, el Valor de prueba nos permiteintroducir el valor que define la hipótesis nula (µµ0). Por último, si seleccionamosOpciones aparece una ventana en la que podemos introducir el coeficiente (porcentaje)de confianza deseado para el intervalo. Por defecto es del 95%.

Se activa, entonces, el botón Aceptar, y al pulsarlo, el SPSS muestra en el Visor deresultados, bajo el título de Estadísticos para una muestra, el tamaño de la muestra, lamedia, la desviación típica y el error estándar de la media. A continuación, bajo el títulode Prueba para una muestra, encontramos el estadístico del contraste (t), los grados delibertad (gl), el p-valor bilateral ( Sig (bilateral) ), la diferencia de medias y un intervalode confianza para la diferencia µ - µ0. (Por ejemplo, los resultados siguientes seobtienen seleccionando la variable PH con un valor de prueba 7).

Estadísticos para una muestra

300 5.923131 .540562 3.121E-02PHN Media

Desviacióntíp.

Error típ. dela media

Page 5: Analisis de Una Muestra-Intervalos de Confianza-practica5

Práctica 5. Intervalos de confianza 5

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València

Prueba para una muestra

-34.505 299 .000 -1.076869 -1.138287 -1.015451PHt gl Sig. (bilateral)

Diferenciade medias Inferior Superior

95% Intervalo deconfianza para la

diferencia

Valor de prueba = 7

Es importante tener en cuenta que el contraste que realiza el SPSS es el siguiente:

H0: µ = µ 0

HA: µ ≠ µ 0

por lo que el p-valor aparece como sig.(bilateral), es decir, corresponde siempre alcontraste bilateral o no direccional. Por tanto, si el problema que queremos resolverinvolucra un contraste unilateral o direccional debemos adaptar dicho p-valor.

La Prueba T es válida siempre que el tamaño muestral sea suficientemente grande o, encaso contrario, cuando la muestra provenga de una población con distribución normal.En la siguiente Sección veremos cómo comprobar si se satisface esta última condición.

Ejercicio 7:

En estudios previos se concluyó que el nivel medio de sulfato era de 5.1. ¿Confirmanlos datos del fichero AMBIENTE las conclusiones de dichos estudios?

3. Pruebas de normalidad

Una de las hipótesis que deben comprobarse para la validez de las Pruebas T es la denormalidad de los datos cuando el tamaño de las muestras es pequeño. Esta condiciónpuede comprobarse con la prueba de Kolmogorov-Smirnov y mediante el dibujo dehistogramas, diagramas de cajas o gráficos Q-Q.Para obtener una prueba de normalidad de los datos, seleccionamos el menúAnalizar/Estadísticos descriptivos/Explorar. Aparece la ventana siguiente:

Page 6: Analisis de Una Muestra-Intervalos de Confianza-practica5

Práctica 5. Intervalos de confianza 6

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València

En el caso de una muestra situamos la variable en la ventana Dependientes, ydejamos Factores en blanco. A continuación, debemos pulsar el botón Gráficos y en lanueva ventana escoger la opción de Histograma y activar la opción de Gráficos conpruebas de normalidad.

En el Visor de resultados encontramos, junto con algunos estadísticos de la variable aestudiar, la prueba de Kolmogorov-Smirnov con corrección de Lilliefors para contrastarla normalidad de la distribución (hipótesis nula) y el histograma.

Ejercicio 8:

Aplicar las pruebas de normalidad a los siguientes datos.Notas obtenidas por los estudiantes presentados en un examen:

3.30, 6.50, 3.60, 5.00, 3.20, 5.50, 5.00, 5.90, 3.80, 3.70, 2.90, 3.60, 3.90, 6.30, 5.00, 3.50, 3.60

Page 7: Analisis de Una Muestra-Intervalos de Confianza-practica5

Práctica 5. Intervalos de confianza 7

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València

Utilizando el SPSS de la forma que se ha explicado, se obtienen los siguientesresultados:

Pruebas de normalidad

,247 17 ,007 ,885 17 ,041NOTASEstadístico gl Sig. Estadístico gl Sig.

Kolmogorov-Smirnova

Shapiro-Wilk

Corrección de la significación de Lillieforsa.

NOTAS

6,506,005,505,004,504,003,503,00

Histograma

Fre

cuen

cia

7

6

5

4

3

2

1

0

Desv. típ. = 1,15

Media = 4,37

N = 17,00

Gráfico Q-Q normal de NOTAS

Valor observado

765432

No

rma

l esp

era

do

2,0

1,5

1,0

,5

0,0

-,5

-1,0

-1,5

-2,0

Gráfico Q-Q normal sin tendencias de NOTAS

Valor observado

765432

De

sv.

de

no

rma

l

,6

,4

,2

-,0

-,2

-,4

-,6

17N =

NOTAS

7

6

5

4

3

2

Page 8: Analisis de Una Muestra-Intervalos de Confianza-practica5

Práctica 5. Intervalos de confianza 8

Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València

4. Ejercicios complementarios

1.- Las manadas de lobos son territoriales, con territorios de 130 km2 o más. Se piensaque los aullidos de los lobos, que comunican información tanto de la situación como dela composición de la manada, están relacionados con la territorialidad. Se obtuvieron lossiguientes valores de la variable X, duración en minutos de una sesión de aullidos deuna determinada manada sometida a estudio. Suponemos que X está normalmentedistribuida.

1.0 1.8 1.6 1.5 2.0 1.81.2 1.9 1.7 1.6 1.61.7 1.5 1.4 1.4 1.4

Calcular intervalos de confianza al 95% y al 90% para la duración media de una sesiónde aullidos. ¿Confirman estos datos que la duración media es superior a 1.5 minutos?

2.- Se está poniendo a prueba un proceso que en fotobiología se denomina abscisión,con la esperanza de aumentar la cosecha de fruta en los naranjos. El proceso implicaexponer los árboles a luz coloreada durante quince minutos cada noche. Se recolectófruta de 10 árboles experimentales, bajo condiciones normales primero y luego despuésdel nuevo tratamiento. Se obtuvieron las siguientes observaciones para X, porcentaje enel que incrementó la recolección de fruto de un año respecto al anterior:

29 37 32 34 3930 36 35 27 40

El promotor del nuevo proceso pretende que éste incrementa la recolección en promedioen más de un 35%. ¿Respaldan los datos esta pretensión?.

3.- Cada especie de luciérnagas tiene un modo peculiar de centelleo. Para unadeterminada especie, consiste en un destello corto de luz seguido por un período dereposo que se piensa que tiene una duración media de menos de 4 segundos. Seobtuvieron los siguientes datos acerca del período de reposo entre centelleos para unamuestra de 16 luciérnagas de esta especie.

3.9 4.1 3.6 3.7 4.0 4.3 3.8 3.23.7 4.2 4.0 3.5 3.5 3.8 3.4 3.6

¿Apoya la evidencia el tiempo de reposo medio propuesto, de menos de 4 segundos?

4.- Normalmente las hojas de la Mimosa púdica son horizontales. Si se toca ligeramenteuna de ellas, las hojas se pliegan. Se afirma que el tiempo medio desde el contacto hastael cierre completo es 2.5 segundos. Se realiza un experimento para comprobar estevalor.

a) Construir la hipótesis apropiada bilateral.b) Se obtuvieron las siguientes observaciones:

3.0 2.9 2.8 2.7 2.62.4 2.5 2.4 2.6 2.7

Hallar el p-valor del contraste. ¿Puede rechazarse H0 con un nivel = 0.10? ¿Aqué tipo de error nos arriesgamos?